Mashina tarjimasi (avtomatik tarjima)
– bir tildagi matnni ikkinchi bir
tilga kompyuter vositasida qisqa vaqt ichida tarjima qilish. Mashina tarjimasi
bo‘yicha birinchi xalqaro konferensiya 1952-yilda Massachusets texnologiya
isttitutida o‘tkazildi. 1954-yilda AQSH dagi Jorjtaun universitetida birinchi
marta avtomatik tarjima tajribadan o‘tkazildi. U GAT tizimi (inglizcha
“Georgetown Automatic Translation” birikmasining qisqartmasi) deb ataldi. Bu
tajribalar IBM-701 kompyuterida o‘tkazildi. Tajriba bazasi algoritmlardan iborat
bo‘lib, 50 000 ta so‘z (50 ta gap)ni rus tilidan ingliz tiliga tarjima qildi.
SYSTRAN avtomatik tarjima tizimi yordamida bir yilda 2,5 mln sahifa
matn ingliz tilidan nemis, fransuz, ispan, yunon, italyan tillariga hamda fransuz
tilidan ingliz, ispan, italyan tillariga tarjima qilinadi. DIANA mashina tarjimasi
tizimi 10 mln ta so‘z bazasiga asoslanib, dunyoning 6 ta yirik tilida
avtomatik tarjimani ta’minlaydi. YEUROTRA tizimi barcha yevropa tillari
bo‘yicha avtomatik tarjimani amalga oshira oladi. SOKRAT sistemasi ham 40
mln ta so‘z xotira kuchiga ega bo‘lib, dunyodagi 40 ta tilda avtomatik
tarjimani amalga oshiradi.
Internet tiziming rivojlanishi natijasida avtomatik tarjima global
tarmoqda ham tashkil etiladi, ya’ni hozirgi kunda online-tarjima tizimi faol
yo‘lga qo‘yilgan
12
.
Avtomatik tahrir
kompyuter lingvistikasining asosiy yo‘nalishlaridan
biri bo‘lib, u kompyuterdagi matn muharrirlari (Microsoft Word, Exsel,
Wordpad, Lexicon) rivojlanishi bilan bog‘liqdir. Avtomatik tahrir deganda,
kompyuterga kiritilayotgan matnning mexanik xatolari avtomatik tarzda
to‘g‘rilanishi va xato ekanligi haqidagi signallarning foydalanuvchiga taklif
etilishi nazarda tutiladi. Masalan, Microsoft Word dasturi bilan
ishlayotganimizda kiritilgan matnda so‘zlarning yozilishi bilan bog‘liq xatolar
12
Rahimov A. Kompyuter lingvistikasi asoslari. –T., 2011, 143-bet.
27
bo‘lsa, ularning ostiga qizil yoki yashil rangdagi to‘lqinli chiziqning
chizilishi; katta harf bilan yozilishi kerak bo‘lgan so‘zlarning avtomatik tarzda
bosh harfga o‘tkazilishi, bandlarning avtomatik raqamlashtirilishi; xatboshini
to‘g‘irlashi kabi mexanik ishlar avtomatik tahrirda erishilgan yutuqlar
hisoblanadi.
Avtomatik tahrir yo‘nalishi XX asr o‘rtalariga kelib rivojlandi. U matn
muharrir dasturlari bilan birgalikda yangicha imkoniyatlar bilan
rivojlanmoqda. Oddiy muharrirlardan farqi shundaki, unda tahrir avtomatik
tarzda qisqa vaqt ichida katta hajmli matnlar tez tekshirilib, xatolarni samarali
to‘g‘rilash kabi imkoniyatlari bo‘ladi. Avtomatik tahrirning pragmatik
ahamiyati shundaki, u kelajakda taraqqiy etsa, yetarli ma’lumotlar bazasi
yaratilsa va maxsus dasturlar ishlab chiqilsa, muharrir kasbi uchun ehtiyoj
qolmaydi. Bu esa matn bilan ishlashni osonlashtiradi
13
.
Avtomatik tahrirlash yo‘nalishida ham bugungi kunda barcha
kompyuterlarda mavjud bo‘lgan avtomatik tahrir qiluvchi dasturlar ishlab
chiqilgan bo‘lib, ular ruscha, inglizcha, nemischa, fransuzcha, italyancha
matnlarni tahrirlaydi. Bunday tahrirlash dasturlari asosan, imloni tekshirishga
mo‘ljallangan. Ushbu yo‘nalishda R.G.Kotov, V.G.Britvin, I.A.Melchuk,
A.B.Kuznetsov,
L.I.Belyayeva,
V.A.Chijakovskiy,
G.G.Belogonov,
I.S.Duganovlar samarali tadqiqot olib borganlar.
Ushbu olimlarning asosiy xizmati shundaki, ular avtomatik tahrir
qiluvchi dasturlar uchun mutaxassislarga asosiy lingvistik ta’min yaratib
berishgan. Buning natijasida kompyuterdagi ruscha matnlarni tahrirlovchi
dasturlar ishlab chiqilgan. Bunday dasturlar bugungi kunda barcha
kompyuterlarda mavjud.
Lingvistik tahrirlash (korrektura) – turli ko‘rinishdagi (ilmiy, badiiy,
publisistik va rasmiy uslublardagi) matnlarning orfografik, grammatik, stilistik
hamda mantiqiy qurilishdagi xatolarni to‘g‘rilash demakdir. Matnlarni
tahrirlashikki usulda amalga oshiriladi:
13
Rahimov A. Kompyuter lingvistikasi asoslari. – T., 2011. 98-bet.
28
1.
Inson tomonidan matnlarning tahrirlanishi (muharrirlik ishi).
2.
Kompyuter vositasida tahrirlash (avtomatik tahrir).
Shuni ta’kidlash lozimki, har ikki holatda ham mutaxassisning faoliyati
(qobiliyat, temperament, xarakter, irodaviy sifatlar, ijtimoiy holati) muhim
ahamiyatga ega. Muharrir matnlarni bevosita tahrir qiladi, avtomatik tahrirda
esa tilshunos bilvosita qatnashadi, ya’ni tahrirlash dasturining lingvistik
bazasini yaratib beradi.
Ma’lumki, kompyuter yaratilmasdanavval matnlar yozuv mashinkalarida
terilgan, bu jarayonda orfografik, punktuatsion, stilistik va grammatik
xatoliklarga yo‘l qo‘yilsa, matnni boshidan oxirigacha qayta yozib chiqishga
to‘g‘ri kelgan, bu esa foydalanuvchiga noqulaylik tug‘dirgan. Bugungi kunga
kelib, kompyuter orqali matnning tahrir qilinishi bir necha qulayliklarni
yaratdi. Unda foydalanuvchi dialogli rejimda ishlaydi va o‘z o‘rnida xatolarni
to‘g‘rilash imkoniyatiga ega bo‘ladi. Hatto matn bilan ishlash jarayonida uni
shakl jihatdan ham tahrirlash imkoniyatiga bo‘ladi. Shuni ta’kidlash kerakki,
avtomatik tahrirlash tizimi faqat matn muharrirlari dasturlari bazasiga
qo‘shilgan tillarda amal qiladi, masalan, rus, ingliz, fransuz, nemis va boshqa
tillarida. Bazada lingvistik ta’minoti mavjud bo‘lmagan tilda matn kiritilsa,
dastur uni avto-lingvistik tahrirlay olmaydi, aslicha yozilgan internatsional
so‘zlar esa bundan mustasno. Masalan, kompyuter, internet, klaviatura, modem,
telefon, faks kabi. Avtomatik tahrirlash jarayonida MS Word lug‘atida mavjud
bo‘lmagan so‘z uchrasa, uning ostiga to‘lqinli qizil chiziq chiziladi. Mazkur
holatda insonning – foydalanuvchining ishtiroki zarur, ya’ni foydalanuvchini
so‘zning imlosi to‘g‘ri ekanligiga amin bo‘lsa, uning avtotahrirda to‘g‘ri deb
tekshirilishi uchun MS WORD lug‘atiga “lug‘at kiritish” (kontekst menyudagi
«добавитьвсловарь»buyrug‘i orqali mumkin.
Avtomatik tahrirlash tizimi juda ko‘p amaliy vazifalarni o‘z ichiga oladi. Bu
vazifalarning eng asosiylari quyidagilar:
orfografiyani tekshirish;
grammatika va stilistikani tekshirish;
29
kontekstli qidiruv;
formatlash;
avtomatik referatlash – matndagi kalit so‘zlar asosida uning umumiy
mundarijasini yaratish;
matn ichiga jadval, rasm, turli figuralar, klip-artlar, grafik sxemalar,
diagrammalar qo‘shish, giperhavolalar bilan ta’minlash;
matndagi abzaslar, belgilar, so‘zlarning miqdorini aniqlash (statistikasini
ko‘rsatish);
tezaurus xizmati – matndagi muayyan so‘zning sinonimik variantlarini
aniqlash;
transliteratsiyalash – bir alifbodan boshqa alifboga o‘tkazish (masalan, krill
alifbosidan lotin alifbosidagi harfga almashtirish).
Avtomatik tahrirda uch tarkibli asosiy vazifa e’tiborga olinishi lozim:
1.
Orfografiyani tekshirish – bu vazifa morfologik tahlil yordamida amalga
oshiriladi, bunda etalon lug‘atdagi baza asosida tekshiriladi.
2.
Sintaksisni tekshirish orfografiyani tekshirishdan ko‘ra murakkabroq. Chunki
orfografiyani tekshiruvchi dasturlar yaratilgan, lekin norasmiy matnlarning
sintaktik jihatdan avtomatik tahriri masalasi haligacha hal etilgani yo‘q. Rasmiy
matnlarning avtomatik tahriri bo‘yicha muhim natijalarga erishilgan.
3.
Semantik tahrirlash inson tafakkurini modellashtirishga asoslangan sun’iy
intellekt tizimi bilan bog‘liq ravishda o‘rganilmoqda. Bunda mazkur ko‘p
aspektli muammoni semantik maydon, freym yondashuv, tezauruslar tizimini
boyitish, so‘z va so‘z birikmalari o‘rtasidagi paradigmatik munosabatlar
(sinonimiya, gipo-giperonimik-tur-jins munosabati)ni modellashtirishga tatbiq
etish asosida hal etish mumkin. Chunki inson bunday assotsiativ munosabatlarni
o‘z intellektiga tayanib o‘rnata oladi, biroq bu jarayon kompyuter uchun
murakkabdir.
MC Word dasturida orfografiyani tekshirish imkoniyati cheklanganligi bois
hozirgi kunda maxsus Spell Cheker dasturlar yaratilmoqda. Bunday dasturlar
30
sirasiga quyidagilarni kiritish mumkin: SpellLink Multilingual Pro (ingliz. ispan,
italyan, nemis, fransuz, portugal, ukrain tillaridagi so‘zlarning to‘g‘ri yozilishini
tekshiradi. _ SpellLink -Enlis’h, SpellLink French, SpellLink Italian. SpellLink
Spanish. Ruta 1.0 rus va ukrain tillaridagi so‘zlarning imlosini tekshirishga yordam
beradi), Asutyp. Spellex, Spell atche kabi. Mazkur dasturlar Word dasturiga
qo‘shimcha tarzda o‘rnatiladi.
Matn kiritish davomida so‘z yokiso‘zlar birikmasi ostiga yashil to‘lqinli
chiziq chiziladi, bu tinish belgining noto‘g‘ri qo‘llanishi yoxud so‘zlarning
grammatik noto‘g‘ri bog‘lanishi bilan bog‘liq. Bunday holda foydalanuvchi
xatoni o‘zi to‘g‘rilab qo‘yishi kerak yoki ostiga chizilgan so‘zda
sichqonchaning o‘ng tomoni bosilsa, kontekst menyu ochiladi, unda so‘zning
to‘g‘ri varianti taklif etiladi yoki to‘g‘rilash uchun lingvistik ko‘rsatma
beriladi, so‘ng xatoni to‘g‘rilash kerak bo‘ladi.
|