Topshiriqlar
1. Qanday til o’rgatuvchi o’quv dasturlarini bilasiz?
2. Til o’rgatuvchi o’quv dasturlarining samaradorligi qanday bo’ladi?
3. Boshqa turdagi o’quv dasturlari haqida yozing.
4. Internet tizimi yordamida (on-line) til o’qitish kurslaridan
foydalanganmisiz?
5. CALL tizimining rivojlanishi va istiqbollari qanday deb baholaysiz?
80
Po'latov A., Muhamedova S. Kompyuter lingvistikasi. – Toshkent, 2007. – B. 68.
91
Adabiyotlar
1. Нелюбин Л. Л. Компьютерная лингвистика и машинный перевод. –
М.: ВЦП., 1991.
2. Шемакин Ю.И. Начало компьютерной лингвистики. – М.: МГОУ.
1992.
3. Po'latov A., Muhamedova S. Kompyuter lingvistikasi. – Toshkent, 2007.
4. Р. Г. Пиотровский. Текст, машина, человек. – М.: Просвещение.
1989.
5. Белоногов Г.Г. Компьютерная лингвистика и перспективные
информационные технологии. - М.: Русский мир, 2004.
Kompyuter lingvistikasida avtomatik tahrir, information qidiruv
tizimlari va gipertekst texnologiyasi
Reja
1. Avtomatik tahrir yo’nalishi.
2. Informatsion qidiruv tizimlari.
3. Gipertekst texnologiyasi.
Tayanch so’z va iboralar: matn tahriri, mexanik xatolar, matn
muharrirlari, avtomatik tahrir, tezaurus, deskriptor, gipertekst, kontekstli qidiruv,
avtomatik referatlash,transliteratsiyalash, informatsion qdiruv tizimlari,manzilli
qidiruv, semantik qidiruv, faktografik qidiruv, hujjatli qidiruv, indekslash,
gpermedia.
Avtomatik tahrir kompyuter lingvistikasining asosiy yo’nalishlaridan biri
bo’lib, u kompyuterdagi matn muharrirlari ( Microsoft Word, Excel, Wordpad,
Lexicon) rivojlanishi bilan bog’liqdir. Bilamizki, avtomatik tahrir deganda
matndagi mexanik xatolarning avtomatik tarzda to’g’rilanishi va xato ekanligi
haqidagi signallarning userga taklif etilishi kabilar bilan bog’liq. Buni aniq
misollar bilan tushuntiriladigan bo’lsa, Microsoft Word dasturi bilan ishlar
ekanmiz, unda so’zlarning yozilishi bilan bog’liq xatolar bo’lsa, ularning ostiga
qizil yoki ko’k rangda ostiga chizilishi, katta harf bilan yozilishi kerak bo’lgan
so’zlarning avtomatik bosh harfga o’tkazilishi, hujjatga avtomatik numeratsiya
qo’yilishi kabilar avtomatik tahrir erishgan yutuqlar hisoblanadi.
92
Avtomatik tahrir yo’nalishi XX asrning o’rtalariga kelib rivojlandi. U matn
muharrir dasturlari bilan birgalikda yangicha imkoniyatlar bilan, qo’shimcha
effektlar bilan rivojlanmoqda. U oddiy muharrirlardan farqi shundaki, unda tahrir
avtomatik tarzda qisqa vaqt birligi ichida hajman katta bo’lgan matnni tez
tekshirish va xatolarni to’g’rilash imkoniyati bo’ladi. Avtomatik tahrirning
pragmatik ahamiyati shundaki, u kelajakda taraqqiy etsa, yetarli ma’lumotlar
bazasi yaratilsa va maxsus dasturlar ishlab chiqilsa, muharrir kasbi uchun ehtiyoj
qolmaydi. Bu esa matn bilan ishlashni osonlashtiradi.
Ma’lumki, kompyuter yaratilmasidan ilgari matnlar yozuv mashinkalarida
terilgan, bu jarayonda orfografik, punktuatsion, stilistik va grammatik xatolarga
yo’l qo’yilsa, matnni boshdan oxirigacha qayta yozib chiqishga to’g’ri kelgan, bu
esa foydalanuvchiga noqulaylik tug’dirgan. Kompyuterda esa matnni tahrirlash bir
muncha qulay bo’lib, unda foydalanuvchi dialogli rejimda ishlaydi va o’z o’rnida
xatolarni to’g’rilash imkoniyatiga ega bo’ladi. Hatto matn bilan ishlash jarayonida
biz yuqorida ta’kidlab o’tgan avtomatik tahrirlash, xatolarni to’g’rilash imkoniyati
ham mavjud. Shu o’rinda alohida ta’kidlash zarurki, avtomatik tahrirlash tizimi
faqat matn muharrirlari dasturlari bazasiga qo’shilgan tillarda amal qiladi, masalan,
ingliz, rus, nemis, fransuz tillarida. Agar bazada mavjud bo’lmagan tilda matn
kiritilsa, uni avtomatik tahrirlay olmaydi, ayrim internatsional so’zlar bundan
mustasno. Avtomatik tahrirlash jarayonida MS Word lug’atida mavjud bo’lmagan
so’z uchrasa, ostiga qizil chiziq bilan ajratib ko’rsatiladi. Mazkur holat quyidagi
sababga ko’ra bo’lishi mumkin, bunda o’sha so’z imlosi haqida dastur variant
taklif eta olmaydi, chunki Ms Word lug’atida bu so’z mavjud emas. Ehtimol u so’z
tog’ri yozilgan bo’lishi mumkin, bunda insonning ishtiroki zarur bo’ladi. Agar bu
so’zning imlosi to’g’ri bo’lsa, u matnda yana tez-tez qayta ishlatilsa, uni
avtokorreksiyada to’g’ri deb sanalishi uchun Ms Word lug’atiga “kiritib qo’yish”
(kontekst menyudagi “add” yoki “добавить” komandasi yordamida) mumkin.
Matn kiritish davomida so’z yoki so’zlar birikmasi ko’k chiziq bilan ajratib
qo’yiladi, bunda so’zning imlosida xato mavjud. Bu holda foydalanuvchi xatoni
o’zi tog’rilab qo’yishi zarur yoki ostiga chizilgan so’zda sichqonchaning o’ng
tomoni bosilsa, kontekst menyusida so’zning to’g’ri varianti taklif etiladi va uni
tanlashi zarur bo’ladi.
Avtomatik tahrirlash tizimi juda ko’p amaliy vazifalarni o’z ichiga oladi.
Bu vazifalarning eng asosiylarini umumlashtirib sanab o’tmoqchimiz:
- orfografiyani tekshirish;
- grammatika va stilistikani tekshirish;
- kontekstli qidiruv;
- formatlash;
93
- avtomatik referatlash – matndagi kalit so’zlar asosida uning umumiy
mundarijasini yaratish;
- matn ichiga jadval, rasm, turli figuralar, klip-artlar, grafik sxemalar,
diagrammalar qo’shish, giperhavolalar bilan ta’minlash;
- matndagi abzatslar, belgilar, so’zlarning aniq miqdorini aniqlash
(statistikasini ko’rsatish);
- tezaurus xizmati – matndagi muayyan so’zning sinonimik variantlarini
aniqlash;
- transliteratsiyalash – bir alifbodan boshqa alifboga o’tkazish (masalan,
kirill alifbosidan lotin alifbosidagi harfga almashtirish).
Avtomatik tahrirda uch tarkibli asosiy vazifa e’tiborga olinishi lozim:
1. Orfografiyani tekshirish – bu vazifa morfologik tahlil yordamida amalga
oshiriladi, bunda etalon lug’atdagi baza asosida tekshiriladi.
2. Sintaksisni tekshirish orfografiyani tekshirishdan ko’ra murakkabroq.
Chunki orfografiyani tekshiruvchi dasturlar yaratilgan, lekin norasmiy matnlarning
sintaktik jihatdan avtomatik tahriri masalasi haligacha hal etilgani yo’q. Rasmiy
matnlarning avtomatik tahriri bo’yicha muhim natijalarga erishilgan.
3. Semantik tahrirlash inson tafakkurini modellashtirishga asoslangan
sun’iy intellekt tizimi bilan bog’liq ravishda o’rganilmoqda. Bunda mazkur ko’p
aspektli muammoni semantik maydon, freym yondashuv, tezauruslar tizimini
boyitish, so’z va so’z birikmalari o’rtasidagi paradigmatik munosabatlar
(sinonimiya, gipo-giperonimik-tur-jins munosabati)ni modellashtirishga tatbiq
etish asosida hal etish mumkin. Chunki inson bunday assotsiativ munosabatlarni
o’z intellektiga tayanib o’rnata oladi, biroq bu jarayon kompyuter uchun
murakkabdir.
Ms Word dasturida orfografiyani tekshirish imkoniyati cheklanganligi bois
hozirgi kunda maxsus Spell Checker dasturlar yaratilmoqda. Bunday dasturlar
sirasiga quyidagilarni kiritish mumkin: SpellLink Multilingual Pro (ingliz, ispan,
italyan, nemis, fransuz, portugal, ukrain tillaridagi so’zlarning to’g’ri yozilishini
tekshiradi), Orfo SpellLink English, SpellLink French, SpellLink Italian, SpellLink
Spanish, Ruta 1.0 (rus va ukrain tillaridagi so’zlarning imlosini tekshirishga
yordam beradi), Asutype, Spellex, Spell Catcher kabi. Mazkur dasturlar Word
dasturi ustiga qo’shimcha o’rnatiladi. Masalan, aniqroq tasavvur hosil qilish uchun
bu dasturlarning orfografiya tekshirish jarayonini ko’rsatib o’tmoqchimiz.
94
95
96
97
Kompyuter lingvistikasining muhim yo’nalishlaridan yana biri information
qidiruv tizimlari (IQT) hisoblanadi. Ular formal belgilarga ko’ra informatsiyani
qidirishga mo’ljallangan. IQTlar quyidagi bosqichlar asosida ishlaydi:
• informatsiyani jamlash
• informatsiyani klassifikatsiya qilish
• hujjatning qidiruv obrazi (HQO)ni yaratish
• hujjatning qidiruv obrazi va hujjatlarni saqlash
• qidirish va natijani chiqarish.
|