II BOB.KOMPYUTER LINGVISTIK TA’MINOTIDA O‘ZBEKCHA
MATN USLUBIGA XOS DOLZARB MUAMMOLAR
2.1 Avtomatik tahrir dasturlarida o‘zbekcha matn bilan bog‘liq
muammolar
O‘zbek tilidagi matnlarni avtomatik ravishda tahrir va tahlil qilish
dasturini yaratish bugungi kunning dolzarb masalasiga aylangan
16
.Bunday
dastur tizimining katta imkoniyat va yuqori sifati lingvistik modullarning
mukammal ishlab chiqilgani bilan belgilanadi, ular o‘z navbatida dasturning
bosqichlarini tashkil etadi.
Lingvistik tahrir – bu turli ko‘rinish (ilmiy, badiiy, publisistik va rasmiy
uslublar) dagi matnlarning orfografik, grammatik, stilistik hamda mantiqiy
qurilishdagi xatolarni to‘g‘rilash degani.
Matnlarni tahrir qilish ikki usulda amalga oshiriladi:
1.
Inson tomonidan amalga oshiriladigan tahrir (bevosita tahrir –
muharrirlik ishi).
16
AbjalovaM.A. Matnlarni avtomatik tahrir va tahlil qilish dasturining lingvistik bosqichlari//Yosh olim va
talabalarning respublika ilmiy-amaliy anjumani materiallari. Toshkent-2015, 7-bet.
35
2.
Zamonaviy texnika vositasida amalga oshiriladigan tahrir
(bilvosita, ya’ni avtomatik tahrir).
Keyingi paytlarda axborot almashinuvining jadallashuvi va ma’lumotlar
ko‘lamining tobora kengayib ketayotgani sababli bilvosita tahrirga bo‘lgan
talab oshib bormoqda.
Avtomatik tahrir kompyuter lingvistikasining asosiy yo‘nalishining biri
bo‘lib, u kompyuterdagi matn muharrirlari ( Microsoft Word, Excel, Wordpad,
Lexicon) rivojlanishi bilan bog‘liq holda yuzaga kelgan. Avtomatik tahrir
deganda, kompyuterga kiritilayotgan matnning mexanik xatolari avtomatik
tarzda to‘g‘rilanishi va xato ekanligi haqidagi signallarning foydalanuvchiga
taklif etilishi nazarda tutiladi. Masalan, Microsoft Word dasturi asosida ingliz
yoki rus tilida matn yozsak, unda so‘zlarning yozilishi bilan bog‘liq xatolar
bo‘lsa, kompyuterning o‘zi ularning ostiga qizil yoki yashil rangli to‘lqinli
chiziq chizadi; katta harf bilan yozilishi kerak bo‘lgan so‘zlarni kichik harf
bilan yozsak, ularni avtomatik tarzda bosh harfga o‘tkazadi; bandlarni
avtomatik tarzda raqamlab beradi; xatboshini o‘zi qo‘yadi va hokazo. Bu esa
ishni osonlashtiradi.
Biroq hozirgi paytga qadar mukammal avtomatik tahrir qiladigan
lingvistik dastur yaratilmagan. Kompyuter tahrir dasturi tahrirga qisman
yordam beradi, xolos. Aniqroq qilib aytganda, matnni sintaktik tahrir qilish
dasturi hali yechimini topmagan. Sintaktik tahrirning murakkabligi shundaki,
matnda ko‘chma ma’noli so‘zlar, iboralar, tagma’nolarga ega so‘zlar
ishlatilishi mumkin.
Matnlarni avtomatik tahrir qilishning mukammal va yuqori sifatli
tizimiga erishish uchun unga kiritilayotgan matnlarni nafaqat orfografik va
morfologik jihatdan, balki sintaktik (so‘z birikmasi va gap tahriri), semantik
(matnda qo‘llanilayotgan tushunchalar tahriri) va pragmatik (tushunchalarning
to‘g‘ri qo‘llanilishi va ularni qo‘llash maqsadi tahriri) tahrir qilish
imkoniyatlarini yaratish lozim.
36
Matnlarni to‘liq avtomatik tahrir va tahlil qilish uchun dastur quyidagi
modullarga ega lingvistik modullardan tarkib topishi lozim:
Grafematik tahrir
bosqichida matndagi xatboshi, raqam, punktuatsion va
boshqa ramziy belgilar aniqlanadi, ya’ni so‘z va so‘zshakllarga qadar
tekshiruvni amalga oshiradi. Grafematik tahrir bosqichining maqsadi –
matndagi eng kichik birliklarni ham aniqlash va tasniflashdan iborat. Bunday
birliklarga quyidagilar kiradi: so‘z, xatboshi, tinish belgilari, sanalar, pul
birliklarining ramzlari, so‘z-raqamli birikmalar, sonlar, IP-manzillar va fayl
nomlari, telefon raqamlari. Grafematik tahrir ko‘p bosqichli tahrir qilish
dasturining ilk bosqichi hisoblanib, u keyingi bosqichlarning to‘laqonli va
samarali bo‘lishi uchun asos yaratadi.
Morfologik tahrir
bosqichi asos va shu asosdan yuzaga kelgan
so‘zshakllarni tekshiradi. Morfologik tahrirning maqsadi – faqat orfografik
xatolarni tekshirishdan iborat, deb hisoblash uning vazifa ko‘lamini
toraytiradi. Ushbu bosqichda kiritlayotgan so‘zshaklning qanday asosiy
shakldan qaysi lingvistk parametrlardan yuzaga kelganini aniqlaydi. Bu
keyinchalik bir so‘zning barcha shakllari ustida ishlashga emas, balki asosiy
shaklning qanday lingvistik parametrlarni olish imkoniyatiga egaligi ustida
ish olib borishga turtki beradi. Masalan, ot turkumidagi
kitob
so‘zining
qanday shakl hosil qiluvchi va sintaktik shakl yasovchi qo‘shimchalarni
qabul qilishi hamda ularning kombinatsiyasini biriktirib, so‘zshakllarni hosil
qilish imkoniyati, ya’ni parametrlari dasturning bazasiga kiritiladi. Natijada
kitob
so‘zining barcha shakllari kiritilib, dastur ta’minotidan katta hajm
egallanmaydi, balki asosiy shakl va unga birikishi me’yoriy hisoblangan
lingvistik parametrlar kiritilib, hajm iqtisod qilinadi.
Sintaktik tahlilbosqichi –
matn tahririning eng qiyin bosqichi. Uning
asosiy vazifasi so‘zlarning o‘rnini va ularning o‘zaro birikishini aniqlash
hisoblanadi. Shu bois ushbu bosqichni
tahrir bosqichi
deb emas, balki
lingvistik tahlil bosqichi
, deyish mumkin. Bir so‘zshakl bir qancha so‘zning
grammatik shakliga to‘g‘ri kelishi mumkin. Bunday hollarda so‘zlarni farqlash
37
uchun matn kiritiluvchiga shunday so‘zlar varianti ko‘rsatiladi va matn
teruvchi so‘zlardan muvofig‘ini tanlab qo‘yadi. Ushbu jarayon morfologik
tahrirda ham kuzatiladi. Ya’ni so‘zning xato yozilgani aniqlangach, matn
teruvchiga tanlab qo‘yish imkonini beruvchi so‘zlar variantini taklif etadi.
Sintaktik tahlilda asosiy maqsad so‘zlarning asosiy maqsad so‘zlarning o‘zaro
bog‘lanish me’yorlarini e’tiborga olishdir.
Matnlarni grammatik tahrir qilishda (Grammar checking) kompyuterga
kiritilayotgan matndagi gap strukturasining grammatik jihatdan to‘g‘ri
tuzilganligini tekshiradi. Buning uchun dasturga gaplarning kombinatsiyalarini
kiritish talab etiladi. Shunda gapni dastur kiritilgan ko‘plab me’yoriy
kombinatsiyalar doirasida tekshiradi. Agar gap tuzilish kombinatsiyalariga
muvofiq kelmasa, dastur uni xato deb hisoblaydi va foydalanuvchiga bu
haqda xabar beradi. Grammar checking dasturida faqat grammatik me’yorlar
emas, balki semantika, so‘zlarning ma’nosi hamda mantiqiyligiga ham e’tibor
beriladi. Masalan,
Qush uchmoqda
.
Odam uchmoqda. Devor uchmoqda
gaplari
Grammatik jihatdan to‘g‘ri yozilgan, ya’ni ega+kesim munosabati mavjud (III
shaxs, birlik). Ammo semantikasiga e’tibor bersak, gaplar xato tuzilgan. Chunki
odamning qanoti yo‘q, faqat badiiy matndagina insonning uchishi uchishi
haqida yozish mumkin. Matnlarni kompyuter vositasida qayta ishlashda ilmiy,
rasmiy-idoraviy, axborot doirasidagi matnlar ham e’tiborga olinadi
17
.Keltirilgan
devor uchmoqda
gapining semantikasi esa noto‘g‘ri va gap hech bir uslubga
mos kelmaydi. Chunki devor muqim bir joyda turuvchi, binoning, uyning
tomini ko‘tarib turuvchi yoki xonalarga ajratuvchi tik ko‘tarilgan qismi
18
.
Matnlarni semantik tahlil qilish bosqichida tushunchaga ega so‘zning
o‘rinli qo‘llanilayotgani tekshirib boriladi. Buning uchun dastur ta’minotiga
tezaurus lug‘atlarni kiritish talab qilinadi. Tezaurus ( yunoncha thesaurus –
xazina, boylik) lug‘atning o‘ziga xos maxsus ko‘rinishi bo‘lib, unda lug‘aviy
17
Абжалова М.А. Ўзбек тилидаги матнларни автоматик таҳрирлашда услуб масаласи// Таълим
тизимидаги ижтимоий-гуманитар фанлар, №2, Т.: 2013, 141-145-бетлар.
18
Қаранг: Ўзбек тилининг изоҳли луғати. 1-жилд. Т., 2006., 588-б.
38
birliklar o‘rtasida semantik munosabat (sinonimlar, antonimlar, paronimlar,
giponimlar, giperonimlar va boshqalar) ko‘rsatilgan bo‘ladi.
Zamonaviy texnologiyalarning kundalik turmushimizda muhim o‘rin
egallashi va ilm-fanning rivojlanishi avtomatik tahrir va tahlilning
ahamiyatini oshirmoqda. Avtomatik tahlil faqat matnlardagi mexanik xatolarni
bartaraf etibgina qolmay, matnning savodli yozilishini ham ta’minlaydi, matn
kirituvchiga jumlada xato so‘z borligi haqida xabar berib, uni xatoni bartaraf
etishga undaydi, natijada to‘liq lingvistik me’yorlar darajasidagi matnni yuzaga
keltirishda vaqt tejaladi.
Bunday imkoniyatga erishish uchun, albatta, o‘zbek tili asosida ko‘p
bosqichli avtomatik tahrir dasturining lingvistik ta’minotini mukammal
darajada ishlab chiqish talab etiladi.
|