162
biznes ma’lumotlarni
tahlil qilish, web dasturlarni ishlab chiqish, korpus
tilshunosligi, informatika va sun’iy intellekt orqali hisoblash kabi soha-
larni ham qamrab olgan. Internet axborot tarmogʻida mavjud ma’lumot-
larning asosiy qismini matnli ma’lumotlar tashkil qiladi. Shuning uchun
matnli ma’
lumotlarni tahlil qilish orqali kerakli axborotlarni olish, oʻz-
bek tilidagi matnlarni morfologik va sintaktik tahlil
qilish masalalari
dolzarb hisoblanadi. Shu sababli NLP bilan ishlashda oʻzbek tili korpu-
sida matnlarni sintaktik va morfologik teglash mu
him oʻrin egallaydi.
Korpus tilshunosligida soʻz turkumlarini teglash, grammatik teglash
yoki soʻz turkumlariga ajratish deb ham ataladi, bu matn (korpus)dagi
soʻzni nutqning ma’lum bir qismiga mos keladigan tarzda belgilash,
uning ta’rifi
va kontekstida
n kelib chiqqan holda, ya’ni oʻzidan oldin va
keyin kelgan va oʻzaro bog‘liq ibora, jumla yoki paragrafdagi soʻzlar-
dir.
Soʻz turkumlarini teglash shunchaki soʻzlarni soʻz turkumlariga so-
lishtirishdan
koʻra ancha murakkabroq. Chunki soʻz turkumlarini teglash
oson narsa emas. Bitta soʻz uchun turli xil kontekst asosida turli xil jum-
lalarda turli soʻz turkumi vazifasida boʻlishi mumkin.
1
Hozirgi kungacha oʻzbek tili uchun teglangan korpus mavjud emas
shu sababli tadqiqotning ishidan asosiy maqsad matnlarni teglashning
algoritmlarini ishlab chiqish va uning asosida webga asoslangan tizim
ishlab chiqish. Buning uchun quyidagi muammolarni hal qilish
kerak
boʻladi:
●foydalanuvchilarni roʻyxatdan oʻtkazish;
●matnlarni korpusdan oʻqib olish va gaplarga hamda soʻzlarga ajra-
tish;
●tanlangan gapni foydalanuvchi interfeysiga yuborish;
●teglangan gapni foydalanuvchi ID raqami bilan natijani faylga yo-
zish;
●har bir gap uch marta teglangandan keyin oxirgi natijani hosil qi-
lish;
●natijani XML formatda korpusga yozish.
Matnlarni sintaktik va morfologik teglash uchun ishlab chiqilgan al-
goritmning funksional sxemasi quyidagi koʻrinishda bo‘ladi (1-rasm):
1
Axmedova X.I., Yusupova D.M. Kompyuter lingvistikasi: muammolar, yechim, istiqbollar. Alisher Navoiy nomi-
dagi Toshkent davlat O‘zbek tili
va adabiyoti universiteti, respublika I ilmiy-
texnikaviy konferensiysi, Vol. 1, №.01
(2021).
163
Taklif qilinayotgan algoritm va dasturiy ta’minot yordamida teglan-
gan matnlardan foydalangan holda stoxastik metodga asoslangan holda
teglashni amalga oshirish mumkin.