|
Morfologik tahlil (leksik tahlil) - (Part-of-Spech-tagging)
|
bet | 10/27 | Sana | 20.11.2023 | Hajmi | 294 Kb. | | #102034 |
Bog'liq Amaliy matemarika va axborot texnologiyalari” kafedrasi SadullayMorfologik tahlil (leksik tahlil) - (Part-of-Spech-tagging).
Morfologik tahlilning asosiy masalasi - har bir so’z qaysi turkumga tegishli ekanligini aniqlash va barcha unga tegishli bo’lgan morfologik atribut (xususiyatlar) larning qiymatlarini aniqlashdir. Agar berilgan so’z uchun uning qanchalik ko’p atributlarining qiymatlari aniqlansa so’z shunchalik aniq tahlil qilingan bo’ladi. Rus tili uchun mavjud morfologik tahlilchilar taxminan 100 foiz aniqlikda tahlil qiladilar va asosan A.A. Zaliznyakning morfologik lug’atiga asoslanganlar. Ingliz tili so’zlari uchun ehtimollik nazariyasiga asoslangan tahlilchilar - 90% va undan yuqoriroq foiz aniqlikda ishlaydi va Myullerning morfologik lug’ati asosida qurilgan . Nemis tili uchun ham shunga o’xshash natijalar olingan.
So`zning morfologik analizi ularning turli xil shakllarini bir xil deb qarab sintaktik va semantik xususiyatlari haqida axborotlarni olishni maqsad qiladi, matn ustida ishlash jarayonida keyingi kerakli bosqichlariga qo`llaniladi.
Morfologik sintez – so`zning turli xil shakllarini olish maqsadida matnli axborotlarni qayta kodlash va uni insonga tushunarli shaklga keltirish.
Morfologik analiz va sintez o`zak so`zlar lug`ati bazasida va xuddi shunday so`z shakkllari lug`ati bazasida qurilishi mumkin. Ko`pincha birinchi yo`lni afzal ko`rishadi, bu kompyuter xotirasini tejash zaruriyati bilan asoslanadi. Ammo hisoblash texnikasining rivojlanishi sababli kompyuter xotirasi hajm jihatdan oshib bormoqda shuning uchun bunday dalillar asosida tanlash hamisha muvaffaqiyatli bo`lavermaydi. Lug`at asosan tashqi xotirada ma`lumotlarning o`zaro bo`g`liq tuzilmasi shaklida saqlanadi. Bunga xotira tejamkorligi asosiy faktor hisoblanmasdan lug`at tuzilmasi (axtarish jarayonining vaqt tejamkorligi) asosiy o`rinda turadi. Yetarlicha katta hajmga ega bo`lgan massivlarda (bir necha million so`zdan iborat) lug`atlarning ulushi 5% dan oshmaydi.
Morfologik analiz va sintezning turli usullari matnli xabarlarni (bir tildan boshqa tilga) rus tilidan o`zbek tiliga, o`zbek tilidan rus tiliga avtomatik tarjima qilishni tadqiq qilish bilan bog`liq, shu jumladan avtomatlashtirilgan axborot tizimlarini yaratilishi bilan ham aloqador. So`z shakllarining o`zgarishi har xil xarakterlanadi. Bu so`zning o`zagi o`zgarishi va qo`shimcha o`zgarishi bilan bog`liq bo`lishi mumkin. O`zakdagi harfiy tarkib o`rni o`zgaradi, misol uchun, rus tilidagi so`z shakllarining keyingi juftliklari:
Сижу – сидиш, шел – шли, кто – кого, человек – люди ...
Turli so`z shakllarini yaratishda qo`shimchaning o`zgartirilishi asosiy usullardan biridir.
Rus tilida bu ham mustaqil ravishda, ham so`z o`zagining o`zgarishi bilan birgalikda foydalaniladi.
|
| |