• Kalit so’zlar
  • Foydalanilgan adabiyotlar ro’yxati
  • Avtomatik tarjima sohasida olmoshlarni tahlil qilish muammolari




    Download 46.5 Kb.
    Sana01.12.2022
    Hajmi46.5 Kb.
    #32680
    Bog'liq
    maqola 1
    gost-16130-90, 6-ma\'ruza

    AVTOMATIK TARJIMA SOHASIDA OLMOSHLARNI TAHLIL QILISH MUAMMOLARI.

    Qodirova Madinabonu Murodjon qizi,


    Namangan davlat universiteti magistranti,
    E-mail: begonammmm@gmail.com


    Annotatsiya: Tilshunoslikda olmosh so’z turkumi til xususiyatlaridan kelib chiqib turli vaziyatlarda qo’llanishi mumkin. Ular o’zi mustaqil leksik ma’noga ega bo’lmaganliklari sababli turli xil atash ma’nolariga ega so’zlarga ishora qiladi. Bu esa matnni bir tildan ikkinchi tilga avtomatik tarjima qilishda turli g’alizliklarni keltirib chiqarishi mumkin. Ushbu maqola tilshunoslikning aynan shu sohasiga oid muammolar va ularning yechimlariga bag’ishlangan.
    Kalit so’zlar: kompyuter tilshunosligi, tabiiy tilni qayta ishlash(NLP), mashina tarjimasi (MT), nutqni avtomatik ravishda tanib olish (ATR), matndan nutqqa (TTS), sun'iy aql, model, sintaktik tuzilish.


    PRONOUN PARSING PROBLEMS IN THE FIELD OF AUTOMATIC TRANSLATION.


    Abstract: In linguistics, the word group of pronouns can be used in different situations depending on the characteristics of the language. Since they do not have an independent lexical meaning, they refer to words with different meanings. This can cause various errors in the automatic translation of text from one language to another. This article is dedicated to the problems and their solutions related to this field of linguistics.
    Keywords: computational linguistics, natural language processing (NLP), machine translation (MT), automatic speech recognition (ATR), text-to-speech (TTS), artificial intelligence, model, syntactic structure.

    Kompyuter tilshunosligi sohasida o'nlab yillar davomida butun dunyo tilshunoslarini qiynayotgan muammolarning uzoq ro'yxati mavjud. Tabiiy tilni qayta ishlash (NLP) va mashina tarjimasi (MT) kabi fanlar, shuningdek nutqni avtomatik ravishda tanib olish (ATR) va matndan nutqqa (TTS) o'xshash nutq texnologiyalarini yaratish sohalari so'nggi bir necha yil ichida birmuncha muvaffaqiyat qozongan bo'lishiga qaramay, hali ham ularda odamlarning muloqotiga xos bo'lgan tabiiylik mavjud emas.


    Kompyuter lingvistikasi mashinalarning tabiiy inson tilini avtomatik ravishda qayta ishlash va talqin qilish usullarini o'rganadi. Ushbu sohadagi tadqiqotlar tabiiy tilning mantiqiy va matematik xususiyatlari bilan ishlashga qaratilgan bo'lib, tillarni qayta ishlash algoritmlari va modellarini ishlab chiqish, tillarni mashina orqali tarjima qilish va sun'iy aqlni stimulyatsiya qilish kabilarni o’z ichiga oladi.
    Kompyuterlar deyarli barcha sohalarda inson tilini qayta ishlaydi. Hisoblash lingvistikasi ushbu jarayonlarni osonlashtiradigan usullarni ishlab chiqadi va tahlil qiladi. Shuningdek, tilning mohiyati, masalan, morfologiya va sintaksisning asosiy lingvistik masalalari, masalan, ba'zi bir gaplarning to'g'riligini baholash kabi murakkab dasturlarni yaratishga asos bo’ladi.
    Ushbu tahlillardan modellar olingan bo'lib, ular mashinalarga tilni yanada samarali ishlashiga yordam beradi. Hisoblash lingvistikasi mashinalarning inson suhbatlariga iloji boricha real taqlid qilishiga imkon beradigan sun'iy intellekt va dasturlarni ishlab chiqishda asosiy rol o’ynaydi.
    Kompyuter lingvistikasi fani bir qator qoidalar va protseduralarni ishlab chiqishga harakat qiladi. Hozirgi kunda so’zlarni kompyuter tilida tahlil qilish mumkin. Fanning galdagi asosiy vazifalari: gaplarning sintaktik tuzilishini tanib olish yoki olmoshlarning havolalarini hal qilish.
    Tabiiy tilni qayta ishlashdagi eng muhim muammolardan biri bu noaniqlik muammosi. Bu muammo aynan olmoshlar orqali yuzaga keladi. Jumladan,
    (1) Men qizchani durbin bilan ko'rdim. U juda chiroyli.
    Bu yerda “u” olmoshi ‘qiz’, ‘durbin’ so’zlaridan qay biriga ishora qilayotgani haqida menda ma’lumot yo’q. Yoki,
    (2)Yong’in xavfsizligi xodimi dedi: “Mashinangiz yonida yonuvchi axlat uyumi turibdi. Siz undan xalos bo’lishingiz kerak”.
    Siz “bu” so'zini axlat uyumiga yoki mashinaga ishora qilyapti deb tushuningiz, bu harakatingizda keskin farqlarga olib keladi. Bu kabi noaniqliklar og'zaki nutqlarda va yozma matnlarda keng tarqalgan. Ko'pgina noaniqliklar bizning e'tiborimizdan chetda qoladi, chunki biz ularni dunyo va kontekst haqidagi bilimlarimizdan foydalanib juda yaxshi hal qilamiz. Ammo kompyuter tizimlari dunyo haqida juda ko'p ma'lumotga ega emas va kontekstdan ham yaxshi foydalana olmaydi.
    Bunday mavhumlik muammosini hal qilish bo'yicha harakatlar ikkita potensial yechimga yo'naltirilgan: bilimga asoslangan va statistik yechim.
    Bilimga asoslangan yondashuvda tizimni ishlab chiquvchilar dunyo haqidagi ko'plab bilimlarni kodlashlari va undan matnlarning ma'nosini aniqlashda foydalanish tartibini ishlab chiqishlari kerak. Yuqoridagi ikkinchi misol uchun ular axlat uyumi va avtoulovlarning nisbiy qiymati, "axlat" va "qutulish" tushunchalari o'rtasidagi chambarchas bog'liqlik, o't o'chiruvchilarning alangalanadigan narsalarga bo'lgan xavotiri to'g'risida faktlarni kodlashlari kerak va hokazo. Ushbu yondashuvning afzalligi shundaki, u odamlarning tilni qayta ishlash uslubiga o'xshaydi va shu bilan uzoq muddatda muvaffaqiyat qozonishi mumkin. Kamchiliklari shundaki, zarur bo'lgan dunyo bilimlarini kodlash uchun qilingan sa'y-harakatlar juda katta va bilimlardan foydalanish bo'yicha ma'lum protseduralar juda samarasiz.
    Statistik yondashuvda izohli ma'lumotlarning katta korpusi talab qilinadi. So'ngra tizim ishlab chiquvchilari so'zlar yoki so'zlar turkumlari va boshqa osonlikcha aniqlangan shartlarni hisobga olgan holda, noaniqliklarning eng aniq yechimlarini hisoblaydigan protseduralarni yozadilar. Masalan, “so’z - belgi” juftliklarini to'plash va ulardan qay biri ko’proq uchrashi statistik tahlil qilinadi. Korpusda “qiz chiroyli” juftligi “durbin chiroyli”ga qaraganda ko’p uchraydi. Kompyuter buni statistika qiladi va eng ko’p qo’llanganini tanlaydi. Ushbu yondashuvning afzalliklari shundaki, izohli korpus mavjud bo'lgandan so'ng, undan istalgan nutqiy vaqtda foydalanish mumkin va u juda samarali. Kamchiliklari shundaki, kerakli izohli korpuslarni yaratish juda qimmatga tushadi va usullar noto'g'ri tahlillarni keltirib chiqarishi ham mumkin.
    Qolaversa, bunda nutqiy vaziyat hisobga olinmaydi. Bu jihatdan olganda, kompyuter lingvistikasi uchun bilimga asoslangan metodni statistik metod bilan birga qo’llash samaraliroq hisoblanadi. Bunda so’zlar assotsiativ tarkibda kompyuter xotirasida saqlanadi va ular statistik tahlil qilinadi. Quyidagi matnga e’tibor bering:
    Kitob hech qachon “qarimaydigan”, oʻz maʼnaviy mulkini avloddan-avlodga eltuvchi sehrgardir. “Kitob – aql farzandlari. U insonga qanot bagʻishlaydi, ilk hayot parvoziga dalda beradi”, – degan edi mutafakkirlardan biri.(“Oila davrasida” gazetasidan)
    Matnda quyidagi assotsiatsiyalarni ko’rish mumkin:

    1. kitob, ma’naviy, kitob, aql, mutafakkir, degan edi;

    2. mulk, farzand, avloddan-avlodga;

    3. qanot, parvoz;

    4. degan edi, dalda beradi;

    5. sehrgar.

    Demak, “u” olmoshi o’rniga (1) guruh birliklaridan biri tanlanadi.


    Foydalanilgan adabiyotlar ro’yxati:
    1. Пўлатов А. «Компьютер лингвистикаси». — Тошкент: Академнашр, 2011. — 520 б.
    2. Гришман Р. Computational linguistics // Cambridge University Press. — 1994. — № 24.
    3. Журафский Д., Мартин Ж. Speech and language processing. — USA, 2000. — 950 p.
    4. http://ziyonet.uz 5. http://elziyouz.blogspot.com
    Download 46.5 Kb.




    Download 46.5 Kb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Avtomatik tarjima sohasida olmoshlarni tahlil qilish muammolari

    Download 46.5 Kb.