• J.Sobirov (UrDU Axborot texnologiyalari kafedrasi magistranti)
  • Oʻzbekiston respublikasi oliy va oʻrta maxsus ta’lim vazirligi urganch davlat universiteti




    Download 1.94 Mb.
    Pdf ko'rish
    bet67/99
    Sana20.02.2023
    Hajmi1.94 Mb.
    #42897
    1   ...   63   64   65   66   67   68   69   70   ...   99
    Bog'liq
    Istedod ziyosi 2022 (2)
    10 Informatika Savollar UZB, 2 sinf 2 chorak matem, 3- 4 - MAVZU (1), 88888888888, Psixologik xizmatning o`rni va ahamiyati, 13-mavzu, 602629, ADSL, 11-sinf-Fizika-darslik, [05.10.2022 20 13] ТАШКЕНТ ЮЖНЫЙ НУКУС, Health food, О КУРСЕ, 15.Mehnat muhofazasi va texnika xavfsizligi hivWBz9, Tarmoqlar komp
    Foydalanilgan adabiyotlar: 
    1. 
    OʻzME. Birinchi jild. Toshkent, 2000-yil 
    2. Sanches E., Garcia D., Carballo C.&Crespo M. (1997). Foenikulum 
    vulgare tegirmonini farmakognostik o‘rganish (Arpabodiyon). Kubalik dorivor 
    o‘simliklar jurnali, 2 (1), 19
    ‒24-betlar. 
    3. M.A.Dar, B.A.Sofi, S.N.Bhat, B.A.&Qurishi M.A. (2016). Foenikulum 
    vulgare: uning an’anaviy ishlatilishi, fitokimyo, farmakologiya va xavfsizligini har 
    tomonlama ko‘rib chiqish. Arab kimyo jurnali, 9, S1574-S1583. 
    4. Foeniculum vulgare tegirmoni (2007) Asturnatura DB. Qayta tiklangan: 
    asturnatura.com 
     
    OʻZBEK TILI KORPUSI UCHUN MATNLARNI SINTAKTIK VA 
    MORFOLOGIK TEGLASH ALGORITMINI YARATISH 
    M.S.Sharipov (UrDU Axborot texnologiyalari kafedrasi dotsenti, f-m.f.n.), 
    R.Sh.Baltayev (Al-Xorazmiy nomidagi TATU Urganch filiali magistranti), 
    J.Sobirov (UrDU Axborot texnologiyalari kafedrasi magistranti) 
     
    Mazkur maqolada 
    oʻzbek tili uchun teglangan korpus yaratish maq-
    sadida korpusdan olingan gaplarni sintaktik va morfologik teglash algo-
    ritmini yaratish jarayoni yoritib berilgan. Teglangan korpusni yaratish 
    uchun mijoz server asosida ishlovchi web ilova uchun algoritm loyiha-
    langan, sintaktik va morfologik teglarning roʻyxati shakllantirilgan ham-
    da web interfeys ishlab chiqilgan.
    Hozirgi kunda tabiiy tillar jarayonini qayta ishlash (NLP
    ‒Natural 
    language processing) ilmiy, iqtisodiy va madaniy sohalarda muhim hi-
    soblanadi. Bu soha jadallik bilan rivojlanmoqda. NLP 
    ‒ sanoat sohasi, 


    162 
    biznes ma’lumotlarni tahlil qilish, web dasturlarni ishlab chiqish, korpus 
    tilshunosligi, informatika va sun’iy intellekt orqali hisoblash kabi soha-
    larni ham qamrab olgan. Internet axborot tarmogʻida mavjud ma’lumot-
    larning asosiy qismini matnli ma’lumotlar tashkil qiladi. Shuning uchun 
    matnli ma’
    lumotlarni tahlil qilish orqali kerakli axborotlarni olish, oʻz-
    bek tilidagi matnlarni morfologik va sintaktik tahlil qilish masalalari 
    dolzarb hisoblanadi. Shu sababli NLP bilan ishlashda oʻzbek tili korpu-
    sida matnlarni sintaktik va morfologik teglash mu
    him oʻrin egallaydi. 
    Korpus tilshunosligida soʻz turkumlarini teglash, grammatik teglash 
    yoki soʻz turkumlariga ajratish deb ham ataladi, bu matn (korpus)dagi
    soʻzni nutqning ma’lum bir qismiga mos keladigan tarzda belgilash,
    uning ta’rifi va kontekstida
    n kelib chiqqan holda, ya’ni oʻzidan oldin va
    keyin kelgan va oʻzaro bog‘liq ibora, jumla yoki paragrafdagi soʻzlar-
    dir.
    Soʻz turkumlarini teglash shunchaki soʻzlarni soʻz turkumlariga so-
    lishtirishdan 
    koʻra ancha murakkabroq. Chunki soʻz turkumlarini teglash 
    oson narsa emas. Bitta soʻz uchun turli xil kontekst asosida turli xil jum-
    lalarda turli soʻz turkumi vazifasida boʻlishi mumkin.
    1
    Hozirgi kungacha oʻzbek tili uchun teglangan korpus mavjud emas 
    shu sababli tadqiqotning ishidan asosiy maqsad matnlarni teglashning 
    algoritmlarini ishlab chiqish va uning asosida webga asoslangan tizim 
    ishlab chiqish. Buning uchun quyidagi muammolarni hal qilish kerak 
    boʻladi: 
    ●foydalanuvchilarni roʻyxatdan oʻtkazish; 
    ●matnlarni korpusdan oʻqib olish va gaplarga hamda soʻzlarga ajra-
    tish; 
    ●tanlangan gapni foydalanuvchi interfeysiga yuborish; 
    ●teglangan gapni foydalanuvchi ID raqami bilan natijani faylga yo-
    zish; 
    ●har bir gap uch marta teglangandan keyin oxirgi natijani hosil qi-
    lish; 
    ●natijani XML formatda korpusga yozish. 
    Matnlarni sintaktik va morfologik teglash uchun ishlab chiqilgan al-
    goritmning funksional sxemasi quyidagi koʻrinishda bo‘ladi (1-rasm): 
    1
    Axmedova X.I., Yusupova D.M. Kompyuter lingvistikasi: muammolar, yechim, istiqbollar. Alisher Navoiy nomi-
    dagi Toshkent davlat O‘zbek tili va adabiyoti universiteti, respublika I ilmiy-
    texnikaviy konferensiysi, Vol. 1, №.01 
    (2021). 


    163 
    Taklif qilinayotgan algoritm va dasturiy ta’minot yordamida teglan-
    gan matnlardan foydalangan holda stoxastik metodga asoslangan holda 
    teglashni amalga oshirish mumkin.

    Download 1.94 Mb.
    1   ...   63   64   65   66   67   68   69   70   ...   99




    Download 1.94 Mb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Oʻzbekiston respublikasi oliy va oʻrta maxsus ta’lim vazirligi urganch davlat universiteti

    Download 1.94 Mb.
    Pdf ko'rish