• Avtomatik annotatsiyalash / teglash.
  • Korpus lingvistikasi book · October 022 citation reads 1,207 author




    Download 4,46 Mb.
    Pdf ko'rish
    bet21/76
    Sana31.05.2024
    Hajmi4,46 Mb.
    #258257
    1   ...   17   18   19   20   21   22   23   24   ...   76
    Bog'liq
    AbjalovaM.KorpLing.Uslubiyqollanma (1)

    KORPUS LINGVISTIKASI
     
    Manzura Abjalova
     
    ~ 29 ~ 

    Men
    o‘g‘lim
    bilan
     

    faxrlanaman
    Ayon bo‘lganidek, gap boshidagi LB
     
    Men
     

    olmoshi 
    ekanligi haqida belgi berilgan. 
    Yoki yana 
    Samimiyatni o‘zingizga bezak qilib oling – deydilar 
    onajonim. 
    Ushbu gapdagi “
    Samimiyatni o‘zingizga bezak qilib oling
    qismi 

    va 
     
    teglarida berilgan, bu teg ko‘chirma gap (direct speech – 
    ds)ni anglatadi. 
    Og‘zaki nutq korpuslarida 


    tegi toq holda qo‘llanilishi 
    mumkin. Uning ochuvchi yoki yopuvchi ekanligi ahamiyatsiz bo‘ladi. 
    Bu teg qo‘yilgan o‘rinda to‘xtam bo‘lganligini anglatadi.
    Teglar qisqa belgi yoki ramzlardan iborat bo‘ladi. Masalan, 
    sifat – 
    sif, fe’l – f, noun – N, verb – v 
    tarzida. Teglar foydalanuvchiga 
    ko‘rinmaydi. matnni Annotatsiyalangan ko‘rsatadigan dastur teglarni 
    o‘ziga xos qoidalarga muvofiq izohlaydi va foydalanuvchiga shu 
    qoidalarga muvofiq shakllantirilgan matnni taqdim etadi. 
    Avtomatik annotatsiyalash / teglash.
    Katta hajmli korpuslarni 
    teglash ko‘p vaqt va mablag‘ni talab qiladi. Shu bois XX arsning 70-
    yillarida annotatsiyalashni kompyuter orqali qilish loyihalari paydo bo‘la 
    boshladi. Shunda TAGGIT dasturi Braun korpusining 77 % so‘zining 
    turkumlarini teglagan. Qolgan 23 % esa o‘n yil davomida qo‘lda 
    teglangan. 80-yillarda CLAWS (Constituent Likelihood Automatic 
    Word-tagging System) tizimining teglash ko‘rsatkichi 95 %ga chiqdi. 
    Unda ehtimollik nazariyasi tatbiq qilingan. Bu haqda quyida ma’lumot 
    berildi. Bugungi kunda asosiy Yevropa tillarining so‘z turkumlarini 
    avtomatik teglash (morfologik tahlil, word-class tagging) va gap 
    bo‘laklarini avtomatik teglash (sintaktik tahlil, parsing) tizimlari ishlab 
    chiqilgan. Bu imkoniyatlar Internet qidiruvi vs mashina tarjimasida ham 
    zarur sanaladi. Shuningdek, “Matnlarni avtomatik qayta ishlash” 
    (http://www.aot.ru) nomi bilan rus tilini kompyuter texnologiyalari 
    yordamida qayta ishlash imkoniyatlari yaratildi. Rossiya davlat 



    Download 4,46 Mb.
    1   ...   17   18   19   20   21   22   23   24   ...   76




    Download 4,46 Mb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Korpus lingvistikasi book · October 022 citation reads 1,207 author

    Download 4,46 Mb.
    Pdf ko'rish