• Morxologik belgilash
  • Korpus lingvistikasi book · October 022 citation reads 1,207 author




    Download 4,46 Mb.
    Pdf ko'rish
    bet23/76
    Sana31.05.2024
    Hajmi4,46 Mb.
    #258257
    1   ...   19   20   21   22   23   24   25   26   ...   76
    Bog'liq
    AbjalovaM.KorpLing.Uslubiyqollanma (1)

    KORPUS LINGVISTIKASI
     
    Manzura Abjalova
     
    ~ 31 ~ 
    2)
    sintaktik tahlil yoki parsing 
    – leksik birliklar va turli sintaktik 
    tuzilmalar orasidagi sintaktik munosabatlarni tavsiflash; 
    3)
    semantik
    – berilgan so‘z yoki ibora tegishli bo‘lgan semantik 
    toifalarga va uning ma’nosini aniqlaydigan kichikroq toifalarga ko‘ra 
    tavsiflash; 
    4)
    anaforik
    – referent aloqalarini, masalan, olmoshlar bilan 
    bog‘lanishni izohlash; 
    5)
    prosodik
    – urg‘u va intonatsiyani tavsiflaydigan teglardan 
    foydalanadi; 
    6)
    diskurs 
    – og‘zaki nutq korpusida pauza, takrorlash, eslatma va 
    hokazolarni ko‘rsatish uchun matn maxsus izohlanadi; 
    7)
    stilistik 
    – leksik birlikning uslubiy xoslanishini ko‘rsatadi. 
    Morxologik belgilash
    ning asosiy birligi – bu belgilar zanjiri sifatida 
    tushuniladigan va odatda, oddiy so‘zshaklga teng bo‘lgan matniy shakl 
    yoki 
    token
    . Bunday ramziy holat kompyuter dasturining ishi uchun zarur 
    hisoblanadi. Matndagi tokenlarni alohidalash jarayoni 
    tokenizatsiya
    deyiladi. Ayrim adabiyotlarda 
    grafematik tahlil
    ham deb beriladi. Shuni 
    ta’kidlash joizki token nafaqat korpus lingvistikasining, malki boshqa 
    sohalarga ham tegishli termin bo‘lib, asosan, probel (bo‘shliq)dan 
    probelgacha bo‘lgan belgi token hisoblanadi. Korpus obyekti matn, eng 
    kichik birligi so‘z (so‘zshakl) hisoblangani uchun korpus lingvistikasida 
    token sifatida so‘z va so‘z shakllar e’tiborga olinadi. 
    Korpusda tokenizatsiya bilan birga yana bir muhim jarayon bor. Bu 
    bosqich korpusga kiritilgan ma’lumotlarni qayta ishlash uchun muhim 
    sanaladi. 
    Lemmatizatsiya
    deb nomlangan bu jarayonda so‘zshakl 
    boshlang‘ich shakli avtomatik tarzda aniqlanadi, boshlang‘ich shaklning 
    o‘zi 
    lemma
    deyiladi. Lemmatizatsiya flektiv tillar uchun juda muhim. 
    Sababi lemmatizatsiya jarayonida fleksiyaga uchragan so‘zning asosi 
    tiklanadi. Masalan, 
    copies → copy, bases → basis, oxen → ox; вижу → 
    видить, иду → идти, пальчик → палец.
    Ma’lumki, deyarli barcha mamlakat xalq ta’limi maskanlarida 
    boshlang‘ich sinflaridanoq o‘quvchi gapni o‘qiydi va undagi ot, sifat, 



    Download 4,46 Mb.
    1   ...   19   20   21   22   23   24   25   26   ...   76




    Download 4,46 Mb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Korpus lingvistikasi book · October 022 citation reads 1,207 author

    Download 4,46 Mb.
    Pdf ko'rish