|
Korpus lingvistikasi book · October 022 citation reads 1,207 authorBog'liq AbjalovaM.KorpLing.Uslubiyqollanma (1)KORPUS LINGVISTIKASI
Manzura Abjalova
~ 31 ~
2)
sintaktik tahlil yoki parsing
– leksik birliklar va turli sintaktik
tuzilmalar orasidagi sintaktik munosabatlarni tavsiflash;
3)
semantik
– berilgan so‘z yoki ibora tegishli bo‘lgan semantik
toifalarga va uning ma’nosini aniqlaydigan kichikroq toifalarga ko‘ra
tavsiflash;
4)
anaforik
– referent aloqalarini, masalan, olmoshlar bilan
bog‘lanishni izohlash;
5)
prosodik
– urg‘u va intonatsiyani tavsiflaydigan teglardan
foydalanadi;
6)
diskurs
– og‘zaki nutq korpusida pauza, takrorlash, eslatma va
hokazolarni ko‘rsatish uchun matn maxsus izohlanadi;
7)
stilistik
– leksik birlikning uslubiy xoslanishini ko‘rsatadi.
Morxologik belgilash
ning asosiy birligi – bu belgilar zanjiri sifatida
tushuniladigan va odatda, oddiy so‘zshaklga teng bo‘lgan matniy shakl
yoki
token
. Bunday ramziy holat kompyuter dasturining ishi uchun zarur
hisoblanadi. Matndagi tokenlarni alohidalash jarayoni
tokenizatsiya
deyiladi. Ayrim adabiyotlarda
grafematik tahlil
ham deb beriladi. Shuni
ta’kidlash joizki token nafaqat korpus lingvistikasining, malki boshqa
sohalarga ham tegishli termin bo‘lib, asosan, probel (bo‘shliq)dan
probelgacha bo‘lgan belgi token hisoblanadi. Korpus obyekti matn, eng
kichik birligi so‘z (so‘zshakl) hisoblangani uchun korpus lingvistikasida
token sifatida so‘z va so‘z shakllar e’tiborga olinadi.
Korpusda tokenizatsiya bilan birga yana bir muhim jarayon bor. Bu
bosqich korpusga kiritilgan ma’lumotlarni qayta ishlash uchun muhim
sanaladi.
Lemmatizatsiya
deb nomlangan bu jarayonda so‘zshakl
boshlang‘ich shakli avtomatik tarzda aniqlanadi, boshlang‘ich shaklning
o‘zi
lemma
deyiladi. Lemmatizatsiya flektiv tillar uchun juda muhim.
Sababi lemmatizatsiya jarayonida fleksiyaga uchragan so‘zning asosi
tiklanadi. Masalan,
copies → copy, bases → basis, oxen → ox; вижу →
видить, иду → идти, пальчик → палец.
Ma’lumki, deyarli barcha mamlakat xalq ta’limi maskanlarida
boshlang‘ich sinflaridanoq o‘quvchi gapni o‘qiydi va undagi ot, sifat,
|
| |