|
Korpus lingvistikasi book · October 022 citation reads 1,207 authorBog'liq AbjalovaM.KorpLing.Uslubiyqollanma (1)KORPUS LINGVISTIKASI
Manzura Abjalova
~ 29 ~
Men
o‘g‘lim
bilan
faxrlanaman.
Ayon bo‘lganidek, gap boshidagi LB
Men
olmoshi
ekanligi haqida belgi berilgan.
Yoki yana
Samimiyatni o‘zingizga bezak qilib oling – deydilar
onajonim.
Ushbu gapdagi “
Samimiyatni o‘zingizga bezak qilib oling
” qismi
va
teglarida berilgan, bu teg ko‘chirma gap (direct speech –
ds)ni anglatadi.
Og‘zaki nutq korpuslarida
tegi toq holda qo‘llanilishi
mumkin. Uning ochuvchi yoki yopuvchi ekanligi ahamiyatsiz bo‘ladi.
Bu teg qo‘yilgan o‘rinda to‘xtam bo‘lganligini anglatadi.
Teglar qisqa belgi yoki ramzlardan iborat bo‘ladi. Masalan,
sifat –
sif, fe’l – f, noun – N, verb – v
tarzida. Teglar foydalanuvchiga
ko‘rinmaydi. matnni Annotatsiyalangan ko‘rsatadigan dastur teglarni
o‘ziga xos qoidalarga muvofiq izohlaydi va foydalanuvchiga shu
qoidalarga muvofiq shakllantirilgan matnni taqdim etadi.
Avtomatik annotatsiyalash / teglash.
Katta hajmli korpuslarni
teglash ko‘p vaqt va mablag‘ni talab qiladi. Shu bois XX arsning 70-
yillarida annotatsiyalashni kompyuter orqali qilish loyihalari paydo bo‘la
boshladi. Shunda TAGGIT dasturi Braun korpusining 77 % so‘zining
turkumlarini teglagan. Qolgan 23 % esa o‘n yil davomida qo‘lda
teglangan. 80-yillarda CLAWS (Constituent Likelihood Automatic
Word-tagging System) tizimining teglash ko‘rsatkichi 95 %ga chiqdi.
Unda ehtimollik nazariyasi tatbiq qilingan. Bu haqda quyida ma’lumot
berildi. Bugungi kunda asosiy Yevropa tillarining so‘z turkumlarini
avtomatik teglash (morfologik tahlil, word-class tagging) va gap
bo‘laklarini avtomatik teglash (sintaktik tahlil, parsing) tizimlari ishlab
chiqilgan. Bu imkoniyatlar Internet qidiruvi vs mashina tarjimasida ham
zarur sanaladi. Shuningdek, “Matnlarni avtomatik qayta ishlash”
(http://www.aot.ru) nomi bilan rus tilini kompyuter texnologiyalari
yordamida qayta ishlash imkoniyatlari yaratildi. Rossiya davlat
|
| |