|
Korpus lingvistikasi book · October 022 citation reads 1,207 authorBog'liq AbjalovaM.KorpLing.Uslubiyqollanma (1)KORPUS LINGVISTIKASI
Manzura Abjalova
~ 35 ~
“
va hokazo
” kabi birikma va belgilar roʻyxatning davomiyligini emas,
balki noaniqligini bildiradi. Shu bois kompyuter lingvistikasida bu kabi
noaniqliklarga yoʻl qoʻyilmaydi, balki har bir lingvistik birlikning tabiati,
xususiyatlari dasturiy ta’minot bazasida aniq koʻrsatilishi talab etiladi.
–
Tilni modellashtirishda teglashtirish qoidalariga asoslaniladi.
STOXASTIK TEGLASH USULI.
Mazkur usul chastota yoki
ehtimollik (statistika)ka asoslanadi. Shu bois ayrim manbalarda statistik
yoxud ehtimolikka asoslangan usul tarzida tushuntiriladi. Ayon
boʻlganidek, oddiy stoxastik teglashda ST teglari uchun quyidagi
metodlardan foydalaniladi:
1. Chastotali yondashuv.
Ushbu yondashuvda stoxastik tegerlar
soʻzning matnda ma’lum bir teg bilan uchrashi ehtimoli asosida
grammatik noaniqliklarni bartaraf etadi. Shuni ham aytish mumkinki,
oʻrganilayotgan toʻplam (matn qismi)da muayyan soʻz bilan tez-tez
qoʻllaniladigan teg oʻsha soʻzning noaniqligiga ma’lumot berishga
yordamchi tegdir. Masalan, qoʻllanilish darajasiga binoan tushun
kelishigidagi soʻzdan soʻng kelgan lingvistik birlik fe’l turkumiga
mansub hisoblanadi:
kitobni oʻqimoq, ismni yozmoq, mamlakatni
aylanib chiqmoq =˃
{W
ni
V}
kabi. Teglash jarayonidagi bunday
yondashuvning asosiy muammosi, u tabiiy tilda birikuvchanligi
boʻlmagan teglar ketma-ketligini keltirib chiqarishi mumkin. Masalan,
“
Doʻstimga kitobni sovgʻa qilish uchun sotib oldim
” misolida
sovgʻa
soʻzi oʻng tomondan “
qilish uchun
” birikmasi bilan birikuvchanlikka
ega, ammo chapdagi soʻz bilan (
kitobni
) na grammatik, na semantik
jihatdan birika oladi. Bunday hollarda teglashtirishda birikuvchanlikka
ega boʻlmagan soʻzlar nomutanosibligiga asoslanish natijasida
morfoanaliz jarayonida notoʻgʻri ma’lumot yuzaga keladi.
|
| |