12
Bundan tashqari, n-gramm tabiiy tillarni qayta ishlashda keng qo‘l-
laniladi. Tabiiy tilni qayta ishlash sohasida n-gramm, asosan, ehtimollik
modellari asosida taxmin qilish uchun ishlatiladi. N-grammlik model,
agar avvalgi barcha narsalar ma’lum bo‘lsa, oxirgi so‘z
n-gramm ehti-
molini hisoblab chiqadi. Tilni modellashtirish uchun ushbu yondashuv-
dan foydalanganda, har bir so‘zning paydo bo‘lishi faqat oldingi so‘zlar-
ga bog‘liq deb taxmin qilinadi.
1
N-grammning yana bir qo‘llanilishi plagiatni aniqlashdir. Agar siz
matnni n-grammlar tomonidan taqdim etilgan bir nechta
kichik qismlar-
ga ajratsangiz, ularni bir-biri bilan taqqoslash oson va shuning uchun
tahlil qilingan hujjatlarning o‘xshashligi.
2
N-grammlar odatda matn va
tilni tasniflash uchun muvaffaqiyatli ishlatiladi. Bundan tashqari, ular
matnli ma'lumotlardan bilim olish imkonini beruvchi xususiyatlarni
yaratish uchun ishlatilishi mumkin. N-grammdan
foydalanib, so‘zlarni
imlo xatolari bilan almashtirish uchun nomzodlarni samarali topish
mumkin.
N-grammni tez-tez ishlatish bilan bog‘liq holda, turli muammolarni
hal qilish uchun ularni matndan chiqarish uchun ishonchli
va tezkor al-
goritm kerak. N-grammni olish uchun mos vosita cheksiz matn hajmi bi-
lan ishlashi, mavjud resurslardan tez va samarali foydalanishi kerak.
Matndan n-grammni olishning bir necha usullari mavjud. Ushbu usullar
turli tamoyillarga asoslangan:
●Yapon tilidagi matnlar uchun Nagao 94 algoritmi;
●Lempel Algoritmi-Ziva-Velcha;
●Suffix qator;
●Suffix daraxti;
●Teskari indeks.
Sintaktik n-grammlar matnning chiziqli
tuzilishi emas, balki sintak-
tik bog‘liqliklar yoki tarkibiy daraxtlarning daraxtlaridagi yo‘llar bilan
aniqlangan n-grammdir. Sintaktik n-grammlar sintaktik strukturani chi-
ziqli n-grammdan farqli ravishda aks ettiradi va lineer n-grammlar bilan
bir xil
ilovalarda, shu jumladan, vektor modelida belgilar sifatida ishlati-
lishi mumkin. Sintaksik n-grammdan foydalanish, masalan, mualliflikni
aniqlash uchun standart n-grammdan foydalanishdan ko‘ra muayyan
muammolarni hal qilishda yaxshiroq natijalar beradi.
1
Jurafsky D. and Martin J.H. Speech and Language Processing: An Introduction to Natural Language Processing,
Computational Linguistics, and Speech Recognition. Pearson Prentice Hall, 2009, p. 988.
2
Proceedings of the ITAT 2008, Information Technologies.
Applications and Theory, Hrebienok, Slovakia, p. 23‒
26, September, 2008.