Oʻzbekiston respublikasi oliy va oʻrta maxsus ta’lim vazirligi urganch davlat universiteti




Download 1.94 Mb.
Pdf ko'rish
bet5/99
Sana20.02.2023
Hajmi1.94 Mb.
#42897
1   2   3   4   5   6   7   8   9   ...   99
Bog'liq
Istedod ziyosi 2022 (2)
10 Informatika Savollar UZB, 2 sinf 2 chorak matem, 3- 4 - MAVZU (1), 88888888888, Psixologik xizmatning o`rni va ahamiyati, 13-mavzu, 602629, ADSL, 11-sinf-Fizika-darslik, [05.10.2022 20 13] ТАШКЕНТ ЮЖНЫЙ НУКУС, Health food, О КУРСЕ, 15.Mehnat muhofazasi va texnika xavfsizligi hivWBz9, Tarmoqlar komp
 
N-GRAMM – LEKSIK MODELI HAQIDA 
R.Daubayeva (Kompyuter lingvistikasi mutaxassisligi 2-kurs magistranti) 
 
N-gramm – bu n elementlarning ketma-ketligi.
1
Semantik nuqtai 
nazardan, bu tovushlar, so‘zlar yoki harflar ketma-ketligi bo‘lishi mum-
kin. Amalda, n-gramm bir qator so‘zlar sifatida keng tarqalgan, barqaror 
iboralar qo‘ng‘iroq deb ataladi. Ikki ketma-ket elementlarning ketma-
ketligi, ko‘pincha, bigram deb ataladi, uchta elementning ketma-ketligi 
Trigram deb ataladi. Kamida to‘rt va undan yuqori elementlar N-gramm 
deb ataladi, n ketma-ket elementlarning soni bilan almashtiriladi. 
N-grammlar odatda keng fan sohasida qo‘llaniladi. Ular, masalan, 
lingvistika, nazariy matematika, biologiya, kartografiya va musiqa soha-
larida qo‘llanilishi mumkin. N-grammning eng ko‘p ishlatilishi quyidagi 
sohalarni o‘z ichiga oladi. 
Kosmosdan yer sun’iy yo‘ldosh rasmlari bir qator kumelenme 
uchun ma’lumotlarni chiqarib, keyin tasvirda Yerning muayyan qismlari 
qanday qaror qabul qilish, genetik ketma-ketliklarni topish, genetika so-
hasida DNK namunalari qanday turdagi hayvonlarning to‘planganligini 
aniqlash uchun foydalaniladi, kompyuter qidiruv tizimlarida ma’lumot-
larni indekslash uchun N-grammdan foydalanib, ovoz bilan bog‘liq ma’-
lumotlar indekslanadi. 
1
Proceedings of the 7th Annual Conference ZNALOSTI 2008, Bratislava, Slovakia, p. 
54‒65, February, 2008.


12 
Bundan tashqari, n-gramm tabiiy tillarni qayta ishlashda keng qo‘l-
laniladi. Tabiiy tilni qayta ishlash sohasida n-gramm, asosan, ehtimollik 
modellari asosida taxmin qilish uchun ishlatiladi. N-grammlik model, 
agar avvalgi barcha narsalar ma’lum bo‘lsa, oxirgi so‘z n-gramm ehti-
molini hisoblab chiqadi. Tilni modellashtirish uchun ushbu yondashuv-
dan foydalanganda, har bir so‘zning paydo bo‘lishi faqat oldingi so‘zlar-
ga bog‘liq deb taxmin qilinadi.
1
N-grammning yana bir qo‘llanilishi plagiatni aniqlashdir. Agar siz 
matnni n-grammlar tomonidan taqdim etilgan bir nechta kichik qismlar-
ga ajratsangiz, ularni bir-biri bilan taqqoslash oson va shuning uchun 
tahlil qilingan hujjatlarning o‘xshashligi.
2
N-grammlar odatda matn va 
tilni tasniflash uchun muvaffaqiyatli ishlatiladi. Bundan tashqari, ular 
matnli ma'lumotlardan bilim olish imkonini beruvchi xususiyatlarni 
yaratish uchun ishlatilishi mumkin. N-grammdan foydalanib, so‘zlarni 
imlo xatolari bilan almashtirish uchun nomzodlarni samarali topish 
mumkin. 
N-grammni tez-tez ishlatish bilan bog‘liq holda, turli muammolarni 
hal qilish uchun ularni matndan chiqarish uchun ishonchli va tezkor al-
goritm kerak. N-grammni olish uchun mos vosita cheksiz matn hajmi bi-
lan ishlashi, mavjud resurslardan tez va samarali foydalanishi kerak. 
Matndan n-grammni olishning bir necha usullari mavjud. Ushbu usullar 
turli tamoyillarga asoslangan: 
●Yapon tilidagi matnlar uchun Nagao 94 algoritmi;
●Lempel Algoritmi-Ziva-Velcha; 
●Suffix qator; 
●Suffix daraxti; 
●Teskari indeks. 
Sintaktik n-grammlar matnning chiziqli tuzilishi emas, balki sintak-
tik bog‘liqliklar yoki tarkibiy daraxtlarning daraxtlaridagi yo‘llar bilan 
aniqlangan n-grammdir. Sintaktik n-grammlar sintaktik strukturani chi-
ziqli n-grammdan farqli ravishda aks ettiradi va lineer n-grammlar bilan 
bir xil ilovalarda, shu jumladan, vektor modelida belgilar sifatida ishlati-
lishi mumkin. Sintaksik n-grammdan foydalanish, masalan, mualliflikni 
aniqlash uchun standart n-grammdan foydalanishdan ko‘ra muayyan 
muammolarni hal qilishda yaxshiroq natijalar beradi. 
1
Jurafsky D. and Martin J.H. Speech and Language Processing: An Introduction to Natural Language Processing, 
Computational Linguistics, and Speech Recognition. Pearson Prentice Hall, 2009, p. 988.
2
Proceedings of the ITAT 2008, Information Technologies. 
Applications and Theory, Hrebienok, Slovakia, p. 23‒
26, September, 2008.


13 

Download 1.94 Mb.
1   2   3   4   5   6   7   8   9   ...   99




Download 1.94 Mb.
Pdf ko'rish

Bosh sahifa
Aloqalar

    Bosh sahifa



Oʻzbekiston respublikasi oliy va oʻrta maxsus ta’lim vazirligi urganch davlat universiteti

Download 1.94 Mb.
Pdf ko'rish