O’zbek lotin alifbosini izohli lug’atlarining mb

Download 0,87 Mb. Pdf ko'rish
Sana	12.12.2023
Hajmi	0,87 Mb.
	#117094

Bog'liq
Mustaqil ta\'lim. Na\'muna

O’zbek lotin alifbosi
Tokenlashlash, Lemmalash va Stiminglash
Statistika: google qidiruv tizimida “Axborot
Izoh
Tokenlash, Lemmalash va Stiminglash

Mavzu: Axborot texnologiyalari sohasidagi atamalarni qidiruv tizimi
strukturasi.
O’zbek
lotin alifbosini
izohli lug’atlarining
MB
Tizim
Foydalanuvchi so’rovlarini normallashtirish
Tokenlash
Lemmalash
Stiming
№
Lemma
1
….
2
….
3
….
№
Lemma
1
….
2
….
№
Lemma
1
….
№ Sohalar
1
IT
2
Iqtisod
3
Siyosat
4
Sport
5
Ta’lim
6
I/Ch
Signallarga raqamli ishlov
berish
Axborotlashtirish
Axborotlashtirmoq
Axborot-tahlil
Axborotlashmoq
Axborotnoma
So’rovlar
Natijalar

Ushbu strukturada tizim orqali foydalanuvchilarninng so’rovlarini
normallashtirish jarayonlarining ishlash ketma-ketligi blok sxema ko’rinishida
keltirilgan. SO’rovda aniqlangan so’zlarni sinonimlarini aniqlash uchun O’zbek
lotin alifbosini izohli lug’atlarning MA’LUMOTLAR BAZASI shakillantirilgan.
Bu ma’lumotlar bazasi orqali so’zning turli sinonimlarini ham serverdan qidirish
imkonini beradi.
Ishlab chiqilgan strukturaning ishlash tamoyili quyidagicha:
1. Tizimga kiritilgan so’rovni normallashtirish;
2. Tizimga kiritilgan so’rovni tokenlash;
3. Tizimga kiritilgan so’rovni lemmalash;
4. Tizimga kiritilgan so’rovni stiminglash;
Normallashtirishning yuqoridagi 3 ta bosqichida so’rov kanonik-tayyor
ko’rinishga keltiriladi. So’rov ikkita yoki undan ko’p so’zlardan iborat bo’lsa
Tokenlashlash, Lemmalash va Stiminglash jarayoni amalga oshiriladi. Aks holda
ma’lumotlar bazasidan so’rovdagi bitta so’zning sinonimlari aniqlanadi.
Uchta normallashtirish jarayonlaridan o’tgan so’rovdan tokenlangan,
lemmalangan va stiminglangan so’zlar sinonimlari Serverdan qidirish uchun
yuboriladi. Serverdan natijalar tizimga yuboriladi.
Ushbu strukturani yaratishdan maqsad – ma’lum algoritmlar yordamida tizimda
qidirilayotgan o’zbek lotin alifbosida berilgan so’rovlardagi so’zlarni sinonimlari
asosida qidirishni tashkil etishdan iborat.
Statistika:
google qidiruv tizimida “Axborot” so’zi qidirilgandan 5 070 000 ta natija,
“Ахборот” so’zi qidirilganda 4 000 000 ta natija va “information” so’zi
qidirilganda 15 460 000 000 ta natija topilgan.
Bundan xulosa qilish mumkinki, so’rovdagi so’zlarning sinonimlari asosida
qidiruvni amalga oshirish foydalanuvchining ma’lumotga bo’lgan ehtiyojlarni
yuqori darajada qondirishga olib keladi.
Izoh: Har bir magistr ikkita yoki undan ko’p so’rovlarni normallashtirsh
jarayonlarini strukturasini yaratishi kerak. Misol uchun so’rovlardagi so’zlarni
qanday hujjatlar (MB, sayt sahifasi, fayl) da mavjudligini aniqlash uchun
Tokenlash, Lemmalash va Stiminglash jarayonlarini strukturasini ishlab chiqishi
kerak. Yuqorida keltirilgan na’munada Tokenlash, Lemmalash va Stiminglash
jarayonlari yopiq holatda keltirilgan. Magistrantning asossiy mustaqil ishi ushbu 3
ta jarayonni strukturasini ishlab chiqishdan iborat.
Struktura word faylda tayyorlanishi kerak. Rasm ko’rinishi joylashtirish
mumkin emas.

Download 0,87 Mb.

Pdf ko'rish