Mavzu: Axborot texnologiyalari sohasidagi atamalarni qidiruv tizimi
strukturasi.
O’zbek
lotin alifbosini
izohli lug’atlarining
MB
Tizim
Foydalanuvchi so’rovlarini normallashtirish
Tokenlash
Lemmalash
Stiming
№
Lemma
1
….
2
….
3
….
№
Lemma
1
….
2
….
№
Lemma
1
….
№ Sohalar
1
IT
2
Iqtisod
3
Siyosat
4
Sport
5
Ta’lim
6
I/Ch
Signallarga raqamli ishlov
berish
Axborotlashtirish
Axborotlashtirmoq
Axborot-tahlil
Axborotlashmoq
Axborotnoma
So’rovlar
Natijalar
Ushbu strukturada tizim orqali foydalanuvchilarninng so’rovlarini
normallashtirish jarayonlarining ishlash ketma-ketligi blok sxema ko’rinishida
keltirilgan. SO’rovda aniqlangan so’zlarni
sinonimlarini aniqlash uchun O’zbek
lotin alifbosini izohli lug’atlarning
MA’LUMOTLAR BAZASI shakillantirilgan.
Bu ma’lumotlar bazasi orqali so’zning turli sinonimlarini ham serverdan qidirish
imkonini beradi.
Ishlab chiqilgan strukturaning ishlash tamoyili quyidagicha:
1. Tizimga kiritilgan so’rovni normallashtirish;
2. Tizimga kiritilgan so’rovni tokenlash;
3. Tizimga kiritilgan so’rovni lemmalash;
4. Tizimga kiritilgan so’rovni stiminglash;
Normallashtirishning yuqoridagi 3 ta bosqichida so’rov
kanonik-tayyor
ko’rinishga keltiriladi. So’rov ikkita yoki undan ko’p so’zlardan iborat bo’lsa
Tokenlashlash, Lemmalash va
Stiminglash jarayoni amalga oshiriladi. Aks holda
ma’lumotlar bazasidan so’rovdagi bitta so’zning sinonimlari aniqlanadi.
Uchta normallashtirish jarayonlaridan o’tgan so’rovdan
tokenlangan,
lemmalangan va
stiminglangan so’zlar sinonimlari
Serverdan
qidirish uchun
yuboriladi. Serverdan natijalar tizimga yuboriladi.
Ushbu strukturani yaratishdan maqsad – ma’lum algoritmlar yordamida tizimda
qidirilayotgan o’zbek lotin alifbosida berilgan so’rovlardagi so’zlarni sinonimlari
asosida qidirishni tashkil etishdan iborat.
Statistika:
google qidiruv tizimida “
Axborot” so’zi qidirilgandan 5 070 000
ta natija,
“
Ахборот” so’zi qidirilganda 4 000 000 ta natija va “
information” so’zi
qidirilganda 15 460 000 000 ta natija topilgan.
Bundan xulosa qilish mumkinki, so’rovdagi so’zlarning
sinonimlari asosida
qidiruvni amalga oshirish foydalanuvchining ma’lumotga bo’lgan ehtiyojlarni
yuqori darajada qondirishga olib keladi.
Izoh: Har bir magistr ikkita yoki undan ko’p so’rovlarni normallashtirsh
jarayonlarini strukturasini yaratishi kerak. Misol uchun so’rovlardagi so’zlarni
qanday hujjatlar (MB, sayt sahifasi, fayl) da mavjudligini aniqlash uchun
Tokenlash, Lemmalash va Stiminglash jarayonlarini strukturasini ishlab chiqishi
kerak. Yuqorida keltirilgan na’munada Tokenlash, Lemmalash va Stiminglash
jarayonlari yopiq holatda keltirilgan. Magistrantning asossiy mustaqil ishi ushbu 3
ta jarayonni strukturasini ishlab chiqishdan iborat.
Struktura word faylda tayyorlanishi kerak. Rasm ko’rinishi joylashtirish
mumkin emas.