|
RAQAMLI TEXNOLOGIYALAR DAVRIDA TILLARNI INTENSIV OʻQITISHNING PSIXOLOGIK-Bog'liq qidiruv-tizimlari-algoritmlarining-tahlili
RAQAMLI TEXNOLOGIYALAR DAVRIDA TILLARNI INTENSIV OʻQITISHNING PSIXOLOGIK-
PEDAGOGIK JIHATLARI
RESPUBLIKA ILMIY-AMALIY ANJUMANI
2023-yil 2-iyun
480
Rasm. Qidiruv tizimlarining ishlash sxemasi.
Mashhur qidiruv tizimi algoritmlari
1.
PageRank algoritmi:
Ushbu algoritm Google tomonidan ishlab chiqilgan va sahifaga
kiruvchi havolalar soniga qarab qidiruv natijalarini ustuvorlashtirish uchun mo’ljallangan. U
sahifani boshqa sahifalarga nisbatan ahamiyatini aniqlash uchun sahifaga bo’lgan havolalar
miqdori va sifatini o’lchaydi. PageRank ma’lum bir qidiruv so’rovida eng mos va maqbul
saytlarni aniqlashga yordam beradi.
Umumiy holda, har qanday sahifa “
𝓊
” uchun PageRank qiymatini quyidagicha ifodalash
mumkin:
(
1)
ya’ni “
𝓊
” sahifasi uchun PageRank qiymati: Bu to’plamidagi har bir “
𝓋
” sahifaning
PageRank qiymatini shu sahifadagi havolalarning L(
𝓋
) soniga bo’linadi va har bir bo’linma
qo’shib chiqiladi.
2.
TF-IDF algoritmi
: Bu algoritm Term Frequency-Inverse Document Frequency
so’zlarining qisqartmasidan ushbu nomga ega bo’lgan va berilgan so’rov bo’yicha hujjatning
dolzarbligini aniqlash uchun ishlatiladi. U hujjatdagi atamaning chastotasini o’lchaydi va keyin
ma’lum hujjatlar to’plamidagi atamaning ahamiyatini tortish uchun teskari hujjat chastotasidan
foydalanadi. Ushbu algoritm ko’pincha veb-saytning ma’lum bir so’rov uchun mosligini
o’lchash uchun ishlatiladi.
TF-IDF statistik o’lchovi ortidagi oddiy formulani ko’rib chiqaylik. Dastlab ba’zi
belgilarni aniqlaymiz:
N
- bizning ma’lumotlar to’plamimizdagi hujjatlar soni
d
- bizning ma’lumotlar to’plamimizdan berilgan hujjat
D
- barcha hujjatlar to’plami
w
- hujjatdagi berilgan so’z
Birinchi qadamda hujjat chastotasi
|
| |