309
Berilgan holat chastotaning ikki chegaraviy ahamiyati mavjudligini taxmin
qiladi:
quyi chegaradan kam chastotaga ega so’zlar juda kamyob hisoblanadi (hujjat
mazmunini aks ettirishga qodir emas);
bu ikki chegara orasidagi chastotaga ega so’zlar esa berilgan aniq hujjat
mazmunini ifodalaydi.
Havola kriteriyalariga asosan hujjat sitata olish indeksi hisobidan saralanadi.
Sitata olish indeksi – bu saytning Internetda mashhurligi ko’rsatkichi,
qidirilayotgan resursda boshqa saytlarga havolalarning soni va ahamiyati bilan
aniqlanadi. Saytga tashqi havolalarning umumiy soni sitatalash hisoblari uchun
kriteriyalar sifatida to’g’ri kelmaydi, chunki mashhur bo’lmagan resurslarga
havolalarning ahamiyati mashhur saytlar havolalari ahamiyatiga qaraganda juda
oz.
Sitatalash indeksini aniqlashda nafaqat saytga tashqi havolalar soni
e’tiborga olinadi, balki ma’lumotga havola etilgan o’z saytlarining sitatalash
indeksiga e’tibor beriladi. Umumiy holatda Web- sahifaga har bir to’g’ri havola
hajm bo’yicha sitatalashni ko’paytiradi, hajm havola qilinuvchi sahifaga
sitatalashga proporsional va aksi havola etilayotgan sahifada havolalar umumiy
soniga proporsional bo’ladi.
Yirik qidiruv mashinalarining qidiruv bazasida ulkan miqdordagi hujjatlar
saqlanadi. Tenglama tizimiga mos keluvchi matritsa siyraklashishiga qaramay, bu
tizimning miqdoriy yechimi ulkan hisoblash quvvatini talab qiladi. Shuning uchun
qidiruv tizimi hisoblash jarayonini ba’zi farazlarni kiritib maksimal darajada
soddalashtirishga harakat qilishi kerak. Mana shu PageRank klassik formulasini
amalga oshirishning aniq o’ziga xosliklari qidiruv mashinalarining kommersiya
sirini tashkil qiladi.