305
23-BOB. SE XIZMATI – QIDIRUV TIZIMLARI
SE (Search Engine) qidiruv xizmati tizimlari –
bu maxsus Web-saytlar,
ularda foydalanuvchi berilgan so’rov bo’yicha shu so’rovga mos keluvchi
saytlarga havola (ссылка) olishi mumkin. 85% Internet foydalanuvchilari kerakli
mahsulotlar, xizmatlar va axborotlarni topish maqsadida qidiruv tizimlaridan
foydalanadilar.
23.1. SE xizmatning vazifasi
Qidiruv tizimlari tematik kataloglardan farq qiladi. Ular katta bazaga ega
URL-adreslarni ifodalaydi, bunda ular avtomatik ravishda bu adreslar bo’yicha
Web-sahifalarga murojaat qiladi, sahifalarning mazmunini o’rganib chiqadi,
sahifalardan
kalit so’zlarni yozib oladi va shakllantiradi (sahifalarni
indeksatsiyalaydi). Bundan tashqari bu serverlar sahifalarda
barcha uchraydigan
havolalarga murojaat qiladi va yangi sahifaga o’tayotib xuddi shunday ishni
bajaradi. Ixtiyoriy Web-sahifa boshqa sahifalarga bir necha havolaga egadir, ya’ni
bunday ishda qidiruv tizimi natijada Internet barcha saytlarini “aylanib” chiqadi.
Qidiruv tizimi quyidagi asosiy komponentlardan iborat:
O’rgimchak (spider) – Web-sahifalarni, foydalanuvchi brauzeri usulida
yuklab oluvchi dastur. Ularning
farqli tomoni shundaki, brauzer sahifada bo’lgan
axborotlarni aks ettiradi (matnli, grafikli), o’rgimchak esa vizual komponentlarga
ega emas va to’g’ridan-to’g’ri sahifaning html-matni bilan ishlaydi (ko’rish uchun
brauzerda «просмотр html-кода» qilish mumkin).
Sayohat qiluvchi o’rgimchak (crawler) – sahifada mavjud bo’lgan barcha
havolalarni aks ettiruvchi dastur. Uning vazifasi – havolalarga asoslanib yoki
oldindan berilgan adreslar ro’yxatidan kelib chiqib, o’rgimchak qayerga borishini
306
aniqlab beradi. Krauler topilgan havolalar bo’yicha qidiruv tizimida noma’lum
bo’lgan yangi hujjatlar qidiruvini amalga oshiradi.
Indeksator (indexer) – sahifani tarkibiy qismlarga bo’lib, ularni tahlil
qiluvchi dastur.
Sahifaning turli elementlari, ya’ni tekst, sarlavha, tarkibiy va
uslubiy o’ziga xosliklari, maxsus xizmat html-teglari va b.
ajratib olinib tahlil
qilinadi. Index-fayl tahlil natijasi hisoblanadi.
Ma’lumotlar bazasi (database) – bu yuklab olish jarayonida qidiruv
tizimidan olingan barcha index-fayllar va Web- sahifalar tahlili ombori. Ba’zida
ma’lumotlar bazasini qidiruv tizimi indeksi deyiladi.
Natijalarni berish tizimi (search engine results engine) – sahifalarni
darajalash bilan shug’ullanadi. U foydalanuvchilar so’rovi asosida shakllangan
sahifalarni taqdim etadi va ular qanday tartibda saralanishini belgilaydi. Bu
qidiruv tizimini darajalash algoritmi asosida amalga oshiriladi. Qidiruv tizimining
bu komponenti bilan optimizator aloqada bo’ladi, u chiqarish paytida sayt holatini
darajalash natijalariga ta’sir ko’rsatuvchi ma’lum
bir faktorlar yordamida
yaxshilashga harakat qiladi.
Web-server (Web-server) – foydalanuvchi va qidiruv tizimining boshqa
komponentlari orasidagi o’zaro munosabatni amalga oshiruvchi server. Odatda,
serverda kirish maydonli html-sahifa mavjud bo’ladi, unda foydalanuvchi o’zini
qiziqtirgan qidiruv terminini berishi mumkin. Web-server ham foydalanuvchiga
html- sahifa ko’rinishida natijalarni chiqarib berishga javob beradi.
Qidiruv mexanizmlarini batafsil amalga oshirish bir-biridan farq qilishi
mumkin. Masalan, spider+crawler+indexer bog’lami qidiruv roboti deb nomlangan
yagona dastur ko’rinishida bajarilishi mumkin. U taniqli
Web-sahifalarni yuklab
oladi, ularni tahlil qiladi, havolalar orqali yangi resurslarni izlaydi, ularni
indekslaydi va ma’lumotlar bazasiga index-fayl ko’rinishida kiritadi.
Foydalanuvchi tomonidan so’ralayotgan ma’lumotlarni
index-fayllardan chiqarib
oluvchi boshqa dastur orqali qidiruv amalga oshiriladi. Biroq barcha qidiruv
tizimlariga ko’rsatib o’tilgan tomonlar tegishlidir.