215
foydalanuvchilari kerakli mahsulotlar, xizmatlar va axborotlarni topish
maqsadida qidiruv tizimlaridan foydalanadilar.
Qidiruv tizimlari tematik kataloglardan farq qiladi. Ular katta
bazaga ega URL-adreslarni ifodalaydi, bunda ular avtomatik ravishda bu
adreslar bo‘yicha Web –sahifalarga
murojaat qiladi, sahifalarning
mazmunini o‘rganib chiqadi, sahifalardan kalit so‘zlarni yozib oladi va
shakllantiradi (sahifalarni indeksatsiyadaydi). Bundan tashqari bu
serverlar sahifalarda barcha uchraydigan havolalarga murojaat qiladi va
yangi sahifaga o‘tayotib xudi shunday ishni bajaradi. Ixtiyoriy Web-
sahifa boshqa sahifalarga bir necha havolaga egadir, ya’ni bunday ishda
qidiruv tizimi natijada Internet barcha saytlarini aylanib chiqadi.
Qidiruv tizimi quyidagi asosiy komponentlardan iborat:
1.
O‘rgimchak (spider) – Web-sahifalarni,
foydalanuvchi brauzeri
usulida yuklab oluvchi dastur. Ularning farqli tomoni shundaki, brauzer
saxifada bo‘lgan axborotlarni aks ettiradi ( tekstli, grafikli), o‘rgimchak
esa vizual komponentlarga ega emas va to‘g‘ridan-to‘g‘ri sahifaning
html-teksti bilan ishlaydi (ko‘rish uchun brauzerda «prosmotr html-
koda» qilish mumkin)
2.
Sayohat qiluvchi o‘rgimchak (crawler) – sahifada mavjud
bo‘lgan barcha havolalarni aks ettiruvchi dastur. Uning vazifasi –
havolalarga asoslanib yoki oldindan berilgan adreslar ro‘yhatidan kelib
chiqib, o‘rgimchak qaerga borishini aniqlab beradi. Krauler, topilgan
havolalar bo‘yicha qidiruv tizimida noma’lum bo‘lgan yangi hujjatlar
qidiruvini amalga oshiradi.
3.
Indeksator (indexer) – sahifani tarkibiy qismlarga bo‘lib,
ularni
tahlil qiluvchi dastur. Sahifaning turli elementlari, ya’ni tekst, sarlavha,
tarkibiy va uslubiy o‘ziga xosliklari, maxsus xizmat html-teglari va b.,
ajratib olinib tahlil qilinadi. index-fayl tahlil natijasi hisoblanadi.
4.
Ma’lumotlar bazasi (database) – bu yuklab olish jarayonida
qidiruv tizimidan olingan barcha index-fayllar va Web- sahifalar tahlili
ombori (xraniliщe). Ba’zida ma’lumotlar bazasini qidiruv tizimi indeksi
deyiladi.
5.
Natijalarni berish tizimi (search engine results engine) –
sahifalarni darajalash bilan shug‘ullanadi. U qaysi sahifalar
foydalanuvchi ehtiyojini qondiradi va ular qanday tartibda saralanishini
hal qiladi. Bu qidiruv tizimini darajalash
algoritmi asosida amalga
oshiriladi. Qidiruv tizimining bu komponenti bilan optimizator aloqada
bo‘ladi, u chiqarish paytida sayt holatini darajalash natijalariga ta’sir
ko‘rsatuvchi ma’lum bir faktorlar yordamida yaxshilashga harakat
216
qiladi.
6.
Web-server (Web – server) – foydalanuvchi va qidiruv tizimining
boshqa komponentlari orasidagi o‘zaro munosabatni amalga oshiruvchi
server. Odatda, serverda kirish maydonli html-sahifa bor, unda
foydalanuvchi o‘zini qiziqtirgan qidiruv terminini berishi mumkin. Web-
server ham foydalanuvchiga html- sahifa ko‘rinishida
natijalarni
chiqarib berishga javob beradi.
7.
Qidiruv mexanizmlarning batafsil amalga oshirish bir-biridan
farq qilishi mumkin. Masalan, spider+crawler+indexer bog‘lami qidiruv
roboti deb nomlangan yagona dastur ko‘rinishida bajarilishi mumkin. U
taniqli Web-sahifalarni yuklab oladi, ularni tahlil qiladi, havolalar orqali
yangi resurslarni izlaydi, ularni indekslaydi va ma’lumotlar bazasiga
index-fayl ko‘rinishida kiritadi. Foydalanuvchi tomonidan so‘ralayotgan
ma’lumotlarni index-fayllardan chiqarib oluvchi
boshqa dastur orqali
qidiruv amalga oshiriladi. Biroq barcha qidiruv tizimlariga ko‘rsatib
o‘tilgan tomonlar tegishlidir.
Hozirgi kunda 3 ta asosiy xalqaro qidiruv tizimlari mavjud: Google,
Yahoo va MSN Search, ular o‘z bazalari va qidiruv algoritmlariga ega.
Qolgan qidiruv tizimining ko‘pchiligi u yoki bu ko‘rinishda 3 ta sanab
o‘tilganlarni qo‘llaydilar. Masalan, AOL (search.aol.com) qidiruv va
Mail.ru, Google bazasini, AltaVista, Lycos va AllTheWeb esa –Yahoo
bazasini qo‘llaydilar.
Rus tilidagi Internet doirasida o‘ttizdan ortiq qidiruv tizimlari
faoliyat yuritadi. 90% ga yaqin auditoriya 3 ta eng mashhur qidiruv
tizimlaridan foydalanadi: Yandex, Google, Rambler (4.3.5-jadval).
Kerakli hujjatlarni izlash uchun aniq qidiruv tizimiga murojaat
qilish kerak va bir yoki bir necha so‘zdan iborat qidiruv so‘rovini tuzish
lozim. So‘rovda tinish belgilari ishlatilishi mumkin. So‘rovlar
tilining
nozik tomonlariga e’tibor bermay, oddiy so‘rovlar tuzish mumkin. Agar
qidiruv qatoriga bir nechta so‘zlarni tinish belgilarisiz va mantiqiy
operatorlarsiz kiritilsa, bu so‘zlar uchragan barcha hujjatlar topiladi
(bir- biridan chegaralangan masofada). Biroq qidiruv tizimining
so‘rovlar tilini to‘g‘ri qo‘llash va bilish qidiruvni
tez hamda samarali
amalga oshirish imkonini beradi.