|
Qidiruv tizimlari - SE servisning vazifasi
|
bet | 143/216 | Sana | 19.07.2024 | Hajmi | 7,52 Mb. | | #267965 |
Bog'liq 5ffd2d83d9d2c (1)
SE servisi (Search Engine) – qidiruv tizimlari – bu maxsus Web- saytlar, ularda foydalanuvchi berilgan so‘rov bo‘yicha shu so‘rovga mos keluvchi saytlarga havola olishi mumkin. 85% Internet
foydalanuvchilari kerakli mahsulotlar, xizmatlar va axborotlarni topish maqsadida qidiruv tizimlaridan foydalanadilar.
Qidiruv tizimlari tematik kataloglardan farq qiladi. Ular katta bazaga ega URL-adreslarni ifodalaydi, bunda ular avtomatik ravishda bu adreslar bo‘yicha Web –sahifalarga murojaat qiladi, sahifalarning mazmunini o‘rganib chiqadi, sahifalardan kalit so‘zlarni yozib oladi va shakllantiradi (sahifalarni indeksatsiyadaydi). Bundan tashqari bu serverlar sahifalarda barcha uchraydigan havolalarga murojaat qiladi va yangi sahifaga o‘tayotib xudi shunday ishni bajaradi. Ixtiyoriy Web- sahifa boshqa sahifalarga bir necha havolaga egadir, ya’ni bunday ishda qidiruv tizimi natijada Internet barcha saytlarini aylanib chiqadi.
Qidiruv tizimi quyidagi asosiy komponentlardan iborat:
O‘rgimchak (spider) – Web-sahifalarni, foydalanuvchi brauzeri usulida yuklab oluvchi dastur. Ularning farqli tomoni shundaki, brauzer saxifada bo‘lgan axborotlarni aks ettiradi ( tekstli, grafikli), o‘rgimchak esa vizual komponentlarga ega emas va to‘g‘ridan-to‘g‘ri sahifaning html-teksti bilan ishlaydi (ko‘rish uchun brauzerda «prosmotr html- koda» qilish mumkin)
Sayohat qiluvchi o‘rgimchak (crawler) – sahifada mavjud bo‘lgan barcha havolalarni aks ettiruvchi dastur. Uning vazifasi – havolalarga asoslanib yoki oldindan berilgan adreslar ro‘yhatidan kelib chiqib, o‘rgimchak qaerga borishini aniqlab beradi. Krauler, topilgan havolalar bo‘yicha qidiruv tizimida noma’lum bo‘lgan yangi hujjatlar qidiruvini amalga oshiradi.
Indeksator (indexer) – sahifani tarkibiy qismlarga bo‘lib, ularni tahlil qiluvchi dastur. Sahifaning turli elementlari, ya’ni tekst, sarlavha, tarkibiy va uslubiy o‘ziga xosliklari, maxsus xizmat html-teglari va b., ajratib olinib tahlil qilinadi. index-fayl tahlil natijasi hisoblanadi.
Ma’lumotlar bazasi (database) – bu yuklab olish jarayonida qidiruv tizimidan olingan barcha index-fayllar va Web- sahifalar tahlili ombori (xraniliщe). Ba’zida ma’lumotlar bazasini qidiruv tizimi indeksi deyiladi.
Natijalarni berish tizimi (search engine results engine) – sahifalarni darajalash bilan shug‘ullanadi. U qaysi sahifalar foydalanuvchi ehtiyojini qondiradi va ular qanday tartibda saralanishini hal qiladi. Bu qidiruv tizimini darajalash algoritmi asosida amalga oshiriladi. Qidiruv tizimining bu komponenti bilan optimizator aloqada bo‘ladi, u chiqarish paytida sayt holatini darajalash natijalariga ta’sir ko‘rsatuvchi ma’lum bir faktorlar yordamida yaxshilashga harakat
qiladi.
Web-server (Web – server) – foydalanuvchi va qidiruv tizimining boshqa komponentlari orasidagi o‘zaro munosabatni amalga oshiruvchi server. Odatda, serverda kirish maydonli html-sahifa bor, unda foydalanuvchi o‘zini qiziqtirgan qidiruv terminini berishi mumkin. Web- server ham foydalanuvchiga html- sahifa ko‘rinishida natijalarni chiqarib berishga javob beradi.
Qidiruv mexanizmlarning batafsil amalga oshirish bir-biridan farq qilishi mumkin. Masalan, spider+crawler+indexer bog‘lami qidiruv roboti deb nomlangan yagona dastur ko‘rinishida bajarilishi mumkin. U taniqli Web-sahifalarni yuklab oladi, ularni tahlil qiladi, havolalar orqali yangi resurslarni izlaydi, ularni indekslaydi va ma’lumotlar bazasiga index-fayl ko‘rinishida kiritadi. Foydalanuvchi tomonidan so‘ralayotgan ma’lumotlarni index-fayllardan chiqarib oluvchi boshqa dastur orqali qidiruv amalga oshiriladi. Biroq barcha qidiruv tizimlariga ko‘rsatib o‘tilgan tomonlar tegishlidir.
Hozirgi kunda 3 ta asosiy xalqaro qidiruv tizimlari mavjud: Google, Yahoo va MSN Search, ular o‘z bazalari va qidiruv algoritmlariga ega. Qolgan qidiruv tizimining ko‘pchiligi u yoki bu ko‘rinishda 3 ta sanab o‘tilganlarni qo‘llaydilar. Masalan, AOL (search.aol.com) qidiruv va Mail.ru, Google bazasini, AltaVista, Lycos va AllTheWeb esa –Yahoo bazasini qo‘llaydilar.
Rus tilidagi Internet doirasida o‘ttizdan ortiq qidiruv tizimlari faoliyat yuritadi. 90% ga yaqin auditoriya 3 ta eng mashhur qidiruv tizimlaridan foydalanadi: Yandex, Google, Rambler (4.3.5-jadval).
Kerakli hujjatlarni izlash uchun aniq qidiruv tizimiga murojaat qilish kerak va bir yoki bir necha so‘zdan iborat qidiruv so‘rovini tuzish lozim. So‘rovda tinish belgilari ishlatilishi mumkin. So‘rovlar tilining nozik tomonlariga e’tibor bermay, oddiy so‘rovlar tuzish mumkin. Agar qidiruv qatoriga bir nechta so‘zlarni tinish belgilarisiz va mantiqiy operatorlarsiz kiritilsa, bu so‘zlar uchragan barcha hujjatlar topiladi (bir- biridan chegaralangan masofada). Biroq qidiruv tizimining so‘rovlar tilini to‘g‘ri qo‘llash va bilish qidiruvni tez hamda samarali amalga oshirish imkonini beradi.
|
| |