|
Mavzu: Axborotni izlash
|
bet | 12/32 | Sana | 16.09.2024 | Hajmi | 0,58 Mb. | | #271195 |
Bog'liq Mavzu axborotni izlash rejaIPS tasnifi ular veb-maydonda navigatsiyani maxsus ko'rsatgichlar asosida amalga oshiradilar, ular tasniflar asosida qurilgan tematik "daraxtlar" dir. Internetda resurslarni tasniflash sxemalari odatda daraxt tuzilmalari bo'lib, ularning tugunlari tabiiy til so'zlari bilan nomlanadi. Turli xil tasniflash sxemalari bir-biridan ularning tuzilish doirasi va metodikasi bilan farq qiladi. Umumjahon ierarxik tasniflarning kamchiliklaridan biri shundaki, ular konservativ bo'lib, umuman fan, texnika va hayotning rivojlanishidan orqada qolmoqda. Tasniflashni qidirish xizmatlari bilan bog'liq asosiy muammo - bu tasniflashni avtomatlashtirish. Hozirgacha avtomatik tasniflash muammosi qoniqarli echim topmagan. Veb-saytlarni va veb-sahifalarni kataloglarda ro'yxatdan o'tkazish, odatda, ushbu tizimning indeksatorlari va moderatorlari tomonidan amalga oshiriladi. Va shuning uchun, tasniflash tizimlari ma'lumotlar bazasining hajmi butun Internetning axborot hajmi bilan taqqoslaganda nisbatan kichikdir.
Internet-resurslarni maksimal darajada qamrab olish muammosini hal qilish uchun tizimlar yaratilgan metasearch (metasearch dvigatellari). Ular o'zlarining qidiruv ma'lumotlar bazalariga ega emaslar, hech qanday indekslarni o'z ichiga olmaydi va qidirish paytida boshqa qidiruv tizimlarining resurslaridan foydalanadilar. Shu sababli, kerakli ma'lumotlarni topish ehtimoli oshadi. So'rovni qidiruv tizimiga uzatish uchun so'rovni boshqa tizimlarga etkazish jarayoni uchun javob beradigan maxsus metasearch agentidan foydalaniladi. Qabul qilingan so'rovni ko'rib chiqqandan so'ng, har bir tizim metasearch agentiga ushbu so'rovga tegishli deb hisoblagan tavsiflar to'plamiga va hujjatlar havolalariga qaytadi. Metasearch dvigatellarining barcha jozibadorligi uchun ularning kamchiliklari va kamchiliklarini yodda tutish kerak. Avvalo, yo'qligi yagona standart so'rovlar tili metasistemalarni metasearch motorlarida ishlaydigan qidiruv tizimlaridan tajribali foydalanuvchi har bir mashinadan alohida-alohida olishlari mumkin bo'lgan natijalarni olishiga to'sqinlik qiladi.
Bugungi kunda Internetda ma'lumot qidirishning asosiy vositasi global IPS deb hisoblanishi kerak og'zaki turi (qidiruv tizimlari), butun Internet maydonini indeksatsiya qilish (hech bo'lmaganda o'zlarini da'vo qilish). Ushbu turdagi asosiy qidiruv tizimlariga (birinchi navbatda ma'lumotlar bazasi hajmi bo'yicha) Google, Fast (AlltheWeb), AltaVista, HotBot, Inktomi, Teoma, WiseNut, MSN Search kiradi. Ular orasida rossiya tizimlari asosiylari uchta: Yandex (Yandex), Rambler (Rambler) va Aport! (Aport). Qidiruv bazasining to'liqligi va veb-saytlarni indekslash samaradorligi Internetdagi barcha ISS-larning asosiy muammosi hisoblanadi. Odatda, ma'lumotlar bazasi kattaroq bo'lgan tizimlar natijasida hujjatlar soni ko'payadi. Ikkala lingvistik va dasturiy muammo Internet-axborot makonining ko'p tilliligi va ma'lumotlar taqdimotining xilma-xilligidir. Shunga qaramay, asosiy global tizimlar ushbu muammolarni engishmoqda.
Aynan og'zaki IPS qo'llanmaning amaliy qismiga e'tibor qaratadi. Avvalo, foydalanuvchi darajasi modellashtirilgan bo'lib, so'rovlar tillarida va so'rovlarga javob beradigan interfeyslarda ifodalangan. Internetning turli ISS so'rovlari tillarini qiyosiy tahlil qilish amalga oshirildi.
Zamonaviy tizimlarning xususiyati to'liq matnli qidirishdir. Internetdagi ko'plab og'zaki IRSlar so'rovlar elementlarini veb-saytga joylashtirilgan hujjatlarning to'liq matnlari bilan taqqoslash orqali hujjatlarning so'rovlarga aloqadorligini hisoblashadi. Axborot qidirish tiliga kelsak, qoida tariqasida tabiiy tillarning oddiy so'zlari qidiruv elementlari vazifasini bajaradi. So'rovlar maxsus interfeys orqali shakllantirilib, brauzer dasturlarida ekran shakllari shaklida amalga oshiriladi.
Ushbu tizimlarning qanday ishlashini tushunish foydalidir. Har qanday qidiruv tizimining uchta asosiy qismi mavjud.
Robot - internetni ko'rishni (skanerlashni) va teskari faylni (indekslar ma'lumotlar bazasini) yangilab turishni ta'minlaydigan kichik tizim. Ushbu dasturiy ta'minot to'plami tarmoqning axborot resurslarining mavjudligi va holati to'g'risida ma'lumot to'plashning asosiy vositasi hisoblanadi.
|
| |