• Qidiruv tizim
  • Ma'lumotlar bazasini qidirish




    Download 0,58 Mb.
    bet13/32
    Sana16.09.2024
    Hajmi0,58 Mb.
    #271195
    1   ...   9   10   11   12   13   14   15   16   ...   32
    Bog'liq
    Mavzu axborotni izlash reja

    Ma'lumotlar bazasini qidirish - deb nomlangan indeks -maxsus tashkil etilgan baza (eng.index ma'lumotlar bazasi), shu jumladan, birinchi navbatda, indekslangan veb-hujjatlardan olingan leksik birliklardan tashkil topgan va ular haqida turli xil ma'lumotlarni (xususan, ularning hujjatlardagi o'rni) o'z ichiga olgan teskari fayl. hujjatlarning o'zi va umuman saytlar haqida.
    Qidiruv tizim - foydalanuvchi so'rovini (qidirish retsepti) qayta ishlaydigan, ma'lumotlar bazasida qidiradigan va foydalanuvchiga qidiruv natijalarini ta'minlaydigan qidiruv quyi tizimi. Qidiruv tizim foydalanuvchi interfeysi - brauzer dasturlarining ekran shakllari orqali foydalanuvchi bilan aloqa o'rnatadi: so'rovlar yaratish interfeysi va qidiruv natijalarini ko'rish interfeysi.
    Indeks fayli (yoki shunchaki indeks) - bu talab bo'yicha ma'lumotlarni tezda qidirish uchun mo'ljallangan o'zaro bog'liq fayllar to'plami. Indeks har doim teskari faylga asoslangan. Teskari (teskari) elektron qidiruv qatorini tashkil etish, ularning tarkibini identifikatorlari (qidirish xususiyatlari: tavsiflovchilar, kalit so'zlar, atamalar, boshqa xususiyatlar) orqali hujjatlarga kirishni ta'minlash printsipiga asoslanadi. Ushbu sxema maxsus yordamchi teskari fayllar - kirish nuqtalarini yaratish uchun ketma-ket hujjatlar majmuasini qayta ishlash orqali olinadi.
    Bunday yordamchi massivning har bir yozuvi tegishli tarkib identifikatori (identifikator, kalit so'z, atama, muallifning ismi, tashkilot nomi va boshqalar) bilan aniqlanadi va u joylashgan barcha qidiruv rasmlaridagi nomlarning nomlarini (saqlash manzillarini) o'z ichiga oladi. Inverted qatoridagi har bir kontent identifikatori (qidiruv ma'lumoti elementi) uchun hujjatning manzili (raqami, nomi) bilan birga qo'shimcha ma'lumotlar saqlanishi mumkin (va odatda saqlanadi), masalan: ushbu hujjat ushbu element topilgan maydon nomi, jumla raqami. , gapdagi so'z raqami va boshqalar. Matndagi so'zning o'rnini gapning soniga va gapdagi ushbu so'zning soniga aniq belgilash, hujjatdagi so'zlar va jumlalar orasidagi masofani belgilashga imkon beradigan moslashuvchan so'rovlar tilini yaratishga imkon beradi. Pozitsion xususiyatlar, shuningdek, qidiruv natijalarida dolzarblik darajasi va reyting hujjatlarini hisoblashda ishlatiladi.
    Teskari fayl orqali kerakli hujjatlarni topish butun massivni doimiy ravishda skanerlash orqali emas, balki faqat teskari faylda qidirish retseptida ko'rsatilgan tarkib identifikatorlarini ko'rish orqali amalga oshiriladi, ya'ni. qidiruvdagi so'zlarni taqqoslash operatsiyalari soni qidirish retseptidagi atamalar soniga mutanosibdir. Tizimlarning ishlashining bunday usuli qidiruv vaqtini qisqartiradi va real vaqt rejimida iste'molchilarga xizmat ko'rsatishga imkon beradi.
    Indeksni izlash - bu qidiruv modeli va moslik mezonlariga muvofiq qidiruv elementlari identifikatorlari ro'yxatlaridagi operatsiyalar. Olingan tegishli hujjatlarning ro'yxati (zamonaviy terminologiyada "javob"), gipermatnli havolalar va boshqa xususiyatlar bilan ta'minlangan hujjatlarning qisqacha tavsiflarining tartiblangan ro'yxatiga aylantirilib, foydalanuvchiga o'z mijozining brauzer dasturida qaytariladi. Qisqacha tavsifdagi hujjat nomini bosish (ko'prik bo'yicha) ushbu hujjatni to'g'ridan-to'g'ri o'zi joylashgan serverdan yoki qidiruv tizimining ma'lumotlar bazasi orqali so'raydi.
    Zamonaviy IRS-ning muhim tarkibiy qismi bu oldingi veb-sahifalar deb ataladi, ya'ni. foydalanuvchi qidiruv tizimi bilan aloqa o'rnatadigan ekran shakllari. Old sahifalarning ikkita asosiy turi mavjud: so'rovlar sahifalari va qidiruv natijalari sahifalari.
    iloji boricha ko'proq saytlarning to'liq matnlarini indeksatsiya qilish;
    So'z shakllari bilan "vakolatli" ishlash - XKSning bir xil leksemaning turli xil so'z shakllarini, boshqacha tarzda aniqlash, kanonik shakl - lemma hosil qilish qobiliyati va so'z shakllari to'plami orasida ma'lum bir shaklni tanlash qobiliyati;

    Download 0,58 Mb.
    1   ...   9   10   11   12   13   14   15   16   ...   32




    Download 0,58 Mb.