|
Mavzu: Axborotni izlash
|
bet | 15/32 | Sana | 16.09.2024 | Hajmi | 0,58 Mb. | | #271195 |
Bog'liq Mavzu axborotni izlash rejaTadqiqotning maqsadi avtomatlashtirilgan axborot qidirish tizimlarini o'rganishdir.
Ushbu kurs ishidagi vazifa avtomatlashtirilgan axborot olishning nazariy asoslarini, tasnifini va axborot qidirish tizimlarining turlarini o'rganadi. Shuningdek, u hozirda ishlatilgan ma'lumotlarning materiallarini tahlil qiladi - kataloglarni qidirish to'liq matnli va gipermatnli qidiruv tizimlari.
Internet paydo bo'lishi bilan qidirish muammosi dolzarb bo'lib qoldi. Internet - bu butun dunyo bo'ylab kompyuter tarmog'i bo'lib, u yagona axborot muhiti bo'lib, istalgan vaqtda ma'lumot olish imkoniyatini beradi. Ammo boshqa tomondan, Internetda juda ko'p foydali ma'lumotlar saqlanadi, ammo ularni topish uchun ko'p vaqt talab etiladi. Ushbu muammo qidiruv tizimlarining paydo bo'lishiga sabab bo'ldi. Ushbu kursda Internetda qidiruv tizimlari ko'rib chiqiladi.
1-bob. Axborot qidirish tizimlari
1 Axborot qidirish tizimlari haqida tushuncha
Ma'lumot qidirish insoniyat ko'p asrlar davomida hal qilib kelayotgan vazifadir. Bir kishiga (masalan, kutubxonaga tashrif buyuruvchiga) ega bo'lishi mumkin bo'lgan axborot resurslari hajmi oshgani sayin, kerakli hujjatni topish uchun tobora takomillashtirilgan va takomillashtirilgan qidiruv vositalari va texnikalari ishlab chiqildi.
Avtomatlashtirilgan qidiruv tizimi - bu belgilangan funktsiyalarni bajarish uchun axborot texnologiyalarini amalga oshiradigan xodimlar va ularning faoliyatini avtomatlashtirish vositalari to'plamidan iborat tizim.
Faoliyatning turli sohalarida tizimlarni yaratish tajribasi va amaliyoti ularning mohiyatining barcha jihatlarini yanada to'liq aks ettiradigan kengroq va universal ta'rif berishga imkon beradi.
Axborot qidirish tizimi - bu ma'lumot qidirish tili va tegishli qidirish qoidalariga asoslangan ma'lumot manbalari (indeks) tavsiflari bilan maxsus ma'lumotlar bazasida kerakli ma'lumotlarni qidirish va tanlashni ta'minlaydigan tizim.
Har qanday XKSning asosiy vazifasi foydalanuvchining axborot ehtiyojlariga mos ma'lumotlarni topishdir. Qidiruv natijasida hech narsani yo'qotmaslik, ya'ni so'rov bilan bog'liq barcha hujjatlarni topish va ortiqcha narsalarni topmaslik juda muhimdir. Shu sababli, qidiruv protsedurasining sifatli xarakteristikasi - dolzarbligi kiritiladi.
Muvofiqlik - qidiruv natijalarining formulali so'rovga mos kelishidir.
Bundan tashqari biz asosan Internet tarmog'ining (WorldWideWeb) Internet-resurslarini ko'rib chiqamiz. WWW uchun IRSning asosiy ko'rsatkichlari fazoviy miqyos va ixtisoslashuvdir. Fazoviy miqyosi bo'yicha XKSni mahalliy, global, mintaqaviy va ixtisoslashgan deb ajratish mumkin. Mahalliy qidiruv tizimlari uchun mo'ljallangan bo'lishi mumkin tezkor qidiruv bitta server miqyosidagi sahifalar. Mintaqaviy IRS ma'lum bir mintaqaning axborot resurslarini, masalan, Internetdagi rus tilidagi sahifalarni tavsiflaydi. Global qidiruv tizimlari, mahalliylardan farqli o'laroq, cheksizlikni qabul qilishga intilishadi - Internetning barcha axborot makonining resurslarini iloji boricha to'liq tavsiflash.
2 IPS rivojlanish tarixi
Keling, turli xil kompyuter tizimlari o'rtasida taqsimlangan axborot resurslaridan birgalikda foydalanish zarurati paydo bo'lishi munosabati bilan yaratilgan Internet tarixiga to'xtalamiz. Dastlabki dasturlarning aksariyati, shu jumladan FTP va elektron pochta, faqat Internet-xostlar o'rtasida ma'lumot almashish uchun ishlab chiqilgan.
Boshqa dasturlar, masalan, Telnet, foydalanuvchiga nafaqat ma'lumotlarga, balki masofaviy tizimning ish resurslariga ham kirish imkoniyatini berish uchun ishlab chiqilgan. Internet rivojlanishi bilan (ko'proq foydalanuvchilar va xostlar) ma'lumotlar almashinuvining eski usullari foydalanuvchilarning ortib borayotgan ehtiyojlarini qondira olmaydi. Tarmoq resurslarini izlash va ularga kirishning yangi usullarini ishlab chiqish zarurati tug'ildi, bu esa uning shakli va joylashuvidan qat'i nazar ma'lumotlardan foydalanish imkoniyatini yaratdi.
Ushbu ehtiyojlarni qondirish uchun birinchi navbatda FTP serverida resurslarni lokalizatsiya qilish muammosini hal qiluvchi Archie qidiruvi va turli tarmoq resurslariga kirishni soddalashtiradigan Gopher tizimi yaratildi. Keyin tarmoqqa oid axborot tizimlari ishlab chiqildi Butun dunyo Axborot olishning mutlaqo yangi usullarini taklif qiluvchi veb va WAIS. Ushbu tizimlarning ishlash printsiplari Internetning o'zi ishlash mexanizmlarini taqdim etish zaruriyatisiz juda ko'p miqdordagi axborot resurslarida harakat qilishni osonlashtiradi. Ushbu yondashuv nafaqat o'zaro bog'liq kompyuter tizimlarining resurslari haqida, balki tarmoqning maxsus axborot bo'shliqlari to'g'risida gaplashishga imkon beradi.
Archie tizimi bu maxsus ma'lumotlar bazalari bilan ishlaydigan dasturiy vositalar to'plamidir. Ushbu ma'lumotlar bazalarida FTP xizmati orqali kirish mumkin bo'lgan fayllar to'g'risida doimiy ravishda yangilanadigan ma'lumotlar mavjud. Archie tizimining xizmatlaridan foydalangan holda siz uning nomidagi naqsh bo'yicha faylni qidirishingiz mumkin. Bunday holda, foydalanuvchi tarmoqdagi saqlash joyini aniq ko'rsatadigan fayllar ro'yxatini, shuningdek fayllarning turi, yaratilish vaqti va hajmi to'g'risida ma'lumot oladi. Archie axborot qidirish tizimiga so'rovlardan tortib turli xil yo'llar bilan kirish mumkin elektron pochta va Telnet xizmati yordamida va Archie grafik mijozlaridan foydalanish bilan yakunlanadi.
Gopher tizimi Internet FTP resurslarini lokalizatsiya qilish jarayonini soddalashtirish va FTP serverlarida saqlanadigan fayllar tarkibi to'g'risidagi ma'lumotlarni qulayroq taqdim etish uchun ishlab chiqilgan. Gopher tizimi foydalanuvchilarga mavjud fayllar va ularning mazmuni haqida taqdim etish uchun qulay shaklda (menyu ko'rinishida) imkoniyat yaratadi. Gopher server menyularida boshqa Gopher va FTP serverlariga havolalar bo'lishi mumkin. Shunday qilib, foydalanuvchi imkoniyatga ega bo'ladi sayohat Internetda, qiziqish manbalarining joylashishiga e'tibor bermaslik va ushbu manbalarga kirish huquqini olish.
Veronika tizimi Gopher makonidagi ma'lumotlarni menyu elementlari sarlavhalari bo'yicha qidirish uchun ishlatiladi. Kalit so'zni kiritgandan so'ng, Veronica tizimi har qanday Gopher serveridagi menyuda mavjudligini aniqlaydi va kalit so'zni o'z ichiga olgan menyu elementlari sarlavhasini qidiruv natijalari sifatida qaytaradi. Veronika tizimi avtonom bo'lmaganligi sababli qidiruv dasturi, lekin Gopher tizimi bilan chambarchas bog'liq, u Gopher tizimi bilan bir xil kamchiliklarga ega: sarlavhadan u yoki bu ma'lumot manbai nima ekanligini bilish har doim ham mumkin emas. Tizimning afzalligi shundaki, topilgan ma'lumotlar qayerda joylashganligini aniqlashga hojat yo'q, faqat ro'yxatdan kerakli yozuvni tanlang.
3 ISS tuzilishi
Axborot-qidirish tizimining tuzilishi uning funktsional maqsadi, ko'lami va u tavsiflagan predmet sohasining xususiyatlariga asoslanadi.
Funktsional jihatdan, XKS tezkor va qulay qidirish va ma'lumotni ichki ish uchun ham, ularni turli SAPR tizimlariga tayyorlash uchun ham step motorlaridagi katta hajmdagi ma'lumotlarni tanlash uchun mo'ljallangan. Bu foydalanuvchi interfeysi qurilishiga va ma'lumotni taqdim etish shakliga ma'lum talablarni qo'yadi. IRS strukturasini barpo etishda potentsial foydalanuvchining kontekstni sezgir so'rovlar tizimiga kirish ehtiyoji ham hisobga olinadi.
Yuqoridagi talablarni amalga oshirish quyidagi tarkibiy qismlarga, ya'ni bloklar deb nomlangan:
ma'lumotlar bazasini yaxlitligini tekshirish;
ko'rish;
tahrirlash;
parolni himoya qilish;
natija chiqarish;
qidiruv parametrlarini saqlash;
Bosqichli dvigatellar uchun ma'lumot olish tizimining aynan shunday tuzilishini tanlash juda oddiy mantiqqa asoslanadi - tizimning har qanday bloki ma'lumotlarni qabul qilishi, uni qayta ishlashi va foydalanuvchiga jarayonning mantig'ini ta'minlab, ma'lum tartibda berishi kerak.
Keling, har bir blokni batafsil ko'rib chiqamiz (1-rasm):
Ma'lumotlar bazasini yaxlitligini tekshirish uchun blok ma'lumotlar bazasining barcha tarkibiy qismlarini tekshiradi.
Ko'rish bloki ma'lumotlar bazasini ko'rish orqali tizimda ishlashni boshlashga va keyin boshqa ish rejimini tanlashga imkon beradi.
Tahrirlash bloki faqat ma'lumotlar bazasining maydonlarini tahrir qiladi va ma'lumotlar bazasi jadvallariga xususiyatlarini o'zgartirish, yangi kiritish va eski yozuvlarni o'chirish imkonini beradi. Bundan tashqari, bu erda ish rejimini o'zgartirishingiz mumkin.
Parolni himoya qilish bloki olti xonali parolni kiritish orqali ma'lumotlarni tahrirlashga kirish huquqini bloklaydi.
Qidiruv bloki kiritilgan texnik shartlarni (TOR) qidirish va boshqa ish rejimlariga o'tish uchun mo'ljallangan.
Qidiruv natijalarining chiqish bloki aniqlangan barcha step motorlarini va ularning xususiyatlarini qidiruv spetsifikatsiyasiga muvofiq ma'lum tartibda aks ettiradi. Qidiruv parametrlarini saqlash birligi ma'lumotlarni qidiruvning keyingi bosqichiga qadar qayd qiladi va saqlaydi.
Yordam bloki tizimning turli xil ish rejimlarida ko'rsatma vazifasini bajaradi.
Shakl 1. ISS tuzilishi.
ISSning ko'lami, yuqorida aytib o'tilganidek, axborot bilan ichki ish va modullardan biri sifatida ISSni o'z ichiga olgan SAPR ishida foydalanish uchun ma'lumotlarni qayta ishlash. Bu tizimning ishlash ishonchliligi uchun juda yuqori talablarni nazarda tutadi, chunki har qanday SAPR ishonchlilik parametrlari berilgan juda murakkab tuzilishga ega va bunday tuzilishga kiritilgan har bir struktura kamida butun tizimdan kam bo'lmasligi kerak. Kerakli ishonchlilik ko'rsatkichlarini ta'minlash, o'z navbatida, asosan tizimning tuzilishi bilan belgilanadi. ISS ma'lumotlar bazasini tashkil qilish uchun mavzuni to'liq o'rganish kerak. Ushbu ISSda predmet sohasi step motorlarining keng sinfidir.
ma'lumot qidirish asos berilgan
Axborot-qidirish tizimlari (ISS) Internet o'zining tashqi xilma-xilligi bilan ham ushbu sinflardan biriga kiradi. Shuning uchun ushbu ISSlar bilan tanishishdan oldin mavhum alfavit (lug'at), sistematik va predmetli ISSlarni ko'rib chiqamiz. Buning uchun biz ma'lumot olish nazariyasidan ba'zi atamalarga ta'rif beramiz.
Axborot qidirish tizimlarining tasnifi
ISS tasnifida axborotning ierarxik (daraxtga o'xshash) tashkiloti ishlatiladi, bu KLASSIFIER deb nomlanadi. Tasniflagichning bo'limlari HEADINGS deb nomlanadi. ISS tasnifining kutubxona analogi bu tizimli katalogdir. Tasniflovchi mualliflar jamoasi tomonidan ishlab chiqilgan va takomillashtirilgan. Keyin u SYSTEMATORS deb nomlangan boshqa bir mutaxassislar guruhi tomonidan qo'llaniladi. Tizimlashtiruvchilar, klassifikatorni bilgan holda, hujjatlarni o'qiydilar va ularga ushbu hujjatlar tasniflagichning qaysi bo'limlariga mos kelishini ko'rsatuvchi tasnif indekslarini berishadi.
|
| |