|
Resurslarni tahlil qilish va ma'lumot to'plash
|
bet | 6/32 | Sana | 16.09.2024 | Hajmi | 0,58 Mb. | | #271195 |
Bog'liq Mavzu axborotni izlash rejaResurslarni tahlil qilish va ma'lumot to'plash
Resurslarni dastlabki tahlil qilish, agar mavjud bo'lsa, izohlarga va agar kerak bo'lsa, manbaning mazmuni bilan tanishishga asoslangan. Tanlangan manbalardan olingan ma'lumotlar ma'lum bir manbaga mos keladigan usullardan foydalanib olinadi, bu sezilarli aloqa, hisoblash va disk resurslarini talab qilishi mumkin.
Qisqacha axborot veb-manbalarining quyidagi turlarini ajratish mumkin:
Kompaniyalarning tijorat saytlari;
Ikkilamchi axborot saytlari;
Tahliliy ma'lumot manbalari;
Mintaqaviy axborot resurslari.
Hozirgi kunda Internetning rus tilidagi qismida bir qator manbalar mavjud, ular odatda jadval ko'rinishida qo'shimcha ma'lumot beradi. Bunday manbalarda nashr qilish uchun ma'lumot berish Internetda o'z vakiliga ega bo'lmagan kompaniyalar uchun arzonroq variant.
Qidiruv muammolari
Muammolardan biri sof uslubiy. Samarali qidiruvni amalga oshirish uchun biz bir vaqtning o'zida ikkita qarama-qarshi muammoni hal qilishdan manfaatdormiz:
Tegishli ma'lumotlarning maksimal miqdorini olish uchun qamrovni oshirish;
Shovqin haqida ma'lumotni minimallashtirish uchun qamrovni kamaytirish. Bir vaqtning o'zida buni amalga oshirish juda qiyin, ammo bu hali ham imkoni bor. Agar qidirish mexanizmi ruxsat bersa, usullardan biri aniq cheklovlarni (taqiqlangan so'zlarni) kiritishdir. Ikkinchisi so'rovlarning to'g'ri shakllanishidan iborat, xususan, bir nechta maxsus so'rovlarni bitta generalga nisbatan afzal ko'rish. Afsuski, aksariyat mashinalarning juda cheklangan kirish tili ushbu yo'nalishda ijod qilish uchun katta joy qoldirmaydi.
Yana bir muammo - bu inson tilining ko'p qirraliligi. Agar ingliz tilida ba'zi so'zlar turli xil ma'nolarga ega bo'lsa, unda ruscha so'zlarning morfologik tafovutlariga boy va qidiruvning to'liqligi uchun sinonimlarni ham hisobga olish kerak.
Ko'pincha rus Interneti sohasida turli xil ma'lumotlarni kodlash tufayli texnik qiyinchiliklar yuzaga keladi. Rossiya qidiruv tizimlari foydalanuvchi va siz qidirayotgan saytning kodlarini taniydi, lekin ularni birlashtirish har doim ham mumkin emas.
Tarmoqning rus tilidagi qismining yana bir xususiyati uning beqarorligidir. Saytlarning manzillari va tuzilishi doimiy ravishda o'zgarib turadi, ular paydo bo'ladi va yo'qoladi va qidiruv tizimlarida indekslangan ma'lumotlar bazalarini yangilashga vaqtlari yo'q, shuning uchun siz tomonidan berilgan hujjatlar ro'yxatining muhim qismi mavjud bo'lmasligi mumkin. 1997 yil sentyabr oyida haftasiga bir marta ma'lumotlarni yangilab turuvchi Yandex-Web tizimining paydo bo'lishi bu muammoni hal qilishda oldinga siljishni ko'rsatdi.
Qidiruv muhim axborot jarayoni. Qidiruvni tashkil etish va o'tkazish imkoniyatlari ma'lumotlarning mavjudligi, uning mavjudligi, shuningdek, qidiruvni tashkil etishning vositalari va ko'nikmalariga bog'liq. Har qanday qidirishning maqsadi foydalanuvchilarga kerak bo'lgan har xil ma'lumotlarni topish usullaridan foydalanishdir.
Atamasi ma'lumot qidirish "(Inglizcha" ma'lumot olish ") Amerika matematiki C. Muers tomonidan kiritilgan. U kerakli ma'lumotlarni qidirish uchun qidiruv ishlari olib borilganini payqadi. Buning uchun avval siz ma'lumot so'rovini shakllantirishingiz kerak, so'ngra uni turli xil ma'lumot manbalarida kerakli ma'lumotlarni qidirish uchun ishlatishingiz kerak.
Ular har qanday qidiruv jarayonlarini amalga oshiradigan tizimlar deyiladi qidiruv tizimlari(PS). Ma'lumot qidirish uchun “ ma'lumot olish tizimlari” (inglizcha "Axborot-qidiruv tizimlari", IRS). An'anaviy texnologiyalarda IPS fayllar kabinetlari va kataloglar, ma'lumotnomalar, indekslar, entsiklopediyalar, arxivlar va boshqa materiallardir.
Kompyuter tizimlarida ma'lumotlarni qidirish va saqlash uchun elektron ma'lumot olish tizimlari (IPS) qo'llaniladi. Bular maxsus kompyuter dasturlari bo'lib, ular yordamida elektron ma'lumotlar bazalarida va ma'lumotlar banklarida ma'lumotlarni yaratish, yangilash (yangilash), saqlash va qidirish. Qidiruv natijasi to'g'ri to'ldirilgan so'rovga ham, foydalanuvchining qidiruv amalga oshirilgan elektron ma'lumotlar bazasida va ma'lumotlar bankiga kerak bo'lgan ma'lumotlarning mavjudligiga ham bog'liq. IPS-da qidirish foydalanuvchi ushbu tizimni kalit (qidirish) so'zlari va iboralaridan iborat so'rovni so'raganidan keyin amalga oshiriladi. Buning uchun u "VA", "OR", "YO'Q" va boshqa IPS imkoniyatlaridan foydalanishi mumkin.
|
| |