MUHAMMAD AL-XORAZMIY NOMIDAGI
TOSHKENT AXBOROT TEXNOLOGIYALARI UNIVERSITETI
AXBOROTLARNI IZLASH
VA AJRATIB OLISH
SWD 1316
Boolev izlash tizimi va intellektual qidiruv
turlari
02
MAVZU
Ochilov Mannon Musinovich
“Sun’iy intellekt” kafedrasi dotsenti
Mavzuda ko
‘riladigan savollar
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
2
Bool qidiruv tizmi nima va u qayerda foydalaniladi?
Intellektual qidiruv tizmi nima va u qayerda foydalaniladi?
Klasterlash nima?
Data mining nima?
Neyron tarmoq nima?
Meta teg nima?
Mа’ruza rejasi
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
3
Boolev qidiruv tizimi va uning mehanizmi;
Intellektual qidiruv va uning mexanizmi.
Internetda qidiruv tizimlari.
Xulosa.
Teskari indeks va indekslarni oddiy
mantiqiy so
‘rovlari
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
4
Mantiq algebrasining asosiy tushunchalari.
Asosan uchta jarayon bor:
1.
AND
, birikma,
VA
(˄);
2.
OR
, disjunktsiya,
YOKI
(˅);
3.
NOT
, inkor,
INKOR
(ˉ).
Mantiq algebrasining asosiy qoidalari.
1 AND 1 = 1
1 AND 0 = 0
0 AND 1 = 0
0 AND 0 = 0
1 OR 1 = 1
1 OR 0 = 1
0 OR 1 = 1
0 OR 0 = 0
NOT 1 = 0
NOT 0 = 1
Bool algebrasi orqali axborot qidirishga misol
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
5
Aytaylik, bizda Shekspir peysalari to‘plami bor. Ushbu to'plamni
hujjatlar to'plami deb ataymiz.
Vazifa
: Qaysi peysada
Brutus
,
Caesar
so‘zlari ishlatilgani va
Calpurnia
so‘zi ishlatilmaganini aniqlang.
Ushbu vazifani bajarish uchun matnni boshidan oxirigacha o'qib
chiqishingiz va
Brutus
va
Caesar
so'zlarini o'z ichiga olgan va
Calpurnia
so'zini o'z ichiga olmagan peysalarni belgilashimiz kerak.
Mantiqiy (Boolev) qidiruv
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
6
Ushbu muammoni hal qilishning eng oddiy kompyuter usuli to'plamdagi
barcha hujjatlarni ketma-ket skanerlash (chiziqli skanerlash) bilan bog'liq.
Bu jarayon ko'pincha to'g'ridan-to'g'ri qidirish yoki ingliz tilida
grepping
deb ataladi. To'g'ridan-to'g'ri matn qidirish juda samarali bo'lishi mumkin,
ayniqsa zamonaviy kompyuterlarda.
Zamonaviy
kompyuterlarda
o'rtacha
o'lchamdagi
ma'lumotlar
to'plamlarida (bir million so'zgacha) oddiy so'rovlarni bajarish oddiy
foydalanuvchi uchun etarli.
Mantiqiy (Boolev) qidiruv
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
7
Bunday hollarda hujjat indeksidan foydalaniladi. Hujjat indeksi
hujjatlarni ketma-ket skanerlashni oldini olish uchun ishlatiladi. Buning uchun
har bir hujjat uchun biz topshiriqdan ma'lum bir so'z bor yoki yo'qligini
ko'rsatadigan yozuv yaratamiz.
Barcha so'zlar uchun yozuvlarni yaratish natijasida ikkilik
"so'z-hujjat"
matritsasi tuziladi.
Ushbu matritsada ustun hujjat vektori, satr so'z vektoridir.
Mantiqiy (Boolev) qidiruv
|