Klasterlash algoritmlari
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
30
Klasterlashtirish
bu bir nechta obyektlarni klaster deb nomlangan guruhlarga
bo'lish vazifasidir. Klasterlash va tasniflash o'rtasidagi asosiy farq shundaki,
guruhlar
ro'yxati aniq belgilanmagan va algoritm ishlash jarayonida aniqlanadi.
Klasterlash algoritmlari
orasida ierarxik va tekis guruhlar ajralib turadi. Ierarxik
algoritmlar (shuningdek, taksonomiya algoritmlari deb ataladi) namunaning faqat bitta
qismini bo'linib bo'lmaydigan klasterlarga emas, balki ichki qismlarga ajratish tizimini
yaratadi. Shunday qilib, algoritmning natijasi klasterlar daraxtidir, uning ildizi butun
namunadir, barglari esa eng kichik klasterlardir.
Internetda qidirish tizimlari
AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
31
Internetda ma'lumot izlashning asosiy vositasi - qidiruv tizimidir.
Qidiruv tizimi Internet saytlarini ko'rib chiqadigan o'rgatuvchi dasturdan va ko'rilgan
saytlar haqida ma'lumotni o'z ichiga olgan ma'lumotlar bazasidan iborat.
Veb-sayt
boshqaruvchisi iltimosiga binoan, robot o'rgimchakchasi saytga kiradi va
saytning sahifalarini qidirish mexanizmi indeksiga kiritib, sayt sahifalarini ko'radi. Sayt
ma'muri ro'yxatdan o'tish uchun ariza bermagan bo'lsa ham, qidiruv tizimi saytni topishi
mumkin. Agar saytga havola qidiruv tizimining (masalan, boshqa saytda) bir joyga tushib
qolsa, u darhol saytni indeksatsiya qiladi.
O'rgimchak sayt
sahifalarini qidiruvi indeksiga
ko'chirmaydi, lekin saytning har bir sahifasining tuzilishi haqida ma'lumotni saqlaydi -
masalan, qaysi so'zlar hujjatda va qanday tartibda, sayt sahifasining ko'prigi, kilobaytdagi
hujjatning o'lchami, yaratilgan sana va boshqalar. Shuning uchun, qidiruvi indekslari
indekslangan ma'lumotlarning hajmidan bir necha marta kichikroq.
|