|
k-means klasterlashni moslashtirish
|
bet | 9/10 | Sana | 16.05.2024 | Hajmi | 345,87 Kb. | | #237900 |
Bog'liq Mustaqil ish 418.5.4.1 k-means klasterlashni moslashtirish
Baholar matritsasini klasterlash uchun 6. bobda muhokama qilingan ko'plab klasterlash usullarini moslashtirish mumkin. Biroq, bu usullarni kam ko'rsatilgan to'liq bo'lmagan ma'lumotlar to'plamlariga moslashtirish muhimdir. k-means va Kutish Maksimallashtirish kabi usullardan normallashtirilgan reyting matritsasi bo'yicha foydalanish mumkin. 6.Bob tavsifidan k-means usulida ikkita asosiy farq bor:
k-means iteratsiyasida markazlar har bir o'lchovni klaster a'zolaridagi belgilangan qiymatlar soni bo'yicha o'rtacha hisoblash yo'li bilan hisoblanadi. Bundan tashqari, markazning o'zi to'liq aniqlanmagan bo'lishi mumkin.
Ma'lumotlar nuqtasi va markaz o'rtasidagi masofa faqat ikkalasida ham belgilangan o'lchamlar bo'yicha hisoblanadi. Bundan tashqari, turli xil ma'lumotlar nuqtalarini adolatli taqqoslash uchun masofa bunday o'lchamlar soniga bo'linadi.
Klasterlash usulini qo'llashdan oldin reyting matritsasi normallashtirilishi kerak.
18.5.4.2 Co-klasterlashni moslashtirish
Birgalikda klasterlash(co-clustering) usuli 13-bob. 13.3.3.1bo'limda tasvirlangan. Birgalikda klasterlash siyrak matritsalardagi foydalanuvchilar va elementlarning qo'shni to'plamlarini topish uchun juda mos keladi. Ko'rsatilgan yozuvlar birgalikda klasterlash uchun 1 lar va aniqlanmagan yozuvlar 0 lar sifatida ko'rib chiqiladi. 18.4b-rasmdagi foydali matritsaga tatbiq etilgan birgalikda klasterlash yondashuviga misol 18.6a-rasmda ko'rsatilgan.
Bunday holda, oddiylik uchun faqat 2 tomonlama birgalikda klaster ko'rsatilgan.
Birgalikda klasterlash yondashuvi foydalanuvchilarni va ob'ektlarni bir-biriga aniq mos keladigan guruhlarga ajratadi. Shu sababli, foydalanuvchi-qo’shni va ob'ekt-qo’shni bir vaqtning o'zida topiladi. qo’shni qiymatlar aniqlangandan so'ng, yuqorida aytib o'tilgan foydalanuvchiga asoslangan usullar va elementlarga asoslangan usullar yetishmayotgan yozuvlar uchun tamin qilish uchun ishlatilishi mumkin.
foydalanuvchilar elementlar
a guruh qiziquvchilar
b guruh qiziquvchilar
birgalikda klasterlash(co-clustering) (b)foydalanuvchi-element grafigi
18.6 rasm: foydalanuvchi-element grafigini birgalikda klasterlash
Birgalikda klasterlash yondashuvi foydalanuvchi elementi grafigi nuqtai nazaridan ham yaxshi talqinga ega. G = (Nu ∪ Ni, A) afzallik grafigini bildirsin, bu erda Nu - foydalanuvchilarni ifodalovchi tugunlar to'plami va Ni - elementlarni ifodalovchi tugunlar to'plami. Yordamchi matritsaning har bir nolga teng bo'lmagan kirishi uchun A nig ichida yo'naltirilmagan chekka mavjud. Keyin co-klaster bu grafik tuzilishining klasterlashuvidir. Tegishli ikki tomonlama grafik bo'limi 18.6b-rasmda ko'rsatilgan. Ushbu talqin tufayli Foydalanuvchi-element grafiklari nuqtai nazaridan, yondashuv bir vaqtning o'zida element-element va foydalanuvchi-foydalanuvchi o'xshashligidan foydalanishga qodir. Birgalikda klasterlash usullari ham, yashirin omillardan foydalangan holda qatorlar va ustunlarni bir vaqtning o'zida klasterlashadigan manfiy bo'lmagan matritsa faktorizatsiyasi kabi yashirin omil modellariga yaqin aloqador.
|
| |