Klasterlash usullarining umume'tirof etilgan tasnifi mavjud emas, lekin bir qator yondashuvlar guruhlarini ajratish mumkin (ba'zi usullarni bir vaqtning o'zida bir nechta guruhlarga kiritish mumkin, shuning uchun bu tiplashtirishni klasterlashning haqiqiy tasnifiga qandaydir yaqinlik sifatida ko'rib chiqish taklif etiladi. usullari) [9] :
Ehtimoliy yondashuv . Har bir ko'rib chiqilayotgan ob'ekt k sinflardan biriga tegishli deb taxmin qilinadi. Ayrim mualliflar (masalan, A. I. Orlov) bu guruhni klasterlashtirishga umuman mansub emas deb hisoblaydilar va unga “diskriminatsiya” nomi ostida, ya’ni ob’ektlarni ma’lum guruhlardan biriga (o’quv namunalari) berishni tanlashga qarshi chiqadilar.
Sun'iy intellekt tizimlariga asoslangan yondashuvlar: juda shartli guruh, chunki usullar juda ko'p va uslubiy jihatdan ular juda farq qiladi.
mantiqiy yondashuv. Dendrogrammani qurish qaror daraxti yordamida amalga oshiriladi.
Grafik-nazariy yondashuv.
Ierarxik yondashuv. Ichki guruhlar (turli tartibdagi klasterlar) mavjudligi taxmin qilinadi. Algoritmlar, o'z navbatida, aglomerativ (birlashtiruvchi) va bo'linuvchi (ajratuvchi) ga bo'linadi. Xususiyatlari soniga ko'ra, ba'zida tasniflashning monotetik va politetik usullari farqlanadi.
Ierarxik bo'linish klasterlash yoki taksonomiya. Klasterlash muammolari miqdoriy taksonomiyada ko'rib chiqiladi .
Boshqa usullar. Oldingi guruhlarga kiritilmagan.
Statistik klasterlash algoritmlari
Klasterlar ansambli
KRAB oilasining algoritmlari
Elakdan o'tkazish usuliga asoslangan algoritm
DBSCAN va boshqalar.
4 va 5 yondashuvlar ba'zan strukturaviy yoki geometrik yondashuv nomi ostida birlashtiriladi, bu yaqinlik haqidagi yanada rasmiylashtirilgan tushunchaga ega [10] . Ro'yxatdagi usullar o'rtasidagi sezilarli farqlarga qaramay, ularning barchasi asl " ixchamlik gipotezasiga " tayanadi : ob'ekt fazosida barcha yaqin ob'ektlar bir xil klasterga tegishli bo'lishi kerak va barcha turli ob'ektlar mos ravishda turli klasterlarda bo'lishi kerak.
Biologiyada
Biologiyada klasterlash turli sohalarda juda ko'p qo'llaniladi. Masalan, bioinformatikada u ba'zan yuzlab yoki hatto minglab elementlardan tashkil topgan o'zaro ta'sir qiluvchi genlarning murakkab tarmoqlarini tahlil qilish uchun ishlatiladi. Klaster tahlili o'rganilayotgan tizimning pastki tarmoqlari, to'siqlari, markazlari va boshqa yashirin xususiyatlarini aniqlash imkonini beradi, bu esa pirovardida har bir genning o'rganilayotgan hodisaning shakllanishiga qo'shgan hissasini aniqlash imkonini beradi.
Ekologiya sohasida u organizmlar, jamoalar va boshqalarning fazoviy jihatdan bir hil guruhlarini aniqlash uchun keng qo'llaniladi. Kamroq, vaqt o'tishi bilan jamoalarni o'rganish uchun klaster tahlil usullari qo'llaniladi. Jamoalar tuzilishining heterojenligi klaster tahlilining ahamiyatsiz bo'lmagan usullarining paydo bo'lishiga olib keladi (masalan, Chekanovskiy usuli ).
Tarixiy jihatdan o'xshashlik o'lchovlari biologiyada farq o'lchovlari (masofa) emas, balki yaqinlik o'lchovlari sifatida ko'proq qo'llaniladi.
|