qayerdaQRezyumekvartil o'zgaruvchanlik koeffitsienti bo'lib, birinchi kvartil tomonidan berilganQ1, va uchinchi chorak tomonidan berilganQ3.
Klasterlash usuli
Adabiyotda bir nechta klasterlash yondashuvlari qo'llanilgan, jumladan sun'iy neyron tarmoqlari (ANN) (Emu
va boshqalar, 2022; Brombacher va
boshqalar, 2017;
Vang va boshqalar, 2017), Tasodifiy o'rmon (Li va boshqalar, 2017) va yorliqli ma'lumotlarni (ya'ni, asosiy haqiqat ma'lumotlari) talab qiladigan nazorat ostida o'rganish usullari uchun Yordam Vektor mashinasi (SVM). Biroq, asosan, etiketli ma'lumotlar tadqiqotchilar uchun mavjud emas.
Shunday qilib, nazoratsiz o'rganish usullari (masalan, klasterlash algoritmlari) turli xil haydash uslublarini belgilash uchun qo'llanilishi mumkin (Tselentis va Papadimitriu, 2023;
Mantouka va boshqalar, 2019; Mohammadnazar va boshqalar, 2021) ular orasida k-o'rtacha, k-medoid va ierarxik klasterlash eng ko'p ishlatiladigan algoritmlar qatoriga kiradi (Jentlmen va Keri, 2008 yil; Kassambara, 2017 yil). Ushbu tadqiqotda keyingi usullar qo'llanildi, chunki ular boshqa sinovdan o'tgan usullardan farqli o'laroq, klasterlash o'lchovlari uchun moslik darajasiga qarab yaxshiroq moslikni ta'minladi. Algoritmlarning tavsifi va klasterlash usulini tanlash va haydash hodisalarini tasniflash uchun klasterlar sonini aniqlashga yondashuv quyida keltirilgan.
K-klasterlash demakdir
K-means - bu ma'lumotlar nuqtalarini guruhlash uchun bo'linish
algoritmikcentroidlar ichiga kiradi
khar bir ma'lumot nuqtasi eng yaqin markazda guruhlangan tarzda klasterlar (Jeyn, 2010 yil). Maqsad funktsiyasi quyida keltirilgan K-o'rtacha algoritmlarida xatolikni kamaytiradi (Gan