qayerdaQRezyumekvartil o'zgaruvchanlik koeffitsienti bo'lib, birinchi kvartil tomonidan berilganQ1, va uchinchi chorak tomonidan berilganQ3.
Klasterlash usuli
Adabiyotda bir nechta klasterlash yondashuvlari qo'llanilgan, jumladan sun'iy neyron tarmoqlari (ANN) (Emu va boshqalar, 2022; Brombacher va boshqalar, 2017; Vang va boshqalar, 2017), Tasodifiy o'rmon (Li va boshqalar, 2017) va yorliqli ma'lumotlarni (ya'ni, asosiy haqiqat ma'lumotlari) talab qiladigan nazorat ostida o'rganish usullari uchun Yordam Vektor mashinasi (SVM). Biroq, asosan, etiketli ma'lumotlar tadqiqotchilar uchun mavjud emas. Shunday qilib, nazoratsiz o'rganish usullari (masalan, klasterlash algoritmlari) turli xil haydash uslublarini belgilash uchun qo'llanilishi mumkin (Tselentis va Papadimitriu, 2023; Mantouka va boshqalar, 2019; Mohammadnazar va boshqalar, 2021) ular orasida k-o'rtacha, k-medoid va ierarxik klasterlash eng ko'p ishlatiladigan algoritmlar qatoriga kiradi (Jentlmen va Keri, 2008 yil; Kassambara, 2017 yil). Ushbu tadqiqotda keyingi usullar qo'llanildi, chunki ular boshqa sinovdan o'tgan usullardan farqli o'laroq, klasterlash o'lchovlari uchun moslik darajasiga qarab yaxshiroq moslikni ta'minladi. Algoritmlarning tavsifi va klasterlash usulini tanlash va haydash hodisalarini tasniflash uchun klasterlar sonini aniqlashga yondashuv quyida keltirilgan.
K-klasterlash demakdir
K-means - bu ma'lumotlar nuqtalarini guruhlash uchun bo'linish algoritmi
kcentroidlar ichiga kiradi
khar bir ma'lumot nuqtasi eng yaqin markazda guruhlangan tarzda klasterlar (Jeyn, 2010 yil). Maqsad funktsiyasi quyida keltirilgan K-o'rtacha algoritmlarida xatolikni kamaytiradi (Gan