362
K ta-yaqin qo‘shnilar usuli.
K ta yaqin qo‘shnilar usuli(k-nearest neighbours, k-NN)
boshqa usullardan farqli ravishda o‘qitish(train) fazasini talab qilmaydi. Sinflashtirish
masalasini yechish usuli ko‘p o‘lchovli belgilar to‘plamidan eng ko‘p topilgan k ta yaqin
qo‘shnilarni sinflarga ajratish hisoblanadi. Bu sinflashtirish modellarini o‘qitishning eng
oddiy algoritmlardan biridir. K soni-bu belgilar sohasidagi sinflanadigan ob'ektlar bilan
taqqoslanadigan qo‘shni ob’ektlar sonidir. Boshqacha aytganda agar k=10 bo‘lsa, unda har
bir ob’ekt o‘zining 10-ta qo‘shnisi orasidagi masofa bilan solishtiriladi(
1-rasm
). Usul Data
Mining texnologiyalarida sinflashtirish masalasini yechish uchun qo‘llaniladi.
1-rasm. O‘qitish jarayonida algoritm barcha vektor belgilarini va unga mos sinf lebellarini
oddiy tarzda eslab qoladi.
Algoritm.
Test to‘plamidagi har bir ob’ektni sinflashtirish uchun kema-ket ravishda
qo‘yidagi amallarni bajarish zarurdir:
O‘qitish tanlanmasidagi har bir ob’ektigacha bo‘lgan masofani hisoblash;
O‘qitish tanlanmasidan bir-biridan masofasi eng minimal bo‘lagan k ta ob’ektni
tanlab olish.
Sinflanadigan ob’ekting sinfi – bu k ta yaqin qo‘shnilar orasida ko‘p uchraydigan sinfdir.