Reja: k-nn algoritmi nima?




Download 219,37 Kb.
bet1/2
Sana30.05.2024
Hajmi219,37 Kb.
#257392
  1   2
Bog'liq
Ma\'lumotlar tuzilmasi(KNN)


Mavzu: K-NN algoritmi. Mashinali o’qitish uchun

  1. Eng yaqin qo’shni (K-NN)algoritmi.

Reja:
1.K-NN algoritmi nima?
2.K-NN qanday ishlaydi?
3.Machine Learning(Mashina o'rganish algoritmlari)


K-NN algoritmi. Mashinani o'rganish uchun K-Yaqin qo'shni (K-NN) algoritmi.
Mashinani o'rganish uchun ishlatilishi mumkin bo'lgan g'oya - parranda go'shti bilan bog'liq yana bir ibora: "to'q qushlar birga to'planadi".
Boshqacha qilib aytganda, o'xshash narsalar bir xil xususiyatlarga ega bo'lishi mumkin.
Biz ushbu printsipdan ma'lumotlarni eng o'xshash yoki "yaqin" qo'shnilar bilan toifaga joylashtirish orqali tasniflash uchun foydalanishimiz mumkin.
Eng yaqin qo'shnilar tasnifi
Bitta jumlada eng yaqin qo'shni klassifikatorlar eng o'xshash yorliqli misollar sinfini belgilash orqali yorliqsiz misollarni tasniflash xususiyati bilan aniqlanadi. Ushbu g'oyaning soddaligiga qaramay, eng yaqin qo'shni usullari juda kuchli. Ular quyidagi maqsadlarda muvaffaqiyatli qo'llanilgan:
Kompyuter ko‘rish ilovalari, shu jumladan, harakatsiz tasvirlar va videolarda optik belgilarni aniqlash va yuzni tanish
- Biror kishi unga tavsiya etilgan filmni yoqtiradimi yoki yo'qligini taxmin qilish (Netflix tanlovida bo'lgani kabi)
Muayyan protein yoki kasalliklarni aniqlashda foydalanish uchun genetik ma'lumotlardagi naqshlarni aniqlash
kNN algoritmi nominal o'zgaruvchi bilan belgilangan bir necha toifalarga bo'lingan misollardan tashkil topgan o'quv ma'lumotlar to'plamidan boshlanadi.
Tasavvur qilaylik, bizda yorliqsiz misollarni o'z ichiga olgan test ma'lumotlar to'plami bor, ular aks holda o'quv ma'lumotlari bilan bir xil xususiyatlarga ega.
Sinov ma'lumotlar to'plamidagi har bir yozuv uchun kNN o'xshashlik bo'yicha "eng yaqin" bo'lgan ta'lim ma'lumotlaridagi k yozuvni aniqlaydi, bu erda k - oldindan belgilangan butun son.
Yorliqsiz sinov namunasi k eng yaqin qo'shnilarning ko'pchiligi sinfiga tayinlanadi.
Klassifikatsiya Mashinaviy o'qitish uchun K-Eng yaqin qo'shnilar (K-NN - K-Nearest Neighbor) algoritmi
KNN algoritmi oddiy, amalga oshirish oson, nazorat ostidagi mashinaviy o'qitish algoritmi bo'lib, u ham tasniflash, ham regressiya muammolarini hal qilish uchun ishlatilishi mumkin.
K-NN algoritmi yangi holatlar(ma'lumotlar) va mavjud ma’lumotlar o'rtasidagi o'xshashlikni qabul qiladi va yangi ma’lumotni mavjud toifalar orasidan eng o'xshash toifaga kiritadi.
K-NN algoritmi regressiya uchun ham, tasniflash uchun ham ishlatilishi mumkin, lekin u asosan tasniflash muammolari uchun ishlatiladi.
K-NN parametrik bo'lmagan algoritmdir , ya'ni ma'lumotlarning taqsimlanishi haqida hech qanday asosiy taxminlar qilmaydi
Nima uchun bizga K-NN algoritmi kerak?
Aytaylik, ikkita toifa, ya'ni A va B toifalari mavjud va bizda yangi ma'lumotlar nuqtasi bor, bu ma'lumotlar nuqtasi ushbu toifalarning qaysi birida joylashishini aniqlashimiz kerak. Ushbu turdagi muammolarni hal qilish uchun bizga K-NN algoritmi kerak. K-NN yordamida biz ma'lum bir ma'lumotlar to'plamining toifasi yoki sinfini osongina aniqlashimiz mumkin. Quyidagi diagrammani ko'rib chiqing:
K-NN qanday ishlaydi?
K-NN ning ishlashini quyidagi algoritm asosida tushuntirish mumkin:
1-qadam: K-NN uchun eng yaxshi K tanlash.
2-qadam: K qo'shnilarning Evklid masofasini hisoblash.
3-qadam: Hisoblangan Evklid masofasiga ko'ra K eng yaqin qo'shnilarni olish.
4-qadam: Ushbu K qo'shnilar orasida har bir toifadagi ma'lumotlar nuqtalarining sonini hisoblash.
5-qadam: Yangi ma'lumotlar nuqtalarini qo'shni soni maksimal bo'lgan toifaga belgilash.
6-qadam: Modelimiz tayyor.
Aytaylik, bizda yangi ma'lumotlar nuqtasi bor va biz uni kerakli toifaga joylashtirishimiz kerak.

Download 219,37 Kb.
  1   2




Download 219,37 Kb.