|
O’zbekiston respublikasi oliy va o’rta maxsus ta’lim vazirligi muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti
|
bet | 1/4 | Sana | 08.07.2024 | Hajmi | 102,97 Kb. | | #266983 |
Bog'liq Muzataqil ish-1
O’ZBEKISTON RESPUBLIKASI
OLIY VA O’RTA MAXSUS TA’LIM VAZIRLIGI
MUHAMMAD AL-XORAZMIY NOMIDAGI
TOSHKENT AXBOROT TEXNOLOGIYALARI UNIVERSITETI
“Mashinali o`qitish"
fanidan
Mustaqil ishi
Mavzu: KNN algoritmi
Bajardi: Xoldarov Muzaffar
Tekshirdi: Nurmurodov Javoxir
Toshkent 2024
Reja:
KNN algoritmi nima?
KNNni hisoblash: masofa ko'rsatkichlari
KNNni hisoblash: k.ni aniqlash
K-NN ning mashinalarni o'rganishda qo'llanilishi
KNN algoritmining afzalliklari va kamchiliklari
Xulosa
KNN algoritmi nima?
K-eng yaqin qo'shnilar (KNN) algoritmi parametrik bo'lmagan, nazorat qilinadigan o'rganish tasniflagichi bo'lib, u alohida ma'lumotlar nuqtasini guruhlash bo'yicha tasniflash yoki bashorat qilish uchun yaqinlikdan foydalanadi. Bu bugungi kunda mashinani o'rganishda ishlatiladigan mashhur va eng oddiy tasniflash va regressiya tasniflagichlaridan biridir.
KNN algoritmi regressiya yoki tasniflash muammolari uchun ishlatilishi mumkin bo'lsa-da, u odatda tasniflash algoritmi sifatida ishlatiladi va shunga o'xshash nuqtalar bir-biriga yaqin bo'lishi mumkin degan taxminga asoslanadi.
Tasniflash muammolari uchun sinf yorlig'i ko'pchilik ovozi asosida tayinlanadi, ya'ni ma'lum bir ma'lumot nuqtasi atrofida eng ko'p ifodalanadigan yorliq ishlatiladi. Bu texnik jihatdan "ko'p ovoz berish" deb hisoblansa-da, adabiyotda "ko'pchilik ovoz" atamasi ko'proq qo'llaniladi. Ushbu terminologiyalar orasidagi farq shundaki, "ko'pchilik ovoz berish" texnik jihatdan 50% dan ortiq ko'pchilikni talab qiladi, bu asosan faqat ikkita toifa mavjud bo'lganda ishlaydi. Agar siz bir nechta sinflarga ega bo'lsangiz, masalan, to'rtta toifaga ega bo'lsangiz, sinf haqida xulosa chiqarish uchun sizga 50% ovoz kerak emas; 25% dan ortiq ovoz bilan sinf yorlig'ini belgilashingiz mumkin.
Regressiya muammolari tasniflash muammosiga o'xshash tushunchadan foydalanadi, ammo bu holda tasniflash haqida bashorat qilish uchun eng yaqin qo'shnilarning o'rtacha qiymati olinadi. Bu erda asosiy farq shundaki, tasniflash diskret qiymatlar uchun ishlatiladi, regressiya esa doimiy qiymatlar uchun ishlatiladi. Biroq, tasniflashdan oldin masofani aniqlash kerak. Evklid masofasi eng ko'p ishlatiladi, biz quyida batafsilroq ko'rib chiqamiz.
Shuni ham ta'kidlash joizki, KNN algoritmi ham "dangasa o'rganish" modellari oilasining bir qismidir, ya'ni u mashg'ulot bosqichidan o'tishga nisbatan faqat o'quv ma'lumotlar to'plamini saqlaydi. Bu shuningdek, barcha hisob-kitoblar tasniflash yoki bashorat qilinayotganda sodir bo'lishini anglatadi. U o'zining barcha o'quv ma'lumotlarini saqlash uchun xotiraga juda tayanganligi sababli, u misolga asoslangan yoki xotiraga asoslangan o'rganish usuli deb ham ataladi. Evelin Fiks va Jozef Xodjlar 1951 yilgi ushbu maqolada KNN modeli atrofidagi dastlabki g'oyalar bilan ta'minlangan (havola ibm.com'dan tashqarida joylashgan), Tomas Kover esa o'z tadqiqotida (havola ibm.com'dan tashqarida joylashgan), "Eng yaqin qo'shni namunasi" kontseptsiyasini kengaytiradi. Tasniflash”. Bu avvalgidek mashhur bo'lmasa-da, soddaligi va aniqligi tufayli u hali ham ma'lumotlar fanida o'rganiladigan birinchi algoritmlardan biri hisoblanadi. Biroq, ma'lumotlar to'plami o'sishi bilan KNN tobora samarasiz bo'lib, modelning umumiy ishlashiga putur etkazadi. Odatda oddiy tavsiya tizimlari, naqshni aniqlash, ma'lumotlarni qidirish, moliyaviy bozorni bashorat qilish, hujumni aniqlash va boshqalar uchun ishlatiladi.
|
|
Bosh sahifa
Aloqalar
Bosh sahifa
O’zbekiston respublikasi oliy va o’rta maxsus ta’lim vazirligi muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti
|