Kompyuter tizimlari kafedrasi

Download 60,64 Kb.
bet	2/4
Sana	24.05.2024
Hajmi	60,64 Kb.
	#252852

1 2 3 4

Bog'liq
mashinali ok1

2.K-means klasifikatori

K-means klasifikatori ma'lumot tahlilida ishlatiladigan bir unsupervised o'qitish algoritmidir. Bu algoritmda, kiritilgan ma'lumotlar to'plami bir nechta guruhga bo'linganligi uchun tanlash uchun ishlatiladi.

Bu algoritmda quyidagi bosqichlar uchun amalga oshiriladi:
K-means algoritmi uchun kerakli guruhlar soni (K) va har bir ma'lumotni belgilaydigan xususiyatlar ko'rinishi aniqlanadi.

Har bir ma'lumotning guruh bilan bo'linganligi tasavvur qilinadi. Guruhlar kiritilgan xususiyatlar asosida avtomatik ravishda aniqlanadi.

Guruhlar o'zgaruvchilar jadvalida ko'rsatiladi va guruhlar orasidagi masofalar yaxlitlanadi.

Har bir ma'lumot yangi masofalar asosida guruhlarga qaytariladi. Bu bosqichda, har bir ma'lumotning guruh bilan bo'linganligi yangidan hisoblanadi.
Guruhlarning o'zgaruvchilari jadvalida ko'rsatiladi va yangi guruhlar orasidagi masofalar yaxlitlanadi.
3 va 4 bosqichlar takrorlanadi, guruhlar orasidagi masofalar yaxlitlanadi va guruhlar ko'rsatilgan jadvalda belgilanadi, nihoyatda guruhlar qayta aniqlanadi.
Algoritm, guruhlar hisoblanganidan so'ng, guruhlarning o'zgaruvchilariga qarab yangi ma'lumotlarni guruhlarga qo'shish uchun ishlatilishi mumkin.
K-means algoritmi, ma'lumotlar tahlilida va to'plamlarini ko'rsatishda juda foydali bo'ladi. Masalan, qishloqdagi ko'kchi, qog'oz yoki plastik turi bo'yicha avtomatik ravishda ma'lumotlarni tahlil qilishda ishlatiladi.
Naive Bayes klasifikatori
Naive Bayes klasifikatori, ma'lumotlarni tahlil qilish uchun ishlatiladigan bir bayon algoritmidir. Bu algoritmda, ma'lumotlar ko'rsatilgan klaslarga qo'shiladi, keyinchalik esa yangi ma'lumotlar uchun mos klas tanlanadi.
Naive Bayes klasifikatori quyidagi bosqichlar bilan ishlaydi:
Ma'lumotlar va ularga mos klaslar kiritiladi.
Klaslar uchun yagona moslik ko'rsatilishi, ya'ni barcha ma'lumotlar uchun birlikda ishlatiladigan o'zaro bog'liqliklar aniqlanadi.
Test ma'lumotlari uchun klaslar aniqlanadi. Bu bosqichda, ma'lumotlarning o'zaro bog'liqliklariga qarab ularni klaslarga bo'lish uchun bayon formulalaridan foydalaniladi.
Naive Bayes klasifikatori juda oddiy va samarali hisoblanadi. U yuzlab ma'lumotlar ko'rsatilganida ishlaydi va kichik ma'lumotlarda ham samarali natijalar olib chiqaradi. U o'qitish va tasdiqlash uchun kichik sanoqda ma'lumotlarni ishlatadi, ammo uning natijalari ko'p va ko'p ma'lumotlarni tahlil qilishda ishlatiladi.
Naive Bayes klasifikatori ma'lumotlar tahlilida, odatda, ma'lumotlar uchun uchta asosiy xususiyatga ega bo'lgan yopiq ma'lumotlar uchun ishlatiladi. Ular:
"P(X)": bu, masalan, bir xususiyatning klasga mosligi haqida ma'lumot beradi.
"P(Y)": bu, klaslarning ko'rsatilishi bilan bog'liq hisoblanadi.
"P(X | Y)": bu, klasga ko'rsatilgan xususiyatning birlikdagi klasga mosligini hisoblaydi.
Naive Bayes klasifikatori, har qanday ma'lumotlar uchun juda samarali hisoblanadi va tez natijalarni olib chiqaradi. U kichik ma'lumotlarda ishlash uchun idealdir, ammo ko'p kategoriyalarni tahlil qilish uchun yaxshi natijalar olib chiqaradi.
Decision tree modellari
Qaror qabul qarshilik (decision tree) modellari, qaror qabul mashinasi tomonidan ishlatiluvchi algoritmlardan biridir. Bu algoritm, murojaat qiluvchi ma'lumotlardan foydalanib, aniq natijalarga yetkazib beruvchi bir strukturani yaratadi. Bu struktura "erkak" yoki "ayol" kabi narsalarni aniqlash kabi eng oddiy qarorlardan, odatda, bir qator kategoriyalarni aniqlashga qadar o'sadi.
Qaror qabul qarshilik algoritmi quyidagi bosqichlarda ishlaydi:
Ma'lumotlar yig'ilib, ularning xususiyatlari tahlil qilinadi.
Qaror qabul qarshilik modeli yaratiladi. Bu model esa ma'lumotlarni bir necha qatorda, masalan, jins, yoshi, ish staji, o'qish darajasi kabi kategoriyalarga bo'ling.
Qaror qabul qarshilik modeli o'qitiladi. Bu bosqichda, model ma'lumotlarning bir qismini o'rganadi va boshqa qismini sinab ko'radi.
Qaror qabul qarshilik modeli sinovdan o'tqaziladi. Bu bosqichda, modelni sinovdan o'tqazilishi maqsadga muvofiq, ma'lumotlarning boshqa qismini sinab ko'radigan holda bajariladi.
Model test qilinganida, uni sinovdan o'tqazish paytida aniqlangan natijalar bilan taqqoslash mumkin. Test paytida model yangi ma'lumotlarni sinab ko'radi va ularga mos klaslar aniqlanadi.
Qaror qabul qarshilik modellari ma'lumotlar tahlilida juda samarali hisoblanadi va shaffof, oddiy aniq natijalarni olib chiqaradi. U shuningdek, har qanday ma'lumot turi uchun ishlatilishi mumkin va yangi ma'lumotlar uchun to'g'ri klaslarni aniqlashda yaxshi ish bajaradi. Ammo modellarning ko'rsatuvchi samaradorligi ma'lumotlarning katta miqdorlari va o'zaro bog'liq ko'p xususiyatlari bilan qisqa kelmaydi.

Download 60,64 Kb.

1 2 3 4

Download 60,64 Kb.