|
Intellektual tizimlar va kompyuter texnologiyalari fakulteti
|
Sana | 14.05.2024 | Hajmi | 356,66 Kb. | | #231167 |
Bog'liq Suniy mustaqil ish3
O’ZBEKISTON RESPUBLIKASI
OLIY TA’LIM, FAN VA INNOVATSIYALAR VAZIRLIGI SHAROF RASHIDOV NOMIDAGI SAMARQAND DAVLAT UNIVERSITETI
INTELLEKTUAL TIZIMLAR VA KOMPYUTER TEXNOLOGIYALARI FAKULTETI
DASTURIY INJINIRING YO’NALISHI TALABASI
Muhammadiyev Bahrombek
SUN’IY INTELLEKT fanidan
tayyorlagan
MUSTAQIL ISHI
Tayyorladi: Muhammadiyev B.
Tekshirdi: Rashidov A.
Samarqand-2024
3-MUSTAQIL ISH: SINFLASHTIRISH VA KLASTERLASH MASALALARINI HAL ETISH USULLARI
1-qadam.
Men Wine Quality datasetsni tanlab oldim bu datasets Portugaliya shimolidagi qizil va oq vino-verde vino namunalari bilan bog'liq ma'lumotlar to'plami kiritilgan. Maqsad fizik-kimyoviy testlar asosida vino sifatini modellashtirishdir.Men shuni klasterlash orqaliy ularni ajratish.
Wine Quality ustunlari.
1 - fixed acidity
2 - volatile acidity
3 - citric acid
4 - residual sugar
5 - chlorides
6 - free sulfur dioxide
7 - total sulfur dioxide
8 - density
9 - pH
10 - sulphates
11 - alcohol
Chiqish o'zgaruvchisi (hissiy ma'lumotlarga asoslangan):
12 - quality (score between 0 and 10)
Shu malumotlarga asoslangan holatda maslani yechishga harakat qildim.
2-qadam.
Nazoratsiz Mashina Ta'limi - bu kompyuterni yorliqsiz, tasniflanmagan ma'lumotlardan foydalanishga o'rgatish va algoritmni nazoratsiz ushbu ma'lumotlar bilan ishlashga imkon berish jarayoni. Avvalgi ma'lumotlarni o'rgatishsiz, bu holda mashinaning vazifasi tartiblanmagan ma'lumotlarni parallellar, naqshlar va o'zgarishlar bo'yicha tartibga solishdir.
K klasterlashni anglatadi, ma'lumotlar nuqtalarini K klasterlaridan biriga klasterlar markazidan masofasiga qarab belgilaydi. Bu bo'shliqda klasterlarning centroidlarini tasodifiy belgilashdan boshlanadi. Keyin har bir ma'lumot nuqtasi klaster markazidan masofasiga qarab klasterdan biriga tayinlanadi. Har bir nuqta klasterdan biriga tayinlangandan so'ng, yangi klaster markazlari tayinlanadi. Bu jarayon yaxshi klaster topilgunga qadar iterativ ravishda ishlaydi. Tahlil qilishda biz klasterlar soni rivojlangan deb hisoblaymiz va biz guruhlardan biriga ball qo'yishimiz kerak.
Ba'zi hollarda K aniq belgilanmagan va biz K. K ning optimal soni haqida o'ylashimiz kerak Klasterlash eng yaxshi ma'lumotlarni yaxshi ajratilganligini anglatadi. Ma'lumotlar nuqtalari bir-birining ustiga chiqqanda, bu klasterlash mos kelmaydi. K Means boshqa klasterlash texnikasiga qaraganda tezroq. Bu ma'lumotlar nuqtalari o'rtasida kuchli ulanishni ta'minlaydi. K klaster klasterlarning sifati haqida aniq ma'lumot bermaydi degan ma'noni anglatadi. Klaster markazining turli xil dastlabki tayinlanishi turli klasterlarga olib kelishi mumkin.
3-qadam.
Kerakli kutubxonalarni chaqirib olamiz.
Datamizni yuklab olamiz.
Datamizni o’qib olamaiz.
Train testga ajratib x va y ga bo’ib olamiz.
Natijani chizilgan jarayoni.Bunda biz ko’rish orqaliy baholay olsak bo’ladi.
4-qadam.Natijalar tahlili.
Natijalar taxliliga kelaydigan bo’lsak bunda Sinfloshing natijasi accuracy: 0.5346153846153846 shunga teng bo’ldi
Klasterlash esa bu ancha kamroq chiqdi: accuracy: 0.33966960649630407 ga teng bo’ldi.
Xulosa:
Xulosa qilib aytsam bu usul siniflarga yaniy turlarga ajratish ushuli bo’lsdi bunda biz datamizdagi malumotlarni o’zimizga keraklisini ola olamaiz.
|
| |