Mashinali o‘qitishda sinflashtirish algoritmlari va ularni dasturlash
O‘ZBEKISTON RESPUBLIKASI AXBOROT TEXNOLOGIYALARI VA KOMMUNIKATSIYALARINI RIVOJLANTIRISH VAZIRLIGI
MUHAMMAD AL-XORAZMIY NOMIDAGI
TOSHKENT AXBOROT TEXNOLOGIYALARI UNIVERSITETI
“Sun’iy intellekt” kafedrasi
“Mashinali o’qitish”
fanidan
2-amaliy ish
Guruh:IML009
Bajardi:Davronova Marjona
Qabul qildi: Ochilov M.M
Toshkent 2022
Mavzu: Mashinali o‘qitishda sinflashtirish algoritmlari va ularni dasturlash. Logistik regressiya
6-variant
№
|
Masala
|
O’zgatuvchi tanlamadagi misollar soni
|
Sinflar soni
|
Xususiyatlari soni
|
6
|
Tadbirkorlarni sinflashtirish
|
40
|
2
|
4
|
1.Quyidagi datasetni yaratdim. Tadbirkorlarning xususiyatlariga ishlab chiqargan mahsuloti soni, export soni, xarajati va daromadini oldim. Sinflarini yirik tadbirkor va kichik tadbirkorga bo’ldim.Sonlar minglarda va pul miqdori ming dollarda olindi.
2.Datasetning mahsulotning ishlab chiqargan soni va eksport soni xususiyatini olgan holda matplotlib kutubxonasidan foydalanib grafik tasvirlaymiz:
3.Datasetni modelni o’qitish uchun 85 % va testlash uchun 15% nisbatda bo’laklarga ajratamiz. Sklearn kutubxonasidan foydalangan holda logistik_regressiya modelini quramiz:
4.Train to’plam uchun tartibsizlik matritsasi (confusion_matrix) ni hisoblaymiz:
Logistik regressiya darajasi 1 chiqdi. Bu tadbirkorlar nomi bilan yaratgan datasetimizda xatolik mavjud emasligini ko’rsatadi. Train uchun ajratib olgan 85%lik qismimizda 17ta Kichik va 11 ta Yirik bo’lgan tadbirkorlar mavjud.
5.Modelni test to’plam bilan testlaymiz. Modelini test to’plamdagi aniqligini hisoblaymiz:
6.Test to’plam uchun tartibsizlik matritsasi (confusion_matrix) ni hisoblaymiz:
Logistik regressiya darajasi 0.83 chiqdi. Bu tadbirkorlik nomi bilan yaratgan datasetimizda qisman xatolik mavjud ekanligini ko’rsatadi. Test uchun ajratib olgan 15%lik qismimizda 2ta Kichik va 3ta Yirik bo’lgan tadbirkorlar mavjud.
XULOSA
Men ushbu amaliy ishini bajarish davomida tadbirkorlar datasetini yaratib uni 4ta xususiyatli va 2ta sinflarga ajratdim.Bu datasetni train va test to’plamga ajratib testlash ishlarini, matplotlib kutubxonasidan foydalanib grafik chizish,confusion-matrixlar aniqlash ishlarini olib bordim.
http://hozir.org
|