|
Mustaqil ish mavzu: Google Colab-da scikit-learn kutubxonasi yordamida ma'lumotlarni klasterlash
|
bet | 7/9 | Sana | 11.12.2023 | Hajmi | 2,6 Mb. | | #115425 |
Bog'liq Jahongir Hasanbayev 1-mustaqil ish Ma’lumotlarning intellektual taxliliMaqsadli massiv
Xususiyatlar matritsasi X bilan bir qatorda biz odatda yorliq yoki maqsadli massiv ko'rinishida bir nechta maqsadli qiymatlarni ishlatsa-da, biz birinchi navbatda bir o'lchovli maqsadli massivning umumiy holati bilan ishlaymiz.< /span>da joylashgan. Maqsadli massiv doimiy raqamli qiymatlarga yoki diskret sinflarga/yorliqlarga ega bo'lishi mumkin. Ba'zi Scikit-Learn hisoblagichlari ikki o'lchovli, va odatda NumPy massivida yoki Pandas deb nomlaymiz. Maqsadli massiv odatda bir oʻlchovli boʻlib, uzunligi massiv, biz odatda targetyn_samplesSeries[n_samples, n_targets]
Umumiy chalkashlik bu maqsadli massivning boshqa xususiyat ustunlaridan qanday farq qilishidir. Maqsadli massivning farqlovchi xarakteristikasi shundaki, u odatda biz xususiyatlardan bashorat qilmoqchi bo'lgan miqdordir: statistik ma'noda u qaram o'zgaruvchidir. Masalan, oldingi ma'lumotlarni hisobga olgan holda, biz boshqa o'lchovlar asosida gul turlarini bashorat qila oladigan modelni qurishni xohlashimiz mumkin; bu holda species ustuni maqsadli massiv hisoblanadi.
Estimator API
Scikit-Learn API Scikit-Learn API hujjatida bayon qilinganidek, quyidagi asosiy tamoyillarni hisobga olgan holda ishlab chiqilgan:
Muvofiqlik: Barcha ob'ektlar cheklangan usullardan olingan, izchil hujjatlar bilan umumiy interfeysga ega.
Tekshiruv: Belgilangan barcha parametr qiymatlari umumiy atributlar sifatida ko‘rsatiladi.
Cheklangan obyekt ierarxiyasi: Faqat algoritmlar Python sinflari bilan ifodalanadi; ma’lumotlar to‘plamlari ifodalanadi standart formatlarda (NumPy massivlari, Pandalar DataFrame obyektlari, SciPy siyrak matritsalari) va parametr nomlar standart Python satrlaridan foydalanadi.
Tarkib: Mashinani o‘rganish bo‘yicha ko‘plab vazifalarni asosiy algoritmlar ketma-ketligi sifatida ifodalash mumkin, va Scikit-Learn imkon qadar bundan foydalanadi.
Sensial standart qiymatlar: Modellar foydalanuvchi tomonidan belgilangan parametrlarni talab qilganda, kutubxona tegishli standart qiymatni belgilaydi.
Amalda, bu tamoyillar Scikit-Learn-ni asosiy tamoyillar tushunilgandan so'ng foydalanishni juda oson qiladi. Scikit-Learn-dagi har bir mashinani o'rganish algoritmi Estimator API orqali amalga oshiriladi, bu mashinani o'rganishning keng doirasi uchun izchil interfeysni ta'minlaydi.
API asoslari
Odatda, Scikit-Learn Estimator API-dan foydalanish bosqichlari quyidagicha:
Scikit-Learn'dan tegishli baholovchi sinfini import qilish orqali model sinfini tanlang.
Ushbu sinfni kerakli qiymatlar bilan o'rnatish orqali model giperparametrlarini tanlang.
Ushbu bobda avval aytib o'tilganidek, ma'lumotlarni xususiyatlar matritsasi va maqsad vektoriga joylashtiring.
Model namunasining fit usulini chaqirish orqali modelni maʼlumotlaringizga moslang.
Modelni yangi ma'lumotlarga qo'llang:
Nazorat ostidagi o‘rganish uchun biz predict usuli yordamida noma’lum ma’lumotlar uchun yorliqlarni bashorat qilamiz.
Nazoratsiz oʻrganish uchun biz koʻpincha transform yoki predict usuli yordamida maʼlumotlar xususiyatlarini oʻzgartiramiz yoki xulosa qilamiz.
|
| |