|
Mustaqil ish mavzu: Google Colab-da scikit-learn kutubxonasi yordamida ma'lumotlarni klasterlash
|
bet | 6/9 | Sana | 11.12.2023 | Hajmi | 2,6 Mb. | | #115425 |
Bog'liq Jahongir Hasanbayev 1-mustaqil ish Ma’lumotlarning intellektual taxliliTugatish Vaqtlimitlari:
Google Colab jadvallarini ishlatish va izohlash uchun xavfsizlik sababli bir vaqt limiti mavjud. Odatda, siz aktiv faoliyat bajarish uchun bir muddatga ega bo'ladi. Agar aktivliklaringiz cheklanib qolsa, tizim sizni ochiq qoldirishi mumkin.
Yod qilish kerakki, Google Colab bepul xizmatdir va umumiy ravishda maxfiylikni himoya qiladi. Bu nuqsalarni e'tibor bering va maxfiylik so'rovlari va shartlarni o'qing, shuningdek, shaxsiy ma'lumotlaringizni xavfsiz saqlash uchun ko'proq qo'lyozma ishlatishni maslahat beriladi.
Google Colab-da scikit-learn kutubxonasi yordamida ma'lumotlarni klasterlash
Scikit-Learn bilan tanishtirish
Mashinani o'rganish algoritmlari qatorini mustahkam tatbiq qilishni ta'minlaydigan bir nechta Python kutubxonalari mavjud. Eng mashhurlaridan biri Scikit-Learn boʻlib, koʻp sonli umumiy algoritmlarning samarali versiyalarini taqdim etadi. Scikit-Learn toza, bir xil va soddalashtirilgan API, shuningdek, juda foydali va to'liq onlayn hujjatlar bilan tavsiflanadi. Ushbu bir xillikning afzalligi shundaki, Scikit-Learn-ning asosiy ishlatilishi va sintaksisini bir turdagi modellar uchun tushunganingizdan so'ng, yangi model yoki algoritmga o'tish oson kechadi.
Ushbu bobda Scikit-Learn API haqida umumiy ma'lumot berilgan. Ushbu API elementlarini chuqur tushunish keyingi boblarda mashinani o'rganish algoritmlari va yondashuvlarini chuqurroq amaliy muhokama qilishni tushunish uchun asos bo'ladi.
Biz Scikit-Learn-da ma'lumotlar taqdimotini qamrab olishdan boshlaymiz, keyin Estimator API-ni o'rganamiz va nihoyat, qo'lda yozilgan raqamlarning rasmlari to'plamini o'rganish uchun ushbu vositalardan foydalanishning yanada qiziqarli misolini ko'rib chiqamiz.
Mashinani oʻrganish maʼlumotlardan modellar yaratishdan iborat: shuning uchun biz maʼlumotlarni qanday koʻrsatish mumkinligini muhokama qilishdan boshlaymiz. Scikit-Learn ichida ma'lumotlar haqida fikr yuritishning eng yaxshi usuli jadvallar.dir.
Asosiy jadval bu ikki oʻlchovli maʼlumotlar toʻri boʻlib, unda satrlar maʼlumotlar toʻplamining alohida elementlarini, ustunlar esa ushbu elementlarning har biriga tegishli miqdorlarni ifodalaydi. Masalan, 1936 yilda Ronald Fisher tomonidan mashhur tahlil qilingan Iris ma'lumotlar to'plamini ko'rib chiqing. Biz ushbu maʼlumotlar toʻplamini Seaborn kutubxonasidan foydalanib, Pandas DataFrame koʻrinishida yuklab olishimiz va birinchisini koʻrib chiqishimiz mumkin. bir nechta elementlar:
Bu yerda ma'lumotlarning har bir qatori bitta kuzatilgan gulga ishora qiladi va qatorlar soni ma'lumotlar to'plamidagi gullarning umumiy sonidir. Umuman olganda, matritsa qatorlarini namunalar, qatorlar sonini esa n_samples deb ataymiz.< /span>
Xuddi shunday, ma'lumotlarning har bir ustuni har bir namunani tavsiflovchi ma'lum bir miqdoriy ma'lumotga ishora qiladi. Umuman olganda, matritsa ustunlariga xususiyatlar, ustunlar soni esa n_features deb murojaat qilamiz.< /span>
Xususiyatlar matritsasi
Jadval tuzilishi ma'lumotni ikki o'lchovli raqamli massiv yoki matritsa sifatida ko'rish mumkinligini aniq ko'rsatib turibdi, biz uni xususiyatlar matritsasiX nomli o'zgaruvchida saqlanadi. Xususiyatlar matritsasi ikki oʻlchovli, shakli [n_samples, n_features] va koʻpincha NumPy massivida yoki Pandalar DataFrameda boʻladi, ammo baʼzi Scikit-Learn modellar SciPy siyrak matritsalarini ham qabul qiladi.
Namunalar (ya'ni, qatorlar) har doim ma'lumotlar to'plami tomonidan tasvirlangan alohida ob'ektlarga ishora qiladi. Misol uchun, namuna gulni, odamni, hujjatni, tasvirni, ovoz faylini, videoni, astronomik ob'ektni yoki miqdoriy o'lchovlar to'plami bilan tasvirlashingiz mumkin bo'lgan boshqa narsalarni ko'rsatishi mumkin.
Xususiyatlar (ya'ni, ustunlar) har doim har bir namunani miqdoriy jihatdan tavsiflovchi aniq kuzatuvlarga ishora qiladi. Xususiyatlar ko'pincha haqiqiy qiymatga ega, lekin ba'zi hollarda mantiqiy yoki diskret qiymatli bo'lishi mumkin.
|
| |