|
Pandasda yangi ma’lumot e’lon qilish, o’qish va yozish
|
bet | 3/3 | Sana | 22.12.2023 | Hajmi | 314,92 Kb. | | #127156 |
Bog'liq ML mustPandasda yangi ma’lumot e’lon qilish, o’qish va yozish
Birinchi navbatda kutubxonani chaqirib olishni bilishimiz kerak:
import pandas
Pandas da 2 turdagi muhim obyektlar bor: DataFrame va Series.
DataFrame - bu jadval. Jadvalni kiritish uchun lug’at shaklida ma’lumotlar kiritiladi(kalit - qiymat juftligida kalit ustun nomi, qiymat esa massiv bo’lib kalit ustunga mos kelgan qiymatlarni ifodalaydi).
Misol:
import pandas
df = pandas.DataFrame({'Tovar': ['Non', 'Sut', 'Qaymoq'], 'Narx': [2800, 12000, 45000]})
print(df)
DataFrame da qatorlar belgilanishini ham o’zgartirish mumkin, yuqoridagi holatda qatorlar 0, 1, 2 shaklida bo’lsa, quyida ko’rsatadigan namunamizda qatorlar nomlangan:
df = pandas.DataFrame({'Bob': ['I liked it.', 'It was awful.'],
'Sue': ['Pretty good.', 'Bland.']},
index=['Product A', 'Product B'])
print(df)
Endi Series obyektini ko’rib chiqamiz:
Series - data qiymatlari ketma-ketligi List.
Misol:
srs = pandas.Series([23, 442, 34, 3])
print(srs)
E“tibor qiladigan bo“lsak, Series bu DataFrame ning ustunlari soni 1 ta bo“lgan holati desak ham bo“ladi.
Seriesda ham DataFrame ga o“xshab qator nomi berish mumkin.
Misol:
srs = pandas.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'], name='Product A')
print(srs)
Pandas yordamida '.csv', '.xlsx' va boshqa formatdagi ma“lumotlardan DataFrame obyekti sifatida ma“lumotlar o“qib olish mumkin.
Misol:
„oddiy.csv“ nomi faylimizda ma’lumotlar bor, shuni pandas bilan o’qib olamiz:
Biz csv faylini ichiga yangi ma’lumot(ustun) ham qo’shishimiz mumkin:
Shuningdek, .shape metodi yordamida jadval o’lchamlarini ham bilishimiz mumkin:
print(df.shape) # (3, 5)
Pandasda indekslash va tanlash
Pandasda tanlab olish uchun qulay usullar bor. Shulardan ayrimlarini misollar bilan ko’ramiz:
Bizda futbolchilar bilan bog’liq dataset bor edi, shulardan futbolchilar ustunini ko’rish uchun
df.Futbolchilar deb chaqirdik, endi agar biz klublar ustunini ko’rmoqchi bo’lsak
df.Klubi deb yozsak kifoya.
Pandas da .iloc funksiyasi bor, bu bizga pythondagi slicing uchun juda katta yengillikni beradi.
df.iloc[a:b+1, c:d+1]
Olovrang bilan to’liq DataFrame bo’yalgan bo’lsa, kulrang bilan soha .iloc funksiya orqali tanlangan DataFrame ni izohlayapti.
Pandas da .iloc ga o’xshagan .loc funksiyasi ham bor, lekin imkoniyatlari .iloc ga qaraganda ko’proq(.iloc ko’proq sonlar bilan ishlaydi, .loc str ma’lumotlar bilan ishlay oladi)
Shu .loc funksiyasi orqali biz ma’lumotlarni filterlash xususiyatiga ham ega bo’lamiz
Misol: 28 va undan yosh futbolchilar jadvali:
Xulosa
Xulosa o’rnida shuni aytnoqchimanki, Mashinali o’qitish uchun pythonni fundamental bilimlarini bilish eng 1 — navbatda zarur, keyingi navbatda pandas, numpy kabi muhim kutubxonalarni, undan keyingi navbatlarda esa Mashinali o’qitish uchun zarur bo’lgan boshqa muhim kutubxonalar sklearn, seaborn, va hokazo kutubxonalarni yetarli darajada bilish bizni shu sohada yetuk mutaxassis bo’lishga o’z yordamini beradi, ishimizni ham yengillashtiradi.
Foydalanilgan saytlar:
1.https://docs.python.org/3/
2.https://www.kaggle.com/learn/pandas
3.https://www.w3schools.com/python/pandas/default.asp
4.https://www.javatpoint.com/python-pandas
|
| |