Python Dataframe to'plamini yaratishning 3 ta oson yo'li
Salom, o'quvchilar! Ushbu maqolada biz turli xilPython Dataframe-ning pastki
to'plamini yaratish usullariga batafsil to'xtalamiz.
Xo'sh, keling, boshlaylik!
Birinchidan, Python Dataframe nima?
Python Pandas moduli bizga qiymatlarni saqlash uchun ikkita ma'lumotlar
tuzilmasi, ya'ni Series va Dataframe bilan ta'minlaydi.
Dataframebu ma'lumotlarni matritsa ko'rinishida saqlaydigan ma'lumotlar
strukturasidir, ya'ni u satr va ustunlar qiymat ko'rinishidagi ma'lumotlarni o'z
ichiga oladi. Shunday qilib, u bilan bog'liq holda, biz quyidagi formatlarda uning
kichik to'plamini yaratishimiz va unga kirishimiz mumkin:
Qatorlar boʻyicha maʼlumotlarga quyi toʻplam sifatida kirish
Ustunlar bo'yicha ma'lumotlarni quyi to'plam sifatida oling
Ba'zi qatorlar va ustunlar ma'lumotlariga quyi to'plam sifatida kirish
Dataframe va quyi to'plamlar haqida tushunganimizdan so'ng, keling,
Dataframe-dan kichik to'plam yaratishning turli usullarini tushunamiz.
Ishlash uchun Dataframe yaratish!
Dataframening quyi to'plamlarini yaratish uchun biz dataframe yaratishimiz
kerak. Keling, avvalo buni yo'ldan chiqaraylik:
import pandas as pd
data = {"Roll-num": [10,20,30,40,50,60,70], "Age":[12,14,13,12,14,13,15],
"NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}
block = pd.DataFrame(data)
print("Original Data frame:\n")
print(block)
Chiqish:
Original Data frame:
Roll-num Age NAME
0 10 12 John
1 20 14 Camili
2 30 13 Rheana
3 40 12 Joseph
4 50 14 Amanti
5 60 13 Alexa
6 70 15 Siri
Bu yerda biz pandas.DataFrame() usuli yordamida ma'lumotlar ramkasini
yaratdik. Biz ushbu maqola davomida yuqorida yaratilgan ma'lumotlar
to'plamidan foydalanamiz
Keling, boshlaymiz!
1. Loc() funksiyasidan foydalanib, Python dataframening kichik to'plamini
yarating
Python loc() funktsiyasi ma'lum bir satr yoki ustunga yoki ikkalasining
kombinatsiyasiga muvofiq ma'lumotlar ramkasining kichik to'plamini yaratishga
imkon beradi.
loc() funksiyasi teglar asosida ishlaydi ya'ni moslashtirilgan kichik to'plamni
tanlash va yaratish uchun biz uni qator/ustun yorlig'i bilan ta'minlashimiz kerak.
Sintaksis:
pandas.dataframe.loc[]
1-misol: Dataframening ma'lum qatorlari ma'lumotlarini ajratib oling
block.loc[[0,1,3]]
Chiqish:
Quyida ko'rib turganimizdek, biz 0, 1 va 3-qatorning barcha ma'lumotlarini o'z
ichiga olgan kichik to'plamni yaratdik.
Roll-num Age NAME
0 10
12
John
1 20
14
Camili
3 40
12
Joseph
2-misol: Kesish yordamida qatorlar to‘plamini yarating
block.loc[0:3]
Bu erda biz loc() funksiyali slicing operatori yordamida indeks 0 dan indeks 3
gacha bo'lgan barcha qatorlar ma'lumotlarini chiqarib oldik.
Chiqish:
Roll-num Age NAME
0 10
12
John
1 20
14
Camili
2 30
13
Rheana
3 40
12
Joseph
3-misol: Yorliqlar yordamida alohida ustunlar to‘plamini yarating
block.loc[0:2,['Age','NAME']]
Chiqish:
Age
NAME
0 12
John
1 14
Camili
2 13
Rheana
Bu erda biz 0 dan 2-qatorgacha bo'lgan ma'lumotlarni o'z ichiga olgan kichik
to'plamni yaratdik, lekin faqat ba'zi maxsus ustunlarni, masalan, Yosh va
NAMEni o'z ichiga oladi.
2. Dataframening kichik to'plamini yaratish uchun Python iloc() funksiyasidan
foydalanish
Python iloc() funksiyasi bizga indekslar asosida satr va ustunlardan maʼlum
qiymatlarni tanlab kichik toʻplam yaratish imkonini beradi.
Ya'ni, yorliqlarda ishlaydigan loc() funksiyasidan farqli o'laroq, iloc()
funksiyasi indeks qiymatlarida ishlaydi. Biz satrlar va ustunlar indeks raqamlarini
ta'minlovchi ma'lumotlardan Python ma'lumotlar ramkasining kichik to'plamini
tanlashimiz va yaratishimiz mumkin.
Sintaksis:
pandas.dataframe.iloc[]
Misol:
block.iloc[[0,1,3,6],[0,2]]
Bu erda biz 0,1,3 va 6-qatorlar ma'lumotlarini hamda 0 va 2-ustun raqamlarini,
ya'ni Roll-num va NAME ni o'z ichiga olgan kichik to'plamni yaratdik.
Chiqish:
Roll-num NAME
0 10
John
1 20
Camili
3 40
Joseph
6 70
Siri
3. Dataframening kichik to'plamini yaratish uchun indekslash operatori
Oddiy qilib aytganda, biz ma'lumotlarning kichik to'plamini yaratish uchun
indekslash operatoridan, ya'ni kvadrat qavslardan foydalanishimiz mumkin.
Sintaksis:
dataframe[['col1','col2','colN']]
Misol:
block[['Age','NAME']]
Bu erda biz mos ravishda Yosh va NAME ustunlarining barcha ma'lumotlar
qiymatlarini tanladik.
Chiqish:
Age
NAME
0 12
John
1 14
Camili
2 13
Rheana
3 12
Joseph
4 14
Amanti
5 13
Alexa
6 15
Siri
Xulosa
Shu bilan biz mavzuni yakuniga yetdik. Agar biron bir savolga duch kelsangiz,
quyida sharh qoldiring. Python bilan bog'liq ko'proq shunday postlar uchun bizni
kuzatib boring va shu vaqtgacha, Happy Learning!! :)
Statistikada va tadqiqot dizaynida indeks kompozit statistik ko'rsatkichdir.
Boshqacha qilib aytganda, bir nechta ko'rsatkichlarni jamlaydigan murakkab
o'lchov[1].
Indekslar - kompozit ko'rsatkichlar sifatida ham tanilgan. Ular aniq
kuzatishlarni umumlashtiradi va tartiblaydi[2].
Ijtimoiy fanlar va barqarorlik sohasidagi ko'plab ma'lumotlar Gender farqi
indeksi, Inson taraqqiyoti indeksi yoki Dow Jones sanoat o'rtacha indeksi kabi
turli indekslarda taqdim etilgan. 2009-yilda Jozef Stiglits, Amartya Sen va Jean-
Paul Fitoussi tomonidan yozilgan "Iqtisodiy samaradorlik va ijtimoiy
taraqqiyotni o'lchash bo'yicha komissiyaning hisoboti" shuni ko'rsatadiki[3], bu
chora-tadbirlar so'nggi yillarda uchta omil tufayli keskin o'sishni boshdan
kechirgan. Mos keladigan omillar:
savodxonlik darajasini oshirish (shu jumladan statistik)
zamonaviy jamiyatlar va iqtisodiyotlarning murakkabligi ortishi
axborot texnologiyalarining keng tarqalganligi.
Erl Babbining so'zlariga ko'ra, indeksdagi elementlar odatda teng darajada
tortiladi, agar bunga qarshi biron bir sabab bo'lmasa (masalan, agar ikkita element
o'zgaruvchining deyarli bir xil tomonini aks ettirsa, ularning har birining vazni
0,5 bo'lishi mumkin)[4].
Xuddi shu muallifga ko'ra[5], buyumlarni qurish to'rt bosqichni o'z ichiga
oladi. Birinchidan, ob'ektlarni ularning mazmuni haqiqiyligi, bir o'lchovliligi,
o'lchovni o'lchash kerak bo'lgan o'ziga xoslik darajasi va ularning farqlari miqdori
asosida tanlash kerak. Ob'ektlar bir-biri bilan empirik bog'liq bo'lishi kerak, bu
ularning ko'p o'lchovli munosabatlarini tekshirishning ikkinchi bosqichiga olib
keladi. Uchinchidan, indekslar ballari ishlab chiqilgan bo'lib, bu ularning ballar
diapazonini va ob'ektlar uchun og'irliklarini aniqlashni o'z ichiga oladi. Nihoyat,
indekslar tasdiqlanishi kerak, bu ularning qurilishida foydalanilmagan
o'lchanadigan o'zgaruvchiga tegishli ko'rsatkichlarni bashorat qila oladimi yoki
yo'qligini tekshirishni o'z ichiga oladi[5].
2008-yilda OECD va Yevropa Komissiyasining Qo'shma tadqiqot markazi
tomonidan qo'shma ko'rsatkichlarni (CI) qurish bo'yicha qo'llanma nashr
etilgan[6]. OECDning yuqori darajadagi statistika qo'mitasi tomonidan rasman
ma'qullangan qo'llanma indeksni ishlab chiqish uchun o'nta rekursiv qadamni
tavsiflaydi[7]:
1-qadam: Nazariy asos
2-qadam: Ma'lumotlarni tanlash
3-qadam: Yetishmayotgan ma'lumotlarni hisoblash
4-qadam: Ko'p o'lchovli tahlil
5-qadam: Normalizatsiya
6-qadam: Og'irlik
7-qadam: Ko'rsatkichlarni umumlashtirish
8-qadam: Sezuvchanlikni tahlil qilish
9-qadam: Boshqa chora-tadbirlar bilan bog'lanish
10-qadam: Vizualizatsiya
Ro'yxatda ta'kidlanganidek, kompozit indikatorni yaratish uchun ko'plab
modellashtirish tanlovlari talab qilinadi, bu esa ulardan foydalanishni munozarali
qiladi[6]. Og'irliklarni belgilash va tasdiqlashning nozik masalasi[8], muhokama
qilinadi. Kompozit ko'rsatkichlarning tabiatini sotsiologik o'qishni Paul-Marie
Boulanger taklif qiladi, u ushbu chora-tadbirlarni uchta harakatning kesishmasida
ko'radi[9]:
tajribani demokratlashtirish, yagona mutaxassislar tomonidan taqdim etilishi
mumkin bo'lgan ijtimoiy va ekologik muammolarni hal qilish uchun ko'proq
bilim zarurligi haqidagi tushuncha - bu fikrlash yo'nalishi postnormal fan
tomonidan ishlab chiqilgan kengaytirilgan tengdoshlar hamjamiyatining
kontseptsiyasi bilan bog'liq.
John Dewey kabi pragmatistlar faoliyati bilan qayta bog'lanishi mumkin
bo'lgan ijtimoiy kashfiyotlar jarayoni orqali yangi jamoatchilikni yaratishga
turtki.
Charlz Sanders Peircening semiotikasi; Shunday qilib, CI shunchaki belgi yoki
raqam emas, balki harakat yoki xatti-harakatni taklif qiladi.
Boulangerning keyingi ishi taraqqiyotning turli o'lchovlari qanday qabul
qilinishi yoki olinmasligini o'rganish uchun Niklas Luhmanning ijtimoiy tizim
nazariyalari asosida kompozit ko'rsatkichlarni tahlil qiladi
Foydalanilgan adabiyotlar:
•
Python for Data Analysis – Wes McKinney
•
NumPy 1.5 – Ivan Irdis
•
SciPy and NumPy
•
https://numpy.org/doc/stable/user/absolute_beginners.html
•
https://havola.uz/e/numpy
https://community.uzbekcoders.uz/post/ma-lumotlar-tahlili-
data-
analysis-uchun-python-dasturlash-tili-distributorl--
5ee9f044d73750310952c31a
•
https://techcult.com/how-to-install-numpy/
•
https://www.youtube.com/watch?v=I-E09N5-lzk
|