Kompyuter tizimlati kafedrasi Ma’lumotlarning intelektual tahlili fani bo’yicha Amaliy ish №1 Mavzu

Download 379.36 Kb. Pdf ko'rish
Sana	20.04.2023
Hajmi	379.36 Kb.
	#52910

Bog'liq
2115-18 Muxtarova Aziza MIT amaliy1
xudo xoxlasa tushadi99%, 3-labarotoriya ishi Saralash usul va algoritmlarini tadqiq qilis, cmd buyruqlari, Incremental model nima, 1matematik, word sAM 1 savol, Документ Microsoft Word (4), Ma\'ruzalar (2), ЛАБОРАТОРНАЯ РАБОТА N1, Dasturlash 2, Ariza, Qalandarova Gulshoda, 1648631455, 1650692784, 1651669892 (2)

df.shape()

O`ZBEKISTON RESPUBLIKASI AXBOROT TEXNOLOGIYALARI VA
KOMMUNIKATSIYALARINI RIVOJLANTIRISH VAZIRLIGI MUHAMMAD
AL-XORAZMIY NOMIDAGI TOSHKENT AXBOROT TEXNOLOGIYALARI
UNIVERSITETI

Kompyuter tizimlati kafedrasi
Ma’lumotlarning intelektual tahlili fani bo’yicha
Amaliy ish №1
Mavzu:
Bo'sh qiymatli datasetlarni to'ldirish yoki ularni tushirib qoldirish
Bajardi: 215-18 guruh talabasi
Muxtarova Aziza
Tekshirdi: Ochilov Temur

Toshkent 2021

Laboratoriya ishi №3
Mavzu:
Bo'sh qiymatli datasetlarni to'ldirish yoki ularni tushirib qoldirish

Ishdan maqsad: Ma’lumotlar to’plamini optimallashtirishda
Pandas
kutubxonasining dropna() modulidan foydalanib bo’sh qiymatlarni tushirib
qoldirishni tashkillashtirish. Ustunlardagi kategoriyali ma’lumotlarni ushbu
ustundagi eng ko’p takrorlangan qiymat(mode) bilan to’ldirish. Boshqa qiymatlarni
esa ushbu vaziyatga qarab ustundagi qiymatlarning mean yoki medianlari bilan
to’ldirish
,
df.shape() orqali qayta ishlangan ma’lumotlar sonini chiqarish va
bajargan ishdan xulosa chiqarish.
Ishni bajarish
4-variant
iris.csv database dan foydalanib ma’lumotlarni optimallashtiramiz
Kutubxonalarni yuklab olish:
import numpy as np
import pandas as pd

Ma’lumotlarni o’qib olish
data=pd.read_csv('iris.csv')
data
1-rasm. O’qib olingan dataset ko’rinishi.

O’qib olingan ma’lumotlar soni chiqarish df.shape() orqali
df=pd.DataFrame(data)
rows, columns=df.shape
rows, columns
Hozirgi datasetda 150ta qator, 5ta ustun mavjud ekan. Har bir ustun bo’yicha bo’sh
qiymatlar yig’indisini chiqarish:
df.isnull().sum()
Qatorning 80% idan ko’p qismi mavjud bo’lmasa qatorni tushirib qoldirish,
df=df.dropna(axis=0,thresh=4)
df

2-rasm. Qatorlari o’chgandan keyingi dataset.

Qatorlarni o’chirgandan keyin 139ta qator qoldi. Qolgan ma’lumotlarni har
bir ustuni bo’yicha bo’sh qiymatlarning yig’indisini chiqarish:
df.isnull().sum()
Qolgan bo’sh qiymatlarni mean, median, mode lardan mosidan foydalanib
to’ldirib chiqamiz. Sepal va Petal yaproqlarining uzunligi va enini mean bilan, gul
turini (class label) mode bilan to’ldirib chiqamiz.
sepal_length=df['sepal_length'].mean()
sepal_width=df['sepal_width'].mean()
petal_length=df['petal_length'].mean()
petal_width=df['petal_width'].mean()
class_label=df['class_label'].mode().iloc[0]

df['sepal_length']=df['sepal_length'].fillna(value=sepal_length)
df['sepal_width']=df['sepal_width'].fillna(value=sepal_width)
df['petal_length']=df['petal_length'].fillna(value=petal_length)
df['petal_width']=df['petal_width'].fillna(value=petal_width)
df['class_label']=df['class_label'].fillna(value=class_label)
df

3-rasm. Bo’sh qiymatlarni to’ldirgandan keyingi dataset ko’rinishi.
df.isnull().sum()
rows, columns=df.shape
rows, columns
Yuqorida ko’rib turganimizdek dataset ustunlarining bo’sh qoymatlari
qolmadi. Natijada 139ta qator, 5ta ustun qoldi.

Xulosa
Bu laboratoriyani ishini bajarish davomida ma’lumotlar to’plamini
optimallashtirish bilan tanishdim. Berilgan datasetdan pandas kutubxonasining
dropna() modulidan foydalanib bo’sh qiymatlarni tushirib qoldirdim. Qolgan bo’sh
qiymatlarni mean, mode larni hisoblab to’ldirib chiqdim. Bundan maqsad, qurgan
modelimizning aniqligini oshirish.

Download 379.36 Kb.

Pdf ko'rish