• df.shape()
  • Kompyuter tizimlati kafedrasi Ma’lumotlarning intelektual tahlili fani bo’yicha Amaliy ish №1 Mavzu




    Download 379.36 Kb.
    Pdf ko'rish
    Sana20.04.2023
    Hajmi379.36 Kb.
    #52910
    Bog'liq
    2115-18 Muxtarova Aziza MIT amaliy1
    xudo xoxlasa tushadi99%, 3-labarotoriya ishi Saralash usul va algoritmlarini tadqiq qilis, cmd buyruqlari, Incremental model nima, 1matematik, word sAM 1 savol, Документ Microsoft Word (4), Ma\'ruzalar (2), ЛАБОРАТОРНАЯ РАБОТА N1, Dasturlash 2, Ariza, Qalandarova Gulshoda, 1648631455, 1650692784, 1651669892 (2)


    O`ZBEKISTON RESPUBLIKASI AXBOROT TEXNOLOGIYALARI VA 
    KOMMUNIKATSIYALARINI RIVOJLANTIRISH VAZIRLIGI MUHAMMAD 
    AL-XORAZMIY NOMIDAGI TOSHKENT AXBOROT TEXNOLOGIYALARI 
    UNIVERSITETI 
     
    Kompyuter tizimlati kafedrasi 
    Ma’lumotlarning intelektual tahlili fani bo’yicha 
    Amaliy ish №1 
    Mavzu: 
    Bo'sh qiymatli datasetlarni to'ldirish yoki ularni tushirib qoldirish
    Bajardi: 215-18 guruh talabasi 
    Muxtarova Aziza 
    Tekshirdi: Ochilov Temur 
     
     
     
     
     
     
     
    Toshkent 2021 


     
    Laboratoriya ishi №3 
    Mavzu: 
    Bo'sh qiymatli datasetlarni to'ldirish yoki ularni tushirib qoldirish
     
    Ishdan maqsad: Ma’lumotlar to’plamini optimallashtirishda 
    Pandas 
    kutubxonasining dropna() modulidan foydalanib bo’sh qiymatlarni tushirib 
    qoldirishni tashkillashtirish. Ustunlardagi kategoriyali ma’lumotlarni ushbu 
    ustundagi eng ko’p takrorlangan qiymat(mode) bilan to’ldirish. Boshqa qiymatlarni 
    esa ushbu vaziyatga qarab ustundagi qiymatlarning mean yoki medianlari bilan 
    to’ldirish
    ,
    df.shape() orqali qayta ishlangan ma’lumotlar sonini chiqarish va 
    bajargan ishdan xulosa chiqarish. 
    Ishni bajarish 
    4-variant 
    iris.csv database dan foydalanib ma’lumotlarni optimallashtiramiz 
    Kutubxonalarni yuklab olish: 
    import numpy as np
    import pandas as pd 
     
    Ma’lumotlarni o’qib olish 
    data=pd.read_csv('iris.csv') 
    data 
    1-rasm. O’qib olingan dataset ko’rinishi. 


    O’qib olingan ma’lumotlar soni chiqarish df.shape() orqali 
    df=pd.DataFrame(data) 
    rows, columns=df.shape 
    rows, columns 
    Hozirgi datasetda 150ta qator, 5ta ustun mavjud ekan. Har bir ustun bo’yicha bo’sh 
    qiymatlar yig’indisini chiqarish: 
    df.isnull().sum() 
    Qatorning 80% idan ko’p qismi mavjud bo’lmasa qatorni tushirib qoldirish, 
    df=df.dropna(axis=0,thresh=4) 
    df 
     
    2-rasm. Qatorlari o’chgandan keyingi dataset. 


    Qatorlarni o’chirgandan keyin 139ta qator qoldi. Qolgan ma’lumotlarni har 
    bir ustuni bo’yicha bo’sh qiymatlarning yig’indisini chiqarish: 
    df.isnull().sum() 
    Qolgan bo’sh qiymatlarni mean, median, mode lardan mosidan foydalanib 
    to’ldirib chiqamiz. Sepal va Petal yaproqlarining uzunligi va enini mean bilan, gul 
    turini (class label) mode bilan to’ldirib chiqamiz.
    sepal_length=df['sepal_length'].mean() 
    sepal_width=df['sepal_width'].mean() 
    petal_length=df['petal_length'].mean() 
    petal_width=df['petal_width'].mean() 
    class_label=df['class_label'].mode().iloc[0] 
     
    df['sepal_length']=df['sepal_length'].fillna(value=sepal_length) 
    df['sepal_width']=df['sepal_width'].fillna(value=sepal_width) 
    df['petal_length']=df['petal_length'].fillna(value=petal_length) 
    df['petal_width']=df['petal_width'].fillna(value=petal_width) 
    df['class_label']=df['class_label'].fillna(value=class_label) 
    df 


    3-rasm. Bo’sh qiymatlarni to’ldirgandan keyingi dataset ko’rinishi. 
    df.isnull().sum() 
    rows, columns=df.shape 
    rows, columns 
    Yuqorida ko’rib turganimizdek dataset ustunlarining bo’sh qoymatlari 
    qolmadi. Natijada 139ta qator, 5ta ustun qoldi. 
     
     
     
     
     


    Xulosa 
    Bu laboratoriyani ishini bajarish davomida ma’lumotlar to’plamini 
    optimallashtirish bilan tanishdim. Berilgan datasetdan pandas kutubxonasining 
    dropna() modulidan foydalanib bo’sh qiymatlarni tushirib qoldirdim. Qolgan bo’sh 
    qiymatlarni mean, mode larni hisoblab to’ldirib chiqdim. Bundan maqsad, qurgan 
    modelimizning aniqligini oshirish.
     
     

    Download 379.36 Kb.




    Download 379.36 Kb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Kompyuter tizimlati kafedrasi Ma’lumotlarning intelektual tahlili fani bo’yicha Amaliy ish №1 Mavzu

    Download 379.36 Kb.
    Pdf ko'rish