import statsmodels.api as sm




Download 110.05 Kb.
bet2/10
Sana19.02.2024
Hajmi110.05 Kb.
#159025
1   2   3   4   5   6   7   8   9   10
Bog'liq
1Chiziqli regressiya masalasi
Ma’ruza №3 Mavzu O’rnatilgan tizimlar arxitekturasi Rеja-fayllar.org, Bir kompyuterda Katta ma’lumotlar bilan ishlash Reja, Katta ma\'lumotlar uchun Business Intelligence, Amaliy ish 1, 4 курс Амалиёт кундалиги ўзбек, 021-19 sodiqov sohib labaratoriya ishi, 2-amaliy ish
import statsmodels.api as sm
Chiziqli regressiya uchun Statsmodelsdan qanday foydalanishni ko'rib chiqaylik. Data Science sinfidan misol keltirgan. Birinchidan, biz ma'lumotlar to'plamini sklearn dan import qilamiz.
from sklearn import datasets ## imports datasets from scikit-learn
data = datasets.load_boston() ## loads Boston dataset from datasets library
Data.feature_names va data.target ishga tushirilsa, mos ravishda mustaqil o'zgaruvchilar va bog'liq o'zgaruvchilar ustun nomlari chop etiladi. Ya'ni, Scikit-learn allaqachon qiymati va narx ma'lumotlarini maqsadli o'zgaruvchi sifatida va boshqa 13 o'zgaruvchini bashorat qiluvchi sifatida belgilab qo'ygan. Keling, ushbu ma'lumotlar to'plamida chiziqli regressiyani qanday bajarishni ko'rib chiqaylik.
Birinchidan, biz osonroq tahlil qilish uchun ma'lumotlarni pandas dataframe sifatida yuklashimiz va o'rtacha qiymatini maqsadli o'zgaruvchi sifatida belgilashimiz kerak:
import numpy as np
import pandas as pd# define the data/predictors as the pre-set feature names
df = pd.DataFrame(data.data, columns=data.feature_names)

# Put the target (housing value -- MEDV) in another DataFrame
target = pd.DataFrame(data.target, columns=["MEDV"])
Bu yerda qilgan ishimiz maʼlumotlar toʻplamini olib, uni pandalar maʼlumotlar ramkasi sifatida yuklash; shundan so'ng biz bashorat qiluvchilarni o'rnatamiz (masalan, df) - ma'lumotlar to'plamida oldindan o'rnatilgan mustaqil o'zgaruvchilar. Shuningdek, biz maqsadni qo'ydik - biz taxmin qilmoqchi bo'lgan bog'liq o'zgaruvchi malum bo'ladi.
Keyinchalik, chiziqli regressiya modeliga moslashmoqchi bo'lgan o'zgaruvchilar. o'zgaruvchi uchun yaxshi bashorat qiluvchi o'zgaruvchilarni tanlashi, o'zgaruvchilar orasidagi korrelyatsiyalarni tekshirish, ma'lumotlarning chizmalarini tuzish va aloqalarni vizual ravishda izlash, qaysi o'zgaruvchilar bo'lishi haqida dastlabki tadqiqotlar o'tkazish orqali amalga oshirish mumkin. y uchun yaxshi bashorat qiluvchilar va boshqalar. Ushbu birinchi misol uchun RM ni olaylik - xonalar o'rtacha soni va LSTAT - aholining pastki holatining foizi. Shuni ta'kidlash kerakki, Statsmodels standart konstantani qo'shmaydi. Keling, buni birinchi navbatda regressiya modelimizda doimiysiz ko'rib chiqaylik:
## Without a constant


Download 110.05 Kb.
1   2   3   4   5   6   7   8   9   10




Download 110.05 Kb.