Google Colab-da regressiya tahlili yordamida ko'chmas mulk narxlarini prognoz qilish
Kaggle ma'lumotlar to'plamini Pandas ma'lumotlar ramkasiga yuklaymiz:
Tadqiqot - ma'lumotlarimizni his qilish
Biz SalePrice ustunini ($ USD) bashorat qilamiz, keling, undan boshlaylik:
Zichlikning katta qismi 100k dan 250k gacha bo'ladi, lekin qimmatroq tomonda juda ko'p farqlar mavjud.
Keyinchalik, sotuv narxiga nisbatan kattaroq yashash maydonini (kvadrat fut) ko'rib chiqaylik:
Kattaroq yashash maydoni yuqori narxni anglatishini kutgan bo'lishingiz mumkin. Ushbu diagramma sizning to'g'ri ekanligingizni ko'rsatadi. Ammo katta yashash maydonini taklif qiladigan 2-3 "arzon" uy nima?
Siz o'rganish haqida o'ylamasligingiz mumkin bo'lgan ustunlardan biri "TotalBsmtSF" - podvalning umumiy kvadrat futlari, ammo baribir buni qilaylik:
Qiziqarli, shunday emasmi? Podval maydoni bizning modelimiz uchun juda ko'p bashoratli kuchga ega bo'lishi mumkin.
OK, oxirgisi. Keling, "OverallQual" ni ko'rib chiqaylik - umumiy material va tugatish sifati. Albatta, bu ko'proq sub'ektiv xususiyatga o'xshaydi, shuning uchun u sotuv narxiga biroz boshqacha nuqtai nazarni berishi mumkin.
Sotish narxini bashorat qilish
Endi biz o'ynayotgan ma'lumotlarimizni his qilganimizdan so'ng, biz hujum rejamizni boshlashimiz mumkin - ma'lum bir uyning sotish narxini qanday taxmin qilish mumkin?
Chiziqli regressiyadan foydalanish
Chiziqli regressiya modellari bog'liq uzluksiz o'zgaruvchi Y va bir yoki bir nechta tushuntirish (mustaqil) o'zgaruvchilar X o'rtasidagi munosabatlar chiziqli (ya'ni to'g'ri chiziq) deb taxmin qiladi. U qiymatlarni toifalarga (masalan, mushuk, it) tasniflashdan ko'ra, doimiy diapazondagi (masalan, savdo, narx) taxmin qilish uchun ishlatiladi. Chiziqli regressiya modellarini ikkita asosiy turga bo'lish mumkin:
|