|
Ma'lumotlar to'plamini o'quv va test ma'lumotlariga bo'lish
|
bet | 3/4 | Sana | 04.10.2023 | Hajmi | 106.64 Kb. | | #86396 |
Bog'liq laboratoriya mashg\'uloti 3 Ichki ishlar boshqarmasiga, Документ Microsoft Word (2) (Автосохраненный), kompyuter chiqarish, Topshiriq 2, 2 hafta laboratoriya, Дастурлаш 4.1 машгулот (2), 9, 2, SQL 1-lab Umarov Amirjon, Topshiriq 2.05(Texnikum), 1.1, 7.1 машгулот, MB 2-amaliy ish, 5-amaliy, 1-lab Sirqilarga AbstraktMT3. Ma'lumotlar to'plamini o'quv va test ma'lumotlariga bo'lish
maxfiy ma'lumotlar to'plamimizdan trening va test ma'lumotlar to'plamini yaratish uchun scikit-learn ning train_test_split funksiyasidan ro'yxatni ochish bilan birgalikda foydalanamiz .
scikit-learn kutubxonasining model_validation modulidan train_test_split ni import qilishingiz kerak :
sklearn.model dan _selection import train_test_split
train_test_split funktsiyasiga o'tadigan x va y qiymatlarini belgilashimiz kerak .
X qiymatlari DataFrame ni ifodalaydi biz ilgari yaratgan scaled_data . Y qiymatlari bizning raw_data manba jadvalining "TARGET CLASS" ustunida saqlanadi .
Ushbu o'zgaruvchilarni quyidagicha yaratishingiz mumkin:
x = masshtabli_ma'lumotlar
y = xom_ma'lumotlar [ ' MAQSADLI SINF']
ushbu ikkita argument va mos test_size yordamida train_test_split funksiyasini ishga tushirishingiz kerak . Biz test_size 30% dan foydalanamiz , bu quyidagi funksiya parametrlarini beradi:
x_training_data , x_test_data , y_training_data , y_test_data = train_test_split ( x , y, test_size = 0.3)
Endi bizning ma'lumotlar to'plamimiz o'quv ma'lumotlari va sinov ma'lumotlariga bo'lingan, biz modelimizni o'qitishni boshlashga tayyormiz!
4.K-eng yaqin qo'shnilar modelini o'rgatish
Scikit-learn dan KNeighborsClassifier ni import qilishdan boshlaylik :
dan sklearn . qo'shnilar Import KNeighborsClassifier
KNeighborsClassifier sinfining namunasini yaratamiz va uni model o'zgaruvchisiga tayinlaymiz .
siz tanlagan K-eng yaqin qo'shnilar algoritmining K qiymatiga teng bo'lgan n_neighbors parametrini o'tkazishni talab qiladi . Birinchidan, n_neighbors = 1 ni aniqlaymiz :
model = KNeighborsClassifier ( n_neighbors = 1 )
Endi biz modelimizni fit usuli va x_training_data va y_training_data o'zgaruvchilari yordamida o'rgatishimiz mumkin :
model.fit ( x_training_data , y_training_data )
Endi olingan modeldan foydalanib, ba'zi bashoratlar qilaylik!
K-Yaqin qo'shnilar algoritmi yordamida bashorat qilish
logistik regressiya modellari bilan bir xil: bashorat qilish uchun unga x_test_data o'zgaruvchisini uzatib, bashorat qilish usulini chaqirish kifoya .
bashorat oʻzgaruvchisiga belgilashingiz mumkin :
bashoratlar = model.predict ( x_test_data )
Keling, bizning bashoratlarimiz qanchalik to'g'ri ekanligini ushbu qo'llanmaning keyingi qismida ko'rib chiqamiz.
|
| |