16
2.3 Ma'lumotlar to'plamini muvozanatlashning ahamiyati
Keyin olingan ma'lumotlar ustun qiymatlari tushirilganda xususiyatlarni qayta ishlashdan o'tadi,
va IG qiymatiga ega qiymatlar sinfni farqlash uchun foydali xususiyatlarni ko'rsatadi [36].
Yuqori namuna olish. Ma'lumotlarni o'zgartirish etishmayotgan qiymatlarni o'z ichiga olgan qatorlarni o'chirishni o'z ichiga oladi. Yorliq
Sklearn kodlovchi funksiyasi noaniq xususiyatlarni raqamli qiymatlarga aylantirish uchun ishlatiladi. The
birlashtiriladi va kodlanadi. Bu natijalar massivlarda saqlanadi.
"toifa" chiqish yorlig'i ishlashning yomonlashishini oldini olish uchun issiq kodlashdan o'tadi.
Xususiyatlari
[10] foydasiz va etishmayotgan xususiyatlarni qayta ishlash uchun dastlabki ishlov berish bosqichini qo'llaydi. Bu qadam ham
Nazorat ostidagi mashinani o'rganish (ML) usullari o'qitish uchun etiketli ma'lumotlar to'plamini
talab qiladi
IPV4 va IPV6 manzillarini o'z ichiga olgan va o'n oltilik format raqamli qiymatlarga aylantiriladi va
ML modelining ishlashiga foyda keltirishi mumkin bo'lgan yangi xususiyatlarni ishlab chiqarish va o'zgartirishga yordam beradi.
tasniflash yoki bashorat qilish modeli. Ikkilik tasniflash muammosida haqiqiy yoki noto'g'ri
belgilar kerak
Bu IDS samaradorligini oshirishi mumkin. Yuqori namuna olish oddiy namunalarda amalga oshiriladi
mos ravishda butun sonlar. MinMaxScalar funktsiyasi xususiyat vektorlarida normallashtirish bosqichi sifatida qo'llaniladi.
[48] bijektiv yumshoq to'plamni qo'lladi va CorrACC deb nomlangan metrik
yondashuvni taklif qildi
ma'lumotlarning xususiyatlari eksperiment uchun ishlatiladi va olib tashlash bilan ta'siri o'rganiladi
muvozanat muammosini hal qilish.
xususiyatlarni samarali tanlash. Soft Set statistik xususiyatlar va o'zaro bog'liqlikni ko'rsatishga yordam beradi
IDS uchun eng samarali xususiyatlar tanlanadi.
yuqori korrelyatsiya qiluvchi xususiyatlar.
Xususiyatlarni ajratib olish [1] da paket ma'lumotlarini chiqarish uchun TShark vositasi
yordamida amalga oshiriladi
Ortiqcha va ahamiyatsiz xususiyatlar funksiya tanlash yordamida samarali tarzda kamayadi
har bir ma'lumot namunasi kirish sifatida ishlatiladigan ko'p sonli xususiyatlarga ega bo'lsa, etarli miqdorda bo'lishi
Ma'lumotlar [47] da uch bosqichdan foydalangan holda oldindan qayta ishlanadi: ma'lumotlarni o'zgartirish, ma'lumotlarni
normallashtirish va
PCAP fayllaridan. Hujumga yo'naltirilgan xususiyatlar o'rniga trafikning umumiy xususiyatlari olinadi.
komponent. Ma'lumot olish (IG) amalga oshiriladi va kamroq IG qiymatlari bo'lgan xususiyatlar o'chiriladi
Machine Translated by Google