|
Namangan Institute of Engineering and Technology Pdf ko'rish
|
bet | 509/693 | Sana | 13.05.2024 | Hajmi | 15,56 Mb. | | #228860 |
Bog'liq ТўпламNamangan Institute of Engineering and Technology
nammti.uz
10.25.2023
Pg.470
3.
Mashinaniy o'qitish algoritmlari. Spam-xabarlarni aniqlash va tasniflash uchun turli xil
Mashinaniy o'qitish algoritmlari o'qitilishi mumkin. Ushbu algoritmlar spam va spam bo'lmagan
elektron pochta xabarlaridan iborat etiketli ma'lumotlar to'plamidan o'rganadi. Spamni aniqlash
uchun mashhur Mashinaniy o'qitish usullari quyidagilarni o'z ichiga oladi:
3.1.
Naive Bayes [4]: Ushbu algoritm Bayes teoremasiga asoslanadi va elektron pochtada
ma'lum bir xususiyatning mavjudligi boshqa xususiyatlar mavjudligidan mustaqil deb taxmin qiladi.
Naive Bayes tasniflagichlari spamni aniqlash uchun yaxshi ishlaydi va hisoblash jihatidan samaralidir.
3.2.
Tayanch Vektorlar usuli (SVM): SVMlar ikkita sinfni maksimal darajada ajratib
turadigan giperplan yaratish orqali spam va spam bo'lmagan xabarlarni ajratishda samarali [5]. SVM-
lar yuqori o'lchamli xususiyatlar bo'shliqlarini boshqarishi mumkin va ularning mustahkamligi bilan
mashhur.
3.3.
Tasodifiy o'rmonlar (Random Forests): Tasodifiy o'rmonlar bashorat qilish uchun bir
nechta qaror daraxtlarini birlashtiradi. Ular katta ma'lumotlar to'plamlarini boshqarishda samarali
va xususiyatlar o'rtasidagi murakkab munosabatlarni qo'lga kiritishi mumkin [6].
3.4.
Neyron tarmoqlar: Spamni aniqlash uchun rekkurent neyron tarmoqlari (RNN) va
konvolyutsion neyron tarmoqlari (CNN) kabi chuqur o'qitish usullaridan foydalanish mumkin. Ushbu
modellar elektron pochta tarkibining ierarxik ko'rinishlarini o'rganadi [7], bu ularga murakkab
naqshlar va bog'liqliklarni olish imkonini beradi.
4.
Kontentga asoslangan tahlil: Kontentga asoslangan tahlil spam holatini aniqlash uchun
elektron pochtaning matn va strukturaviy xususiyatlarini tahlil qilishni o'z ichiga oladi [8]. U shubhali
URL manzillar mavjudligi, katta harflar yoki undov belgilaridan haddan tashqari foydalanish va HTML
kodini tahlil qilish kabi tahlil xususiyatlarini o'z ichiga olishi mumkin.
Xulosa. Umuman olganda, spamni aniqlash va tasniflash uchun ishonchli algoritmlarni ishlab
chiqish va qo'llash foydalanuvchi tajribasini yaxshilash, xavfsizlikni ta'minlash, resurslardan
foydalanishni optimallashtirish va elektron xabar almashish tizimlarida me'yoriy hujjatlarga rioya
qilishni ta'minlashda muhim rol o'ynaydi.
Ushbu maqolada spamni elektron xabarlarda spamni aniqlash tizimlari ko'pincha yuqori
aniqlikka erishish uchun ushbu usullarning kombinatsiyasidan foydalanadi. Doimiy ravishda o'z
modellarini yangi ma'lumotlar bilan yangilash va takomillashtirish orqali ushbu algoritmlar spam
yuborishning yangi usullariga moslasha oladi va spamni samarali aniqlash va tasniflashni ta'minlaydi.
|
| |