|
Microsoft Word ÌÀÊÅÒ ÓÂÒÈ 019
|
bet | 2/10 | Sana | 13.02.2024 | Hajmi | 1,84 Mb. | | #155943 |
Bog'liq intellektualnyy-algoritm-identifikatsii-destruktivnoy-informatsii-v-tekste (1).ru.uzIqtibos uchun:Davidyuk N.V., Gostyunina V.A., Baidulova D.R.Matndagi buzg'unchi ma'lumotlarni aniqlashning aqlli algoritmi // Astraxan davlat texnika universitetining xabarnomasi. Seriya: Menejment, kompyuter texnologiyalari va axborot fanlari. 2019. № 2. 29–39-betlar. DOI: 10.24143/2072-9502-2019-2-29-39.
Kirish
Fan va texnika taraqqiyoti hozirgi vaqtda inson faoliyatining ko‘plab sohalariga yangi axborot texnologiyalarini jadal joriy etish bilan birga olib borilmoqda. Internetning rivojlanishi turli xil ma'lumotlar miqdorining nazoratsiz eksponensial o'sishiga olib keladi, ularning aksariyati matn shaklida taqdim etiladi.
Axborot xavfsizligini taʼminlash uchun telekommunikatsiya tarmoqlarida noqonuniy maʼlumotlar, jumladan, terrorizm, giyohvand moddalarning noqonuniy aylanishi, norozilik harakatlari yoki tartibsizliklarni tayyorlash bilan bogʻliq, davlat ramzlari, haqoratomuz soʻzlar va boshqalarga oid maʼlumotlarni oʻz ichiga olgan kontentni tahlil qilish katta ahamiyatga ega. 1]. Shu munosabat bilan, shuningdek, Rossiya Federatsiyasida "yopiq" Internet makonini yaratish kontekstida buzg'unchi ma'lumotlarni qidirish va avtomatik ravishda aniqlash muammosini hal qilish ustuvor vazifa hisoblanadi. Shu bilan birga, bugungi kunda Rossiya Federatsiyasi tomonidan qabul qilingan qonunchilik choralari jamiyatning axborot va psixologik xavfsizligini ta'minlash uchun etarli emas [2].
Shunday qilib, axborot resurslarini qidirish va turkumlashning ixtisoslashtirilgan tizimlarini ishlab chiqish zarurati tug'iladi. Bundan tashqari, axborot resurslarining doimiy ravishda o'sib borayotgan hajmi tufayli, xavfli tarkibni yanada blokirovka qilish maqsadida kiritilgan matn ma'lumotlarining tabiatini aniqlash jarayonini avtomatlashtirish nafaqat mehnat xarajatlarini kamaytiradi, balki sub'ektivlikni va xatolar ehtimolini kamaytiradi. inson omilining ta'siri bilan.
Buzg'unchi ma'lumotlarni avtomatik identifikatsiya qilish muammosini hal qilish uchun, so'zlarni qidirish va aniqlash misolidan foydalanib, matnda aniq so'zlarni topish uchun ishlatiladigan mavjud qidiruv usullari tahlil qilindi [3, 4]. Ma'lum bo'lishicha, ushbu usullar quyidagilarga bo'linadi:
to'liq ma'lumotni ekspert qayta ishlashga tayanadigan usullar bo'yicha, natijada "qora ro'yxatlar", registrlar va boshqalar (masalan, Roskomnadzorning bloklangan resurslari domen nomlarining yagona reestri);
Bizning ishimizga qiziqishning avtomatlashtirilgan usullari, shu jumladan tematik qidiruv (lug'at yordamida) va ma'lumotlarni aqlli qayta ishlash usullari. Lug'at qidiruvi, so'zdan so'zning aniq mosligini qidirish tizimidan iborat
pishirish va uni matnda aniqlash buzg'unchi ma'lumotlarni aniqlashning eng keng tarqalgan turlaridan biridir [5]. Biroq, qabihlik misolidan foydalanib, buzg'unchi tarkibni aniqlash muammosini hal qilish uchun "sof" shaklda tematik qidiruvdan foydalanish quyidagi sabablarga ko'ra mos emas:
so'z yasashning yangi shakllari va usullari paydo bo'lishi munosabati bilan lug'atni doimiy ravishda to'ldirish zarurati (hozirda turli birikmalar va so'z shakllarini tashkil etuvchi 250 dan ortiq asosiy so'zlar mavjud);
odobsiz so'zning matnda tizimga noma'lum bo'lgan yangi shakli qo'llanilishi tufayli yo'qolib qolish ehtimoli yuqori.
Ma'lumotlarni qayta ishlashning aqlli usullariga asoslangan tizimlar quyidagi afzalliklarga ega [3, 6-9]:
axborotni inson tafakkuriga yaqin shaklda ramziy (semantik) qayta ishlash;
foydalanuvchilar bilan intensiv muloqot o'tkazish imkonini beruvchi rivojlangan muloqot ko'nikmalari, uning davomida tizim tomonidan mavjud va olingan bilimlarga aniqlik kiritiladi;
tizimga so'rovlar yaratish va odamlar bilan muloqotga yaqin tabiiy tilda javoblar (muammolar yechimlari) olish;
o'z-o'zini o'rganish qobiliyati, ya'ni foydalanuvchi muammolarini tahlil qilish va hal qilishda tizim tomonidan to'plangan tajribaga asoslangan yangi bilimlarni avtomatik ravishda to'ldirish va olish;
tizim faoliyatining predmeti (muammo) sohasidagi ob'ektiv o'zgarishlarga tizimni moslash (moslashuvchanligi) qobiliyati va boshqalar.
Ko'rinib turibdiki, uyatlilikni aniqlashning samarali avtomatlashtirilgan tizimi sanab o'tilgan funktsiyalarni qo'llab-quvvatlashi kerak, xususan:
agar "xavfli" so'z aniqlansa, lug'atni avtomatik ravishda to'ldirish;
lug'at qo'shilishining to'g'riligini tekshirish uchun ekspertdan so'rov (agar kerak bo'lsa);
tahliliy qidiruv natijalari bo'yicha batafsil hisobotlarni taqdim etish.
Shunday qilib, muammoni hal qilish uchun o'zgartirilgan lug'at qidiruvini amalga oshiradigan matndagi haqoratni aniqlashning aqlli algoritmi ishlab chiqildi.
|
| |