70
Nizomaddin XUDAYBERGANOV, Shaxboz HASANOV
bir-biriga qanchalik yaqinligini ko‘rsatuvchi qiymat. Maqolada
quyidagi algoritmlar orqali ushbu qiymatni
aniqlash hamda undan
qanday foyda olish ko‘rib chiqiladi.
1. Hamming masofasi.
2. Levenshteyin masofasi.
3. Kosinus o‘xshashligi.
Mavjud nazariyalarni o‘rganish davomida shu narsa
aniqlandiki, o‘zbek tilidagi so‘zlar raqamli ko‘rinishga olib kelinishi
lozim. Ushbu qiymatlar uchun Python tilidan foydalanish maqsadga
muvofiq.
Asosiy qism
Berilgan satrlarni taxminan moslashtirish, shuningdek, katta
hajmdagi matn orasidan kerakli ma’lumotlarni
qidirish kabilarni
amalga oshirish mumkin, bu esa o‘z navbatida imlo tekshiruvi, maxsus
belgilarni aniqlash uchun tuzatish tizimlari, nutqni aniqlash, spamni
filtrlash, to‘g‘ri yozuvni tekshirish kabi turli xil ilovalarda qo‘llaniladi.
Bundan tashqari tabiiy tilni tushunishda aniqlikni oshirish, plagiatni
aniqlash kabi yo‘nalishlarda samarali qo‘llash mumkin bo‘ladi.
Matnlardagi plagiat akademik hamjamiyatni
tashvishga solayotgan
masalalardan biri hisoblanadi. Endi eng keng tarqalgan matn
plagiati so‘zlarni
kiritish, o‘chirish yoki almashtirishni o‘z ichiga
olgan turli xil kichik o‘zgartirishlar kiritish orqali yuzaga keladi.
Biroq, bunday oddiy o‘zgarishlar plagiatni aniqlash
jarayonida
ortiqcha taqqoslashni talab qiladi. Ushbu maqola orqali jarayonning
samaradorligini oshiruvchi bir qancha nazariyalar taqdim qilinadi.