Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar




Download 2,7 Mb.
Pdf ko'rish
bet16/26
Sana20.12.2023
Hajmi2,7 Mb.
#125027
1   ...   12   13   14   15   16   17   18   19   ...   26
Bog'liq
juniper-final (2)

4.3.3 Model
vektor. O'rnatish qatlamidan chiqish uchta LSTM dan iborat kodlovchiga beriladi
yashirin holatni saqlab qolish va uni keyingi kirish so'zini dekodlash uchun o'tkazish.
26
shakl, saqlangan lug'atni indekslash uchun so'zdan foydalaning va keyin o'rnatish qatlami uni a ga tarjima qiladi
yakuniy chiqish. Dekoder (9-rasmda qizil qutilar sifatida ko'rsatilgan) yordamida o'zini ishga tushiradi
enkoderdagi LSTM qatlamlari tomonidan hisoblangan holatlar. U kodlovchiga o'xshash ishlaydi
Enkoder o'rnatish qatlamidan kirishni oladi va ichki holatni saqlaydi. Ichki holat
9-rasmda ko'rsatilganidek, dekoderning vazifasi har bir kirish so'zidan uning yashirin holatini yangilash uchun foydalanishdir
matnni umumlashtirish uchun oddiy oldinga uzatiladigan neyron tarmoqlardan ustundir (Nallapati, Chjou,
So'nggi tadqiqotlar shuni ko'rsatdiki, enkoder-dekoder bilan ketma-ketlik modeli
qatlamlar. Rasmdagi yashil qutilar LSTM kodlovchi to'plamini tashkil qiladi. LSTM qatlamlari
Trening bosqichida dekoder kirish sifatida haqiqiy yoki ma'lumot xulosasini oladi
Machine Translated by Google


27
Model uchta ma'lumotlar to'plamida to'g'ri o'qitilgandan so'ng, model baholanadi
saqlangan chiqish lug'at ro'yxatidagi so'z. Keyin taxmin qilingan qiymat kutilgan qiymat bilan taqqoslanadi
tekshirish uchun ajratilgan ma'lumotlar to'plamining qismi. Xulosa haqida bashorat qilish uchun
xulosadagi keyingi so'z bo'lgan qiymat. Model tomonidan hisoblangan zararga qarab,
LSTM hujayralarining og'irliklari klassik orqaga tarqalish algoritmi orqali yangilanadi.
kiritilgan ma'lumotlar, modelning haqiqiy xulosasi ko'rsatilmaydi. Dekoderga birinchi kirish "boshlash" dir
token' bu modelga o'rgatilgan. Model so'zni bashorat qilgandan so'ng, bu so'z bo'ladi
9-rasm: Trening modeli arxitekturasi
Machine Translated by Google


10-rasm: bashorat qilish modeli arxitekturasi
Konstantin Lopyrevning takroriy neyron tarmoqlari bilan yangiliklar sarlavhalari (2015). Softmax qatlami
Endi 10-rasmda ko'rsatilganidek, keyingi so'z uchun dekoderga kirish sifatida ishlatiladi. Shu sababli,
"Generating" da taklif qilingan vaqtning o'ndan bir qismidagi haqiqiy xulosa so'zining o'rniga kiritish
28
va keyin xulosa chiqarish uchun qolgan mahsulot bilan birlashtiriladi.
Har qanday nomuvofiqlikni bartaraf etish uchun trening bosqichida biz tasodifiy so'zni tanladik
dekoderda har bir so'zning bir martalik kodlanishi chiqadi. Xaritadan foydalanib, so'z topiladi
o'qitish va modelning bashorat qilish bosqichi o'rtasida bir oz farq bor.
Machine Translated by Google


Juniper ma'lumotlar to'plami bilan chambarchas bog'liq emas va har bir modelni bir marta o'qitish 2 kungacha davom etishi mumkin.
Kodlovchining har bir LSTM qatlamiga haddan tashqari mos kelmaslik uchun tushirilishi mumkin) qo'shilgan. Turli qiymatlar
mavhum xulosalash modeli Yangiliklar ma'lumotlar to'plamida o'rganilmagan, chunki Yangiliklar ma'lumotlar to'plami
davrlar soni o'zgartirildi va tark etish parametri (kiritilgan so'zlarning ulushi
ma'lumotlar to'plamining samarali umumlashtirish imkoniyatlarini o'lchash mumkin. Natijalar ko'rsatadi
yaratilgan xulosalar ROGUE-1 va BLEU ballari yordamida baholandi. Ushbu ballardan foydalanib,
modelni sinab ko'ring. Modellar ma'lumotlar to'plamida qayta ishlandi va natijalar bilan taqqoslandi
Keyin to'rtta model ma'lumotlar to'plamining tasdiqlash uchun ajratilgan qismida sinovdan o'tkazildi. The
cheklangan resurslarni hisobga olgan holda har bir parametr uchun sinovdan o'tkazildi
29
agar model har qanday ma'lumot to'plamida yaxshiroq ishlasa.
oldingi yugurish. Xulosalar ham inson ko'zlari bilan baholandi va ular bilan solishtirildi
ilgari ishlab chiqarilgan. Tizimimizning orqa qismini tashkil etuvchi eng yaxshi modellar tanlab olindi.
sozlangan - xususan, yashirin birliklar soni ko'paytirildi, o'rganish tezligi oshirildi,
tozalangan ma'lumotlar to'plami: Stack Dataset, KB Dataset, JIRA Dataset va JTAC Dataset. The
Modelning to'rt xil versiyasi yaratilgan bo'lib, ularning har biri to'rttadan birida o'qitilgan
Modelni turli ma'lumotlar to'plamlarida ishga tushirish va sinovdan o'tkazgandan so'ng, modelning parametrlari

Download 2,7 Mb.
1   ...   12   13   14   15   16   17   18   19   ...   26




Download 2,7 Mb.
Pdf ko'rish

Bosh sahifa
Aloqalar

    Bosh sahifa



Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar

Download 2,7 Mb.
Pdf ko'rish