lug'atni vektor shakliga oldindan o'rgatilgan so'zlarni kiritish orqali. Stack kabi ommaviy ma'lumotlar to'plamlari uchun
O'rnatish qatlami bizning modelimiz uchun oldingi qatlam edi. Bu qatlam dan foydalanadi
25
Bundan tashqari, biz barcha so'zlarni o'zgartirib, o'rnatish
matritsasini yaratdik
4.3.2 O'rnatish qatlami
va Juniper Networks tomonidan ichki ma'lumotlar to'plamida o'qitilgan. Juniper Network-ning o'rnatilishi
har biri yuz o'lchamda. Juniper ma'lumotlar to'plami uchun biz yaratilgan o'rnatish matritsasidan foydalandik
uning vektor shakli. Qatlam so'z indekslari va shaklida ifodalangan har bir jumlani kiritadi
Overflow, biz so'zlarni o'rnatishni o'z ichiga olgan ommaviy oldindan o'rgatilgan
GloVe modelidan foydalandik
Har bir so'zni o'zgartirish uchun ma'lumotlar to'plamini tayyorlashning oldingi bosqichida saqlangan o'rnatish matritsasi
Biz birinchi navbatda kirish (maqola) va kutilgan barcha noyob so'zlarni to'pladik
indeks xaritalari, o'rnatish matritsasi va ma'lumotlar to'plami haqida tavsiflovchi ma'lumotlar (shunday
chunki u har bir so'zga matematik kontekst beradi va o'xshashlikni
hisoblash usulini beradi
matritsaning har biri bir yuz ellik o'lchovli vektorlari bor edi. Bilan so'zning lug'atlari
gapdagi har bir so'z uchun vektor chiqaradi. Ushbu vektorning o'lchami ga bog'liq
qatlam tomonidan ishlatiladigan matritsani joylashtirish. Har bir so'zni vektor fazoda ifodalash muhim ahamiyatga ega
Modelda keyinroq foydalanish uchun Python lug'ati.
ular ustida ishlaydi va o'zini o'zi o'rgatadi.
hujjatlarni kiritish va chiqarish uchun xaritalar.
hujjatlarning chiqishi (sarlavhasi) va indeksli ikkita Python lug'at lug'atini yaratdi.
sifatida kiritilgan so'zlar soni va kirish satrining maksimal uzunligi) a da saqlangan
ular orasida. Vektor fazodagi so'zlarni ifodalash orqali bizning modelimiz matematik
tarzda ishlashi mumkin
Machine Translated by Google
o'tmishda mashina tarjimasi. Bizning modelimiz ketma-ketlikni loyihalash uchun ketma-ketlikdan foydalanadi. 9-rasm
oldingi LSTM qatlami tomonidan qayta ishlangan holat.
so'ngra, softmax qatlamidan o'tgandan so'ng, xulosadagi keyingi so'zni taxmin qiling. The
softmax qatlami mavjud bo'lgan har birining ehtimolini (so'z chiqish so'zi bo'ladimi) hisoblaydi
Santos, Gulchehre, & Xiang 2016). Sequence to sequence modellari keng tarqalgan bo'lib ishlatilgan
vektor ko'rinishidagi har bir so'z kodlovchiga yuborilganda yangilanadi. Har bir qatlam kirish sifatida qabul qiladi
kutilgan xulosa "Mening uzun bo'yli itim bor". Birinchi bosqichda kirish indeksga aylantiriladi
Modelga “Mening itim bor. It juda baland." va
jarayon. Dekoder uchta LSTM qatlamidan va hisoblash uchun
softmax qatlamidan iborat
modelimizning o'quv qismini ko'rsatadi.
Barcha kirish qayta ishlanganidan so'ng, ichki holat dekoderga o'tkaziladi