• 2.3.1 Suniy neyron tarmogi
  • Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar




    Download 2,7 Mb.
    Pdf ko'rish
    bet6/26
    Sana20.12.2023
    Hajmi2,7 Mb.
    #125027
    1   2   3   4   5   6   7   8   9   ...   26
    Bog'liq
    juniper-final (2)

    2.3 Matnni abstraktsiya qilish
    Machine Translated by Google


    hech qanday oldindan ma'lumotsiz. Masalan, elektron pochta spamida
    odatda raqamlar formatida kiritish; chiqish qatlamida “javob beradigan birliklar mavjud
    5
    keyingi so'zni qayta ishlaganda oldingi so'zlarni eslab qoling. Bunga erishish uchun bizda bor
    tizimlar misollarni ko'rib chiqish orqali vazifalarni o'rganadi va odatda
    tarmoq modeli. U uchta qatlamni o'z ichiga oladi: kirish qatlami qabul qiluvchi birliklarni o'z ichiga oladi
    sun'iy neyron tarmoqlari o'zining tegishli to'plamini rivojlantiradi
    "spam" yoki "spam emas". Ushbu ma'lumotlar to'plamini qayta ishlash orqali
    kirish qatlami va chiqish qatlami va uning vazifasi kirishlarni chiqadigan qatlamga aylantirishdir
    har qanday vazifani qanday o'rganganligi haqida ma'lumot kiritish"; yashirin qatlam orasidagi birliklarni o'z ichiga oladi
    detektor, ma'lumotlar to'plamidagi har bir elektron pochta qo'lda shunday etiketlanadi
    spamdir.
    2.3.1 Sun'iy neyron tarmog'i
    An'anaviy neyron tarmoqlari qurishda oldingi ishlarni eslamaydi
    elektron pochta o'rtasidagi xususiyatlar va yangi elektron pochta xabari
    2.3.2 RNN va LSTM
    foydalanishi mumkin
    (Schalkoff, 1997).
    odatda bir qator qatlamlarda joylashgan. 1-rasm neyronning eng keng tarqalgan arxitekturasidir
    biologik neyron tarmoqlardan ilhomlangan tizimlar. Bunday
    kirish hujjatlaridagi so'zlarning ketma-ketligi muhim ahamiyatga ega. Bunday holda, biz modelni xohlaymiz
    berilgan misollardan vazifani tushunish. Biroq, matnni umumlashtirish kabi vazifalar uchun,
    Ko'proq kengaytirish uchun sun'iy neyron tarmoqlari birliklar deb ataladigan sun'iy neyronlardan iborat
    Sun'iy neyron tarmoqlari hisoblash
    Machine Translated by Google


    o'ralganga o'xshaydi. Uchun
    an'anaviy RNN ko'pincha yod olmaydi
    ma'lumotlar.
    olish uchun yuzlab yoki minglab operatsiyalar
    oldingi vaqt tamg'asi. Biroq, amalda,
    Takroriy neyron tarmoq (RNN)
    har bir vaqt tamg'asidan keyin (agar kiritilgan bo'lsa
    Uzoq muddat. An'anaviy RNNdan farqli o'laroq, har bir LSTM hujayra ichida bir nechta oddiy mavjud
    chiqish birliklari qiymatini ifodalaydi
    masofa
    ortib borishi bilan ma'lumotlar samarali bo'ladi
    rasmdagi belgilar, “ht”
    har bir vaqt tamg'asi uchun birliklar va A neyron tarmog'ining bir qismini bildiradi. 2-rasmda ko'rsatilgan
    takroriy neyron tarmoqlardan foydalanish, chunki ular qayerda halqalari bo'lgan tarmoqlardir
    ulangan
    Yaxshiyamki, Uzoq qisqa muddatli xotira (LSTM) tarmoqlari ma'lumotlarni uzatishi mumkin
    satrlar ro'yxati, har bir vaqt tamg'asi bir so'zni qayta ishlash bo'lishi mumkin), "x" kirishni anglatadi
    the
    6
    orasida
    murakkab hisob-kitoblarsiz ma'lumotlarni uzatish imkonini beruvchi chiziqli operatsiyalar. Sifatida
    neyron tarmog'ining bir bo'lagida sodir bo'ladi. Shunday qilib, ma'lumotlar undan olinadi
    2-rasmda qanday qilib a
    chiziqli bo'lmagan, uni orqaga qaytarish qiyin
    ma `lumot. Har bir faollashtirish funktsiyasidan boshlab
    ma'lumotlar modelda saqlanib qolishi mumkin (Kristofer, 2015).
    oldingi vaqt tamg'asidan olingan natija hisoblashning bir qismi uchun keyingi bosqichga o'tkaziladi
    Machine Translated by Google


    ochiladigan uchta eshik orqali ma'lumot va
    Qanday ma'lumotlar bo'lishi kerakligini hal qilish uchun
    chiqish nima bo'lishi kerakligini hal qiladi. 6-rasmda chiqish qatlamida hujayra holati ko'rsatilgan
    Oxirgi eshik "chiqish eshigi qatlami",
    o'qish, yozish va o'chirishga ruxsat bering
    o'tish.
    ni oladi “unutish darvozasi qatlami” deb ataladi
    4-rasmda ko'rsatilganidek, birinchi eshik
    Bundan tashqari, oldingi chiqish birliklari qiymatini oladi
    yangilangan, LSTM "kirish darvozasi qatlamini" o'z ichiga oladi.
    yaqin.
    joriy kirish xt va raqamni chiqaradi
    3-rasmda ko'rsatilgandek, hozirgacha barcha ma'lumotlarni o'z ichiga olgan oldingi hujayra holati muammosiz ketadi
    ma'lumotlar yangilanishi kerak. Keyin,
    7
    oldingi chiqish birliklari qiymati ht-1 va the
    qaysi hujayralar ichida ekanligini ko'rsatadigan raqam
    ht-1 va joriy kirish xt va chiqishlari a
    ma'lumotlarni uzatish. 0 hech qanday ma'lumot o'tishiga yo'l qo'ymaslikni anglatadi, 1 esa barcha ma'lumotlarga ruxsat berishni anglatadi
    Ichkarida har bir LTSM xujayrasi qanday ma'lumotlarni saqlash va qachon saqlash haqida qaror qabul qiladi
    davlat Ct.
    oldingi hujayra holati Ct-1 yangisiga yangilanadi
    nisbatini ko'rsatish uchun 0 va 1 oralig'ida
    LSTM xujayrasi orqali ba'zi chiziqli operatsiyalarni bajarish orqali.
    Machine Translated by Google


    tarmoq ko'plab LSTM hujayralaridan iborat va barchasi
    Chen, Korrado va Din, 2013). Oddiy misol, so'zlarni vektorlarga ifodalagandan so'ng,
    8
    ma'lumotnomalar xulosalari. Qayta chaqirish bir-biriga o'xshash so'zlar sonini bo'lish yo'li bilan hisoblanadi
    so'zlar o'rtasida aloqa o'rnatadi va ular o'rtasida hisob-kitoblarga imkon beradi (Mikolov, Sutskeve,
    uchta eshik qatlami. Keng LSTM neyroni
    tarmoq qancha hujayradan iborat bo'lishidan qat'i nazar.
    muhim ma'lumotlar oxirigacha saqlanadi, yo'q
    "malika". So'zni joylashtirishdan foydalanishning afzalligi shundaki, u so'zning ko'proq ma'nosini qamrab oladi va
    "qirol - erkaklar + ayollar" funktsiyasi so'zning vektor ko'rinishini ideal tarzda beradi
    ma'lumotlar barcha hujayralar orqali uzatiladi
    So'zni joylashtirish - bu xususiyatlar to'plami
    tanh funksiyasidan o'tadi, keyin esa sigmasimonning og'irlikdagi chiqishi bilan ko'paytiriladi
    ROUGE qisqartmasi Gisting Evaluation uchun Recall-Oriented Understudy degan ma'noni anglatadi. Bu to'plam

    Download 2,7 Mb.
    1   2   3   4   5   6   7   8   9   ...   26




    Download 2,7 Mb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar

    Download 2,7 Mb.
    Pdf ko'rish