• 2.4 ROUGE-N va BLEU korsatkichlari
  • 2.5.2 NLTK 5/5 boladi. Buning sababi shundaki, bir-biriga oxshash sozlar soni 5 va sozlar soni 2.5.1
  • Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar




    Download 2,7 Mb.
    Pdf ko'rish
    bet7/26
    Sana20.12.2023
    Hajmi2,7 Mb.
    #125027
    1   2   3   4   5   6   7   8   9   10   ...   26
    Bog'liq
    juniper-final (2)

    2.3.3 So'zlarni joylashtirish
    ko'pincha, birinchi navbatda, tabiiy tilni qayta ishlash bilan ishlashda vazifani bajarishni yaxshilaydi.
    haqiqiy sonlar vektorlari bilan taqqoslangan. Bu o'xshash so'zlarning o'xshash vakillikka ega bo'lishiga imkon beradi, shuning uchun u
    Oddiy chiziqli operatorlar ni birlashtiradi
    inson tomonidan yaratilgan xulosalar. ROUGE-N - bu barcha N-grammlarni eslab qolishni baholash
    bir yoki bir nechta havolalar yordamida mashina tomonidan yaratilgan xulosani baholash uchun foydalaniladigan ko'rsatkichlar
    funktsiyasi. Shunday qilib, chiqish birliklarining qiymati ht keyingi LSTM yacheykaga o'tkaziladi (Christopher, 2015).
    so'zlar bo'lgan NLP-da o'rganish texnikasi
    2.4 ROUGE-N va BLEU ko'rsatkichlari
    Machine Translated by Google


    yaratilgan xulosa “Unda baland boÿyli it bor”, ROUGE-1 balli 5/8 va BLEU balli boÿladi.
    Fransua Chollet va u Python 2.7-3.6 (Keras.io, nd) bilan mos keladi.
    9
    neyron tarmoqlarni qulay va tez qurish imkonini beradi. Keras tomonidan ishlab chiqilgan va qo'llab-quvvatlangan
    va boshq., 2002). Misol uchun, agar ma'lumotnoma xulosasi "Mushuk va baland it bor" bo'lsa va
    matnni umumlashtirish bilan ishlashda eng ko'p ishlatiladigan ko'rsatkichlar.
    tizim xulosasi va ma'lumotnoma xulosasi mos ravishda 5 va 8. Bu ikki ko'rsatkich
    Natural Language Toolkit (NLTK) - bu matnni qayta ishlash kutubxonasi bo'lib, u keng qo'llaniladi
    2.5.2 NLTK
    5/5 bo'ladi. Buning sababi shundaki, bir-biriga o'xshash so'zlar soni 5 va so'zlar soni
    2.5.1
    ma'lumotnoma xulosasidagi so'zlarning umumiy soni (Lin, Chin-Yew, 2004). BLEU ko'rsatkichi,
    2.5.3 Scikit-o'rganish
    tahlil qilish, tasniflash va boshqalar. NLTK jamoasi dastlab uni 2001 yilda chiqargan (Nltk.org, 2018).
    Tabiiy tilni qayta ishlash (NLP). Tokenizatsiyaning yuqori samarali funktsiyalarini qo'llab-quvvatlaydi,
    o'rganish. Keras ko'plab amalga oshirilgan faollashtirish funktsiyalarini, optimallashtiruvchilarni, qatlamlarni va boshqalarni o'z ichiga oladi. Shunday qilib, u
    Mashina ishlab chiqarilgan xulosa ma'lumotnomalar bilan bir-biriga mos keladi (Papineni, Kishore,
    Asosiy komponentlar tahlili (PCA) kabi kamaytirish usullari, k- kabi klasterlash usullari
    Scikit-learn - bu Python tilidagi mashinani o'rganish kutubxonasi. Foydalanish uchun qulay o'lchovni amalga oshiradi
    ROUGE dan farqli o'laroq, N-gramm aniqligiga asoslangan. Bu so'zlarning foizini bildiradi
    Keras Python kutubxonasi boÿlib, dastlab 2015 yilda chiqarilgan boÿlib, u odatda mashina uchun ishlatiladi

    Download 2,7 Mb.
    1   2   3   4   5   6   7   8   9   10   ...   26




    Download 2,7 Mb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar

    Download 2,7 Mb.
    Pdf ko'rish