• 4.2.1 Algoritmlar
  • Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar




    Download 2,7 Mb.
    Pdf ko'rish
    bet13/26
    Sana20.12.2023
    Hajmi2,7 Mb.
    #125027
    1   ...   9   10   11   12   13   14   15   16   ...   26
    Bog'liq
    juniper-final (2)

    4.2 Ekstraktiv xulosa
    Juniper Network ma'lumotlar bazasi (KB) uchun eng yaxshi yondashuv. Matnni chiqarish
    Xulosa hosil qilish uchun birgalikda.
    uning ma'lumotlar to'plamiga nisbatan. Har bir jumla har bir so'zning ballari yig'indisini hisoblash orqali baholandi
    21
    mavhum xulosa. Ikki yondashuvni sinab ko'rganimizdan so'ng, biz tanlaymiz
    jumlalarni ahamiyatiga ko'ra. Ushbu ro'yxatning eng yaxshi uchta jumlalari birlashtirildi
    barcha natijalar.
    komponentlar - ishlatiladigan ikkita algoritm, ikkita nazorat usuli va taqqoslash uchun ishlatiladigan ko'rsatkichlar
    va qirralari ikkita tugun jumlalari orasidagi o'xshashlik balli edi. O'xshashlik balli edi
    algoritmlar va boshqaruv elementlari Pythonda amalga oshirildi. Kod uchta muhim narsani o'z ichiga oladi
    Textrank har bir jumla tugunni tashkil etadigan grafik yaratish orqali amalga oshirildi,
    Matnni chiqarish uchun algoritmlar ishlatilgan: Textrank (Mihalcea, Rada va Paul Tarau,
    shakllantirildi, Google-ning PageRank algoritmi grafikda bajarildi, keyin esa eng yuqori jumlalar
    4.2.1 Algoritmlar
    Google Word2Vec ommaviy modeli yordamida hisoblangan. Model vektor tasvirini taqdim etadi
    ular orasidagi kosinus o'xshashligini hisoblash uchun ishlatilishi mumkin bo'lgan har bir so'zning. Bir marta grafik
    Yangiliklar ma'lumotlar to'plami, Stack ma'lumotlar to'plami va KB ma'lumotlar to'plami. Har bir algoritm ro'yxatini yaratadi
    Scikit Learnning TF-IDF moduli har bir so'zning TF-IDF ballini hisoblash uchun ishlatilgan.
    birinchi navbatda ekstraktiv yondashuvni sinab ko'rish va qazib olishdan olingan natijani kirish sifatida ishlatish edi
    2004) va TF-IDF (Ramos va Xuan, 2003). Ushbu ikkita algoritm uchta ma'lumotlar to'plamida ishga tushirildi -
    Biz matnni umumlashtirishni ekstraktiv xulosani o'rganishdan boshladik. Maqsad
    chiqishdan yig'ildi.
    Machine Translated by Google


    ishlatilgan. Nazorat tajribasi odatda natijalarni sinab ko'rishga yordam beradigan sodda protseduradir
    ROGUE-1 ball va BLEU ball yordamida baholanadi. Yaratilgan har biri uchun ball
    bu gaplarni kirish sifatida qabul qilishi va xulosa sifatida xulosa chiqarishi mumkin.
    22
    Ikki algoritm, ikkita nazorat eksperimenti samaradorligini tekshirish imkoniyatiga ega bo'lish
    Nazorat tajribalari natijalarini o'z ichiga olgan barcha olingan natijalar
    maqola. Ushbu nazorat tajribalarida bir xil ko'rsatkichlarni ishlatish orqali
    dastlabki uchta satrni birlashtirib, uchta tasodifiy qatorni birlashtirib, xulosa hosil qilish
    ma'lumotlar to'plamidagi ballar. Keyin bu ballar taqqoslandi va har bir ma'lumot to'plami uchun eng yaxshi algoritm
    tajriba. Matnni chiqarishda qo'llanilgan ikkita nazorat eksperimenti - xulosani shakllantirish
    xulosa hisoblab chiqildi. Keyin har bir ma'lumotlar to'plami xulosaning o'rtacha qiymatini hisoblash orqali baholandi
    gaplarda. Buning ortidagi g'oya hujjatdagi eng muhim jumla edi
    algoritmlarning ishlashi har doim boshqaruvning ishlashidan yaxshiroq bo'lishi kerak
    Loyihamizdagi keyingi qadam mavhum xulosa bilan ishlash edi. Bu biri
    algoritm sinovdan o'tkazilsa, algoritmlar uchun asosiy chiziq yaratilishi mumkin. Ideal holatda,
    tanlangan edi.

    Download 2,7 Mb.
    1   ...   9   10   11   12   13   14   15   16   ...   26




    Download 2,7 Mb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Tabiiy tilni qayta ishlash yordamida matnni umumlashtirish Ankit Kumar Homiylar

    Download 2,7 Mb.
    Pdf ko'rish