• AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
  • AXBOR OT L ARN I IZLASH VA AJRATIB OLISH




    Download 2.14 Mb.
    Pdf ko'rish
    bet4/11
    Sana01.10.2023
    Hajmi2.14 Mb.
    #85944
    1   2   3   4   5   6   7   8   9   10   11
    Bog'liq
    2- мавзу (АИА)
    1671528481 (1), 662f8c2918184a6f79d567bc, 662b91d7a40fb76941780404, 662b8f946a5e24f2e9fe9977, Ҳисоб-фактура актсиз 44 29.04.2024 дан
    AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
    16
    Aytaylik, bizning to’plamimiz ikkita hujjatdan iborat:
    Doc 1. I did enact Julius Caesar. I was killed i
    ’ the Capitol;
    Brutus killed me.
    Doc 2. So let it be with Caesar. The noble Brutus
    hath told you Caesar was ambitious:
    Birinchi ustunga barcha terminlarni yozadigan jadval tuzamiz.
    Biz dastlabki uch bosqichni
    ko‘rib chiqmaganimiz uchun matndagi
    barcha
    so‘zlarni normalashgan leksemalarni hisobga olgan holda
    yozamiz.


    Mantiqiy (Boolev) qidiruv
    AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
    17
    So’ngra, birinchi leksemani olib, to‘plamdagi barcha matnlarni
    ko‘rib chiqamiz. Keyingi ustunda ushbu token topilgan hujjatning
    identifikatorini yozamiz. Shunday qilib, barcha leksemalar uchun
    "token - hujjat identifikatori"
    juftlarini aniqlaymiz.
    Biz bir xil leksema juftlarini birlashtiramiz, mos ravishda ikkinchi
    ustunga mos keladigan aniqlovchilarni keltiramiz. Ikkinchi ustunda
    olingan hujjat identifikatorlari ro‘yxati so‘z pozitsiyalari ro‘yxati deb ataladi.


    Mantiqiy (Boolev) qidiruv
    AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
    18
    Olingan jadvalni alfavit tartibida tokenlar bo‘yicha tartiblaymiz.
    Natijada barcha tokenlar uchun tartiblangan juftliklar to'plamning
    teskari indeksi
    hosil bo’ladi.
    Hujjatdagi leksemalar to'plami va mos keladigan chastota qiymatlari
    lug'at yoki leksika deb ataladi. Jismoniy jihatdan, lug'atlar RAMda
    saqlanadi va so'z pozitsiyalari ro'yxati qattiq diskda saqlanadi.


    Mantiqiy (Boolev) qidiruv
    AXBOR OT L ARN I IZLASH VA AJRATIB OLISH
    19
    Teskari indeks va asosiy Boolean qidiruv modeli yordamida
    so'rovlarni qayta ishlash qanday ishlaydi? Aytaylik, bizda Shekspir
    peysalari to‘plamining teskari ko‘rsatkichi bor.
    Brutus

    1
    → 2 → 4 → 11 → 31 → 45 → 173 → 174
    Calpurnia
    − 2 → 31 → 54 → 101
    Keling, oddiy kon'yunktiv so'rovni qayta ishlashni ko'rib chiqaylik:
    Brutus and Calpurnia


    Mantiqiy (Boolev) qidiruv

    Download 2.14 Mb.
    1   2   3   4   5   6   7   8   9   10   11




    Download 2.14 Mb.
    Pdf ko'rish

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    AXBOR OT L ARN I IZLASH VA AJRATIB OLISH

    Download 2.14 Mb.
    Pdf ko'rish