• Kontent (tarkib)ga asoslangan filtrlash
  • Tavsiya tizimlarining turlari




    Download 4,42 Mb.
    bet4/6
    Sana08.02.2024
    Hajmi4,42 Mb.
    #153176
    1   2   3   4   5   6
    Bog'liq
    2-topshiriq AIAO Samandarov
    Tavsiya tizimlarining turlari
    Tavsiyalar berish tizimlari orasida algoritmlar to'plamida farq qiladigan va qaror qabul qilishning o'ziga xos xususiyatlariga ega bo'lgan to'rtta asosiy turni ajratish mumkin.
    1. Kontent (tarkib)ga asoslangan filtrlash
    2. Hamkorlikdagi filtrlash
    3. Bilimlarga asoslangan filtrlash
    4. Gibrid tavsiya tizimlari


    Kontent (tarkib)ga asoslangan filtrlash
    Tarkibga asoslangan model foydalanuvchining hohish-istaklari va qiziqishlarini aniqlashning eng oson va eng aniq usuli hisoblanadi. Kontentga yo'naltirilgan yondashuvning mohiyati foydalanuvchilarni o'zlari yoqtirgan yoki ilgari sotib olgan tovarlar, xizmatlar yoki kontentga moslashtirishdir. Bunday tizimlar, masalan, film tavsiyalari uchun yaxshi ishlaydi. Agar biror kishi jangovar filmni ko'rgan bo'lsa, xizmat unga shunga o'xshash janrdagi yana bir nechta filmlarni taklif qiladi.
    Tarixiy jihatdan Kontentga asoslangan tavsiyalar mavzusi ko'pincha tuzilmagan tavsiflarga ega mahsulotlar bo'lgan: filmlar, kitoblar, maqolalar. Bunday belgilar, masalan, matn tavsiflari, sharhlar, aktyorlar va boshqalar bo'lishi mumkin. Biroq, oddiy raqamli yoki kategorik xususiyatlardan foydalanishga hech narsa to'sqinlik qilmaydi.
    Strukturaviy bo'lmagan xususiyatlar matn uchun odatiy tarzda tasvirlangan - so'z maydonidagi vektorlar (Vektor-Fazo modeli). Bunday vektorning har bir elementi foydalanuvchining qiziqishini potentsial tavsiflovchi belgidir. Xuddi shunday, mahsulot bir xil fazodagi vektordir.
    Foydalanuvchi tizim bilan o'zaro aloqada bo'lganda (aytaylik, u kino sotib oladi), u sotib olgan tovarlarning vektor tavsiflari bitta vektorga birlashtiriladi (jamlanadi va normallashtiriladi) va shu bilan uning qiziqishlari vektori shakllanadi. Keyinchalik, tavsifi qiziqishlar vektoriga eng yaqin bo'lgan mahsulotni topish kifoya, ya'ni. eng yaqin qo'shnini topish muammosini hal qilish.
    Hamma elementlar bir xil ahamiyatga ega emas: masalan, ittifoqdosh so'zlar, shubhasiz, foydali yukni ko'tarmaydi. Shuning uchun, ikkita vektorda mos keladigan elementlarning sonini aniqlashda, birinchi navbatda, barcha o'lchovlar ularning ahamiyati bo'yicha tortilishi kerak. Bu muammo Text Mining-da taniqli TF-IDF transformatsiyasi orqali hal qilinadi, u kamdan-kam manfaatlarga ko'proq ahamiyat beradi. Bunday manfaatlarning mos kelishi ikki vektorning yaqinligini aniqlashda mashhur bo'lganlarning mos kelishidan ko'ra muhimroqdir.

    Wx,y=tfx,y*log(N/dfx)


    TF-IDF – x so’zining y tovarni ta’riflashdagi og’irligi


    tfx,y = y tovarni ta’riflashda ishlatilgan x so’zining chastotatasi
    dfx = tarkibida x so’zi bo’lgan tovarlar soni
    N = tovarlarning umumiy soni

    Bu erda TF-IDF printsipi oddiy nominal atributlarga, masalan, janr, rejissyor, til kabi bir xil darajada qo'llaniladi. TF – atributning foydalanuvchi uchun ahamiyati, IDF – atributning “noyobligi” o‘lchovidir.


    Shunga o'xshash o'zgarishlarning butun oilasi mavjud (masalan, BM25 va shunga o'xshash), ammo ularning barchasi TF-IDF bilan bir xil mantiqni takrorlaydi: mahsulotlarni taqqoslashda noyob atributlar ko'proq vaznga ega bo'lishi kerak. Quyidagi rasmda TF-IDF ning og'irligi TF va IDF ko'rsatkichlariga qanday bog'liqligi aniq ko'rsatilgan. Yaqin gorizontal o'q DF: atributning barcha mahsulotlar orasidagi chastotasi, uzoq gorizontal o'q TF: foydalanuvchi o'rtasidagi atribut chastotasining logarifmi.



    Biroq, bu usul maishiy texnika, mebel, avtomobil va boshqalarni sotib olishda mos emas. Agar xaridor mashina sotib olgan bo'lsa, unga yana o'nlab mashinalarni taklif qilishning ma'nosi yo'q.

    Download 4,42 Mb.
    1   2   3   4   5   6




    Download 4,42 Mb.