3-jadval. Berilgan matnlarga mos raqamli vektorlar (+lemmatizatsiya)
Demak, korpusidagi matnlarga mos TF-IDF qiymatlarni hisoblashda
lemmatizatsiya jarayonini amalga oshirish orqali tahlil samaradorligini oshishini
qayt etish mumkin.
Mashinali o‘rganishda TF-IDFdan foydalanish
TF-IDF usulidan ko‘p hollarda berilgan matnni
raqamli vektoriga
aylantirish
jarayonida foydalaniladi. TF-IDF usuli hujjatdagi har bir so‘zni ushbu
hujjat uchun qanchalik dolzarbligini ko‘rsatadigan
qiymat
bilan bog‘lash
imkoniyatini taqdim etadi. Bunday qiymatlardan keyinchalik mashinali o‘rganish
modellarining xususiyatlari sifatida foydalanish mumkin.
Tabiiy til masalalari bilan ishlashda mashinali o‘rganish bitta asosiy to‘siqqa
duch keladi - uning algoritmlari odatda raqamlar ustida amallarni bajaradi. Tabiiy
tilda esa matnlar qayta ishlanadi. Shunday qilib, tabiiy tildagi matnni raqamlarga
aylantirishga to‘g‘ri keladi. Ushbu jarayon NLPda