|
Kompyuter injiniringi ” fakultеti
|
bet | 1/2 | Sana | 31.05.2024 | Hajmi | 85,85 Kb. | | #258172 |
MUHAMMAD AL-XORAZMIY NOMIDAGI TOSHKЕNT AXBOROT TЕXNOLOGIYALARI UNIVЕRSITЕTI QARSHI FILIALI
“ KOMPYUTER INJINIRINGI ” FAKULTЕTI
MUHAMMAD AL-XORAZMIY NOMIDAGI
TOSHKЕNT AXBOROT TЕXNOLOGIYALARI UNIVЕRSITЕTI QARSHI
FILIALI
“ KOMPYUTER INJINIRINGI ” FAKULTЕTI
1 - BOSQICH MKI-11-23 GURUH MAGISTRANTI
G’aniyeva Shaxnoza Rauf qizining
“Algoritmlarni loyihalashtirish va tahlil qilish”
fanidan
4-Mustaqil ishi
Sinflashtirish masalasida hal qiluvchi qoidani qurish algoritmlari
Sinflashtirish - bu mashina o'rganish algoritmlariga bog'liq bo'lgan tabiiy tilni qayta ishlash vazifasi .
Siz bajarishingiz mumkin bo'lgan juda ko'p turli xil Sinflashtirish vazifalari mavjud, ularning eng mashhuri hissiyotlarni tahlil qilishdir . Har bir vazifa ko'pincha boshqa algoritmni talab qiladi, chunki ularning har biri ma'lum bir muammoni hal qilish uchun ishlatiladi.
Kompyuter olimi Devid Volpert o'zining "O'rganish algoritmlari o'rtasida apriori farqlarning yo'qligi" nomli maqolasida tushuntiradi. Neyron hisoblash, bu:
"Har bir muammo uchun siz to'g'ri algoritmni tanlashingiz kerak. Sizning savolingiz buni qanday qilishdir. Agar sizda juda ko'p hisoblash resurslari bo'lsa, siz bir nechta algoritm va parametr sozlamalarini sinab ko'rishingiz mumkin. Bu yondashuvda asosiy savol qanday baholash va solishtirishdir. algoritmlarning ishonchli tarzda ishlashi."
Sizni tanlash uchun turli xil Sinflashtirish algoritmlari bilan tanishtirishdan oldin, keling, tasnif nima ekanligini tezda ko'rib chiqaylik.
Sinflashtirish nima?
Sinflashtirish - bu g'oyalar va ob'ektlarni oldindan belgilangan toifalarga yoki "pastki populyatsiyalar" ga tanib olish, tushunish va guruhlash jarayoni. Oldindan toifalangan o'quv ma'lumotlar to'plamidan foydalangan holda, mashinani o'rganish dasturlari kelajakdagi ma'lumotlar to'plamlarini toifalarga ajratish uchun turli xil algoritmlardan foydalanadi.
Mashinani o'rganishda Sinflashtirish algoritmlari keyingi ma'lumotlarning oldindan belgilangan toifalardan biriga tushish ehtimolini bashorat qilish uchun kirish o'rgatish ma'lumotlaridan foydalanadi. Sinflashtirishning eng keng tarqalgan usullaridan biri elektron pochta xabarlarini "spam" yoki "spam bo'lmagan" ga filtrlashdir.
Xulosa qilib aytganda, Sinflashtirish "naqshlarni tanib olish" shakli bo'lib, kelajakdagi ma'lumotlar to'plamlarida bir xil naqshni (o'xshash so'zlar yoki his-tuyg'ular, raqamlar ketma-ketligi va boshqalar) topish uchun o'quv ma'lumotlariga Sinflashtirish algoritmlari qo'llaniladi.
Biz quyida batafsilroq toʻxtalib oʻtadigan Sinflashtirish algoritmlaridan foydalanib, matnni tahlil qilish dasturi tuzilmagan matnni mavzu va fikr qutbligi (ijobiy, salbiy, neytral va undan tashqari) boʻyicha toifalarga ajratish uchun aspektlarga asoslangan hissiyot tahlili kabi vazifalarni bajarishi mumkin .
Sinflashtirish algoritmlari amalda qanday ishlashini tushunish uchun ushbu oldindan oʻrgatilgan hissiyotlar tasniflagichini sinab koʻring, soʻngra Sinflashtirish algoritmlarining har xil turlari haqida koʻproq maʼlumot olish uchun oʻqing.
Mashina o'rganishda eng yaxshi 5 ta Sinflashtirish algoritmlari
Statistikada tasnifni o'rganish juda keng va siz ishlayotgan ma'lumotlar to'plamiga qarab foydalanishingiz mumkin bo'lgan Sinflashtirish algoritmlarining bir nechta turlari mavjud. Quyida mashinani o'rganishda eng keng tarqalgan beshta algoritm mavjud.
Ommabop tasnif algoritmlari:
Logistik regressiya
Naive Bayes
K-Eng yaqin qo'shnilar
Qaror daraxti
Vektorli mashinalarni qo'llab-quvvatlash
Logistik regressiya
Logistik regressiya - bu ikkilik natijani bashorat qilish uchun ishlatiladigan hisob: yoki biror narsa sodir bo'ladi yoki sodir bo'lmaydi. Buni Ha/Yo'q, O'tish/O'tmay, Tirik/O'lik va boshqalar sifatida ko'rsatish mumkin.
Mustaqil o'zgaruvchilar ikki toifadan biriga kiradigan natijalar bilan ikkilik natijani aniqlash uchun tahlil qilinadi. Mustaqil o'zgaruvchilar toifali yoki sonli bo'lishi mumkin, ammo qaram o'zgaruvchi har doim kategorik bo'ladi. Bu shunday yozilgan:
|
| |