O’zbekiston respublikasi raqamli texnologiyalari vazirligi




Download 272.38 Kb.
Sana23.02.2024
Hajmi272.38 Kb.
#161035
Bog'liq
rmustaqilish
Курсосвой проект титул, 1, iq spets uz

O’ZBEKISTON RESPUBLIKASI RAQAMLI
TEXNOLOGIYALARI VAZIRLIGI
MUHAMMAD AL-XORAZMIY NOMIDAGI TOSHKENT
AXBOROT TEXNOLOGIYALARI UNIVERSITETI

Sun’iy intelekt kafedrasi


Yo’nalishga kirish fani bo’yicha

MUSTAQIL ISH

Mavzu: Decision Trees va Random Forests algoritmlarini tahlil qilish

Bajardi: Murodullayeva ruxshona


Tekshirdi: Azimova Umida
DECISION TREES VA RANDOM FORESTS ALGORITMLARINI TAHLIL QILISH
Decision Trees va Random Forests, iki populyar ma'lumotlar tahlil algoritmi bo'lib, ma'lumotlarni tahlil qilish va taxlilash uchun foydalaniladi.
Decision Trees (qaror daraxtlari), ma'lumotlar tahlilini o'rganish va taxlilashda ishlatiluvchi qulay va tushunarli algoritm bo'lib, ma'lumotlar to'plamini qismlarga bo'lib tashlash orqali qaror qabul qilishga yordam beradi. Har bir qisim (bo'lim) biror xususiyatni (sifatni) o'rganishga yordam beradi. Daraxtning boshida asosiy qo'naqorlik (root) bo'lib, qo'naqorlikning har bir farzandida bir xususiyat (sifat) bo'lishi mumkin. Daraxtning har bir qo'naqorligi biror qaror niyatiga (decision node) yoki qanchalik qisqa bo'lishiga (leaf node) olib boradi. Qaror niyatilari, qo'naqorlikning har bir farzandiga taalluqli xususiyatlarni taqsimlash orqali aniqlanadi. Shuningdek, qismlar taxlil qilinadi va har qisimda bo'lgan obyektlar uchun qarorlar qabul qilinadi.
Random Forests (tasodifiy urug') esa ko'p qaror daraxtlarini (decision trees) birlashtiruvchi birlashgan algoritm bo'lib, bu yerda har bir daraxt (tree) o'ziga xos ma'lumotlar to'plamini (bootstrap sample) qabul qiladi. Random Forests ma'lumotlarni bo'sh larcha tasodifiy tasodifiylik bilan bo'lgan qismlarga bo'lib tashlaydi va har bir daraxtning o'ziga xos qarorlar niyatlarini (decision node) aniqlash uchun foydalanadi. Natijada, har bir daraxtning o'ziga xos qarorlar niyatlarining ovozi (vote) olinadi va eng ko'p ovoz olingan qaror asosiy qaror sifatida tanlanadi. Bu usul statistik tahminlash usulidir va katta ma'lumotlarni tahlil qilishda va taxlilashda yaxshi natijalar beradi.

Keyin, Decision Trees va Random Forests algoritmlari haqida muhim nuqtalarni ta'riflashimiz mumkin:

  1. Decision Trees tez o'rganiladi va tushunarli. U ma'lumotlarni qismlarga bo'lib tashlash orqali taxlil qilishga yordam beradi. Qarorlar niyatlarini o'rganish oson bo'lgani uchun u shu sababli ma'lumot tahlilida keng qo'llaniladi.

  2. Random Forests esa ko'p qaror daraxtlarini birlashtiradi. U har bir daraxtda tasodifiy tasodifiylik va o'ziga xos ma'lumotlar to'plami (bootstrap sample) qabul qiladi. Bunday birlashtirilgan daraxtlar statistik tahminlash uchun yaxshi natijalarni beradi va ma'lumotlar tahlilida iste'mol qilishda sezilarli samaradorlik ko'rsatadi.

  3. Decision Trees'ning kamchiligi shunda, u o'tgan ma'lumotlarni yodda tutingan holda yaxshi ishlaydi, shuning uchun yangi ma'lumotlarni taxlil qilishda kam samaradorligi bo'lishi mumkin. Random Forests esa ma'lumotlarni o'zaro birlashtiradi va bu yordamida o'tgan ma'lumotlarga nisbatan kengroq samaradorlik ko'rsatadiva yangi ma'lumotlarni taxlil qilishda yaxshi natijalar beradi.

  4. Random Forests algoritmi overfitting (o'tkazib yig'ilish) muammolarini kamaytiradi. Overfitting, modelning o'ziga xosliklarni o'rganish uchun ma'lumotlarga juda katta e'tibor berib, umuman o'ziga xos bo'lmagan ma'lumotlarni ham yodda tutingan holda taxlil qilishi natijasida yuzaga keladi. Random Forests esa tasodifiy tasodifiylik va birlashtirilgan daraxtlar tashkil etish orqali overfitting muammolariga qarshi kuchli bo'ladi.

  5. Random Forests, ma'lumotlar tahlilida va taxlilashda turli xil xususiyatlar (sifatlar) bilan foydalanish imkonini beradi. U har bir daraxtning o'ziga xos qismlashni amalga oshiradi va xususiyatlarni tasodifiy tanlash orqali qarorlar niyatlarini aniqlashni o'rganadi. Bu, ma'lumotlar qatori (feature set) muhim bo'lgan holatlarda foydali bo'ladi.

Barcha qismlar bilan, Decision Trees va Random Forests algoritmlari ma'lumotlar tahlil qilish va taxlilashda ishlatiladigan samarador usullar bo'lib, ma'lumotlardan tashkil topgan qarorlar niyatlarini (decision rules) o'rnatishda yordam beradi. Qo'llanish tartibi va natijalar, ma'lumotlar to'plami va vazifelar turlariga qarab o'zgarib turishi mumkin.


Download 272.38 Kb.




Download 272.38 Kb.

Bosh sahifa
Aloqalar

    Bosh sahifa



O’zbekiston respublikasi raqamli texnologiyalari vazirligi

Download 272.38 Kb.