Parametrik logistik regressiya va parametrik bo'lmagan k-yaqin qo'shni




Download 326.36 Kb.
bet2/2
Sana13.05.2023
Hajmi326.36 Kb.
#59216
1   2
Bog'liq
MASHINALI O\'QITISH (3)
xudo xoxlasa tushadi99%, 3-labarotoriya ishi Saralash usul va algoritmlarini tadqiq qilis, cmd buyruqlari, Incremental model nima, 1matematik, word sAM 1 savol, Документ Microsoft Word (4), Ma\'ruzalar (2), ЛАБОРАТОРНАЯ РАБОТА N1, Dasturlash 2, Ariza, Qalandarova Gulshoda, 1648631455, 1650692784, 1651669892 (2)
Parametrik logistik regressiya va parametrik bo'lmagan k-yaqin qo'shni (KNN) usullari tasniflash vazifalari uchun mashinali o'qitishda keng qo'llaniladigan ikkita usulni diabet ma'lumotlar bazasidan foydalangan holda diabetning boshlanishini bashorat qilish kontekstida ushbu ikki usulni taqqoslaymiz.


    1. – jadval. Qandli diabet ma'lumotlar to'plami turli klinik o'lchovlari.

Diabet ma’lumotlar to‘plamini 1.1 – jadvalda ko‘rishimiz mumkin. Qandli diabet ma'lumotlar to'plamini bashorat qilish uchun mashinali o'qitishda keng qo'llaniladigan ma'lumotlar to'plamidir. Unda glyukoza darajasi, qon bosimi va tana massasi indeksi (BMI) kabi bemorlarning turli klinik o'lchovlari mavjud. Ma'lumotlar to'plamidagi maqsadli o'zgaruvchi bemorda diabet bor yoki yo'qligini ko'rsatadigan ikkilik ko'rsatkichidir.
Qandli diabetni bashorat qilish uchun parametrik logistik regressiya parametrik bo'lmagan k-eng yaqin qo'shni usullardan foydalanish uchun biz birinchi navbatda ma'lumotlar to'plamini o'quv va test to'plamlariga ajratdik. Keyin model o'quv majmuasida o'qitiladi va modelning aniqligi test majmuasida baholandi.
Mashinali o'qitish modellarning qanchalik to'g'ri hisoblashini tekshirishning bir nechta o'lchovlari mavjud: Bu yordamchi o'lchovlar yordamida modelni baholovchi quyidagi o'lchovchlar:


Accuracy - model aniqliligi haqidagi usul;
Precision - to'g'ri prognoz qilingan pozitiv qiymatlarning pozitiv deya prognoz qilingan qiymatlarning umumiy soniga nisbatiga aytiladi;
Recall - to'g'ri prognoz qilingan pozitiv qiymatlarning ma'lumotlar to'plamidagi barcha haqiqiy pozitiv nishonlarga nisbatidir;
F1 Score - Precision hamda Recall orqali ifodalaniladigan o'lchov bo'lib, model aniqligi haqida yanada aniqroq tasavvur beradi;

1.5 - Rasm. Logistik Regressiya va k-eng yaqin qo'shni usullari aniqligini baholash



1.6 - Rasm. Precision va Recall o'lchovlari yordamida Logistik Regressiya va k-eng yaqin qo'shni usullari aniqligi



1.7 – Rasm. Parametrik logistik regressiya va k-eng yaqin qo‘shni (KNN) modellarning grafik tahlili



Model turi

Model nomi

Aniqligi (Accuracy)

Parmaetrik

Logistik Regressiya

87%

Noparametrik

k-eng yaqin qo‘shni

77%

1.2 – jadval. Parametrik va noparametrik modellarning aniqligining solishtirma tahlili keltirilgan jadvali.
Parametrik va noparametrik usullarni olingan solishtirma tahlillarini 1.5 –1.6 - 1.7 - Rasmlar grafikasida ko‘rishimiz mumkin. Tahlil natijalarini 1.2 – jadvalda ko‘rishimiz mumkin, parametrik usul logistik regressiya aniqligi 87%, k-eng yaqin qo’shnilar usuli aniqligi esa 77% ekanligini ko‘rishimiz mumkin. Bu shuni ko‘rsatadiki, parametrik logistik regressiya usuli aniqligi o‘rtasidagi muvozanat parametrik bo‘lmagan usul k-eng yaqin qo‘shnidan ustunligini ko‘rishimiz mumkin.
XULOSA
Ushbu maqolada parametrik va parametrik bo‘lmagan mashinani o‘qitish algoritmlari o‘rtasidagi farqi o‘rganildi va o‘rganish jarayonda kelib chiqadigan muammolar tahlil qilindi.
Parametrik usullar kirish o‘zgaruvchilarini chiqish o‘zgaruvchisiga solishtirish bo‘yicha katta taxminlar qilishini va o‘z navbatida tezroq o‘qitishni, kamroq ma’lumot talab qilishini, lekin unchalik kuchli bo‘lmasligini bilib oldik.
Bundan tashqari, parametrik bo‘lmagan usullar haqida funktsiya kam yoki umuman taxmin qilmaydigan va o‘z navbatida ko‘proq ma’lumot talab qiladigan, o‘rgatish sekinroq va model murakkabligi yuqori, lekin yanada kuchli modellarga olib kelishi mumkinligini bilib oldik.
Umumman olganda, k-eng yaqin qo‘shni parametrik bo‘lmagan model bo‘lib u ma’lumotlarning asosiy taqsimoti haqida taxminlar qilmaydi. Logistik regressiya esa ma’lumotlar uchun logistik taqsimotni nazarda tutadigan parametrik modeldir. Ikkala model ham o’zlarining kamchilik va avfzalik tomonlariga ega va ular orasidagi tanlov muammoning o‘ziga xos xususiyatlariga bog‘liq ekanligi aniqlandi.
Xulosa qilib aytadigan bo'lsak, parametrik algoritmlar kirish ma'lumotlari yaxshi aniqlangan va bashorat qilinadigan muammolar uchun eng mos keladi, parametrik bo'lmagan algoritmlar esa kirish ma'lumotlari yaxshi aniqlanmagan, ammo biz o'qitish uchun foydalanishimiz mumkin bo'lgan juda ko'p ma'lumotlar mavjud bo'lgan muammolar uchun eng mos keladi.
FOYDALANILGAN ADABIYOTLAR



  1. H. Zaynidinov, O. Mallayev and M. Kuchkarov, IEEE Int. IOT, Electron. Mechatronics Conf. IEMTRONICS, pp. 304–310 (2021). doi: https://doi.org/10.1109/IEMTRONICS52119.2021.9422645.

  2. M. Singh, H. Zaynidinov, M. Zaynutdinova, D. Singh, “Bi-cubic spline based temperature measurement in the thermal field for navigation and time system,” Journal of Applied Science and Engineering, 22(3), 2019, doi:10.6180/jase.201909_22(3).0019.

  3. Yusupov I, Nurmurodov J, Ibragimov S, Gofurjonov M, Qobilov S. “Calculation of Spectral Coefficients of Signals on the Basis of Haar by the Method of Machine Learning”, 14th International Conference, IHCI 2022, Tashkent, Uzbekistan, October 20–22, 2022, pp 547–558. https://link.springer.com/conference/ihci

  4. Li, X., Li, B., Liang, Z., & Li, Y. (2020). Comparative analysis of machine learning algorithms for diabetes mellitus type 2 prediction. Health Information Science and Systems, 8(1), 1-8.

  5. Basha, S. H., & Jahangir, M. (2021). A Comparative Study on Performance of Logistic Regression, Decision Tree and K-Nearest Neighbor Algorithm for Diabetes Mellitus Prediction. Journal of Medical Systems, 45(3), 1-11.

  6. Qaiser, S., & Mahmood, T. (2020). Comparative analysis of logistic regression, K-NN and Naïve Bayes for classification of diabetes mellitus data. Engineering, Technology & Applied Science Research, 10(3), 5683-5687.

  7. Gohil, P., & Modi, N. (2019). Analysis of Diabetes dataset using KNN and Naive Bayes classifier. International Journal of Computer Science and Mobile Computing, 8(4), 1-9.

  8. Kalyani, V. B., Kamaraj, V., Manickavasagan, A., & Anusuya, M. (2017). Analysis of Diabetes Dataset using Logistic Regression. International Journal of Pure and Applied Mathematics, 114(5), 59-64.

  9. Ali, A., Majid, A., & Noman, M. (2019). Predicting Diabetes Using K-Nearest Neighbor and Logistic Regression Algorithms. International Journal of Advanced Computer Science and Applications, 10(11), 470-477.

  10. Chaudhary, P., Kumar, D., Kumar, R., & Chaudhary, P. (2019). Predicting Diabetes Mellitus using Logistic Regression and K-Nearest Neighbors. International Journal of Computer Applications, 180(42), 18-22.

Download 326.36 Kb.
1   2




Download 326.36 Kb.

Bosh sahifa
Aloqalar

    Bosh sahifa



Parametrik logistik regressiya va parametrik bo'lmagan k-yaqin qo'shni

Download 326.36 Kb.