|
Tadqiqot mavzusi bo‘yicha adabiyotlar tahlili
|
bet | 2/2 | Sana | 13.07.2023 | Hajmi | 462.53 Kb. | | #76677 |
Bog'liq aa Yetakchi boshqaruvchi shaxslar va jamoalar, SINONIMLAR 37593, ИХ фанидан Мамлака иқтисодий хавфсизлиги, Muammoli ta\'lim, PEDAGOGIK FАОLI, 1-mavzu slayd, БУЛУТЛИ ТЕХНОЛОГИЯЛАРИ MAVZULArI, 7 mavzu, Kurs ishi yuzi (RUS), 2 laboratoriya, Mustaqil ish, Заявка на бронирование помещения, Fizika attestatsiya 2022 , 3-амалий. Toʻgʻri chiziq va tekislikdagi nuqtaning koordinatalari., 4-амалий. Мatritsalar va determinantlarTadqiqot mavzusi bo‘yicha adabiyotlar tahlili
Assotsiativ qoidalar va bozor savatlarinining tahlili bo‘yicha chet ellik olimlarning, jumladan R. Agrawal, T. Imielinski, A. Swami, R. Srikant. A. Savasere, E. Omiecinski, and S. Navathe, J.S. Park, M.-S. Chen, and S.Y. Philip, J. Hipp, U. Guntzer, and G. Nakaeizadeh. ishlarida ko‘plab natijalar keltirilgan.
Effektiv algoritmlardan biri sifatida Apriora va Genetik algoritmlar ko‘rsatilgan.
Tadqiqot metodologiyasi
Qo‘yilgan masalani yechish uchun ma’lumotlarni tahlili qilishdagi assotsiativ qoidalar va algoritmlardan hamda Cell protsessorlar bazasidagi hisoblash tizimi uchun moslashtirilgan bozor savatlarini tahlil qilishning parallel algoritmidan foydalanilgan.
Tadqiqot maqsadi va vazifalari. Tanlangan metod va algoritmlar asosida bozor savatchalarini tahlili qilishning optimallashtirish. Ushbu maqsadga erishish uchun quyidagi masalalar yechildi:
Assotsiativ qoidalar o‘rganish va mavjud adabiyotlardan nazariy ma’lumotlarni to‘plash;
Apriora - assotsiativ qoidasining algoritmini va unga oid nazariy ma’lumotlarni tahlil qilish;
Bozor savatchalarining tahlil kilish masalalarini yechishning Genetik algoritmi tahlil qilish;
Bozor savatchalarining taxlil kilish masalalarini yechishning parallel algoritmi tahlil qilish;
O‘rganilgan algoritmlar asosida qilingan hisoblashlarni tahlil qilish;
Algoritm va metodlarni yaxshilash bo‘yicha asosli taklif va tavsiyalar ishlab chiqish.
Tadqiqot natijalari
Tadqiqotning nazariy ahamiyati, bozor savatlarini tahlili qilish masalalarini yechish uchun assotsiativ qoidalarni izlash va algoritmlarni ishlab chiqishdan iborat.
Dissertatsiyani amaliy ahamiyati, assotsiativ qoidalar asosida ishlab chiqilgan parallel algoritm yaratish va ushbu algoritm ma’lumotlar tahlilini Cell protsessorlar bazasila hisoblashlarni amalga oshirish.
Ishlab chiqilgan algoritm samaradorligini baholash uchun biz uch seriyadagi hisoblash tajribalarini o‘tkazdik. Tajribalarning tashqi ma’lumotlari sifatida Data Mining algoritm samaradorligini baholash uchun foydalanilgan msnbc.com veb sayti sahifalariga tashrif buyurishlar to‘g‘risidagi standart test to‘plam ma’lumotlari olindi . B to‘plam test vazifasi sayt sahifalariga tashrif buyurish bo‘yicha qaydlarni aks ettiradi. Har bir qayd qanday mazmuniy toifaga tegishliligi to‘g‘risidagi belgidan iborat. Tajribalarda tez-tez tashrif buyuriladigan sahifalarning qiduruv to‘plamlari amalga oshirildi .
Tajribalarning birinchi seriyasida biz hisoblash yadrosiga bog‘liq holda ish vaqti va algoritm tezlanishini aniqladik. Izchil algoritmlarning qabul qilingan unumdorlik birligi uchun tezlanishni hisoblashda bugungi kunda bozor savatini tahlil vazifalarini yechishning eng yaxshi algoritmlaridan biri sanaladi. Tajribalar shuni ko‘rsatdiki, DDCapriori algoritmi chiziqliga yaqin tezlanishni namoyon qildi..
a) tezlanish b) vaqt bo’ychida tahlil
1-rasm. DDCapriori algoritmining ishlash kuchi
Bundan tashqari biz ishlab chiqilgan algoritm va Count Distribution dlya Cell uchun Count Distribution algoritmini o‘lchamlarini taqqosladik. Taqqoslash shuni ko‘rsatdiki ishlab chiqilgan algoritm bir qancha yaxshi o‘lchamlarga ega
2-rasm. DataDistribution va CountDistribution mastshtablashni taqqoslash.
Tajribalarning ikkinchi seriyasida biz nomzod uzunligi va savatga bog‘liq holda savatga nomzodning kirishini tekshirishda skalyar bilan birga vektor operatsiyalarini qo‘llashdan yutuqni taqqosladik. Tajribalar natijalari shuni ko‘rsatdiki, vektor operatsiyalaridan keladigan yutuq nomzod va savat uzunligiga to‘g‘ri proporsional..
Vaqt bo‘yicha tekshirish b) vektorli orqali tekshirish
3-rasm. Kandidatning korzinaga kirishini vektorli funksiya orqali tekshirish.
Tajribalarning uchinchi seriyasi Cell va Intel platformasidagi ishlab chiqilgan algoritmni unumdorligini taqqoslashga yo‘naltirilgan. Bu tajribalarni o‘tkazish uchun biz Intel protsessoriga mo‘ljallangan DDCapriori algoritmni ishlab chiqdik. SPE-tizimi bilan birga buni amalga oshirishda POSIX- tizimidan foydalaniladi va vektor funksiyalari ishlatilmaydi. Tajribalar natijalari 10-rasmda keltirilgan .
3-rasm. Cell va Intel protsessorlarini ishlash jarayonini taqqoslash
Tajribalar shuni ko‘rsatdiki, Cell protsessorlaridagi algoritm Intel protsessorlaridagi algoritmga qaraganda bir qancha yaxshi tezlanishlarni namoyon qildi. Ammo Intel protsessorlari Cell protsessorlariga qaraganda ancha yuqori tezkor faoliyatni ta’minlaydi.
Xulosa
Ushbu tadqiqotda ishlov berilmagan ma’lumotlar orasida bilimlar tuzilishiga olib keladi. Bu bilimlar qaror qabul qilishda qo‘llanilishi mumkin. Shu sababli so`nggi yillarda «ma’lumotlar bazasidan bilim olish» (knowledge discovery in databases) yo’nalishi keskin suratlarda rivojlanib borayotnanini yaqol misol sifatida ko`rishimiz mumkin.
Data Mining – bu «ishlov berilmagan» ma’lumotlar ichidan kerakli, ilgari taniqli bo‘lmagan, amaliy jihatdan foydali va interpritatsiyaga loyiq bilimlarni topish jarayoni hisoblanadi. Bu bilimlar inson xayotining turli yunalishlarida qaror kabul kilish jarayonida muhim rol uynaydi.
Xususan, bozor savatchasining asosiy tushunchalari izohlangan, katta hajmdagi ma’lumotlar qayta ishlash va zarur axborotni samarali topishga imkon beruvchi Data Mining dastaklaridan biri sifatida assotsiativ qoidalar ko‘rib chiqilgan. Yuqorida ta’kidlaganidek, assotsiativ qoidalarni izlash masalasi dastlab bozor savatchasini tahlil qilish uchun taqdim etilgan.
Assotsiativ qoidalar xaridlar, mijozlarning xohishlarini tahlil qilish, supermarketlarda tovarlarni joylashtirishni rejalashtirish, kross-marketing, manzilli jo‘natishda xaridorlarning hatti-harakatlari bo‘yicha segmentlashtirishda samarali qo‘llanilmoqda. Biroq, ushbu algoritmlarning qo‘llanilish sohasi faqatgina savdo bilan cheklanmaydi.
Tadqiqot natijalaridan kelib chiqqan ma’lumotlar yordamida parallelashtirishning umumiy usuli yaratildi.
Yuqorida ko‘rsatilgan algoritmlarni ta’riflash uchun asosiy tushunchalari ifodalangan.
Bozor savatlarining yo‘nalishlaridan amaliy misollar keltirilgan.
Cell va Intel protsessorlar bazasidagi hisoblash tizimi uchun moslashtirilgan bozor savatlarini tahlil qilish vazifalarini yechishning parallel algoritmi keltirilgan. Parallel algoritmlar to‘plamni guruhlarga bo‘lishi va hisoblash yadrolari bo‘yicha bu guruhlarni tarqatish yo‘li bilan erishilgan. Bunda savat to‘plami har bir hisoblash yadrosiga uzatiladi.
Taklif qilingan algoritm samaradorligini ko‘rsatuvchi hisoblash tajribalari natijalari keltirilgan.
Keltirilgan algoritm va model yordamida ko‘pgina tajribalar o‘tqazildi va tajriba natijalar asosida yakuniy xulosalar chiqarildi.
Wang,. Н. lay, and В. Liu. mterestingness-Based Interval Merger for Numeric Association Rules. In Proc. of the 4 th Intl. Conf. on Knowledge Discovery and Data Mining, pages 121-128, New York, NY, August 2014.
I. Webb. Preliminary investigations into statistically valid exploratory rule discovery. In Proc. of the Australasian Data Mining Workshop (AusDMOS), Canberra, Australia, December 2013.
Xiong, X. He, C. Ding, Y. Zhang, V. Kumar, and S. R. Holbrook. Identification of Functional Modules in Protein Complexes via Hyperclique Pattern Discovery. In Proc. of the Pacific Symposium on Biocomputing, (PSB 2005), Maui, January 2010.
H. Xiong, S. Shekhar, P. N. Tan, and V. Kumar. Exploiting a Support-based Upper Bound of Pearson’s Correlation Coefficient for Efficiently Identifying Strongly Correlated Pairs. In Proc. of the 10th Intl. Conf. on Knowledge Discovery and Data Mining, pages 334-343, Seattle, WA, August 2010.
H. Xiong, M. Steinbach, P. N. Tan, and V. Kumar. HICAP: Hierarchial Clustering with Pattern Preservation. In Proc. of the SIAM Intl. Conf. on Data Mining, pages 279-290, Orlando, FL, April 2011
H. Xiong, P. N. Tan, and V. Kumar. Mining Strong Affinity Association Patterns in Data Sets with Skewed Support Distribution. In Proc. of the 2003 IEEE Intl. Conf. on Data Mining, pages 387-394, Melbourne, FL, 2010
X. Yan and J. Han. gSpan: Graph-based Substructure Pattern Mining. In Proc. of the 2002 IEEE Inti Conf. on Data Mining, pages 721-724, Maebashi City, Japan, December 2012.
C. Yang, U. M. Fayyad, and P. S. Bradley. Efficient discovery of error-tolerant frequent itemsets in high dimensions. In Proc. of the 7th Intl. Conf. on Knowledge Discovery and Data Mining, pages 194-203, San Francisco, CA, August 2011.
|
| |