|
S harof Rashidov nomidagi Samarqand davlat universiteti Intellektual tizimlar va kompyuter texnologiyalari fakulteti
|
Sana | 22.02.2024 | Hajmi | 66,42 Kb. | | #160855 |
Bog'liq Bahora 3
S harof Rashidov nomidagi Samarqand davlat universiteti
Intellektual tizimlar va kompyuter texnologiyalari fakulteti
Fan nomi
|
Web mayning
|
Kurs
|
4
|
O’qituvchi
|
Abdiyeva Xabiba
|
Talaba
|
To’xtayeva Bahora
|
3-amaliy topshiriq.
Assotsiatsiya qoidasi va Apriori algoritmi.
Quyidagi linkdan ma’lumotlar to’plamini yuklab oling:
https://github.com/ashishpatel26/Market-Basket-Analysis?tab=readme-ov-file
Yuklab olingan ma’lumotlar to’plamini tahlil qiling(ustunlar nimalardan tashkil topgan, qanaqa ma’lumotlarni o’z ichiga olgan).
Yuklab olgan ma’lumotimizda Do’kon ma’lumotlarining bozor savati tahlili olib borilgan.
Kutubxonamizni import qilish:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from apyori import apriori
Bunda ustunlarimiz,
mayda qisqichbaqa, burgerlar, chutney, kurka, mineral suv kabi mahsulotlardan iborat.Quyidagi ma’lumotlarni o’z ichiga olgan:
Fransiya chakana savdo do’konida bir hafta davomida 7500 ta tranzaksiya berilgan turli xil mahsulotlar va apriori yordamida assotsiatsiya qoidasini hisoblash uchun kutubxonamiz (apyori) mavjud.
Pythondan numpy, pandas, matplotlib va apyori kutubxonalarini yuklang.
Ma’lumotlar to’plamidan ma’lumotlarni ekranda namoyish eting (birinchi 4 ta ustunni ko’rsatsin).
print(store_data.shape) funksiyasi bilan ma’lumotlar to’plamidagi mavjud ustun va qatorlar sonini aniqlang.
Apriori algoritmidan foydalanish uchun ma’lumotlar to’plamini ro’yxat ko’rinishiga o’tkazing.
S(Support), C(Confidence) va L(Lift) metrikalari nima va ular qanday hisoblanadi?
1. Support=S
Ma’lumotlar to’plamidagi ma’lum buyumning qanchalik tez-tez takrorlanishini ko’rsatuvchi o’lchov.
support(X⇒Y)=|X∪Y|n , bu yerda n jami tranzaksiyalar soni.
2. Confidence=C
Ushbu ko'rsatkich qoidaning to'g'ri bo'lish ehtimolini ifodalaydi. U X va Y ni o'z ichiga olgan tranzaksiyalar soni Xni o'z ichiga olgan tranzaksiyalar soniga bo'lingan holda hisoblanadi.Formulasi quyidagicha:
Confidence (X -> Y) = (X va Y ni o’z ichiga olgan jami tranzaksiyalar soni) / (Xni o’z ichiga olgan jami tranzaksiyalar soni)
3. Lift=L
Bu koʻrsatkich X va Y ning mustaqilligi bilan solishtirganda X va Y oʻrtasidagi bogʻlanish darajasini ifodalaydi. U qoida Confidence ko’rsatkichining Y ni Support ko’rsatkichiga nisbati sifatida hisoblanadi. Formulasi quyidagicha:
Lift(X -> Y) = Confidence(X -> Y) / Support(Y)
Ma’lumotlar to’plamiga Apriori algoritmini qo’llang.
Ma’lumotlar to’plamidan assotsiatsiya qoidalarini ajratib oling (association_rules = apriori(records, min_support=0.0045, min_confidence=0.2, min_lift=3, min_length=2)
association_results = list(association_rules)).
Ajratib olingan assotsiatsiya qoidalari uchun S(Support), C(Confidence) va L(Lift) metrikalarini hisoblang.
Практическое задание-3
Правило ассоциации и алгоритм Априори.
Загрузите набор данных по следующей ссылке:
https://github.com/ashishpatel26/Market-Basket-Analysis?tab=readme-ov-file
Проанализировать загруженный набор данных (из чего состоят столбцы, какую информацию они содержат).
Загрузите библиотеки numpy, pandas, matplotlib и apyori из Python.
Отобразите данные из набора данных на экране (покажите первые 4 столбца).
Определите количество столбцов и строк в наборе данных с помощью функции print(store_data.shape).
Переключите набор данных в режим списка, чтобы использовать алгоритм Априори.
Каковы показатели S (Поддержка), C (Доверие) и L (Рост) и как они рассчитываются?
Примените алгоритм Априори к набору данных.
Извлеките правила ассоциации из набора данных. (association_rules = apriori(records, min_support=0.0045, min_confidence=0.2, min_lift=3, min_length=2)
association_results = list(association_rules)).
Рассчитайте метрики S (Поддержка), C (Доверие) и L (Рост) для извлеченных правил ассоциации.
|
| |