三種購物籃分析指標介紹
#134
Replies: 2 comments
-
除了購物籃分析,Apriori演算法也被用在淘寶推薦相關書籍、推薦醫療器具組合與百度文庫推薦相關文件等等,使用的範圍相當廣,是很受歡迎也很有趣的分析方法。 |
Beta Was this translation helpful? Give feedback.
0 replies
-
感覺版主可以參閱一下先前的文章,裡面有介紹markdown語法,或是直接google也會有基礎的教學 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
關聯分析—Apriori算法
上次講到了購物籃分析的方法,這次要介紹跟購物籃分析關聯很大的Apriori演算法的三個指標:
-Support 支持度
-Confidence 可靠度
-Lift 提升度
支持度Support
![image](https://private-user-images.githubusercontent.com/80608422/243157199-5c3a075e-cfa7-4d28-9e28-93222f95e223.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MjA5MDM5OTEsIm5iZiI6MTcyMDkwMzY5MSwicGF0aCI6Ii84MDYwODQyMi8yNDMxNTcxOTktNWMzYTA3NWUtY2ZhNy00ZDI4LTllMjgtOTMyMjJmOTVlMjIzLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA3MTMlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwNzEzVDIwNDgxMVomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTA1NTMyNjI5MWM5OTAxZTAyN2IxYTBhNWEwN2VlNzVlMmM4NmM4NmZjYTc2MWNjMmM5YjgyYmMzOTlkNTY0NGEmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.7kMQnlA_kxFzGrqvmSLYRzF69YgnOI19slzH9YQHulY)
意旨在所有項集發生的狀況下,同時發生X、Y 項集的機率。
Support(A and B) = (A and B) / N (A和 B 同時出現的次數 / 所有交易數)
一般以設定最小支持門檻值 (min-support) =0.005來篩選。
可信度 Confidence
![image](https://private-user-images.githubusercontent.com/80608422/243157330-f95f3377-5de7-4f66-84c7-5ec46616ce7d.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MjA5MDM5OTEsIm5iZiI6MTcyMDkwMzY5MSwicGF0aCI6Ii84MDYwODQyMi8yNDMxNTczMzAtZjk1ZjMzNzctNWRlNy00ZjY2LTg0YzctNWVjNDY2MTZjZTdkLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA3MTMlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwNzEzVDIwNDgxMVomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTk3ZTIyZWUzZGYxNzQ5MDMwZDkwMTM5MzI2OTM1MDc1MzQ5ZTU0YmFjNjYyMGZlM2UxMmM3MjhlMDljNDYzNGMmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.AZt_zwVdXm5z0rfW-0-qgktX_aqQWzinb4jdpn0_jTs)
在 X 項集發生的狀況下,同時發生 XY項集的機率。發生頻次越高表示該關聯性規則越具備高度關係。
P (B|A) = c (A-> B) = (A and B) / A (買了 A 也買 B 的可能性)
一般以設定最小信賴門檻值 (min-confidence) =0.24來篩選。
提升度 Lift
A品項被購買時,B被購買所增加機率的倍數
公式 :Confidence(A->B) / Support(B)
EX: 隨機抽出100筆,有55個人買了A、有70個人買了B,其中25個人兩者都買:
Support(B)=70/100=0.70
Confidence (A -> B)=25/55=0.454
Lift (A,B)= 0.454/0.70 =0.649
我們的目標 : 增益值 >1
Confidence(A->B)/ Support(B)> 1 =>「正相關」
Confidence(A->B)/ Support(B)= 1 =>「獨立事件」
Confidence(A->B)/ Support(B)< 1 =>「負相關」
Beta Was this translation helpful? Give feedback.
All reactions