Association Rule sering disebut juga Market Basket Analysis (Analisa Keranjang Pasar).
Association Rule adalah suatu metode data mining yang bertujuan untuk mencari sekumpulan items yang sering muncul bersamaan. Umumnya association rule ini dianalogikan dengan keranjang belanjaan. Dari keranjang belanjaan para pengunjung supermarket akan dapat diketahui, barang apa saja yang sering dibeli bersamaan dan barang mana saja yang tidak. Association rule umumnya mengambil bentuk IF-THEN yang menggabungkan beberapa items menjadi satu, misalnya:
IF A and B THEN C
Secara teori, beberapa hal yang digunakan untuk mengukur apakah sekumpulan items (an item set) sering muncul bersamaan atau tidak, adalah support of an item set, confidence of an association rule, dan beberapa rule selection methods.
Support of an item set adalah persentase dari semua transaksi yang terjadi yang mengandung item set tersebut. Adapun rumus yang digunakan untuk menghitung adalah sebagai berikut:
Support(S) = (|U|/|T|)*100%
U adalah himpunan transaksi yang mengandung item set S
|U| adalah jumlah element dalam U
|T| adalah jumlah transaksi yang terjadi
Confidence of an association rule adalah perbandingan antara nilai support dari himpunan items yang terdapat di dalam rule dan nilai support dari himpunan items yang mendahuluinya. Sebagai contoh: apabila terdapat rule “Jika A dan B maka C”, confidence of association rule tersebut adalah:
Confidence(R) = (Support{A,B,C}/Support{A,B})*100%
Tetapi, di sini ada satu permasalahan yang umumnya tidak begitu diperhatikan yaitu: Rule yang bagus belum tentu rule yang menarik. Saya ilustrasikan di sini dua contoh yang bisa menjadi pemikiran.
Case 1:
60% dari semua pelanggan membeli ROTI (then ROTI)
58% dari semua pelanggan membeli SELAI bersama-sama dengan ROTI (if SELAI then ROTI)
Case 2:
60% dari semua pelanggan membeli ROTI (then ROTI)
20% dari semua pelanggan membeli SELAI bersama-sama dengan ROTI (if SELAI then ROTI)
Rule mana yang lebih menarik? Apakah yang 58% atau yang 20%?
Untuk menentukan apakah suatu rule itu cukup menarik atau tidak, dapat menggunakan beberapa metode yang antara lain adalah:
- Absolute Confidence Difference to Prior: yang mencari perbedaan confidence antara rule yang ada dengan rule yang mendahului i.e. kalau threshold perbedaannya diset 20% maka nilai terendah untuk menentukan rule itu menarik atau tidak adalah 60-20% = 40% dan tertinggi adalah 60+20% = 80%.
- Difference of Confidence Quotient to 1: terendah (1-20%)*60% = 0,8*60% = 48%, tertinggi 60%/(1-20%) = 60%/0,8 = 75%.
- Absolute Difference of Improvement Value to 1: terendah (1-20%)*60% = 48%, tertinggi (1+20%)*60% = 72%.
- Information Difference to Prior: yang mencari perbedaan information gain antara rule yang ada dengan rule yang mendahului.
- Normalised Chi2 Square: membandingkan antara distribusi items dalam rule yang mendahului dengan rule yang sekarang. Metode ini mencari apakah dengan menambahkan satu item lagi akan membuat suatu nilai Chi2 yang lebih tinggi atau tidak.
Kebetulan saya tidak ada. Kalau mau coba di-search punyanya Christian Borgelt. Ada beberapa aplikasi data mining yang disebarkan secara free.
Mas ada contoh program aplikasi market basket analysis yang menggunakan Delphi nga ya ???
Aku soalnya lagi buat aplikasi data mining dengan metode market basket analysis tetapi kesulitan dalam coding untuk implemantasinya (Algoritma Apriori)