Association Rule sering disebut juga Market Basket Analysis (Analisa Keranjang Pasar).
Association Rule adalah suatu metode data mining yang bertujuan untuk mencari sekumpulan items yang sering muncul bersamaan. Umumnya association rule ini dianalogikan dengan keranjang belanjaan. Dari keranjang belanjaan para pengunjung supermarket akan dapat diketahui, barang apa saja yang sering dibeli bersamaan dan barang mana saja yang tidak. Association rule umumnya mengambil bentuk IF-THEN yang menggabungkan beberapa items menjadi satu, misalnya:
IF A and B THEN C
Secara teori, beberapa hal yang digunakan untuk mengukur apakah sekumpulan items (an item set) sering muncul bersamaan atau tidak, adalah support of an item set, confidence of an association rule, dan beberapa rule selection methods.
Support of an item set adalah persentase dari semua transaksi yang terjadi yang mengandung item set tersebut. Adapun rumus yang digunakan untuk menghitung adalah sebagai berikut:
Support(S) = (|U|/|T|)*100%
U adalah himpunan transaksi yang mengandung item set S
|U| adalah jumlah element dalam U
|T| adalah jumlah transaksi yang terjadi
Confidence of an association rule adalah perbandingan antara nilai support dari himpunan items yang terdapat di dalam rule dan nilai support dari himpunan items yang mendahuluinya. Sebagai contoh: apabila terdapat rule “Jika A dan B maka C”, confidence of association rule tersebut adalah:
Confidence(R) = (Support{A,B,C}/Support{A,B})*100%
Tetapi, di sini ada satu permasalahan yang umumnya tidak begitu diperhatikan yaitu: Rule yang bagus belum tentu rule yang menarik. Saya ilustrasikan di sini dua contoh yang bisa menjadi pemikiran.
Case 1:
60% dari semua pelanggan membeli ROTI (then ROTI)
58% dari semua pelanggan membeli SELAI bersama-sama dengan ROTI (if SELAI then ROTI)
Case 2:
60% dari semua pelanggan membeli ROTI (then ROTI)
20% dari semua pelanggan membeli SELAI bersama-sama dengan ROTI (if SELAI then ROTI)
Rule mana yang lebih menarik? Apakah yang 58% atau yang 20%?
Untuk menentukan apakah suatu rule itu cukup menarik atau tidak, dapat menggunakan beberapa metode yang antara lain adalah:
- Absolute Confidence Difference to Prior: yang mencari perbedaan confidence antara rule yang ada dengan rule yang mendahului i.e. kalau threshold perbedaannya diset 20% maka nilai terendah untuk menentukan rule itu menarik atau tidak adalah 60-20% = 40% dan tertinggi adalah 60+20% = 80%.
- Difference of Confidence Quotient to 1: terendah (1-20%)*60% = 0,8*60% = 48%, tertinggi 60%/(1-20%) = 60%/0,8 = 75%.
- Absolute Difference of Improvement Value to 1: terendah (1-20%)*60% = 48%, tertinggi (1+20%)*60% = 72%.
- Information Difference to Prior: yang mencari perbedaan information gain antara rule yang ada dengan rule yang mendahului.
- Normalised Chi2 Square: membandingkan antara distribusi items dalam rule yang mendahului dengan rule yang sekarang. Metode ini mencari apakah dengan menambahkan satu item lagi akan membuat suatu nilai Chi2 yang lebih tinggi atau tidak.
Selamat siang.. saya lagi butuh info nih pak/buk tentang tugas skripsi saya..Apakah ada yang tahu teori tentang laplace, gain, ps, conviction in association rule?? Dan hasilnya itu didapat darimana??
Reblogged this on Site Title.
[…] https://yudiagusta.wordpress.com/2008/08/04/association-rules/ […]
[…] https://yudiagusta.wordpress.com/2008/08/04/association-rules/ […]
terima kasih pencerahannya, artikel anda sangat bagus, sangat membantu saya dalam anilisis pasar
Makasih, senang bisa membantu. Tks
Pak Yudi, apakah ada journal article atau buku yang membahas lebih dalam tentang association rule ini ?
Thanks
Biasanya association rule selalu menjadi pokok bahasan tersendiri di dalam suatu buku Data Mining.
Semoga menjawab.
Pak…. saya mau nanya mengenai fuzzy c-covering dalam pencarian confidencenya if a then b lalu if b then a…… didasarkan pada apa pak????
mohon penjelasanya pak…..
terimakasih
Penghitungan confidence level didasarkan pada banyak data yang mengatakan bahwa kalau seseorang membeli barang A pasti membeli barang B. Coba dilihat kembali penjelasan di atas untuk penghitungan nilai confidence level.
Semoga membantu.
Pak yudi, saya alumni stikom bali. saya waktu ini bikim skripsi association rulu mining dengan metode fuzzy c Covering. pertanyaan saya metode fuzzy set nya belum saya mengerti benar! jika bapak tau tentang metode ini tolong pencerahannya.
GImana kamu? Sudah mengerjakan sesuatu tentang fuzzy, yang dasar seperti fuzzy set gak didalami. Coba dibuka-buka lagi bukunya, pasti ada yang membahas itu.
Gimana?
untuk Ranun, saya pernah buat pakek delpi ama pakek vb6 itu gak sulit! kamu kirim aja email kosong ke mega.fuzzy@gmail.com.
Kebetulan saya tidak ada. Kalau mau coba di-search punyanya Christian Borgelt. Ada beberapa aplikasi data mining yang disebarkan secara free.
Mas ada contoh program aplikasi market basket analysis yang menggunakan Delphi nga ya ???
Aku soalnya lagi buat aplikasi data mining dengan metode market basket analysis tetapi kesulitan dalam coding untuk implemantasinya (Algoritma Apriori)