Association Rules

4 08 2008

Association Rule sering disebut juga Market Basket Analysis (Analisa Keranjang Pasar).

Association Rule adalah suatu metode data mining yang bertujuan untuk mencari sekumpulan items yang sering muncul bersamaan. Umumnya association rule ini dianalogikan dengan keranjang belanjaan. Dari keranjang belanjaan para pengunjung supermarket akan dapat diketahui, barang apa saja yang sering dibeli bersamaan dan barang mana saja yang tidak. Association rule umumnya mengambil bentuk IF-THEN yang menggabungkan beberapa items menjadi satu, misalnya:

IF A and B THEN C

Secara teori, beberapa hal yang digunakan untuk mengukur apakah sekumpulan items (an item set) sering muncul bersamaan atau tidak, adalah support of an item set, confidence of an association rule, dan beberapa rule selection methods.

Support of an item set adalah persentase dari semua transaksi yang terjadi yang mengandung item set tersebut. Adapun rumus yang digunakan untuk menghitung adalah sebagai berikut:

Support(S) = (|U|/|T|)*100%

U adalah himpunan transaksi yang mengandung item set S
|U| adalah jumlah element dalam U
|T| adalah jumlah transaksi yang terjadi

Confidence of an association rule adalah perbandingan antara nilai support dari himpunan items yang terdapat di dalam rule dan nilai support dari himpunan items yang mendahuluinya. Sebagai contoh: apabila terdapat rule “Jika A dan B maka C”, confidence of association rule tersebut adalah:

Confidence(R) = (Support{A,B,C}/Support{A,B})*100%

Tetapi, di sini ada satu permasalahan yang umumnya tidak begitu diperhatikan yaitu: Rule yang bagus belum tentu rule yang menarik. Saya ilustrasikan di sini dua contoh yang bisa menjadi pemikiran.

Case 1:
60% dari semua pelanggan membeli ROTI (then ROTI)
58% dari semua pelanggan membeli SELAI bersama-sama dengan ROTI (if SELAI then ROTI)

Case 2:
60% dari semua pelanggan membeli ROTI (then ROTI)
20% dari semua pelanggan membeli SELAI bersama-sama dengan ROTI (if SELAI then ROTI)

Rule mana yang lebih menarik? Apakah yang 58% atau yang 20%?

Untuk menentukan apakah suatu rule itu cukup menarik atau tidak, dapat menggunakan beberapa metode yang antara lain adalah:

  • Absolute Confidence Difference to Prior: yang mencari perbedaan confidence antara rule yang ada dengan rule yang mendahului i.e. kalau threshold perbedaannya diset 20% maka nilai terendah untuk menentukan rule itu menarik atau tidak adalah 60-20% = 40% dan tertinggi adalah 60+20% = 80%.
  • Difference of Confidence Quotient to 1: terendah (1-20%)*60% = 0,8*60% = 48%, tertinggi 60%/(1-20%) = 60%/0,8 = 75%.
  • Absolute Difference of Improvement Value to 1: terendah (1-20%)*60% = 48%, tertinggi (1+20%)*60% = 72%.
  • Information Difference to Prior: yang mencari perbedaan information gain antara rule yang ada dengan rule yang mendahului.
  • Normalised Chi2 Square: membandingkan antara distribusi items dalam rule yang mendahului dengan rule yang sekarang. Metode ini mencari apakah dengan menambahkan satu item lagi akan membuat suatu nilai Chi2 yang lebih tinggi atau tidak.

Actions

Information

15 responses

29 07 2017
Erni

Selamat siang.. saya lagi butuh info nih pak/buk tentang tugas skripsi saya..Apakah ada yang tahu teori tentang laplace, gain, ps, conviction in association rule?? Dan hasilnya itu didapat darimana??

16 05 2017
Baby Groooooooot!!!

Reblogged this on Site Title.

2 06 2016
1 06 2016
9 09 2014
Panuluh Adi Riyanto

terima kasih pencerahannya, artikel anda sangat bagus, sangat membantu saya dalam anilisis pasar

1 03 2015
Yudi Agusta

Makasih, senang bisa membantu. Tks

27 03 2011
hadi

Pak Yudi, apakah ada journal article atau buku yang membahas lebih dalam tentang association rule ini ?

Thanks

6 10 2011
Yudi Agusta

Biasanya association rule selalu menjadi pokok bahasan tersendiri di dalam suatu buku Data Mining.

Semoga menjawab.

2 03 2011
kayum

Pak…. saya mau nanya mengenai fuzzy c-covering dalam pencarian confidencenya if a then b lalu if b then a…… didasarkan pada apa pak????

mohon penjelasanya pak…..
terimakasih

6 10 2011
Yudi Agusta

Penghitungan confidence level didasarkan pada banyak data yang mengatakan bahwa kalau seseorang membeli barang A pasti membeli barang B. Coba dilihat kembali penjelasan di atas untuk penghitungan nilai confidence level.

Semoga membantu.

10 06 2010
ngurah

Pak yudi, saya alumni stikom bali. saya waktu ini bikim skripsi association rulu mining dengan metode fuzzy c Covering. pertanyaan saya metode fuzzy set nya belum saya mengerti benar! jika bapak tau tentang metode ini tolong pencerahannya.

16 06 2010
Yudi Agusta

GImana kamu? Sudah mengerjakan sesuatu tentang fuzzy, yang dasar seperti fuzzy set gak didalami. Coba dibuka-buka lagi bukunya, pasti ada yang membahas itu.

Gimana?

10 06 2010
ngurah

untuk Ranun, saya pernah buat pakek delpi ama pakek vb6 itu gak sulit! kamu kirim aja email kosong ke mega.fuzzy@gmail.com.

28 10 2008
Yudi Agusta

Kebetulan saya tidak ada. Kalau mau coba di-search punyanya Christian Borgelt. Ada beberapa aplikasi data mining yang disebarkan secara free.

28 10 2008
Ranum

Mas ada contoh program aplikasi market basket analysis yang menggunakan Delphi nga ya ???
Aku soalnya lagi buat aplikasi data mining dengan metode market basket analysis tetapi kesulitan dalam coding untuk implemantasinya (Algoritma Apriori)

Leave a comment