Bayesian Networks

11 02 2010

Bayesian Networks merupakan suatu metode pemodelan data berbasis probabilitas yang merepresentasikan suatu himpuan variabel dan conditional interdependenciesnya melalui suatu DAG (Directed Acyclic Graph). Adapun joint probability density function dari pemodelan ini adalah sebagai berikut:

P(X1=x1,…,Xn=xn) = Multiply_v=1^n P(Xv=xv | Xj=xj for each Xj which is a parent of Xv)

dimana:
Xv adalah variabel ke v dan xv adalah nilai variabel ke v

Setiap node yang terbentuk di dalam graph mempunyai suatu conditional probability table (CPT) seperti contoh berikut ini:

GRASS WET
T F
SPRINGKLER RAIN
T T 0,99 0,01
T F 0,9 0,1
F T 0,8 0,2
F F 0,0 1,0

Tabel ini mempunyai arti “Kalau Sprinkler Hidup dan Hujan, maka Grass Wet dengan kemungkinan 0,99”, atau “kalau Springkler Mati dan Tidak Hujan, maka Grass Wet dengan kemungkinan 0,0”

Dalam proses pencarian model data menggunakan Bayesian Networks ini adalah dua proses yang dilakukan yaitu parameter learning dan structure learning. Structure learning umumnya dilakukan dengan proses try and error, dengan model dari semua node ke model hasil atau dari satu node ke model hasil. Umumnya metode yang banyak digunakan adalah metode pertama, dimana semua node dan kaitan antar mereka dimunculkan dan kemudian menguji semua kaitan serta menghilangkan kaitan yang tidak mempunyai nilai keterkaitan yang tinggi. Parameter learning umumnya dilakukan bersamaan dengan pelaksanaan proses structure learning. Proses structure learning dan parameter learning dilakukan dengan memanfaatkan data yang dimiliki sebagai training data.

Referensi:
[1] Borgelt, Christian; Kruse, Rudolf (2002). Graphical Models: Methods for Data Analysis and Mining. Chichester, UK: Wiley. ISBN 0-470-84337-3.

Advertisements