Quality Threshold Clustering

12 06 2008

Quality Threshold (QT) Clustering merupakan sub ilmu dari Data Mining dan Soft Computing.

Quality Threshold (QT) Clustering adalah salah satu metode clustering yang awalnya ditemukan untuk melakukan pengelompokan gene. Adapun algoritma yang digunakan adalah sebagai berikut:

  • Tentukan diameter maksimum dari cluster
  • Bangun kandidat cluster untuk setiap data dengan memasukkan data terdekat, data terdekat selanjutnya dan seterusnya, sampai diameter dari cluster melewati batas threshold.
  • Simpan kandidat cluster dengan data terbanyak sebagai cluster terpilih pertama dan hilangkan semua data yang termasuk di dalam cluster tersebut untuk proses selanjutnya.
  • Ulangi dengan kumpulan data yang telah dikurangi tersebut.

Beberapa hal yang terkait dengan QT Clustering ini adalah:

  • Clustering jenis ini memerlukan kemampuan komputer yang lebih dibandingkan dengan K-Means
  • Clustering jenis ini tidak perlu menentukan jumlah cluster di awal
  • Selalu memberikan hasil clustering yang sama
  • Jarak antara suatu data ke suatu cluster dihitung menggunakan metode complete linkage (jarak data tersebut ke semua data yang ada di dalam cluster tersebut).

Referensi:
Heyer, L.J., Kruglyak, S. and Yooseph, S. (1999), Exploring Expression Data: Identification and Analysis of Coexpressed Genes, Genome Research 9:1106-1115.


Actions

Information

4 responses

31 10 2011
Yudi Agusta

Tentu saja bisa, coba dikaji dulu, apakah keluaran dan metode peng-cluster-annya cocok dengan apa yang diinginkan nantinya.

Salam

15 11 2011
Nabila Firdausi

yang saya inginkan keluarannya berupa cluster 1 isinya data apa saja, cluster 2 data apa saja.. saya mengclusterkan 2 kelas pak.. kira-kira metode clustering apa saja yang bisa pak?

berarti menggunakan klastering non-hierarki ya pak, kira2 saya harus membandingkan metode apa dengan apa? bila saya membandingkan metode FCM dan K-Means apakah bisa pak? terimakasih banyak..

21 11 2011
Yudi Agusta

FCM dan K-Means pada dasarnya sama, FCM sudah tentu hasilnya lebih halus. Kalau jumlah clusternya sudah pasti, berarti tinggal karakteristiknya saja yang bisa dibandingkan. Kalau jumlah cluster masih bisa berubah-ubah, cara mencari jumlah cluster yang paling tepat yang bisa dibandingkan. Kalau dalam k-means ada partition entropy, boostrapped method, elbow method dll.

Semoga membantu.

29 10 2011
Nabila Firdausi

Apakah clustering ini bisa digunakan untuk data rasio keuangan (-0.2816, 0.291911, -1122) ?

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s




%d bloggers like this: