Research

Clustering

Publikasi Pilihan

  • Y. Agusta (2007), K-Means – Penerapan, Permasalahan dan Metode Terkait (in Indonesian), Jurnal Sistem dan Informatika, Vol. 1 (Pebruari 2007), 47-60.
  • Y. Agusta (2005), Mixture Modelling Menggunakan Prinsip Minimum Message Length (in Indonesian), Jurnal Sistem dan Informatika, Vol. 1 (Agustus 2005), 1-16.
  • Y. Agusta (2004), Minimum Message Length Mixture Modelling for Uncorrelated and Correlated Continuous Data Applied to Mutual Funds Classification (in English), PhD Thesis in Computer Sciences (Information Technology), Monash University, Victoria, Australia.
  • Y. Agusta and D. L. Dowe (2003b), Unsupervised Learning of Correlated Multivariate Gaussian Mixture Models using MML (in English), In T. D. Gedeon and L. C. Fung (eds), Lecture Notes in Artificial Intelligence Vol. 2903, Springer-Verlag, Berlin, Germany, ISSN: 0302-9743, pp 477-489.
  • Y. Agusta and D. L. Dowe (2003a), Unsupervised Learning of Gamma Mixture Models using Minimum Message Length (in English), In M. H. Hamza (eds), the Proceedings of the Third IASTED Conference on Artificial Intelligence and Applications (AIA2003), Benalmadena, Spain, Sept. 2003, ACTA Press, Calgary, Canada, ISBN: 0-88986-390-3, pp. 457-462.
  • Y. Agusta and D. L. Dowe (2002b), Clustering of Gaussian and t Distributions using Minimum Message Length (in English), In M. Sasikumar, H. J. Jayprasad, and M. Kavitha (eds), the Proceedings of the International Conference on Knowledge Based Computer Systems (KBCS2002), Mumbai, India, Dec. 2002, Vikas Publishing House Pvt. Ltd., New Delhi, India, ISBN:81-259-1428-5, pp 289-299.
  • Y. Agusta and D. L. Dowe (2002a), MML Clustering of Continuous-Valued Data Using Gaussian and t Distributions (in English), In B. McKay and J. Slaney (eds), Lecture Notes in Artificial Intelligence Vol. 2557, Springer-Verlag, Berlin, Germany, ISSN: 0302-9743, pp 143-154.
  • S. Miyamoto and Y. Agusta (1998), Algorithms for L1 and Lp Fuzzy c-Means and Their Convergence (in English), In Hayashi C., N. Ohsumi, K. Yajima, Y. Tanaka, H. H. Bock, and Y. Baba (eds), Data Science, Classification, and Related Methods. Springer-Verlag, Tokyo, pp 295-302.
  • S. Miyamoto and Y. Agusta (1995), An efficient algorithm for L1 fuzzy c-means and its termination (in English), Control and Cybernetics, 24(4), pp 422-436.

Abstraksi Penelitian
Clustering merupakan suatu metode Data Mining yang bertujuan mengelompokkan data menjadi kelompok-kelompok dimana data di masing-masing kelompok memiliki karakteristik yang sama satu dengan yang lainnya. Antara tahun 1994-1996 saya melakukan penelitian clustering mendalami secara khusus metode fuzzy c-means, dimana saat itu sebagai alternatif dari Eucledian Distance Space, saya dengan supervisor menekuni distance space yang lain yaitu L1 (Manhattan) dan Lp (Minkowski). Selanjutnya tahun 2001-2004, saya mendalami clustering dari sudut pandang yang sedikit berbeda yaitu clustering dengan pendekatan Mixture Modelling. Mixture Modelling mempunyai karakteristik yang sedikit berbeda dengan fuzzy c-means , dimana dalam pemodelannya metode ini memasukkan probabilitas (distribusi statistik) sebagai dasarnya. Mixture Modelling yang saya dalami secara khusus adalah mixture modelling yang menerapkan prinsip Minimum Message Length (MML).

Minimum Message Length

Publikasi Pilihan

  • Y. Agusta (2006), Kajian Terhadap MML-Like Criterion Diusulkan Oleh Figueiredo dan Jain (in Indonesian), Jurnal Sistem dan Informatika, Vol. 1 (Pebruari 2006), 1-15.
  • Y. Agusta (2004), Minimum Message Length Mixture Modelling for Uncorrelated and Correlated Continuous Data Applied to Mutual Funds Classification (in English), PhD Thesis in Computer Sciences (Information Technology), Monash University, Victoria, Australia.

Abstraksi Penelitian
Minimum Message Length (MML) merupakan suatu teknik pengestimasian dan pemilihan model yang berbasis teori Bayesian dan teori informasi. MML ini sering dikaitkan dengan prinsip Minimum Description Length (MDL) yang mengadopsi pendekatan yang sama dimana estimasi atau model yang dipilih untuk suatu keadaan tertentu harus secukupnya memperhatikan data yang dianalisa, tetapi tetap tidak melupakan adanya berbagai kemungkinan yang mungkin muncul. Prinsip MML ini banyak dikaitkan teori ketidak pastian, dimana apapun yang dilakukan (yang umumnya memang mengenai ketidak pastian dalam data), selalu ada faktor lain yang harus diperhitungkan selain hal-hal yang memang sudah kelihatan jelas di depan mata kita.

Data Mining Theory

Publikasi Pilihan

  • Y. Agusta (2004), Minimum Message Length Mixture Modelling for Uncorrelated and Correlated Continuous Data Applied to Mutual Funds Classification (in English), PhD Thesis in Computer Sciences (Information Technology), Monash University, Victoria, Australia.

Abstraksi Penelitian
Metode-metode yang tergolong di dalam keilmuan Data Mining merupakan objek-objek penelitian yang telah dan sedang saya dalami. Selain clustering, yang sudah saya tekuni sejak lama, khususnya partition-based clustering, metode-metode yang sedang saya jajaki dan dalami termasuk Bayesian Networks dan Neural Networks. Bayesian Networks adalah suatu metode Data Mining yang berusaha memodel data dengan melihat kondisi sebab akibat antar variabel dan menjadikannya sudah model jaringan yang melibatkan variabel-variabel yang dijajaki, sedangkan Neural Networks merupakan metode supervised classification yang memodel data menyerupai cara kerja otak mahluk hidup. Ada input, proses dan kemudian output. Neural Networks banyak digunakan untuk melakukan prediksi keadaan di masa yang akan datang berdasarkan pada keadaan yang ada sekarang ini.

Penelitian Terapan Terkait Data Mining (Intelligent Systems)

Publikasi Pilihan

  • Y. Agusta (2004), Minimum Message Length Mixture Modelling for Uncorrelated and Correlated Continuous Data Applied to Mutual Funds Classification (in English), PhD Thesis in Computer Sciences (Information Technology), Monash University, Victoria, Australia.
  • Y. Agusta (2006), Pendekatan Penerapan Data Mining Untuk Data-Data Pendukung Perencanaan Pemerintahan (in Indonesian), Jurnal Sistem dan Informatika, Vol. 2 (Agustus 2006), 1-13.

Abstraksi Penelitian
Data Mining telah diterapkan dalam berbagai bidang, baik sebagai alat analisa maupun untuk mendukung pengembangan sistem yang berbasis data mining. Sekarang ini, penelitian terapan yang banyak saya lakukan adalah kaitannya dengan penganalisaan data baik itu data ekonomi, sosial maupun data-data pendukung pemerintah lainnya.

Dalam kegiatan penelitian yang akan datang, pengembangan berbagai metode untuk mendukung terciptanya sistem pendukung keputusan yang berbasis hal-hal yang umum digunakan oleh manusia untuk pengambilan keputusan seperti data, informasi, pengetahuan, dokumen, komunikasi, gambar, kaidah umum (common sense) dan hal-hal pendukung lainnya akan dicoba untuk didalami sedikit demi sedikit. Terciptanya otomatisasi pengambilan keputusan secara soft-computing akan menjadi tujuan penelitian ini.

Leave a comment