Mining All Frequent Queries

11 08 2009

Selama dua bulan, saya men-supervisi dua orang mahasiswa asal Perancis (Lucie Copin dan Nicolas Pecheur) tepatnya dari Politech Montpellier, yang melakukan pengembangan aplikasi untuk keperluan mining all frequent queries dari sebuah Data Warehouse. Basis teori yang digunakan untuk aplikasi tersebut adalah paper berikut:

Tao-Yuan Jen, Dominique Laurent, and Nicolas Spyratos (2008). Mining all frequent projection-selection queries in a star schema database. Proceedings of the 11th International Conference on Extending Database Technology: Advances in Database Technology, pp. 368-379, ACM New York, NY, USA.

Selama dua bulan, mereka berusaha untuk mengertikan teori dan algoritma yang dituangkan di dalam paper tersebut, berusaha menganalisanya untuk bisa dituangkan ke dalam suatu sistem aplikasi yang efektif, kemudian membuat laporan dan melakukan presentasi terhadap aplikasi yang mereka hasilkan. Teori dan algoritma yang dituangkan di dalam paper tersebut memang tergolong rumit, dan untuk bisa mengertikannya memerlukan kerja keras. Beruntungnya mereka datang berdua, sehingga mereka bisa mendiskusikan apa yang sulit untuk dicerna.

Dari apa yang tertuang di paper dan apa yang dijelaskan dari kedua mahasiswa ini, pada intinya aplikasi yang dibuat, akan mendapat masukan/input berupa sebuah data warehouse, dan kemudian menghasilkan keluaran/output berupa jenis-jenis query yang menghasilkan record dengan jumlah yang lebih banyak atau sama dengan threshold yang ditentukan.

Adapun beberapa proses yang dilakukan di dalam algoritma tersebut adalah proses men-generate queries, proses pruning dan proses scanning. Proses generate adalah proses untuk menghasilkan semua class query yang bisa dihasilkan dari keadaan yang ada sebelumnya. Proses pruning adalah proses untuk memotong anak class query yang parent querynya tidak frequent. Proses scanning adalah dari class query yang tersisa diperiksa query mana saja yang merupakan query dengan frekuensi di atas threshold.

Sistem ini dikembangkan oleh dua orang internship dari Perancis ini dalam 3 bulan. Waktu yang tidak panjang untuk mengertikan sekaligus untuk mengembangkan sistemnya. Hasil pengembangan sistem ini juga telah dipublikasikan dalam bentuk demonstration paper dengan bibliography sebagai berikut:

Lucie Copin, Nicolas Pecheur, Anne Laurent, Yudi Agusta, Budi Sentana, Dominique Laurent, Tao-Yuan Jen: DBFrequentQueries: Extraction de requêtes fréquentes. Jean-Gabriel Ganascia, Pierre Gançarski (Eds.): Extraction et gestion des connaissances (EGC’2009), ISBN 978-2-85428-878-0, Actes, Strasbourg. Page 499


Actions

Information

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s




%d bloggers like this: