Punya 3 NPWP: Apa Kata Dunia?

28 03 2008

Sistem di kantor pajak ternyata belum begitu bagus. Sekitar awal tahun 2006, saya mengajukan aplikasi untuk membuat NPWP atas inisiatif sendiri. Satu tahun kemudian, karena saya ada transaksi jual beli, kantor pajak, tanpa setahu saya, membuatkan lagi NPWP untuk saya 😦 . Lanjutannya lagi, karena di tahun 2008 akan diberlakukan sistem pelayanan pajak pratama, semua pegawai kantor saya yang mempunyai pendapatan di atas PTKP (Pendapatan Tidak Kena Pajak) diharuskan untuk punya NPWP. Jadilah dengan sepihak lagi, kantor pajak bikin lagi untuk saya 😦 😦 . Padahal, yang mengurus pembuatan NPWP dari kantor sudah melampirkan nama-nama pegawai yang sudah punya NPWP pada saat pengajuan aplikasi. Jadilah saya punya 3 NPWP.

Tanggal 31 Maret 2008 ini, adalah batas akhir yang punya NPWP nyetor SPT tahunan. Kantor pajak mengirimkan tiga surat pemberitahuan untuk melaporkan SPT tahunan secara terpisah ke alamat saya untuk ke-tiga NPWP tersebut. Padahal, sekitar 6 bulan yang lalu, begitu saya tahu saya punya 3 NPWP, saya sudah membuat surat permohonan untuk menghapus 2 NPWP terakhir. Ternyata sistem di kantor pajak ini, belum dikembangkan dan berjalan dengan baik ya. Benar-benar, APA KATA DUNIA nanti?





Catatan Tentang kNN Algorithm

27 03 2008

Kebetulan di milis indo-dm ada diskusi panjang tentang kNN algorithm, saya buat post untuk catatan.

Definisi: kNN algorithm merupakan metode pengklasifikasian data yang bekerja relatif dengan cara yang lebih sederhana dibandingkan dengan metode pengklasifikasian data lainnya. Algorithm ini berusaha mengklasifikasikan data baru yang belum diketahui class-nya dengan memilih data sejumlah k yang letaknya terdekat dari data baru tersebut. Class terbanyak dari data terdekat sejumlah k tersebut dipilih sebagai class yang diprediksikan untuk data yang baru. k umumnya ditentukan dalam jumlah ganjil untuk menghindari munculnya jumlah jarak yang sama dalam proses pengklasifikasian.

Beberapa hal yang diperhatikan untuk menggunakan algoritma ini dengan efektif dan dapat menghasilkan pengklasifikasian dengan akurasi tinggi antara lain:

  • Pemilihan k: Pemilihan jumlah k yang paling tepat perlu dijajaki agar error rate bisa diperkecil. Dalam diskusi di indo-dm, Mas Anto menjelaskan bahwa pemilihan nilai k dapat dilakukan dengan coba-coba dengan cara seperti berikut ini:

    ——————————————————————————————-

    Misalnya ada 30 ribu sampel. Pilih secara random:
    10 ribu sampel dipakai untuk “training” set
    10 ribu sampel dipakai untuk validation-set
    10 ribu sampel dipakai untuk test-set

    1. Pilih k=1
    2. Asumsinya kita pakai complete storage k-nearest neighbor, jadi seluruh data pada training set dipakai sebagai prototype. Pakai training set untuk klasifikasi data pada validation-set dengan k=1. Catat score-nya, misalnya classification rate pada validation set.
    3. Update k = k + 2.
    4. Kembali ke step 2, dengan k yang baru

    Misalnya eksperimen sudah dilakukan hingga k=11. Selanjutnya tentukan k yang terbaik, yang ditunjukkan dari score yang diperoleh. Misalnya saat k=5 scorenya tertinggi. Selanjutnya pakai k=5 untuk menguji akurasi final pada test-set. Yang dipakai tentunya training set dan test set, sedangkan validation-set tidak dipakai lagi. (Catatan sendiri: Ini mungkin kalau ingin memperbandingkan akurasi pengklasifikasian yang didapat dengan kNN dengan akurasi pengklasifikasian menggunakan classifier yang lain.)

    Sumber: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (Springer)

    ——————————————————————————————-

  • Feature Selection: Untuk meningkatkan tingkat akurasi pengklasifikasian, satu hal yang juga bisa dilakukan adalah dengan melakukan feature selection. Berbeda dengan Neural Network, dimana setiap input diberikan bobot yang berbeda-beda, kNN tidak memberikan bobot (weight) pada data inputnya. Dengan kata lain, semua data input mempunyai bobot (weight) dengan nilai 1. Untuk menghilangkan feature yang irrelevant, perlu dilakukan feature selection.

    Untuk melakukan feature selection, ada banyak alternatif yang bisa digunakan dan harus dicoba-coba untuk mencari yang cocok. Ada dua jenis yang dibicarakan dalam diskusi yaitu tipe filter dan tipe wrapper. Tipe filter mempunyai low computation cost sedangkan tipe wrapper umumnya sangat time consuming. Filter method menggunakan intrinsic statistical properties dari data. Contohnya: Individual Merit-Base Feature Selection dengan selection criterion: Fisher Criterion, Bhattacharyya, Mahalanobis Distance atau Divergence. Metode filter ini memilih suatu feature subset secara independen terhadap kNN classifier dan dilakukan pada tahapan preprocessing.

    Untuk tipe wrapper, selection criterion memanfaatkan classification rate dari k-nearest neighbor. Untuk menghindari time consuming, proses pemilihan umumnya cukup dengan menggunakan classification rate saat k=1. Untuk tipe wrapper, perlu untuk terlebih dahulu melakukan feature subset selection sebelum menentukan subset mana yang mempunyai ranking terbaik. Feature subset selection bisa dilakukan dengan metode sequential forward selection, sequential backward selection, sequential floating selection, GA, among others. Selain dua metode di atas ada juga metode embedded selection yang memanfaatkan suatu learning machine dalam proses feature selection.

    Sumber: J.Kittler, “Feature Selection & Extraction”, in Handbook of Pattern Recognition and Image Processing, Tzay Y. Young, King Sun Fu Ed. Academic Press, 1986.

  • Feature Scaling: berfungsi untuk mengkonversi variable (feature) asli ke dalam bentuk variabel (feature) bayangan yang merupakan cerminan gabungan dari feature-feature yang diikutkan dalam proses pengklasifikasian. Cerminan gabungan ini berisikan variabel summary yang terkait erat dengan kelas-kelas model yang menjadi tujuan pengklasifikasian.

    Beberapa metode yang dapat digunakan untuk melakukan feature scaling antara lain Principal Component Analysis (PCA), Multidimensional Scaling (MDS) dan metode-metode sejenisnya. Yang perlu diperhatikan dalam melakukan feature selection dan feature scaling adalah adanya kemungkinan informasi yang berguna terabaikan dan keadaan pengklasifikasian tidak benar-benar mencerminkan keadaan lapangan karena adanya loss of information tersebut.

  • Searching Algorithm (Indexing Algorithm): Untuk mempercepat proses pencarian data terdekat sejumlah k, khususnya untuk data dalam jumlah besar, pemilihan searching algorithm dalam bentuk indexing algorithm dapat meningkatkan keefektifan proses pengklasifikasian. Ada beberapa searching algorithm yang bisa digunakan termasuk Linear Scan, Kd-trees, Ball-trees, Metric-trees, Locality Sensitive Hashing (LSH) dan Agglomerative Nearest Neighbour.

    Sumber: Ian Witten, “Data Mining Practical Machine Learning Tools and Techniques”.

Beberapa property dari kNN algorithm:

  • k bertambah seiring dengan pertambahan jumlah data
  • Seiring dengan jumlah data yang makin banyak dan mendekati infinity, error rate dari kNN algorithm tidak akan mencapai dua kali error rate dari Bayesian Classifiers. Dengan kata lain:

    P(nb) < P(nn) < P(nb) * (2 – (P(nb) * (M / (M-1) ) ) ) < 2*P(nb)

    Atau :

    P(nb) < P(nn) < 2*P(nb)

    Sumber: Nils J. Nilsson, “Introduction to Machine Learning”; Ville Kyrki, Pattern Recognition

Mas Anto Satriyo Nugroho juga membuat catatan tentang kNN Algorithm dari diskusi yang pernah dilakukan terdahulu.





A Trip to Jembatan Tukad Bangkung

24 03 2008

Petunjuk jalan menuju desa Pelaga, bisa dilihat di bagian bawah tulisan ini.

Hari Jumat tanggal 21 Maret 2008, dalam rangkaian liburan panjang Paskah dan Maulid Nabi, saya sekeluarga bertamasya ke desa Pelaga, Kabupaten Badung, Provinsi Bali, untuk melihat Jembatan Tukad Bangkung yang diklaim sebagai jembatan tertinggi di Asia dengan spesifikasi ketinggian pilar 71,14 meter.

Jembatan Tukad Bangkung Kami sangat kagum melihat ketinggian jembatan tersebut. Jembatan tersebut menghubungkan dua bukit di ketinggiannya, sehingga ruang yang tampak di sekitarnya begitu luas yang diisi dengan pemandangan penuh dari puncak gunung dan langit. Sungguh tempat refreshing yang nyaman. Tukad Bangkung sendiri dulunya adalah daerah yang cukup terisolir, terletak di antara pegunungan tinggi, dan untuk melaluinya harus melintasi jalan kecil yang naik turun lembah dan gunung. Dengan jembatan ini, tiga kabupaten yang dulunya tidak dapat terhubung langsung melalui tempat ini yaitu Badung, Bangli dan Buleleng, sekarang sudah bisa dilalui dengan nyaman.

Tentunya, untuk menerapkan prinsip sekali kayuh dua tiga pulau terlampau, kami juga mencari hal-hal lain yang bisa dinikmati di sana. Mum, Aya dan Kiya di Air Terjun NungnungSelain jembatan tersebut, ada beberapa tempat yang kami kunjungi yang membuat tamasya kami kali ini sangat-sangat mengesankan, yang akhirnya membuat kami spent our day time all in desa Pelaga dan sekitarnya. Ada beberapa tempat menarik selain jembatan yang juga bisa dikunjungi sepanjang perjalanan maupun di sekitar jembatan. Sebelum sampai di Jembatan Tukad Bangkung kita bisa singgah dulu di Air Terjun Nungnung yang namanya memang belum seterkenal Air Terjun Gitgit. Kami menyusuri tangga yang lumayan banyak jumlahnya, turun ke lembah sungai untuk melihat air terjun dari jarak dekat. Tangga-tangga menuju ke air terjun sudah tersedia dengan cukup memadai. Air terjunnya sendiri terletak di lembah yang lebih mendekati gua, dengan suasana hijau daun dan lelumutan. Setelah puas melihat air terjun dan sedikit kelelahan saat kembali naik dari lembah air terjun, kami juga menikmati makan siang di bale-bale kecil yang disediakan di sepanjang jalan setapak menuju air terjun tersebut.

Kiya di Jembatan Tukad Badung Setelah menikmati makan siang, kami meluncur menuju Jembatan Tukad Bangkung. Di jembatan tersebut kami duduk-duduk di warung kopi untuk bisa lebih menikmati pemandangan jembatan tersebut sambil menikmati kopi panas dan buah durian yang dijual di warung tersebut. Kami mengambil beberapa foto pemandangan untuk kenang-kenangan, salah satunya adalah foto di samping (Kiya dengan latar belakang jembatan). Hamparan pemandangan di sana memang sangat menyejukkan mata. Gambar Jembatan Tukad Bangkung KiyaAya dan Kiya juga menyibukkan diri menggambar jembatan Tukad Bangkung tersebut dengan sketch book mereka, yang salah satu hasilnya ada di samping kanan ini. Kami duduk di sana hampir sekitar satu setengah jam.

Setelah puas menikmati pemandangan Jembatan dan sekitarnya, kami kemudian melanjutkan perjalanan untuk melihat Agro Wisata Bagus yang ada di dekat jembatan tersebut. Aya dan Kiya di Agro Wisata BagusWalaupun pemandangan dari agro wisata tersebut sangat indah, tetapi kami tidak bisa melakukan kunjungan ke taman buah dan melakukan pemetikan. Saya sempat berbincang dengan seorang pegawai agro tersebut, yang menyatakan bahwa proyek Agro Wisata Bagus memang sedang bermasalah dalam hal keuangan dan konsep. Dulunya banyak buah-buahan dan sayur-sayuran yang ditanam di sana. Kelebihannya lagi, buah dan sayur tersebut dipelihara secara organik. Tetapi sekarang ini, karena permasalahan konsep agro wisata yang masih belum cocok antara pemilik dan pengelolanya dan juga permasalahan keuangan pendukungnya, untuk sementara agro tersebut tidak dioperasikan. Kami sendiri ingin agar proyek tersebut bisa secepatnya beroperasi kembali. Karena nikmatnya memetik buah dan sayur organik serta memasak dan memakan masakannya, di tempat dengan pemandangan yang nyaman seperti di sana, menjadi imajinasi yang cukup indah di pikiran kami.

Walaupun begitu, secara keseluruhan, perjalanan kami ke desa Pelaga, yang utamanya untuk melihat Jembatan Tukad Bangkung, berubah menjadi satu hari yang sangat mengesankan dan memberikan suasana refresh kepada kami untuk melakukan kembali kegiatan rutin sehari-hari.

Travelling Bali Part 1 Direction: Untuk menuju desa Pelaga, dimana Jembatan Tukad Bangkung itu berada, kami berangkat dari kota Denpasar dengan masuk ke Jalan Ahmad Yani dari Jalan Gatot Subroto, Denpasar. Kami ikuti saja jalan ke arah utara dan hanya perlu belok ke kiri di pasar Desa Mambal. Setelah itu, hanya mengikuti jalan besar saja untuk sampai di desa Pelaga. Air Terjun Nungnung, terletak di desa Nungnung kira-kira 5 km sebelum Jembatan. Agro Wisata Bagus bisa dicapai dengan berbelok ke kiri di pertigaan sebelum masuk jalan baru menuju Jembatan. Agro wisata tersebut terletak kira-kira 1 km dari pertigaan tersebut. Letak absolut desa Pelaga dapat dilihat dengan membuka peta Pulau Bali melalui thumbnail peta di atas. Letak desa Pelaga ditandai dengan angka nomor [1].





My Mixture Modelling Page

19 03 2008

Yudi Agusta’s mixture modelling page has been just started. Hope this of any use.





Rule Mining In Relational Database

17 03 2008

Relational database memang mempunyai tingkat aplikasi yang sangat tinggi di masyarakat. Sekarang ini berbagai sistem penyimpan data dan informasi dikembangkan dengan basis relational database. Sebagai perkembangan yang lain, keilmuan seperti Data Mining sudah juga masuk ke sistem relational database, sehingga tidak heran nantinya, tidak hanya sistem relational database saja yang bisa digunakan orang tetapi paket ‘Intelligent Relational Database System’ juga akan muncul.

Saya sedang membaca suatu paper yang secara khusus membahas tentang association rule mining terhadap relational database untuk bahan internship. Saya cari di google, memang banyak yang telah melakukan pengimplementasian Apriori Algorithm untuk mining rule di dalam relational database. Tahapannya mungkin sekarang ini sudah pada tahap mencari metode yang efektif dari segi waktu dalam memecahkan masalah, karena paper yang banyak saya temukan rata-rata mempunyai tahun sekitar akhir 90-an.

Salah satu paper yang saya baca mengetengahkan bagaimana melakukan rule mining pada RDBMS. Berbeda dengan proses mining pada data plain, seperti barang belanjaan, ada hal-hal yang harus diperhatikan pada saat melakukan mining terhadap RDBMS yaitu bahwa data terstruktur dengan ketentuan ada Primary Key dan Field pengikutnya dan ada relasi antar tabel yang menjadi objek query. Masih banyak mungkin yang perlu diperhatikan, dan dalam kesempatan nanti saya ingin melihat lebih dalam lagi.

Ada yang sudah pernah melakukan penelitian di bidang ini?