Piece of My Wish by 今井美樹

28 07 2008

Piece of My Wish by 今井美樹 (Imai Miki). A peaceful lovely song can calm you down a little bit.

Lyrics:

Asa ga kuru made naki tsuzuketa yoru mo
Arukidaseru chikara ni kitto dekiru

Taiyou wa nobori kokoro o tsutsumu deshou
Yagate yami wa kanarazu akete yuku kara

Doushite motto jibun ni sunao ni ikirenai no
Sonna omoi toikake nagara
Akiramenai de subete ga kuzure sou ni natte mo
Shinjiteite anata no koto o

Hontou wa dare mo ga negai o kanaetai no
Dakedo umaku yukanai toki mo aru wa

Kibou no kakera o te no hira ni atsumete
Ooki na yorokobi e to kaete yukou

Ai suru hito ya tomodachi ga yuuki zukete kureru yo
Sonna kotoba dakishime nagara
Dakedo saigo no kotae wa hitori de mitsukeru no ne
Meguri tsuzuku ashita no tame ni

Ame ni makenai kimochi o honoo mo kuguri nukeru
Sonna tsuyosa mochi tsuzuketai
Sore de mo itsuka subete ga kuzure sou ni natte mo
Shinjiteite anata no koto o
Shinjiteite hoshii anata no koto o

Japanese Lyrics:

朝が来るまで 泣き続けた夜も
歩きだせる力に きっと出来る

太陽は昇り 心をつつむでしょう
やがて闇はかならず 明けてゆくから

どうしてもっと自分に 素直に生きれないの
そんな思い 問いかけながら
あきらめないですべてが 崩れそうになっても
信じていて あなたのことを

本当は誰もが 願いを叶えたいの
だけどうまくゆかない 時もあるわ

希望のかけらを 手のひらにあつめて
大きな喜びへと 変えてゆこう

愛する人や友達が 勇気づけてくれるよ
そんな言葉 抱きしめながら
だけど最後の答えは 一人で見つけるのね
めぐり続く 明日のために

雨に負けない気持ちを 炎もくぐりぬける
そんな強さ 持ち続けたい
それでもいつかすべてが 崩れそうになっても
信じていて あなたのことを
信じていて欲しい あなたのことを





Document Clustering

24 07 2008

Document Clustering adalah suatu kegiatan mengelompokkan dokumen berdasarkan pada karakteristik yang terkandung di dalamnya. Proses analisa document clustering pada intinya ada dua tahapan: yang pertama mentransformasi document ke dalam bentuk quantitative data dan yang kedua menganalisa dokumen dalam bentuk quantitative data tersebut dengan metode clustering yang ditentukan. Untuk proses tahapan kedua ada berbagai jenis metode clustering yang bisa digunakan. Lihat tulisan saya mengenai clustering, k-means, mixture modelling atau tulisan-tulisan clustering lainnya.

Yang umumnya menjadi permasalahan dalam pelaksanaan document clustering ini adalah bagaimana cara merepresentasikan dokumen ke dalam bentuk data quantitative. Ada beberapa cara yang umum digunakan, salah satunya adalah vector space model yang merepresentasikan dokumen ke dalam bentuk vector dari term yang muncul dalam dokumen yang dianalisa. Salah satu bentuk representasinya adalah term-frequency (TF) vector yang bisa dilambangkan dengan:

dtf = (tf1, tf2, . . . , tfm)

dimana
tfi: adalah frekuensi dari term ke-i di dalam suatu dokumen.

Model ini biasanya diperbaiki dengan memberikan weight untuk setiap term dengan alasan term yang sering muncul dalam banyak dokumen tidak mempunyai descriminant power. Dengan alasan ini mereka perlu untuk di-de-emphasised. Ini umumnya dilakukan dengan mengalikan frekuensi yang ada dengan log(N/fi) dimana N adalah jumlah dokumen yang ada dan dfi adalah jumlah dokumen yang mengandung term ke-i. Sehingga didapatkan suatu tf-idf representasi sebagai berikut:

dtfidf = (tf1 log(N/df1), tf2 log(N/df2), . . . , tfm log(N/dfm))

Untuk mengakomodasikan, dokumen dengan panjang berbeda, panjang dokumen dinormalisasikan menjadi suatu unit length, dimana 1 dtfidf = 1 yang artinya setiap dokumen adalah suatu vector dalam unit hypershpere.

Referensi:
G. Salton (1989). Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. Addison-Wesley.





Waterbom – Kuta Bali

21 07 2008

Petunjuk menuju Waterbom ada di bagian bawah tulisan ini.

Waterbom - Waterbom Tanggal 20 Juli 2008 kemaren, kami sekeluarga pergi ke Waterbom Kuta Bali. Ada dua alasan kenapa kami pergi ke sana. Yang pertama, saat liburan Aya n Kiya, saya ada tugas ke Jakarta, jadi tidak sempat mengantar maen. Sebagai gantinya, kami mengantar mereka untuk bermain air di Waterbom ini. Kemudian yang kedua, hari ini tanggal 21 Juli, ulang tahun saya. Jadi kami sepakat untuk pergi ke Waterbom. Maunya sih hari ini, tetapi karena hari kerja, yah diduluin saja acaranya, sementara makan-makannya menyusul.

Waterbom - Boomerang Kami ke Waterbom dengan persiapan yang seadanya. Jam buka Waterbom pun kami hanya tanyakan per telpon pagi sebelum berangkat, yang kemudian kami ketahui buka jam 09:00 pagi. Biaya masuknya pun bisa berbeda-beda, dengan beberapa option, harga untuk family, harga untuk student, harga untuk pemegang kartu kredit VISA dan lain-lain, yang kalau dijelaskan bisa puanjang sekali. Yang pasti kalau dihitung per orang Rp150.000 per orang adalah angka yang fair. Sebagai persiapan yang laen, kami menyiapkan pakaian renang dan gogle. Tetapi untuk bermain di Waterbom tidak harus menggunakan swimming suits, bisa dengan baju kaos dan celana pendek. Malah dengan swimming suits agak sedikit kewalahan pada saat main sliding. Tetapi untuk berenangnya, lebih enak pakai swimming suits. Hanya saja, saat saya main sliding, ada satu orang yang tidak diberkenankan main karena memakai celana jeans. Mungkin celana jeans bisa menimbulkan panas kalau bergesekan dan bisa menimbulkan luka bakar. Gogle perlu juga agar mata terhindar dari kemasukan air.

Waterbom - Nasi Goreng Yang laennya, kita secara umum tidak diperkenankan untuk membawa makanan, tetapi di sana sini ada juga kelompok-kelompok yang membawa makanan termasuk makanan siang untuk dimakan di dalam. Kami juga mempersiapkan makanan ringan, sedangkan makan siang kami beli dari restoran setempat. Tetapi memang harga makanan di area Waterbom bisa dua kali lipat harga makanan di luar. Untuk keperluan belanja belanja, Waterbom mempunyai sistem deposit, dimana kita menyimpan sejumlah uang sebagai deposit dan kita diberikan barcode dalam bentuk gelang (seperti yang melingkar warna biru di tangan maminya anak-anak), dan kemudian dalam berbelanja kita hanya memperlihatkan barcode untuk discan, dan terakhir nanti kalau depositnya sisa kita bisa mengambil uangnya kembali.

Waterbom - Mum RelaxWaterbom menyediakan tempat-tempat duduk dan gazebo untuk bersantai. Tetapi untuk gazebo kita perlu membayar Rp100.000 untuk memakainya. Kami memilih kursi-kursi santai di bawah pohon di dekat seluncuran boomerang, yang setiap saat diramaikan oleh teriakan orang-orang yang meluncur di permainan itu. Setelah mengamati saat kami bersantai, ternyata jenis teriakan orang itu bisa beda-beda ya. Karakter orang juga bisa kelihatan dari teriakan itu kali ya. Waterbom secara umum, memberikan beberapa jenis permainan air. Permainan air untuk anak-anak kecil termasuk sliding yang berskala kecil, water bucket, kolam renang anak-anak, yang cukup memberikan kepuasan bagi anak-anak untuk bermain air. Untuk orang dewasa ada beberapa jenis permainan termasuk di dalamnya: Boomerang, Super Ball, Jungle Ride, Smash Down, Raft River, Macaroni, Race Track. Semuanya bisa dihafal, karena saya sendiri mencoba semua permainan itu. Kalau saya diminta mengurutkan permainan tersebut, dari tingkat adrenalin yang bisa dipicu, bisa diurutkan seperti ini: Smash Down, Boomerang, Race Track, Jungle Ride, Macaroni, Super Ball, Raft River (Dari yang adrenalin yang tertinggi sampai yang terendah).

Waterbom - Kiya SlidingWaterbom - Water BucketWaterbom - Boomerang Super BallWaterbom - Slidings

Waterbom - Mum Lazy River Selain permainan tersebut ada juga Lazy River yang bisa dinikmati dengan memakai ban pelampung sambil bersantai. Beberapa kali kami keliling Lazy River ini, dan terutama satu jam terakhir kami di sana. Ini fotonya mum, tidak sengaja di jungkir balikkan, tetapi karena posisinya waktu difoto dari atas jembatan di atas Lazy River, memang sedang terbalik. Saya dengan Aya berkeliling di atas ban pelampung, untuk sedikit menghilangkan rasa capai karena kita harus naik ke menara hampir 25 kali dalam mencoba permainan. Ada satu point dari Lazy River ini yang enak untuk dicoba yaitu air kucuran yang lumayan deras. Ternyata jatuhan air yang deras itu lumayan enak untuk dipakai sebagai tukang pijat. Saat berada di Lazy River sebelum pulang, kami sempat diam di bawah jatuhan air tersebut beberapa menit untuk mendapatkan pijat gratis.

Waterbom - Aya Kiya Lazy RiverWaterbom - Lazy River

Waterbom sendiri tutup jam 18:00 dan setengah jam sebelum tutup, ada pengumuman bahwa arena bermain Waterbom akan ditutup dalam 30 menit.

Travelling Bali Part 1 Direction: Untuk mencapai Waterbom, Kuta Bali, anda hanya perlu menuju jalan Kartika Plaza, yang jaraknya hanya sekitar 10 menit dari bandara. Dari pintu keluar Bandara Ngurah Rai, anda hanya perlu belok ke kiri, dan belok ke kiri lagi saat ada pertigaan. Waterbom ada di depan Discorvery Shopping Mal di Jalan Kartika Plaza tersebut. Letak absolut Waterbom dapat dilihat dengan membuka peta Pulau Bali melalui thumbnail peta di samping. Letak daerah tersebut tersebut ditandai dengan angka nomor [6].





Decision Trees

16 07 2008

Decision Trees sering disebut juga dengan nama Regression Trees atau Pohon Keputusan.

Decision Trees adalah suatu metode data mining yang bersifat supervised classification dimana setiap record di dalam suatu dataset yang akan dimodel harus mempunyai class/category. Misalnya dataset yang tersedia untuk pemodelan Decision Trees terdiri dari:

Jumlah Anggota Rumah Tangga, Jenis Lantai, Jenis Jamban, Luas Lantai, Miskin/Tidak Miskin

Empat variabel pertama disebut dengan predictor dan satu variabel terakhir adalah class atau category.

Decision trees secara khusus melakukan pemodelan dengan berusaha memodel record yang tersedia ke dalam bentuk pohon keputusan. Dimana dalam suatu pohon keputusan akan ada interior node yang dilabeli dengan suatu variabel. Dari setiap interior node akan keluar tanda panah yang dilabeli dengan nilai dari variabel yang ada pada interior node tersebut. Di bagian akhir pohon keputusan akan terdapat leaf yang dilabeli dengan class atau category. Dalam penggunaannya, atau dalam pengimplementasian model decision trees ini ke dalam suatu sistem (umumnya sistem pendukung keputusan), model pohon keputusan yang didapat perlu diekstrak ke dalam bentuk rule-rule yang berbentuk if – then.

Secara teori, ada dua hal yang perlu diperhatikan dalam melakukan pemodelan decision trees:
1. Bagaimana memilih variabel yang akan diletakkan pada suatu interior node? Variabel mana yang akan dipilih terlebih dahulu?
2. Bagaimana cara memodel agar model decision trees yang didapatkan cukup efektif? Dalam artian occam razor, dimana model yang didapat tidak terlalu fit (overfit), tetapi semua keputusan masih dapat diambil dengan tingkat kesalahan yang kecil.

Untuk menjawab kedua pertanyaan tersebut, ada beberapa metode yang bisa diaplikasikan. Untuk pertanyaan pertama, apakah suatu variabel bisa lebih dulu dipilih dari yang lainnya, dapat dihitung menggunakan Information Gain. Information Gain digunakan untuk menentukan berapa banyak informasi yang bisa diberikan oleh variabel tersebut terhadap category yang ada. Variabel yang memiliki nilai information gain tertinggi, akan dipilih sebagai variabel yang digunakan pada interior node yang sedang dikaji. Secara teori, information gain dirumuskan sebagai berikut:

G(E,f) = H(E) – H(E|f)

dimana:
G(E,f) adalah jumlah informasi baru yang diberikan oleh variabel f
H(E) adalah entropy dari suatu event E
H(E|f) adalah expected entropy dari suatu event E, bila kita mengetahui nilai dari variabel f

Dalam hal ini, entropy dari suatu event E dapat dihitung menggunakan rumus berikut ini:

H(E) = SUM (c in C) P(c) log2 P(c)

dimana:
P(c) adalah probabilitas dari event di dalam E yang mempunyai category c.

Tetapi dengan menggunakan Information Gain saja, variabel yang dipilih umumnya variabel yang mempunyai lebih banyak nilai. Perbandingannya dapat dilihat seperti berikut ini:

– Information gain maksimum untuk variabel yang mempunyai dua nilai (binary) adalah 2, sedangkan information gain maksimum untuk variabel yang mempunyai variabel dengan 1024 nilai adalah 10.

Untuk memecahkan permasalah ini dapat digunakan Information Gain Ratio untuk menghilangkan bias tersebut dengan melakukan normalisasi terhadap nilai semua Information Gain. Information Gain Ratio dapat dihitung dengan rumus sebagai berikut:

IGR(E,f) = G(E,f) / (- SUM (v in V) P(v) log2 P(v)

dimana:
P(v) adalah nilai probabilitas dari jumlah nilai suatu variabel terhadap keseluruhan nilai variabel yang ada.

Masalah yang kedua yang ingin dipecahkan agar model yang didapatkan benar-benar efektif adalah masalah overfitting. Dalam hal ini, memang model decision trees yang benar-benar sesuai dengan record dari dataset yang tersedia, akan lebih konsisten, tetapi model seperti ini sering terlalu overfit dan kurang bisa mengeneralisasikan permasalahan. Hal yang lain yang juga terkait dengan permasalahan ini dengan masalah trade-off antara konsistensi dan compactness.

Salah satu cara yang bisa digunakan untuk memecahkan permasalahan ini adalah Pruning (Pemangkasan). Bagaimana melakukannya? Pruning bisa dilakukan dengan memanfaatkan test data untuk menguji model yang didapat dari training data. Yang artinya dataset yang ada harus dibagi terlebih dahulu menjadi dua: training dan test data. Training data digunakan untuk membuat model, dan test data digunakan untuk menentukan apakah suatu leaf perlu dipangkas atau tidak. Caranya adalah dengan menguji test data dengan leaf tersebut dan tanpa leaf tersebut. Kalau model tanpa leaf memodel lebih bagus, berarti leaf tersebut bisa dipruning.





クリスマスキャロルの頃にはby稲垣潤一

14 07 2008

クリスマスキャロルの頃には (Christmas Carol no Koro ni wa / The Season of Christmas Carol) by 稲垣潤一(Junichi Inagaki) is a very sweet and relaxing Japanese Christmas Song and brought an old 1995 memory into my mind.

Lyrics:

Kurisumasu kyaroru ga nagareru koro ni wa
Kimi to boku no kotae mo kitto dete iru darou
Kurisumasu k yaroru ga nagareru koro ni wa
Dare wo ai shiteru no ka ima wa mienakute mo

Kono te wo sukoshi nobaseba todoite ita no ni
Ichi miri nani ka tarinai ai no sure chigai
Otagai wo wakari sugite ite
Kokoro ga yosomi dekinai no sa

Kurisumasu kyaroru ga kikoeru koro made
Deau mae ni modotte motto jiyuu de iyou
Kurisumasu kyaroru ga kikoeru koro made
Nani ga taisetsu na no ka hitori kangaetai

Dare ka ga soba ni iru no wa atatakai keredo
Senaka wo moufu kawari ni daki aenai kara
Chika sugite mienai sasae wa
Hanarete mireba wakaru rashii

Kurisumasu kyaroru ga nagareru koro ni wa
Kimi to boku no kotae mo kitto dete iru darou
Kurisumasu k yaroru ga nagareru koro ni wa
Dare wo ai shiteru no ka ima wa mienakute mo

Kurisumasu kyaroru ga nagareru koro ni wa
Dou iu kimi to boku ni yuki wa furu no darou ka?
Kurisumasu kyaroru ga nagareru koro ni wa
Dou iu kimi to boku ni yuki wa furu no darou ka?

Japanese Lyrics:

クリスマスキャロルが流れる頃には
君と僕の答えも きっと 出ているだろう
クリスマスキャロルが流れる頃には
誰を愛してるのか 今は見えなくても

この手を 少し 伸ばせば 届いていたのに
1mm 何か 足りない 愛のすれ違い
お互いをわかりすぎていて
心がよそ見できないのさ

クリスマスキャロルが聞こえる頃まで
出逢う前に戻って もっと 自由でいよう
クリスマスキャロルが聞こえる頃まで
何が 大切なのか 一人 考えたい

誰かが そばにいるのは 暖かいけれど
背中を 毛布代わりに 抱き合えないから
近すぎて見えない支えは
離れてみればわかるらしい

クリスマスキャロルが流れる頃には
君と僕の答えも きっと 出ているだろう
クリスマスキャロルが流れる頃には
誰を愛してるのか 今は見えなくても

クリスマスキャロルが流れる頃には
どういう君と僕に雪は降るのだろうか?
クリスマスキャロルが流れる頃には
どういう君と僕に雪は降るのだろうか?