Pelajaran pertama dari tutorial ETL Kettle, kita coba jelaskan cara membuat transformasi sederhana menggunakan aplikasi Spoon, yang merupakan bagian dari suite Pentaho Data Integrasi.
Transformasi pada contoh kita akan membaca catatan dari tabel di database Oracle, dan kemudian akan memfilter dan output ke dua file teks terpisah. Jadi terdapat filter mirip true/false, dimana salah satu kondisi akan keluar di file yang lain.
Diasumsikan spoon sudah diinstal dengan benar, hal pertama yang harus dilakukan setelah menjalankan itu adalah konfigurasi repositori. Setelah 'Pilih repositori' jendela muncul, penting untuk membuat atau memilih salah satu. Repositori adalah tempat di mana semua tool Kettle akan disimpan - dalam tutorial ini akan menjadi database Oracle.
Untuk membuat repositori baru klik tombol 'New' dan ketik parameter koneksi di 'informasi Connection' jendela. Ada beberapa pilihan yang sangat berguna di layar, satu adalah 'test' yang memungkinkan pengguna untuk menguji koneksi baru dan yang lainnya adalah 'explore' yang memungkinkan pengguna menelusuri skema database dan mengeksplorasi objek database.
Setelah mengklik 'Create or Upgrade' repositori baru dibuat. Secara default, pengguna dengan hak administrator diciptakan - nama login itu adalah admin dan password juga admin. Sangat disarankan untuk mengganti password setelah login terlebih dahulu. Ketika selesai "OK" maka akan tergenerate sejumlah 42 tabel dengan awalan R_****. Schedule bisa dibuat jika koneksi repository sudah terbentuk.
Terbatasnya pengetahuan teknologi informasi di Indonesia khususnya business intelligence data warehouse data mining menjadi perhatian tersendiri, sehingga berinisiatif memunculkan web-blog ini. Sekedar sharing sistem datawarehouse, datamart, ataupun business intelligent mulai dari ER Desain/Star Schema,ETL, Reporting, hingga training. Tool yang digunakan (Data Stage, (Kettle, Mondrian, BI Server, Weka) Pentaho , Jasper, Sagent, Business Object, dll)
Tidak ada komentar:
Posting Komentar