Data warehouse adalah kumpulan data dari berbagai sumber yang ditempatkan menjadi satu dalam tempat penyimpanan berukuran besar lalu diproses menjadi bentuk penyimpanan multidimensional dan didesain untuk querying dan reporting. Menurut Bill Inmon, data yang disimpan didalam data warehouse ini memiliki empat karakteristik, yaitu:
1. Subject oriented, data yang disimpan disesuaikan dengan proses bisnisnya
2. Integrated, semua data diintegrasikan kedalam satu media penyimpanan, dalam hal ini adalah database yang sangat besar, dimana formatnya diseragamkan.
3. Time variant, data yang disimpan bersifat historical, dan
4. Non-volatile, data cenderung tidak berubah.
Komponen Utama Data Warehouse
Tiga komponen utama Data Warehouse yaitu:
1. Data staging area Dalam tahap ini, data diolah dari sumbernya untuk siap menjawab query. Prosesnya terdiri dari extract, transform, load (ETL).
2. Data presentation area Dalam tahap ini, data diorganisasikan, disimpan dan dapat menjamin ketersediaannya akan segala kebutuhan query. Selain itu disini dilakukan juga penulisan laporan dan kebutuhan aplikasi untuk analisis selanjutnya.
3. Data access tools Penyediaan interface untuk penggunaan aplikasi untuk query data.