DWHとは?BIツールとの関係
BIツールは、営業や製造、人事、労務などあらゆる部門において生成・収集されるデータを一元管理・分析できるツールです。予実管理を始め企業における経営判断の材料としてデータを活用するために、もはや必須といえるでしょう。
BIツールの導入を検討していると、DWH(データウェアハウス) という用語が目に付くのではないでしょうか。ではDWHとは、一体何を指す言葉なのでしょう?
今回はDWHとは何かをBIツールと比較しながらご紹介します。
1.DWHとは?
DWHとは、Data Warehouse(データウェアハウス) の頭文字を取ったもので、直訳すると「データの倉庫」となります。
企業などで利用されている基幹システムや業務システムといった複数のシステムからデータをすべて集めた大規模なデータベースのことで、データを時系列・内容(サブジェクト)別に保存できる点が特徴です。
DWHは1990年代に登場し、2010年代にクラウドが普及してからはより高性能なものが従量課金制で提供されるようになりました。
2.DWHとBIツールの違い
DWHは、冒頭でお伝えしたBIツールを活用するために欠かせないプロセス(もしくはツール)です。BIツールはDWHに蓄積された膨大なデータから、必要なデータを抽出して集計したり可視化したり分析したりするのです。
つまりDWHとBIツールでは、データに対する役割が異なります。
ただし、DWHがBIツールの一つとして位置づけられたり、DWHを含めてBIツールとしたりすることもあります。
DWHの前段階でデータを集約するプロセスとしてETLがあります。
3.DWHとBIの活用を最大化するETLとは
ETLとは、Extract、Transform、Loadの頭文字を取ったもので、以下の一連の流れ(工程)やこれを担うツールを差します。
・Extract…データを抽出する
・Transform…抽出したデータを変換・加工する
・Load…変換・加工済みのデータをDWHへ格納する
冒頭でDWHが「基幹システムや業務システムといった複数のシステムからデータをすべて集めた大規模なデータベース」であるとお伝えしましたが、各所からデータを集めてデータベース化する役割を担っているのがETLです。
大量データの変換・加工を得意とし、高速処理が可能です。
ETLがなければDWHも実現できませんし、それに続くBIも実現できません。
概念としては1970年代頃から提唱されてきましたが、近年BI実現のためにDWHを構築する際に発生するプロセスとして知られるようになりました。
以前はETLの実装はスクラッチ開発で行われてきましたが、1990年代後半からはETLツールが登場し活用されるようになりました。
4.まとめ
「データドリブン」という言葉がビジネスのさまざまな場面で使われるようになり、いまやデータの分析、活用は企業の成長には欠かすことのできない要素になってきています。
ETLツール、DWH、BIツール、これらがオールインワンになったツールなどデータを扱うためのツールはさまざまなものが出回っていますが、何をどのように活用するのかを慎重に検討し、自社に最適な分析方法、ツールを選びましょう。