ビッグデータの5Vとは
ビッグデータは一般的に、
・Variety(多様性)
・Velocity(速さ)
・Volume(データ量)
の3つのVで説明されることが多いですが、近年ではここに2つのV、すなわち
・Veracity(真実性)
・Value(価値)
を加えた5つのVから成り立っているという考え方が広まっています。
本コラムでは、それぞれのVについて解説し、ビッグデータの本質に迫ります。
1.Variety(多様性)
ビッグデータが内包するデータ範囲は広く、かつてコンピュータで扱われてきた構造データのみではなく、テキストデータやメールデータ、音声データ、動画データ、ログファイル、位置情報、センサ情報、デザインデータ、SNS、為替取引データなどのさまざまな種類の非構造データが含まれます。
非構造データ自体は昔から存在しており、蓄積されていたものもありますが、これらをビッグデータとして分析し、利活用しようという点に新規性があります。
2.Velocity(速さ)
昨今のビジネス環境の変化のスピードに対応するためには、データ活用にも速さが求められます。
SNSや動画共有サイトに投稿されるデータをはじめ、POSデータ、交通系ICカードからの乗車履歴データなど、データが生成された瞬間にリアルタイムで収集・蓄積・分析することでの利活用に意義があります。
3.Volume(データ量)
ICTの進歩により、生成・収集・蓄積・分析できるデータ量は膨大になりました。
ExcelファイルやCSVファイル、固定長ファイルなどといった構造データ、さらには、テキストデータやメールデータ、音声データ、動画データ、ログファイル、位置情報、センサ情報、デザインデータ、SNS、為替取引データといった非構造データも統合し、組み合わせて分析することで、思いもよらぬ示唆が得られることがあります。
4.Veracity(真実性)
Veracityは、真実性や正確さを表します。ビッグデータの利活用にあたっては、データに紛れ込むノイズを排除し、データが正確でクリーンであることを担保することです。
また、フェイクニュースなど真実性に疑いのあるデータも存在することから、データ自体の信ぴょう性について吟味することも大切です。
5.Value(価値)
データを分析・活用することで、最終的には経済的な価値を生み出したり、社会的な課題を解決したりと価値を導き出すことが求められます。
しかし、分析結果から得られる示唆とそれを利活用に結びつける観点次第で価値の大きさも変わってくるため、BIツールなどビッグデータを取り扱う環境の構築が重要になってきます。
6.まとめ
ビッグデータと聞いて「膨大なデータ」「多様な種類のデータ」であることはイメージできても、人に説明しようとするとなかなか難しいものです。
ぜひ、上記でご紹介した5つのVの概念を理解して、ビッグデータの本質を掴んでください。
なお、上記の5つのVに「Virtue(徳)」が加えられることもあります。Virtueとは、ビッグデータを使用する際の倫理観です。ビッグデータにより匿名情報から個人が特定できるとの指摘もあり、今後ビッグデータの利活用が拡大するのに従い、ますます重視される要素だといえるでしょう。
ビッグデータを有効に利活用するためにも、上記のビッグデータの特性を押さえておきましょう。