ビッグデータとAI ~関係性、その課題~
ビッグデータについて語るとき、AIの存在を無視することはできません。
ビッグデータは、そのままでは利活用することができず、BIツールなど分析のためのシステムが必要となり、そこにAIが活用されているケースも多いです。また逆に、一定レベル以上のAI開発を行う際も、ビッグデータが必要になります。
本コラムでは、ビッグデータとAIの関係性と、ビッグデータとAIが抱える課題について、ご紹介します。
【関連記事】
ビッグデータとは ~基礎知識から活用法~
ビッグデータの5Vとは
1.ビッグデータの定義
ビッグデータとは、日々、膨大に生成・蓄積されるさまざまな種類・形式のデータを指します。
ビッグデータ以前から利活用されてきたデータは、コンピューターで分析しやすい構造化データ(「列」と「行」の概念を持つデータ)でしたが、ビッグデータには、テキストデータや電子メール、デザインデータ、音声データ、動画データ、センサーから得られるデータなどの非構造化データが含まれます。
また、ビッグデータの特徴については、Variety(多様性)、Velocity(速さ)、Volume(データ量)、Veracity(真実性)、Value(価値)の5つのVで説明できます。
2.ビッグデータとAIの深い関係性
AI(人工知能)という言葉が世の中に浸透したのは、2006年のディープラーニング(深層学習)、2010年代以降のビッグデータの登場がきっかけだといわれています。
冒頭でもお伝えしましたが、ビッグデータはそれだけで利活用することはできません。分析したり可視化したりし、経営の判断材料として使うには、BIツールやAIが必要となります。
また逆に、AIの開発過程においてもビッグデータが必要になります。たとえば、自動翻訳を行うAIを開発しようとする場合、大量の対訳データを訓練データとして機械学習に使用します。もう一つ上のレベルのAI(自動運転など)ではディープラーニングを取り入れますが、このときもビッグデータから特徴を見つけ出すことで、人間のような判断を行うことができるようになります。
3.ビッグデータとAIの課題とは
前章でお伝えしたようにビッグデータとAIの関係性は深く、組み合わせて活用することで、人間の手では手間と時間のかかり過ぎる分析を短時間で正確に処理し、未知の示唆を導き出すこともできます。
ただ、ビッグデータとAIはその特性から、それぞれ課題も抱えています。
まず、 ビッグデータは、さまざまな種類の膨大な情報を含むことから、匿名データであっても関連性のある情報をつなぎ合わせることで、個人を特定できてしまうというリスクをはらんでいます。そのため、利活用に際しては政府から示されるガイドラインに従い、データを慎重に扱うことはもちろん、データ利用方針を開示し、ユーザーからの同意や賛同を得られるよう努力する必要があります。
AIの利活用では、機械学習やディープラーニングに大量の訓練データが必要になるため、サンプルの少ない事象では正確な問題解決が行えないという課題があります。最近は、少ないデータでも効率的にAIを学習させる研究が行われており、こうした技術が実用段階まで高まれば解消されるとみられます。
もう一つ、AIでどのような処理が行われているのかがわからない(ブラックボックス)という課題もあります。AIの活用によりうまくいったソリューションをノウハウとして取り出すことはできず、いつまでもAIに頼り続けなければならないということになります。
ビッグデータやAIを利用する際は、上記の課題を認識しておく必要があるでしょう。
4.まとめ
ビッグデータという言葉が世の中に浸透し始めたのは2010年代以降のことですが、実際にビジネスにビッグデータを活用できている企業は、まだ大手企業など一部です。今後、データ活用が経営、ひいては競争力の強化に及ぼす影響度はますます大きくなり、企業の成長にビッグデータの活用が必要不可欠となる時代がやってくるでしょう。
そして、ビッグデータの利活用には、AIを搭載したBIツールが最適です。導入の際は、上でご紹介したように、まず自社の抱える課題を明確に把握することからスタートしましょう。
【関連記事】
BIとAI ~その違いとは~