近年、センシング技術が発達し、ヒト・モノから多種多様なデータの取得が可能となり、ビジネスや社会的課題の解決に向けてそのデータ分析に注目が集まっている。一方でそのようなセンサで取得されるデータの分析には問題も伴う。
「センシング技術の発達によって高次元データと呼ばれるデータが増える傾向にあります。高次元データは、現代のAIが分析を苦手とするデータの一つです」
高次元データとは、次元数がデータ数よりも大きなデータを指す。例えばサイズが10×10のグレースケールの画像データが20枚存在する場合、その次元数は10×10=100次元、データ数は20となる。したがってデータ数20よりも次元数100の方が大きいため、このデータは高次元データと言える。現代AIは膨大なデータ数によって性能を引き出すものが多く、相対的にデータ数の少ない高次元データに対しては活用が難しい。
一方でこうした高次元データの分析に強いのがスパースモデリングと呼ばれる技術だ。
「スパースモデリングとは『得られた情報の中でも必要なものはごく一部で、その他の大部分は不要である』というスパース性(sparsity)を仮定してデータを分析する技術です。このスパース性を用いて『必要な次元はごく一部である』と仮定することで、高次元データを分析可能にします」
しかし、スパースモデリングにおいてもデータが高次元になるほど処理時間も長くなり、現実的な時間内でデータを分析・活用することが難しくなる。井田は、スパースモデリングの高速化アルゴリズムを開発することでこの問題に挑んでいる。
「『必要な次元はごく一部である』ということは、逆に不要な次元が多く出てくるということです。これを利用し、不要な計算を独自の方式で安全にスキップするアルゴリズムを開発しました。これにより処理時間を大幅に短縮することができます」
開発したアルゴリズムは分析の精度を劣化させることなく、分析処理を最大35倍高速化することに成功し、その独自性と性能の高さが評価されトップカンファレンスにも論文が採録された。
スパースモデリングを用いた
情報処理の高速化技術
- #センシング(光・無線)
- #Iot/AI
- #コンピュータ&データサイエンス研究所
コンピュータ&データサイエンス研究所
井田 安俊
01.センサで取得される高次元データを
高速に分析する
02.超高次元データで高度な分析を実現
井田が追究する高速スパースモデリング技術は、実際に工場に取り付けられたIoTセンサのデータ分析に適用すべく検証が始まっている。例えば取得したセンサデータからプロダクトの生産量の増減に影響があった時間帯を特定し、生産量の向上施策の考案に役立てたい場合がある。スパースモデリングはこうした分析の前処理ですでに活用されているという。
「スパースモデリング自体はすでに現場で使われている技術ですが、センサで取得されるデータは高次元化していくため、その処理時間は増加する一方です。私の高速スパースモデリング技術は精度を劣化させずに高速化を実現するため、現場で使われている技術をそのまま置き換えることができます」
データ分析にかかる時間の増加は意思決定までのリードタイムを増大させていた。高速スパースモデリング技術を導入するとデータ分析のPDCAサイクルを高速化できるため、問題解消に貢献していけるだろうというのが井田の見通しだ。
「検証はまだ始まったばかりですが、従来であれば3日分とか一週間分のデータしか分析できなかったところを、半年分とか数年分の超高次元データを分析することができるようになると、分析の幅も広がって事業の高度化につながるのではないかと考えています」
03.深層学習との組み合わせで、
高次元データのさらなる活用へ
高次元データの分析を得意とする高速スパースモデリング技術は、工場IoTばかりではなく、今後AIの活用が期待されるさまざまな分野への応用が考えられる。
「例えばゲノムワイド関連解析では、がんなどの疾患に関連する遺伝的要因(SNPs)を特定する分析の前処理へ適用できるため、高速化によってさらに大規模なSNPsデータの分析が可能となります。また核融合炉では、プラズマの崩壊や持続に関連する制御操作やセンサを特定する分析の前処理で活用し、核融合炉を安定して稼働させるための現象解明に貢献できると考えています」
IOWN構想の柱となるデジタルツインコンピューティングの実現においても、高次元データの活用は大きく期待される。
「デジタルツインコンピューティングではヒト・モノに取り付けられたセンサから取得される高次元データを活用してデジタルツインを構築するアプローチが考えられます。一方でデジタルツインの構築に関しては現代AIの一つである深層学習の活用が期待される分野でもありますので、高次元データと深層学習を組み合わせることもポイントの一つになると考えています」
世界屈指の高速化アルゴリズムを開発してきた井田。アルゴリズムの進化は、省電力化や小型のPCでもデータ分析が可能になるような分析技術の一般化にも貢献することができる。未来のデータ活用社会に向けて、今日も研究に邁進している。
- KEY WORD
-
- メディア処理・知識処理
- 環境センシング
- 音響処理
- マルチモーダル
- データ分析・価値化
- IoT/AI
- 機械学習・深層学習
- 量子情報処理
- 並列分散処理・分散データベース
- ソフトウェア工学
革新的な計算機科学、データサイエンスを用いて、
規模や複雑さから取り扱い困難なデータを処理可能とし、
人や社会に有用な価値を創出する研究を推進
飛躍的な性能スケールの実現をめざし、計算機を構成する制御、演算、記憶の仕組みを刷新する研究、また、これまで以上により汎用的な問題を解くことを可能とするAIアルゴリズムやAIに代わる新たな基礎アルゴリズム創出の研究、有益な新たなデータを生成することを目的に、質感などを含む超高臨場なデータの生成や流通、人への伝達に関わる技術の研究、そして、多種多様なデータの適切な処理を通して価値を創出し、社会のさまざまな実問題を解決可能とするデータサイエンス技術の創出に関わる研究に取り組んでいます。
※記事本文中の研究所名や社員の所属組織などは取材時のものであり、
旧研究所名の場合がございます。