3D AIモデルの特徴

弊社で研究開発している世界に先駆けた3次元AIの特徴や技術について、ご紹介します。

CNNとは

ディープラーニング技術で画像を認識するAIモデルには畳み込みニューラルネットワーク(CNN: Convolutional Neural Network)が多用されています。

これは画像のデータ量は多く、CNNの畳み込み、プーリング処理を用いて圧縮しなければ、ニューラルネットワークで計算が難しいためです。

下図の簡単な例では、32かける32、1024画素の画像が20次元の全結合層に圧縮される手順を表現しています。

2次元画像のCNN

2次元画像の畳み込みは画像ピクセルの配列を利用しています。下図にように画像ピクセルの配置が固定されているため、固定された形状とサイズのフィルターで畳み込みが可能です。

3次元画像のCNN

私たちが研究開発している3次元形状認識技術も2次元画像と同じく畳み込み技術が必要です。

3次元形状は、3DCADや3Dスキャナーなどで作成される立体形状です。

3DCADが普及する以前の設計データは2次元の図面データでしたが、いまや設計データは、高さ、幅、奥行きの3次元を持った立体形状のまま保管され、様々な用途に利用されています。

これらの立体形状は、それぞれの節点(頂点)位置にX、Y、Zの座標値を持つデータです。

この節点位置と節点間のつながりを把握することで、AIは形状の特徴と寸法を認識することができます。

3次元AIによる認識の過程で3次元形状の畳み込み技術が使用されています。

先の述べた3次元形状データを詳しく見ると、下図のように節点間ネットワークの数が固定されていないため、2次元画像と同じ固定されたサイズのフィルターが使用できません。

私たちの技術は、この可変のネットワーク構造を畳み込むことを可能にし、それにより効率的に3次元形状をAIに認識させることができます。

接点間ネットワークの詳細

3次元AIの応用

開発された3次元形状認識AIモデルは、形状の特徴を認識し指定されたグループに分類するクラス分け、形状だけでなく寸法を含めたマッチング、複数の形状の特徴を混合し新しい形状を生成する新形状合成などの機能に応用できます。