ソシオネクストが深層学習を用いたSLAM処理を大幅に高速化、画像認識による自律制御がエッジ機器でも可能に

次の記事

架空TikTokスターのネットワークを構築するFourFrontがシード資金調達

SoC(システム・オン・チップ)の設計開発を行うソシオネクストは10月12日、自動運転車やロボットなど自律制御を行う装置に欠かせないSLAM(自己位置推定と環境地図作成を同時に行う)処理に必要な時間を、従来技術の約1/60に短縮できる手法を開発したことを発表した。これは、東北大学大学院情報科学研究科システム情報科学専攻、岡谷貴之教授の研究ブループとの共同研究によるもの。

SLAMは、自動車などではLiDAR(ライダー:レーザーで画像検出と測距を行うシステム)を用いたものと、カメラ映像で行うVisual SLAMとに大別される。Visual SLAMは、安価なカメラで行えることと、画像処理技術が発達したことから応用が広がっている。さらに深層学習を使った画像認識技術の発展もこれを手伝っている。

しかし、深層学習による画像処理では、画像から抽出された3次元点群と観測データをすり合わせて画像の正確な3次元復元を行うバンドル調整(BA。Bundle Adjustment)という、膨大な計算処理が必要となる。そのため、エッジ機器のようなCPU処理能力に制約のある環境では、Visual SLAMは難しかった。

そこでソシオネクストの研究チームは、「グラフネットワーク(Graph Network。GN)を用いた推論による近似計算手法」を提案。これにより従来方式(g2o)と比較して「計算量を抑えた推論処理」が可能となり、処理時間は1/60となった。

ソシオネクストが深層学習を用いたSLAM処理を大幅に高速化、画像認識による自律制御がエッジ機器でも可能に

計算量が減ったことで、CPUの負担や、それにともなうシステムの消費電力も抑えられる。そのため小さなエッジ機器でも高度なVisual SLAM処理が可能となり、応用の範囲が大きく広がる。ソシオネクストでは、この新しい推論手法による処理効率の向上を、画像認識以外の新しい顧客アプリケーションへの応用も検討すると話している。