ailia SDKで使用できる機械学習モデルである「M-LSD」のご紹介です。エッジ向け推論フレームワークであるailia SDKとailia MODELSに公開されている機械学習モデルを使用することで、簡単にAIの機能をアプリケーションに実装することができます。
M-LSDの概要
M-LSDはNAVERが開発した、入力された物体のワイヤーフレームを検出する機械学習モデルです。紙や本の輪郭を正確に検出可能なため、OCRの前処理などに使用可能です。

Towards Real-time and Light-weight Line Segment Detection
M-LSDのアーキテクチャ
従来のライン検出のアプローチは複数のモジュールを使用する複雑なものでした。M-LSDでは、シングルショットでラインを検出するため、高速な処理が可能です。

BackboneにはMobileNetV2を使用しており、後段にヒートマップを生成するためのブロックを追加しています。

線分は下記のように、Tri-Points(TP)として定義されています。中心点を示すlcと、始点への差分であるds、終点への差分であるdeによって線分を表現します。

AIモデルの出力は、線分の中心点を表すCenter mapからTopK Layerを使用して計算した線分の中心点を表す(1,200,2)のベクトルlcと、線分の確信度であるである(1,200)のスコア、中心点から線分の始点と終点への差分を示すベクトルである(1,256,256,4)のDisplacement mapとなります。AIモデルの出力である中心点・始点・終点の3つのベクトルを加算することで、線分を計算可能です。

データセットはWireframeとYorkUrbanを使用しています。

M-LSDの使用方法
下記のコマンドを使用することで、WEBカメラから認識可能です。ailia SDK 1.2.8以降に対応しています。
ailia-models/line_segment_detection/mlsd at master · axinc-ai/ailia-models
実行例です。
ax株式会社はAIを実用化する会社として、クロスプラットフォームでGPUを使用した高速な推論を行うことができるailia SDKを開発しています。ax株式会社ではコンサルティングからモデル作成、SDKの提供、AIを利用したアプリ・システム開発、サポートまで、 AIに関するトータルソリューションを提供していますのでお気軽にお問い合わせください。