ailia SDKで使用できる機械学習モデルである「MoveNet」のご紹介です。エッジ向け推論フレームワークであるailia SDKとailia MODELSに公開されている機械学習モデルを使用することで、簡単にAIの機能をアプリケーションに実装することができます。

MoveNetの概要

MoveNetは2021年5月17日にGoogleが公開した骨格検出モデルです。従来の骨格検出技術と比べて、動きの激しい動画での検出精度を改善しています。ライブフィットネスやスポーツのアプリに最適です。

出典：https://blog.tensorflow.org/2021/05/next-generation-pose-detection-with-movenet-and-tensorflowjs.html

Next-Generation Pose Detection with MoveNet and TensorFlow.js

May 17, 2021 – Posted by Ronny Votel and Na Li, Google Research Today we’re excited to launch our latest pose detection…

blog.tensorflow.org

MoveNetのアーキテクチャ

MoveNetは17個の2次元のキーポイントを高速かつ高精度に検出します。LightnigとThunderの二つのモデルがあり、Lightningが速度が要求されるアプリ、Thunderが精度が要求されるアプリに使用可能です。LightningもThunderもデスクトップPC、ノートPC、スマートフォンで30FPS以上で動作します。

アーキテクチャはCenterNetに近いものとなっています。FeatureExtractorはMobileNetV2にFeature Pyramid Network（FPN）を付加したものになっています。output strideを4に設定することで、高解像度を扱うことができるようになっています。

出典：https://blog.tensorflow.org/2021/05/next-generation-pose-detection-with-movenet-and-tensorflowjs.html

AIモデルの出力は、Person center heatmap、Keypoint regression field、Person keypoint heatmap、2D per-keypoint offset fieldとなります。

出典：https://blog.tensorflow.org/2021/05/next-generation-pose-detection-with-movenet-and-tensorflowjs.html

学習にはCOCOデータセットと、Googleの社内用データセットの両方を使用しています。COCOデータセットは、ポーズが大幅に変わったり、モーションブラーがかかっているような厳しい環境のデータは含まれておらず、フィットネスやダンスのアプリには向いていないという問題があります。Googleの社内用データセットでは、YouTubeのyoga、fitness、danceのビデオにアノテーションして使用しています。各動画は3フレームしか使用せず、データセットの多様性を確保しています。

出典：https://blog.tensorflow.org/2021/05/next-generation-pose-detection-with-movenet-and-tensorflowjs.html

MoveNetの使用方法

MoveNetを使用するには下記のコマンドを使用します。Webカメラから認識が可能です。

$ python3 movenet.py -v 0

実行例です。

https://cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FhFUMD46Nugc%3Ffeature%3Doembed&display_name=YouTube&url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DhFUMD46Nugc&image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FhFUMD46Nugc%2Fhqdefault.jpg&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=youtube

ailia-models/pose_estimation/movenet at master · axinc-ai/ailia-models

(Image from…

github.com

ax株式会社はAIを実用化する会社として、クロスプラットフォームでGPUを使用した高速な推論を行うことができるailia SDKを開発しています。ax株式会社ではコンサルティングからモデル作成、SDKの提供、AIを利用したアプリ・システム開発、サポートまで、 AIに関するトータルソリューションを提供していますのでお気軽にお問い合わせください。

MoveNet : 動きの激しい動画向け骨格検出モデル

MoveNetの概要

Next-Generation Pose Detection with MoveNet and TensorFlow.js

May 17, 2021 – Posted by Ronny Votel and Na Li, Google Research Today we’re excited to launch our latest pose detection…

MoveNetのアーキテクチャ

MoveNetの使用方法

ailia-models/pose_estimation/movenet at master · axinc-ai/ailia-models

(Image from…

関連記事

専門知識なしでも手軽に使える商品画像生成サービスに、新たな機能が追加。

YOLOX : YOLOv5を超える物体検出モデル

さらに機能を強化。AIで建設現場の労働災害リスクを低減するアプリ「HACARUS KY」とは？