AI界の頂点に立つ学生は!?「Axell AI Contest 2025」表彰式レポート

2025年8月、アクセルが主催する学生限定のAIコンテスト「Axell AI Contest 2025」が開催されました。今回のテーマは「飲料パッケージの物体検出」。年々高まるAI技術者へのニーズを背景に、次世代を担う学生エンジニアたちが実践的な課題に挑みました。全国から384名もの学生が参加し、昨年にも増して非常にハイレベルな戦いが繰り広げられた本コンテスト。その表彰式の様子をレポートします。

AIを作る・使う未来のためのコンテスト

「Axell AI Contest」は、高度なアルゴリズム開発から製品化を担うソフトウェア・ハードウェア開発を行う先端テクノロジー企業の株式会社アクセルが、キャンパスOJT型産学連携教育推進財団と共同で開催する学生限定のAIコンテストです。

AI技術の社会実装が進む現代において、実践的なスキルを持つAI技術者の育成は急務となっています。本コンテストは、学生にAI技術の実践の場を提供し、日本の「AI技術の発展」と「次世代人材の育成支援」に貢献することが大きな目的。参加者は昨年の266名を大きく上回る384名にのぼり、その関心の高さが伺えます。

第3回目となる今回は、「飲料パッケージの物体検出」がテーマ。91種類もの飲料パッケージを物体検出技術で識別するAIモデルを開発するという課題です。精度の高さだけでなく、推論時間が0.0175秒/画像以内、モデルファイルのサイズが64MB以内という、実用化を想定した厳しい制約が課せられました。この制約の中で、いかに高精度なモデルを開発するかが勝敗の鍵となりました。

表彰式の冒頭、アクセルグループのAI事業を推進するアイリア株式会社の代表取締役社長、客野一樹は次のように語りました。

アイリア株式会社 代表取締役社長 客野一樹

「生成AIの登場で、AIは『作るもの』から『使うもの』へと潮流が変わりつつあります。しかし、その裏側でAIがどう動き、計算グラフがどうなっているかを理解することで、AIを使うにしても、より深く、より広い応用が可能になります。テクノロジーは積み上げです。ものを作る経験は、使う側になったとしても必ず活きてきます。今回のコンテストでの経験が、今後の皆さんのご活躍の役に立つことを願っています」

順位発表:0.001ポイントを争う熾烈な戦い

今年のコンテストは、上位入賞者のスコアが0.99を超えるなど、極めてハイレベルな接戦となりました。ここでは、見事上位入賞を果たした3名と、その開発手法についてご紹介します。

第3位:井口祐輔さん(スコア:0.99425971)
撮影条件の違いに着目し、精度を向上

第3位となったのは、井口さん。学習データと評価データの撮影条件の違いによる性能低下(ドメインシフト)に着目し、データ拡張を主軸に精度向上を目指しました。

「初期実験で、手元の交差検証(CV)スコアは0.99と高いのに、提出後のリーダーボード(LB)ではスコア0.74と低く、乖離が見られました。学習データと評価データで背景などの撮影条件が異なるためと考え、AIが特定の背景と飲料をセットで学習してしまわないよう、『コンテキストバイアス』を軽減する必要があると考えました。最も効果があったのは、SAM(Segment Anything Model)で飲料パッケージだけを精密に切り抜き、外部データセットから持ってきた多様な背景に合成する手法です。これにより、モデルの汎化性能を大きく向上させることができました。また、評価データに含まれていたピンボケ画像への対処や、ペットボトルなどの非対象物(ネガティブサンプル)を含むライブデータセットも導入し、モデルの頑健性を高めています。さらに、データ拡張において、MixUpは有効でしたが、文字が反転してしまうFlipなどは学習に悪影響だと考え、あえて使用しないといった工夫も行っています」 

第2位:竹川修平さん(スコア:0.99537908)
CLIPとTensorRTで精度と速度を両立

第2位の竹川さんは、見た目が酷似しているクラスの識別精度向上や、未知の物体に対する誤検出の抑制といった、より高度な課題に取り組みました。

「外観が非常に似ている別クラスの飲料を正確に識別するため、画像内の遠距離の特徴も捉えやすいRT-DETRというモデルをベースにしました。また、井口さんと同様に背景の多様性が課題だと考え、私はCLIPというモデルを用いて学習データの背景画像を特徴量でクラスタリングし、異なる背景クラスが各評価セットに均等に含まれるように分割しました。さらに、誤検出を減らすために、学習データに含まれていない物体(ネガティブサンプル)としてCOCOデータセットの画像を意図的に追加し、モデルがより頑健になるよう工夫。最後に、推論時間の制限をクリアするため、モデルをTensorRTに変換し、16ビットの浮動小数点数形式で推論を実行することで、高精度と高速化を両立させました」

第1位:伊藤優心さん(スコア:0.99765184)
単一モデルを極限まで高性能化

栄えある第1位に輝いたのは、伊藤さん。厳しい速度制約の中で、単一モデルの性能を極限まで高めるアプローチで頂点に立ちました。

「0.0175秒という厳しい推論時間制約があったため、複数のモデルを組み合わせるアンサンブルなどの複雑な手法は難しいと考え、YOLOv8-largeという単一の高性能モデルをいかにチューニングするかに集中しました。データ拡張では、画像生成AIで多様な背景を生成し、それを合成する手法を取り入れています。生成した背景の品質はCLIPでチェックし、質の高いデータのみを約4,700枚追加しています。さらに、モデルをTensorRTとFP16(半精度浮動小数点)で最適化することで約3倍の高速化を実現し、その上でFlipなどの幾何学変化は避け、バウンディングボックスの位置精度を高める損失関数の重み調整や、NMS(Non-Maximum Suppression)の閾値を精密に調整するなど、最後の0.001点を削り出すための地道な改善を積み重ねたことが、結果に繋がったと考えています」

第4位:金井俊樹さん(スコア:0.99393763)
第5位:松本隼さん(スコア:0.99349963)

講評:勝敗を分けたのは「高速化」と「データ拡張」への工夫

アイリア株式会社 AIコンピューティング事業部 ナタン・ボワイエ

最後に、本コンテストの課題監修を務めたアイリア株式会社 AIコンピューティング事業部のナタン・ボワイエより総評が述べられました。

「今回は、多くの上位者がYOLO系のモデルをベースにしていました。特に1位、2位、4位の方は、TensorRTやFP16を用いて推論を高速化し、それによって、より大きく高性能なモデルを時間制約内で使うことを可能にしていました。これが大きなアドバンテージになったと考えられます。また、全員が過学習を避けるために、背景合成や外部データの活用といったデータ拡張に取り組んでいました。中でも、1位の伊藤さんが生成AIで背景自体を能動的に作り出していた点は、非常に特徴的で優れたアプローチでした」

上位5位までの手法の比較

コンテスト全体のレベルの高さを評価した上で、その先に待つ実用化への課題と、AI技術のさらなる可能性について次のように続けます。

「今回、上位陣のスコアは非常に高くなりましたが、これは学習データと評価データの撮影環境が似ていたことも一因です。実際にコンビニの棚のような未知の環境でモデルを動かすと、正しく検出できないケースも見られました。実社会で役立つAIを開発するためには、今後さらに多様な状況で性能を評価し、汎化性能を高めていく必要があります」

今回のコンテストは、既存の最先端モデルをベースにしつつも、高速化技術を駆使してモデルの選択肢を広げ、質の高いデータをいかに用意するかという、地道で細やかな工夫が勝敗を分ける結果となりました。参加された学生の皆さんにとって、実務に近い環境でAI開発の難しさと面白さを体感する、貴重な機会となったのではないでしょうか。

SHARE THIS ARTICLE