未来のより快適な暮らしの実現を目指すシャープが開催する技術展示イベント「SHARP Tech-Day’24 “Innovation Showcase”」が、2024年9月17日-18日に開催されました。そのビジネスセッションに、株式会社アクセル 常務取締役 CTO客野一樹が登壇し、近年のAIの動向や今後の予想や、両社の事業におけるAI実装について語りました。イベントの内容と併せて、その模様をご紹介します。
生活空間に関わる、あらゆる領域でAIが活躍
「SHARP Tech-Day’24 “Innovation Showcase”」とは、“未来のより快適な暮らしの実現”のためにシャープが開発しているさまざまな技術「Next Innovation」を体感できる展示イベント。単なる技術展示に留まらず、テクノロジーの実装イメージや実例をもとに、シャープが考える未来を体感できるイベントとなっています。
今年は、「AI」、「EV」、「SMART LIVING」、「INDUSTRY」、「COMMUNICATION」の5ジャンルから、それぞれのNext Innovationを体感できるエリアが登場。家庭や通信、産業などさまざまなシーンでのAI活用技術・ソリューションが紹介されました。
中でも目を引いたのは、このイベントで初公開されたEV(電気自動車)のコンセプトモデル「LDK+」(エルディーケープラス)です。車内をリビングルームの拡張空間として捉え、“止まっている時間”にフォーカスした設計になっているのが特徴で、広い荷室には180度回転するソファのようなイスと大画面のモニター、可動式のデスクを装備。
窓は液晶シャッターによりプライベートな空間が保たれ、まるでリビングの一角のように、子どもの遊び場やシアタールーム、仕事場、趣味の場所として活用することが可能です。
また、独自のエッジAI技術「CE-LLM」やAIoT技術、センシング技術などが盛り込まれており、家電を通して学習したユーザーの好み(温度や光の色、音楽など)を車内に反映したり、自宅内の家電と連携して家族とコミュニケーションが取れるなど、快適な空間を演出してくれる、シャープらしいEVコンセプトとなっています。
AIを活用した身近な製品は他にも。京都芸術大学と共同で開発されたウェアラブルデバイス「AIスマートリンク」は、音声による生成AIとの自然なコミュニケーションにより、生活のあらゆる場面でAIを活用しやすくしてくれます。本体にはAI、カメラ、スピーカーを備えており、例えば外国語で書かれた看板を見て「なんて書いてある?」と問いかけると翻訳して答えてくれたり、料理中の手順をナビゲーションしてくれたりなど、インタラクティブなやりとりが可能になります。
また、発売中の商品では、AIを搭載したプラズマクラスタードラム式洗濯乾燥機「ES-X12C」も注目を集めました。温度センサーと湿度センサーから衣類の乾きやすさを判別してプログラムを調節してくれる、太陽光発電システムと連携して洗濯から乾燥にかかる電気代を削減してくれるなど、生活をより便利にしてくれるAIの存在が印象的でした。
「SHARP Tech-Day」では、ほかにもさまざまなテクノロジーが展示されており、シャープが「Next Innovation」によって実現していこうとする未来に期待は高まるばかり。今後、より一層AIが身近になっていくことを実感すると共に、シャープのAIへの本気度が伺える2日間となりました。
AIの歴史から今後の展望まで。AI実装するなら知っておくべきこと
会場ではAIを中心に、さまざまなトークセッションが開催され、2日目には、株式会社アクセル 常務取締役 CTO客野一樹も登壇。AIの簡単な歴史から、最新の動向、今後の予想、さらにはB2B事業におけるAI実装の実例まで。AIに興味がある人が気になる話題を網羅したディスカッションとなりました。
【プロフィール】
シャープ株式会社 スマートビジネスソリューション 事業本部 副本部⻑ 徳山 満(以下、徳山)
MFP(コピー、スキャナなどの機能を持つ複合機)のエンジニアとして活躍した後、現在はB2Bのソリューション開発の責任者。
株式会社アクセル 常務取締役 CTO 客野一樹(以下、客野)
筑波大学大学院において各種初等関数のハードウェア実装の研究で博士号を取得。独自のAIフレームワークであるailia SDKを企画、開発。現在は先端技術分野を中心にR&Dおよび事業化を行っている。
アナログからデジタル、そしてAIブームヘ
徳山:今日は両社のB2B事業にどうやってAIを実装していくかについてお話していけたらと思うのですが、その前に、まずは少しAIの歴史について振り返りながら、私や客野さんがAIにどう携わってきたかをお話できたらと思います。
AIはですね、実は1950年ごろから実は研究されていたということで、もう今から70年前になりますね。僕はAIって最近の言葉に聞こえるので、10年や15年ぐらいかなとちょっと想像していたんですけれども、そんなことないと。僕よりももっと古い先人の方々の取り組みがあったからこそ、今のようにいろいろなAIが登場する時代になっているということなんですね。
私がMFP(コピー機)のエンジニアをしていた当時は、いろんなものがアナログからデジタルへ変換されていくタイミングで、この時に新しく生まれたのが画像処理。その開発業務の中でニューラルネットワークというAIモデルに触れることになりました。その頃はちょっと小難しい計算方法かなという風に思っていて、最近のLLM(大規模言語モデル)にも繋がっていくようなことになるとは想像もつきませんでした。客野さんは、AIの歴史やご自身の体験をどう捉えていらっしゃいますか?
客野:そうですね。やっぱりAIの歴史の中でいちばんエポックメイキングだったのは、2012年に登場した画像認識ソフトウェア「AlexNet」かなと思います。当時、何を写した画像かを当てる画像認識コンテストで2位に大差を付けて優勝したモデルです。例年、画像認識の性能を示す間違い率は、昨年比で毎年1%ずつくらい改善されていくのが通例だったのが、AlexNetはなんと一気に10%も改善し、エラー率を16%にまで下げました。
いままで緩やかな進化だったのが、AlexNetによって劇的に精度が上がり話題になったというのが、今の第三次AIブームの始まりなのかなと思います。とはいえ、その頃の私はコーデックとかをやっていたので、当時はAIの可能性をそこまで感じてはいませんでしたね。
初めてAIってすごいと思ったのが、PFNさんが作られていた「PaintsChainer」という、線画のイラストに色を塗ってくれるAIです。顔はちゃんと肌色に、服は服の色に塗ってくれる、今でいう生成AIの走りみたいなものです。
それまで私は自分でプログラムを書いていて、画像処理や超解像はある程度自分で作れるかなと思っていたんですけれども、これは絶対に自分では作れないと思ったのを覚えています。線をちゃんと認識して、ここは顔だと認知して、そこに色をつけるっていうのは高度すぎて、AIのすごさを感じたエピソードです。
そこから弊社でもフレームワーク作りをはじめてもう7年くらいになります。高速なディープラーニングを実現する推論エンジン「ailia SDK」は代表作のひとつで、漫画家さんたちが原稿制作に使うソフト「CLIP STUDIO PAINT」に採用されています。当時は夢物語だったことが、ちょっとずつ実現できてきていると思うと嬉しいです。
Transformerの登場から急速にチャットAIが普及
客野:次にエポックメイキングだったのは、2017年の「Transformer」かなと思います。Googleが開発した自然言語モデルですが、これも劇的に処理性能を上げたモデルでした。このTransformerベースに2023年に登場したのが「ChatGPT」ですから、やはり2017年に生まれた新しいアーキテクチャが、2023年、2024年になって花開いてきていると言えるのかなと思います。
徳山:Transformerは僕の中では記憶に新しいですが、もう6年経っていることに驚きますね。我々は文章を印刷するとか、あるいは管理したりするっていうソリューションを作っていたので、自然言語処理の分野にはとても興味があって、チャットボットのGoogle Bard(現Gemini)を調査したり試してみたりと一生懸命やっていたのを覚えています。
このTransformerは今のLLMのベースに繋がっているという風に思うのですが、Transformerがいままでのモデルと何が違うのかというところを教えていただけますか?
客野:Transformerというのは、基本的には文章を認識するモデルですね。その際、文字を一個一個のトークンと呼ばれる数値に変換します。例えば、「吾輩は猫である」という文字列であったら、「吾輩」「は」「猫」「である」をそれぞれ数値化してからAI処理をすることで、意味を理解したり、その先に続く文章を導いたりします。ここでポイントになるのが、「アテンション」という新しい機構が入っていることです。少し分かりにくいのですが、日本語では注意機構といって、文章の重要な部分を抽出するモデルになります。
「吾輩」「は」「猫」「である」であれば、文章において重要なのは「吾輩」と「猫」ですよね。「は」「である」に注目しても、「名前はまだない」を導くことはできません。このように、文章を数値化することと、アテンションで重要なところを取り出す、というのが結構新しいところかなと思いますね。
徳山:ありがとうございます。そこから今のChatGPTの登場に繋がっていくということなんですよね。で、やはりChatGPTが現れてからというもの、第四次AIブームと言われるようにAIの存在感というのがますます大きくなってきていると思います。私も今では「正しく仕事できているかな?」みたいなことをChatGPTに聞きながら仕事したりしているんですが、客野さんはChatGPTにどんな印象を持たれていますか?
客野:Twitter(現X)で流れてきていて、触ってみたのが本当の最初でした。試しにプログラム書けるかなと思って、Pythonでこれこれこういうものを書いてくださいってお願いしたら、指示した通りものものがちゃんと出来まして。文章を理解してプログラムなど複雑なことも書けるってことにかなり衝撃を受けた思いがありますね。
徳山:これまでAIといえば、自分たちでモデルを選定して学習させて、それぞれの商品に組み込むみたいなところまでやってようやくAI実装をしたといえる感じだと思うのですが、ChatGPTを触っていると、そのステップを飛ばしてすぐに使い始められるんじゃないかな、みたいな感じがしますよね。
OpenAI一強時代から分散化の時代へ
AIの民主化といわれ、革新的な技術が出てくる中で、いろいろなところにAIが使われる時代になったなと感じていますけれど、客野さんは普段の業務でChatGPTを使う場面はありますか。
客野:最近はChatGPTにプログラムを書いてもらっていますが、かなり便利ですよね。以前は自分で考えて一文字ずつキーボードを打たないといけなかったですが、今は20行くらいで書けるちょっとしたこともChatGPTに代わりに書いてもらっています。たまに間違えるので、そこを指摘したりもしますが、かなり実用的で、ある意味生活の一部というか、当たり前の存在になっているなという印象があります。
徳山:こうなってくると、次は一体どんな世界がくるんだ、みたいなことをちょっと予想したくなりますよね。一般的に言われているのはシンギュラリティが加速することによって人間の知性をAIが超える、人間と同じように学習するAGI(汎用人工知能)がくる、といったことですが、その前段階があると思っていて。
個人的には、まずはLLMを簡単かつ汎用的に使うことができるようになっていき、次にLLM同士を組み合わせて使う、みたいなことが起こっていくんじゃないかなと思ったりしているんです。それを踏まえて客野さんに2つほど質問です。
まず、LLMというとGAFAMもスタートアップも頑張っていますが、どこがいちばん進んでいるか、あるいは、どこが勝つと思いますか?
客野:そうですね、今のAIの世界って、どれだけGPUを用意できるかで性能が決まるところが大きくなってきているなという印象がすごくあって、そうなるとやはりGAFAMが圧倒的に強いですよね。
例えばMetaがこの前リリースしたLlama3とかって、1万6千台近くのNVIDIA H100 GPUを使っているんですけど、1台約500万円なので、単純計算で800億円掛かっているわけなんです。しかも保守も大変で、1時間ごとに1台壊れるくらいの負荷が掛かるので、その都度人間が直す、みたいなこともやっていて、本当にものすごいお金がかかるんです。そうなると、ひと昔前のように大学論文発のAIみたいなものは、やっぱり生まれにくいですよ。
ただ、ちょっと昔と違うのは、ChatGPTが出てきた2023年って、OpenAIが強すぎて誰も勝てないみたいな世界観だったのが、最近はAnthropicのClaudeの方が高性能だよね、みたいな話も出てきていますし、Google Gemma(GeminiのOSS版)やMetaのLlama3がオープンモデルとして誰でも使えるようになってきたりしていることで、OpenAI一強の時代ではなく、分散化してきているなというのは印象としてありますね。
徳山:昔、数万円した16GBのSDカードが今は数百円で買えるように、計算資源の進化は速いので、これからもっと簡単に安く使える時代が来て、できることがどんどん広がっていくんじゃないかな、なんて思いますよね。
使い処を間違えなければ、日本は世界と戦える
徳山:もうひとつ質問させてください。日本はデジタル化が非常に遅れた国だという風にいわれています。遅れたことに対しては国も助成金を出すなどして積極的に投資していますが、これから日本が世界と戦っていくためには、どうしたらいいと思いますか?
客野:どれだけGPUをかき集めるかが勝負の肝というお話をした通り、結局は計算資源とデータ量の戦いです。そう考えたときに、日本ではAIを開発する各社が個別にGPUを持っているので、これをまず変えていく必要があると思っています。具体的には日本中のGPUを束ねて使うような仕組みにしてですね、そこに国会図書館のデータを全部学習させるとかすれば、全然勝ち目はあるのかな、と思うんです。
AIの技術自体はOSSが主流で、論文もあるし技術的に秘匿されている部分は少ないです。あとは質のいいデータをどれだけ集められるかですから、ちゃんとやればできないものではないなと。日本はスパコンが強い国ですしね。
と、これはどちらかと言えば力勝負の話ですが、もう一つ方向性があって、AIは道具ですから、どうやって使っていくかも重要になっていくと思っています。ChatGPTがあっても、じゃあこれを実際に何に使うのってところの方が大切ですよね。
そういう意味では、日本のコンテンツ産業はすごく強力ですから、そこをAIで後押しして、より良いものづくりができる環境を作っていくっていうのは、日本の強みとしてかなり生きてくるんじゃないかなと思っています。特に漫画やアニメは圧倒的な戦力になります。今後AIが加速していくことで、道具としてできることが増えていけば、アニメのような大規模なコンテンツを1人ですべて作れるような時代がくるかもしれません。そうなれば、多くのクリエイターがより強いコンテンツを作って海外に出て行く、みたいなことがもっとしやすくなると思います。
あらゆるエッジデバイスにAIがやってくる
徳山:AIの歴史から最近の動向まで振り返ってきましたが、ここからは未来のことも聞いていきたいと思います。アクセルさんが取り組まれているAI事業について、今後の展開を教えてください。
客野:はい。当社としてはですね、これからありとあらゆるものにAIが入っていくのはもう間違いないだろうと思っていますので、ハードウェア、ソフトウェアに関わらず、AI導入のサポートをこれからも強化していきたいと思っています。
特に当社が注力しているのは、エッジデバイスへの導入です。すでにワイヤレスイヤホンのノイズキャンセルにAIが入っていたり、音声認識もアルゴリズムでやっていたのがAIに変わっていたりと、気付かない内にAIに置き換わっているものは多いです。それが加速していくのは明らかですので、我々の「ailia SDK」という推論エンジンをいろんなものに導入いただいて、世の中にもっとAIが浸透していく世界というのを作っていきたいですね。
徳山:なるほど。クラウドだけじゃなく、エッジ側にもAIがやってくるというようなイメージですよね。我々シャープもいろんなエッジデバイスを持っていますので、力を入れて取り組んでいるところです。先ほど、AIは道具だから使い道が大切だというお話がありましたが、まさにシャープでは、エッジAI「CE-LLM」を開発して、さまざまなエッジデバイスをAI化していこうということを進めています。
客野さんが言う通り、エッジAIの活用というのは今後主流になっていくことは間違いなくて、Microsoftもクラウドで実行していた従来のAIアシスタント「Copilot」を手元のPCのハードウェアを使ってローカルで実行する「Copilot+ PC」を市場に出してきたりもしています。
そこで鍵になるのが、ユーザーが持っているデータをどう活用できるかという点。これが、よりユーザーに近いところでAIを活用していく方法なんじゃないかなと思います。この辺りの範囲はGAFAMに一泡吹かせるじゃないですが、なんとか対抗できるエリアなんじゃないかなと思っています。
生活やワークフローにAIが溶け込む未来の働き方
徳山:少し話は変わりますが、アクセルさんは大阪万博にも参画していらっしゃって、AI実装を具現化しようとしているようですね。何かおもしろいエピソードはありますか。
客野:落合陽一先生のプロデュースによるシグネチャーパビリオン「null²」というコンテンツに参画させていただいています。先週も合宿で演出を作り込むということをしていたんですけれど、落合先生の働き方にすごく驚きと学ぶところがありましたね。
やっぱりかなり忙しい方で、スケジュールは基本30分刻みだそうなんですけど、その間にもゼミ生とチャットでコミュニケーションを取ったりとかなりハードに動かれているんです。タクシーの移動中にミーティングしながら論文をAIで翻訳掛けつつゼミ生とチャットして、翻訳が終わるとその論文をゼミ生に投げて、何か質問があればChatGPTで調べて回答する、みたいな感じで、生活とかワークフローの中にAIが当たり前のように溶け込んでいるんですよね。
人間とAIが交互に作業しながら激務をこなしていくみたいなのが、未来の働き方という観点ではすごくおもしろいなと思って見させてもらっていました。AIによる働き方のサポートというところでは、我々は「ailia DX Insight」というアプリケーションを出していますが、落合先生の働き方を見ていると、やはりエッジ側でどこでも高速に動くAIはこれからもっと必要とされてくるだろうなと思います。ほかにもいろいろなアイデアが降ってきそうなので、それをまたプロダクトにして、世の中のDX、働き方改革にも貢献していきたいなと思っています。
シャープのトータルソリューションはAI時代でさらに輝く
徳山:すごいですね。僕は移動は寝る時間だと思っているので驚きですね(笑)。でも、今後AIを発展させていく中で、AIに振れる仕事を多くすることで、少しでも人間が楽できるようなものを作っていきたいというのはシャープの考えにも共通するところがあるんです。
特にB2B事業でのAI実装というのは検討していきたいと思っていることです。なかでも意識しているのは社会課題ですね、人口減少あるいは人手不足などといった社会課題を解決して、効率化や高速化、さらには事業継続といったサスティナブルな社会を目指したいと思っています。
そこで客野さんから見て、シャープがやるべきAI実装について、こういうものを作るべきなんじゃないかというアイデアがあればぜひ伺いたいのですが。
客野:これまでシャープさんのエンジニアの方ともたくさん話させていただいて思ったのは、やっぱりハードウェアとソフトウェアを融合したソリューションを全部お持ちだっていうのが、やっぱ圧倒的な強さじゃないでしょうか。
この先のAIの時代がどう変わっていくかなと考えた時に、やっぱりインターフェースがどんどん進化していくんだろうなと思うわけです。つまり、スマートフォンになってタッチパネルが当たり前になったように、AIの時代に合ったインターフェースやハードウェアの形っていうのがあるはずで、それはソフトウェアだけでビジネスが構築されていると手が届かない部分です。なので、トータルソリューションを作られているシャープさんならではの強み、合わせ込みっていうのが、これからのAI時代に輝いていくんじゃないかなと思います。
徳山:ありがとうございます。我々も、既存のプロダクトにどうAIを持ち込みながらインターフェイスを変えていくかというところは、やはりやるべきだろうと思っている部分です。例えば、今回展示しているスマート会議ソリューションでは、スタートボタンを押すだけで、音声録音、書き起こしからまとめ、タスク管理などを抽出して議事録としてまとめるという一連の流れを完全に自動化したいという風に思っています。そうなったときに相応しいインターフェイスというのは、今とはまた違う形になるはずですから、模索を続けていきたいと思います。
「GPT o1」の登場で、AIは1歩先の世界へ
徳山:また、もう一つ伺いたいのは、3〜5年後には、AIの課題やその解決策などはどういう方向に変化していきそうでしょうか? 我々シャープがB2B事業としてAIを実装していくなかで知っておくべきことなどありますか。
客野:そうですね、AIの世界は本当に進化のスピードが速くて、もう次のパラダイムシフトが起き始めているかもしれない、というところは頭に入れておく必要があるなと思っています。論文では次の世界が少し見え始めてきていて、例えば、今のChatGPTは一問一答形式で学習して答えを出してきますが、次のAIの世界では、質問に対してAIが勝手にGoogle検索をしてその結果を元に回答するであるとか、前後の文脈が足りなければAIからユーザーに質問してくれるというような、もう1歩先のAIを作る研究がいま進んでいます。
で、それがそろそろ半年後くらいに出るかもな、と思っていたのですが、実はこの対談の3日前くらいにまさにその機能を搭載した新しいモデルがOpenAIから出たんです。本当にスピードが速いですよね。「OpenAI o1」というモデルなんですが、これまでのAIは学習で性能を上げるのがメインだったところ、推論を複数回行うことで性能を上げるモデルになっています。質問に対する回答をAIが5回くらい考え直して、その結果を返してくれるというもので、これによって数学の性能が博士課程の学生程度の水準まで高まったという高精度なものになっています。
こうした次世代のモデルがさらなる発展をもたらしてくれるのはすごくおもしろいですよね。今年はそういったものがどんどん出てきて、新しい世界が開けていくだろうなという気がしています。
徳山:AIの進化のスピード感にはついていくだけでも大変ですが、これをなんとか自分たちのものにして、お客様に使っていただけるようにしていくのがシャープのやるべきことだなと改めて思います。AIの進化とともに我々のB2B事業でのAI実装を今まで以上に加速して社会課題の解決に活用していきたいです。また、アクセルさん、シャープともにそれぞれ得意な領域を伸ばし、またいろいろな所で協業をさせていただき、お互いのビジネスを成長させていければと思っています。