アスタミューゼ、生成AIの特許分析:圧倒的強さの米国 TPAでは日韓が2位・3位競う
アスタミューゼは27日、人工知能(AI)技術のなかでも近年とくに注目される生成AIの技術領域において、同社の所有するイノベーションデータベース(論文・特許・スタートアップ・グラントなどのイノベーション・研究開発情報)を網羅的に分析し、動向をレポートとしてまとめ発表した。
近年、AI(人工知能)が驚異的な進化をとげている。「ChatGPT」や「STABLE DIFFUSION」に代表される生成AIは、自然言語(日常的な文章や対話)でプロンプト(prompt:呪文)を入力するだけで、翻訳や文章要約などのtext-to-text変換はもとより、画像や音声、動画・アニメや歌唱入りの音楽、小説やドラマの台本、さらにはプログラミングなど多様なアウトプットをすばやく半自動で生成する魔法のような技術。これにより、ビジネスやイノベーション、クリエイティブなどの分野に革新をもたらしている。
AIの進化により、文字だけでなく音声や画像、動画など、さまざまな感覚入力が可能となった。これを「マルチモーダルAI」と呼ぶこともある。例えば、GoogleのAIチャットボット「Bard (PaLM2搭載) 」は、画像認識や文章読み上げ機能を追加してマルチモーダル化している。
さらに、アップロードした画像について質問できる「MiniGPT-4」や、論文などのPDFを読み込んで質問できる「ChatPDF」、WebページやYouTube動画の要約や全文書き起こしができる「ChatGPT Glarity」や「Glasp」など、さまざまな媒体を処理できるGPTベースのアプリやモジュールが次々と登場している。
また、「HuggingGPT」は、自然文による簡単な指示だけで複数の機械学習モジュールを組み合わせてタスクを半自律的にこなすアプリ。「AutoGPT」や「BabyAGI」、「GODMODE」など、外部ツールやデータにアクセスしながらタスクを立案、実施するGPTベースのプラットフォームも登場している。
一方で、生成AIへの過剰な期待や過信に慎重な意見も少なくない。「記号接地問題」(シンボル・グラウンディング:言葉の意味を理解しているか)や、高度なAI技術の驚異的な到達点(例えば「AI-directed science」)など、その負の側面が抱えるリスクは、あまり知られていない状況。人々はまさに、プレ・シンギュラリティとよぶにふさわしい状況を目の当たりにしている。
図1と図2は、2022年前後の生成AIの群雄割拠の様子をしめすAlan D. Thompson氏によるマップ。この1年でも、GPT-4の公開をふくめ、さまざまなセクター間でひしめき合うような動きが如実に示されている。この状況を、古生代カンブリア紀(およそ5億4200万年前から5億3000万年前のあいだ)の生物種の急激な増加と多様化を意味する「カンブリア爆発」になぞらえて、「生成AIのカンブリア爆発」と呼ばれることもある。
こうした生成AIの隆盛は、2017年にGoogleが発表した自然言語処理の深層学習モデルである「トランスフォーマー(transformer)」の想定外の能力がきっかけだった。自己注意(Self-Attention)機構により、もともとは翻訳などの文章変換の高速高精度化を目指して作られたものだったが、2018年には「文脈を読める」革新的な自然言語処理モデルである「BERT」を生み出し、その後、Vision Transformer(ViT)やTransGANなど、画像や音声を含めた幅広い処理に応用できるようになった。これらが今日の生成AIの基盤となっている。
今回、同社保有の「特許」、「グラント(公的研究費)」、「論文」、「ベンチャー企業」のデータベースを活用し、GoogleがTransformerを発表した2017年以降の全世界の生成AI関連の動向を調べた。生成AIの開発だけでなく、応用や生成AI開発のための基盤技術などを含みます。ここでは、とくに最近の特許と論文の動向を中心に紹介する。
4つのデータソースすべてにおいて、米国または中国が首位。とくに特許出願数では中国(11,975件)が、グラント件数では米国(981件)がそれぞれ2位の2倍近い件数で他国を引き離している。論文数では米中がほぼ互角(中国11,875件、米国11,174件)で3位のインドを5倍近い件数で圧倒。日本は特許出願数とグラント件数のいずれも4位。
国ごとの特許資産の総量を表すTPA(total patent asset)合計では、米国が圧倒的な首位で、2位の韓国、3位の日本の7~8倍の値を示しました。件数が首位だった中国は4位になった。
グラントの総配賦額(各国の基礎研究投資額の指標)では、米国が首位、英国が2位で両国が3位以下を大きく引き離しています。ベンチャー・スタートアップの新規設立数と資金調達額では、米国が圧倒的な首位を獲得している。
4つのデータソースすべてで出現する母集団特徴語(本領域の特徴的なキーワード)は、おおむね深層学習に関連するものであり、ベンチャー以外の3つのデータソースでも多く見られる研究テーマ。
【関連記事】
「Google一転、検索に生成AI導入 Microsoftを追う 攻防 生成AI(上)」日本経済新聞