だが、ChatGPTをはじめとする生成AIが世界中で多様な問題を抱えているのは周知のとおりだ。そんな中で、「自国独自の公的な生成AIを開発しよう」というプロジェクトを始めようとする国もある。日本は今のところこうした予定はない。
国内では、民間で、「和製AI」を開発する動きが活発になってきた。5月11日、サイバーエージェントが独自の日本語LLM(大規模言語モデル)を開発したと発表した。既に130億パラメータまで開発が完了、AIを活用した広告配信やクリエーティブ制作などで活用を始めているという。続く17日、同社は最大68億パラメータの日本語LLMを一般公開したと発表した。公開されたモデルはオープンな日本語データで学習したもので、商用利用可能なライセンスで提供される。これをベースとして、対話型AIなどの開発も可能となる(なお、LLMの性能は「パラメータ」という指標で示され、AIの頭脳の大きさに相当し、一般にその数が多いほど性能は上がるとされる)。
また、これまで、AIキャラクターと人のテキスト・音声・画像を介した新しいコミュニケーションの形を提供してきたrinnaは5月17日、日本語に特化した36億パラメータを持つ汎用(はんよう)言語モデルと対話言語モデルの2種類の言語モデルをオープンソースで公開した。
その他にもさまざまな動きがある。例えば、東京工業大学、東北大学、富士通株式会社、理化学研究所は、スーパーコンピューター「富岳」を活用した日本語LLMの研究開発を2023年5月から実施すると発表。今後、アカデミアや企業が幅広く使える大規模言語モデルの構築環境を整え、国内におけるAIの研究力向上への貢献をめざす。さくらインターネットが経済産業省の補助を受け、2024年に生成AI向けクラウドサービスを開始するという報道も目新しい。
これら以外にも、NTTが2023年度中に独自開発の生成AIを企業向けビジネスとして展開、NECが特定分野に特化した独自の生成AIの提供を2023年中にも開始、オルツが1600億パラメータのLLMを開発、など「和製AI」開発のニュースが目白押しとなっている。
やはり日本語対応が使いやすい?!どのような特性があるのか
日本語に特化した「和製AI」を開発すれば、対話型AI・生成AIにおいてさらに自然な日本語の文章生成が可能となるだろう。というのも既存のLLMのほとんどは英語を中心に学習され、日本語および日本文化に強いLLMは少ない状況であったからだ。
確かにChatGPTやBingを使ってみると、その流ちょうな日本語での応対に驚く。ChatGPT搭載の「GPT-3.5」は3550億パラメータ、最新の「GPT-4」は推定で兆単位といわれている。それに比べれば「和製AI」の規模は小さい。とはいえ、ChatGPT関連が多くの言語に対応することからすれば、用途を日本語に限定することで、小さな規模で済む。規模が小さければ、開発や運用を低コストで行えるし、利用時に動きが軽いなど小回りがきく、といった多くのメリットを享受できる。
和製AIでは、用途を特化することで、業務などに効率的に使えるLLMを開発することも可能だという。例えば、オルツが開発した医療向け生成AIは医学に特化した生成AIだ。サイバーエージェントとrinnaは無償版のモデルも公開しており、商用利用も認めているため、能力のあるユーザーが自由に開発することなどで、さらなる活性化も望めそうだ。
Googleの「Bard」など日本語対応で展開するのも。特徴を紹介
多言語に対応した大規模サービスは日本語が不自由か、というとそうでもない。4月10日、ChatGPTの開発元の米OpenAIのサム・アルトマンCEOが来日した際に、CEOは、日本での活発なChatGPTの利用などを引き合いに、日本関連の学習データのウェート引き上げなど7つの提案を行った。今後、OpenAIの日本語関連の動きも目が離せない。
大規模サービスの一例としては、Googleの提供する会話型AIサービス「Bard」にも注目が集まっている。Googleは、Bardの試験運用版を4月10日に提供開始、5月10日にはBard を利用できる国と言語を拡大したと発表、英語に加え、日本語と韓国語で利用可能になった。英語の次に日本語という、いわば優先的な扱いには期待が持てそう、と感じるところだ。
Bandで、ChatGPTやBingと同様の質問を試みると、なかなか的を射ていて、しかも情報が密と感じた。まさにGoogleのいうところの「創造力や生産性を高めるAIパートナーとして、ユーザーをサポートします。例えば、おいしい卵焼きを作るためのコツを教える、新商品発表会のプレゼンの構成を考える、初めてのソロキャンプの持ち物リストを作成するなど、日常のさまざまな場面で役立ちます」という感じだ。今後の動きや本サービスの開始が楽しみだ。
今後どうなっていくか、どう使うか、傾向と対策
ChatGPTへの日本からのアクセスは、米国、インドに次いで世界3位という。しかもChatGPTの利用は日本政府から率先して積極的なのは、以前のコラム「ChatGPT活用で温度差。日本と世界の捉え方の違い」で解説してきたとおり。
だが、米国でのセキュリティ企業が行った調査では、企業の社員がChatGPTに投げかけたデータの1割超は機密情報にあたるという。特に企業や自治体内での利用については、情報を守るためのルールやシステム作りが必須および急務といえる。日本のAIに対する積極的な姿勢と日本語特化AIの開発状況は盛況で良いことだが、情報漏えいのリスクをはじめ、このコラムで述べてきたようなさまざまな課題を抱えていることを忘れてはならない。
今後、日本政府は「我々が共有する民主的価値に沿った、信頼できるAI」をめざす。6月9日に閣議決定された「統合イノベーション戦略2023」における「AIに関する暫定的な論点整理」では、「我が国は、研究・技術水準の高さ、ロボット・AIへの肯定的イメージ、労働人口急減、デジタル化への高いニーズ、きめこまやかさ・創造性など、生成AIとの親和性が高く、大きなチャンス」としつつ、「AIに国境はなく、国際的な共通理解・ルールづくり・相互運用性が重要。我が国は“広島AIプロセス”などを通じ、議論をリードすべき」「生成AIの開発・提供・利用を促進するためにも、生成AIの懸念やリスクへの適切な対応を行うべき」としている。
AIの未来がどうなるか誰にも分からない。利用や開発におけるメリット・デメリット、諸問題の理解とともに、良識と広い視野で、動きを見守り、利用していこう。
※掲載している情報は、記事執筆時点のものです