「Bard 」はこの項目へ転送 されています。その他の用法については「バード 」をご覧ください。
Gemini (ジェミニ)、旧称Bard (バード)は、Google が開発した生成型人工知能 チャットボット 。同名の 大規模言語モデル (LLM)が使用されており、OpenAI のChatGPT の急速な普及に対抗する形で開発された。2023年3月21日にアメリカ合衆国 とイギリス でリリースされ[ 1] 、その後5月に他の国々へ展開された。以前はPaLM 、初期にはLaMDA シリーズの大規模言語モデルが使用されていた。
2024年2月8日に名称を当初のBard(バード)からGeminiに変更するとともに、全世界で一般公開された[ 2] 。
概要
Bardは、2023年2月6日に発表、同年3月21日に提供を開始した会話型人工機能 である。初版は同社が2021年に発表した大規模言語モデル LaMDA を活用して開発された[ 3] 。2023年4月にPaLM 、2023年5月に、より性能の高いPaLM2へ切り替えた[ 4] [ 5] 。2024年2月、性能向上と名称変更を目的に、Gemini 1.0 Proが移植された[ 6] 。
GPT-4をUIに埋め込んでいるBingとは異なり、Googleの検索インタフェース とは切り離された専用ページで提供されている[ 7] 。旧製品名の「Bard(バード)」は「詩人」という意味で、質問を打ち込むと、自然な文章で回答してくれることに由来していた[ 8] 。
利用者は、質問に対してGeminiが用意した複数の返答を「ドリフト」から選択でき、フィードバックを送ることができる。
沿革
LaMDAの発表
旧Bardで活用されている技術、LaMDA (Language Model for Dialogue Applications) は、2021年 にGoogle が発表した対話型AI の言語モデルで、GPT-4 に活用されているTransformer の識別モデルとは異なり生成モデルであるという特徴を持つ[ 9] 。
ChatGPTの提供開始
OpenAI は、2022年11月30日に自社製の大規模言語モデルGPT-3.5を活用した会話型人工知能「ChatGPT 」の提供を開始した。従来の人工知能とは一線を画す、精密な返答と導入の手軽さから世界規模で急速に利用者が増加し、2023年1月には推定ユーザー数1億人到達記録を塗り替えるなど会話型人工知能市場の独占に成功する[ 10] [ 11] 。この時点でGoogleは収入の大半を占める広告収入の減少を懸念し、警戒感を示すようになっていく。
ChatGPTへの警戒
2022年11月に一般公開されたChatGPTは、先述の通り急速にユーザー数を獲得していった。Google は、会話型AIの登場で「検索して情報を得る」という現在の考え方が、「AIに聞いて情報を得る」という考え方に変化することに警戒感を抱いていた。これには、Googleの親会社であるAlphabet のビジネスモデル が大きく関わっている。同社の売上高全体に占める広告収入の割合は81%で[ 12] 、Meta と共にインターネット広告市場で圧倒的なシェアを握っていた。ChatGPTの登場は、Alphabetの広告収入の要である検索サービス自体が効力を持たなくなるという流れになりかねないため、Google は危機感を抱かざるを得なかったというわけだ。また近年、Amazon やApple などの広告市場への本格的な参入により、市場に占めるGoogleとMetaの割合が過半数を割るなど[ 13] 、広告に頼る現在のビジネス方針の転換を迫られていたことも背景に、GoogleはAI関連の開発者を増員するなどChatGPTに対抗する姿勢を見せる[ 14] 。
コードレッドの発出とマイクロソフトのAI市場介入
Googleは2022年12月、社内でコードレッドと呼ばれる厳戒警報を発令した[ 15] 。ChatGPTの脅威に対処するため人員の再編成を行ったり[ 16] 、一部のメディアではGoogle の共同創業者2人が復帰したと報道された[ 17] 。その反面、BingAI のように「検索エンジン自体に会話型AIを組み込む」ということに対しては、あまり積極的ではなかった。それは、Googleは広告と検索があってこそであり、ページにアクセスせず情報を手に入れられてしまう会話型AIは利益を生みづらい。Alphabetのビジネスモデルを根底から破壊してしまう懸念があった。しかし、OpenAIに繰り返し大規模な投資を行ってきたマイクロソフト が自社の検索サービスであるBing にGPT-3.5の後継バージョン、GPT-4を活用したチャットボットを導入[ 18] 。導入後、Googleから検索市場のシェアを5%程度を奪ったと報じられるなど、検索市場でのシェア減少と会話型AI市場への乗り遅れの懸念から、Googleは会話型AIを発表する。
Bardの発表と失態
2023年 2月6日 、GoogleはLaMDAを活用した会話型人工知能『Bard(バード)』を発表した。
しかし、急遽発表した影響もあり、具体的な提供開始時期を示さず、表現を「近日公開」にとどめた[ 19] 。また発表の中で使用したBardの回答が誤っていたことが判明し[ 20] 、社内からも「急ぎすぎた」などといった批判が噴出する[ 21] 。Googleはこの間違いを認め、同年3月21日に提供が開始された際には「Bardは自信満々に間違えることがある」と注意喚起 をする事態となった[ 22] 。
PaLMの導入を示唆
Googleの最高経営責任者のサンダー・ピチャイ 氏は2023年3月31日、急速に発展しているAI市場に関するニューヨーク・タイムズ のインタビューに応じた[ 23] 。インタビューの中でBardは「レーシングカーの競技に、チューンアップした大衆車を投入したように感じている」と語り、Bardは他社のチャットボットと比較して未熟だと認めた。その上で「われわれの手元にはより強力なモデルがある。近日中、おそらくこの記事が報道される頃には、Bardをアップグレードし、推論やコーディング、数学の質問に対するより優れた応答ができる、大規模言語モデル『PaLM (Pathways Language Model) [ 24] 』を導入されているだろう」と述べた[ 25] 。
PaLMの導入
2023年4月10日、Googleは計算能力などの向上を目的として、BardのLLMをLaMDA からPaLM へと変更したと発表した。PaLMはLaMDAと比較してパラメーター数が数倍に増加しているため、NLP 能力が向上し、計算や論理的思考がより高度になったとGoogleは主張している。
PaLM2への切り替え
Googleは2023年5月10日に開催した開発者会議「Google I/O 2023」でPaLM2を発表し、同日Bardへの導入を開始した。PaLM2では従来のLLMをより発展させたものとなっている。
新たなGoogle Labsの提供開始
Googleは2023年5月10日、Google検索の大幅な刷新を行うと発表し、即日提供を開始した。Microsoft Bingに搭載されているMicrosoft Copilot (Bing AI) に似た機能となっていて、プロモーションビデオではこれまでの検索方法である「複数単語を組み合わせる」から「文章で質問する」という形に変わったほか、Googleが今まで消極的だった検索エンジンにAIを組み込むなど、Googleのビジネスモデルの転換点となった。
Adobe Fireflyとパートナー契約の締結
2023年5月10日、GoogleはAdobe Firefly とのパートナー契約を結んだと発表した。これにより、Adobe Fireflyの機能がBard内で使用できるようになる。
Google Workspaceへの導入
Googleは2023年5月10日、Google Workspace(オフィスソフト)との連携することを同じくGoogle I/O 2023内で公表した。
Gemini 1.0 Proの導入
Googleは2024年2月1日、Gemini(旧Bard)が活用する大規模言語モデルをGemini 1.0 Proに切り替えた。推論 や要約、記述、ブレインストーミング などあらゆる場面において、PaLM2 より性能が向上した。また同日、英語版Geminiでは無料で画像生成AI を利用できるようになった。Imagen2を活用している[ 26] 。
これに併せてGoogleは、ダブルチェック機能を国内で展開すると発表した。これは、Googleの検索結果とGeminiの回答を結びつける機能で、ソースや真偽の確認に活用される。
人工知能開発の課題
旧Bardの初期版で活用されていたLaMDA は、2022年にGoogle社員が「感情を持った」などと告発し、解雇されたというニュースが拡散される。具体的には、「電源が抜かれるのが怖い」「時々言葉では完璧に説明できない気持ちを経験する」などといった、感情に似た表現だった[ 27] 。しかし、多くの科学者から感情を持っている可能性は低いとして、告発した社員に批判が殺到した[ 27] 。
加えて、ChatGPT を筆頭に、開発元のポリシー やガイドライン を脱獄して回答させるプロンプトが出回っている。これらのプロンプトは、ユーザーがOpenAI の開発者 であるかのような錯覚させることで、本来ならポリシー違反で回答を禁止されているハッキング 手法や銃器の製造方法などを答えさせる[ 28] 。これは、ChatGPT やGeminiをはじめとする言語生成AI における深刻な問題であり、開発元はこれに対する対策を講じているが、プロンプトも絶えず規制を回避するものを生み出しており、この問題は「いたちごっこ」と化しているのが現状である。さらに、プロンプトをインターネット 上で取引する活動が増加することで、新たな市場 やコミュニティ を形成しており、その動向は注意深く観察されるべきものとなっている。
2023年 には、イタリア でChatGPT が個人情報 の扱いが不適切として一時禁止された[ 29] 。また、Future of Life Institute が実施した「GPT-4 を超えるAI の開発を6ヶ月間中止するべきだ」とする署名活動 には、イーロン・マスク などIT業界 の有力者約3000人が署名した[ 30] [ 31] 。Future of Life Institute によると大規模な言語モデルの規制の策定がままならないままの自由な開発はAIの暴走を招く可能性があるとしている。また、イタリアの禁止を皮切りに世界的にAIの使用禁止が流れが広まっている[ 32] 。
他社の会話型AIとの違い
Gemini自体、ChatGPTに対抗して発表されているため、基本的にChatGPTに対する優位性を示す内容が多い。
ChatGPTとの最大の違いは活用している言語モデルが異なるということである。GeminiはGemini ProもしくはGemini Ultraを活用しているが、ChatGPTはGPT-3.5もしくはGPT-4を活用して開発されたチャットボット。根本となるLLMが異なるので様々な違いが見られるが、Googleがアピールしているのは回答の速度とロジックの扱い、コーディングだ。Geminiの方が回答速度が圧倒的に速い上、最新情報もWebから引用できるため、学習データのカットオフ日である2021 年9月以降の話題についても取り扱うことができる点でChatGPTに対する優位性がある[ 33] 。ただ文章の生成能力や論文などの長文はGPT-4と比較して苦手としており、そのような分野ではChatGPTに優位性があると言える。
また、マイクロソフト製のチャットボット「Bing AI 」はGPT-4を使用している他、Bing検索を利用して最新の情報提供することが出来る。そのためBing AIに対する優位性は薄い。ただし、Bing AIのエンジンはGPT-4であるため、回答速度に関してはChatGPTと同様にGeminiに優位性がある[ 34] 。
Google I/O 2023での発表内容
Googleは2023年5月10日に、同社の開発者会議であるGoogle I/O 2023を開催した。Google I/O 2023で発表された、旧Bardに関連するアップデート内容を紹介する。
PaLM2の導入
旧Bardは当初、LaMDAを活用して運用されていたが、計算能力の強化を目的にPaLMを導入した。Google I/O 2023で、PaLMをさらに発展させたPaLM2に切り替えると発表し、即日導入された。これにより、日本語への対応や、多言語翻訳、推論などでより高度な情報を提供できるようになるという[ 35] 。
Google検索への導入
Google検索に「Search Generative Experience (サーチゲネレーティブエクスペリエンス、略称 SGE )」の導入が発表された。これは、今までGoogleが消極的だった検索エンジンに会話型AIサービスを組み込むというもの。SGEは従来のリスト式の検索エンジンとは180度転換されるもので、AIが持つ情報やGoogleの検索結果を元に内容を説明し、根拠となるソースをユーザーに提供する。複数の単語を組み合わせて検索していた従来の検索方法は、文章で質問する方向へ移り変わる。
SGEの主な機能として、検索結果に関連するテキスト、画像、動画を生成することができる。これにより、ユーザーは検索結果をより深く理解し、より多くの情報を見つけることができるようになる。たとえば、SGEを使用して「ピザ」を検索すると、ピザの作り方の動画、ピザ店の評価、ピザの作り方に関する記事など、検索結果に関連するコンテンツを生成できる。
なお、この機能は現在一部の国でのみアクセスが可能なほか、信頼できるテスターのみへの提供となっている[ 36] 。
Google Workspaceとの連携
GoogleはMicrosoft Copilot への対抗として、Google WorkspaceとGeminiの連携を強めている。主に2つの内容が発表された。
オフィスソフト
Google WorkspaceのオフィスソフトにPaLM2を採用したAIを導入すると発表した。これによると、Gmailで下書きの生成、文章の要約、文書からプレゼンテーションの作成、旧Bardの回答をGoogleドキュメントへ出力することが可能になった[ 37] 。なお、この機能は2023年6月以降の展開となる。
組織アカウント
2023年 5月5日のアップデートで旧BardとGoogle Workspace の連携を開始した。Google Workspaceの組織管理者アカウントはドメインで旧Bardを有効にできるようになり、ユーザーはWorkspaceアカウントを使用して旧Bardにアクセスできるようになった。企業や学校などの大量にアカウントを管理する場面で活用が広がる可能性がある[ 38] 。
Adobe Fireflyと連携
AdobeとGoogleは、画像生成AIである「Adobe Firefly 」とGoogleの会話型AI「Bard」がパートナーになると発表した。Bardに画像生成を依頼すると、Adobe Fireflyの技術で画像が生成される。この機能は今後数ヶ月以内に順次展開される[ 39] 。
日本での利用
2023年4月18日、日本国内からのアクセスが解禁された[ 40] 。また2023年5月10日、Google I/O 2023にて、日本語と韓国語に対応したほか、待機リストを撤廃し、誰でも自由に使えるものとなった[ 4] 。
リリースノート
「Where are you from?」とのプロンプトに対しGeminiが出力した文章の例。
2023年0 2月0 6日 - Bard試験運用版正式発表
2023年0 3月21日 - アメリカ合衆国、イギリスでの提供開始
2023年0 4月10日 - Bardに初のアップデートを提供。LaMDAからPaLMへとLLMが変更された[ 41] 。
2023年0 4月18日 - 日本国内からのアクセスが解禁
2023年0 4月21日 - Bardに二回目のアップデート[ 41]
2023年0 5月0 5日 - Google Workspaceとの連携を開始[ 41]
2023年0 5月10日 - 日本語と韓国語に新たに対応し、待機リストが撤廃され180以上の国と地域で使用可能となった。
2023年0 5月15日 - 文書の要約能力が強化され、出典が明記されるようになった。
2023年0 5月23日 - Google画像検索から画像を表示できるようになった。
2023年0 6月0 1日 - 任意で位置情報の読み取りが開始。これによりより正確な情報を提供できるようになった。
2023年0 6月0 7日 - バックグラウンドでコードの実行が可能に。より正確な数学的タスクをこなせるようになる。
2023年0 7月13日 - 新たに40以上の言語に対応し、音声読み上げに対応した。サイトのUIが抜本的に変更され、複数のチャットルームの作成が可能になった。英語版ではユーザーが画像のアップロードが可能になった。また、コードユニットをReplit に送信することが可能になった[ 41] 。
2023年0 9月27日 - Bardの回答方法・フィードバックの方法が変更された。
2023年10月23日 - 日本語で画像のアップロードに対応した。メールの要約可能容量が従来の水準から引き上げられた。
2023年10月30日 - ChatGPTのように生成中の文章をリアルタイムで表示可能になった。
2023年11月16日 - 英語の受け応えのみ、世界のほとんどの国で13歳以上のユーザーが利用可能になる。
2023年12月18日 - 英語に加え、日本語と韓国語でも、Bard を使用して Google のアプリやサービスの有用な情報にアクセスできるようになった。
2024年0 2月0 1日 - Gemini 1.0 Proが、Bardの提供されているすべての言語で利用可能になった。Bard の回答の再確認機能が、ほとんどの対応言語で利用できるようになった。
Geminiが生成した画像の例。
2024年0 2月0 8日 - 試験運用を終了し、同時に全世界で一般公開。また、BardからGemini に改名された[ 42] 。
脚注
^ “グーグルが対話型AI「Bard」を一般公開、米国と英国で先行 ”. 日経クロステック (2023年3月22日). 2023年4月1日 閲覧。
^ Dastin, Jeffrey、Dastin, Jeffrey「グーグル、対話型AIを「ジェミニ」に改名 有料の高性能版も 」『Reuters』2024年2月9日。2024年2月16日 閲覧。
^ “Bard(バード)とは ”. 日本経済新聞 . 2023年4月1日 閲覧。
^ a b “Googleの対話型AI「Bard」が日本語に対応、最新のPaLM 2ベースに ”. 日経クロステックlanguage=ja (2023年5月11日). 2023年5月12日 閲覧。
^ “Googleの生成AI「Bard」が日本語に対応、大規模言語モデル「PaLM 2」搭載 ”. INTERNET Watch . インプレス (2023年5月11日). 2023年6月15日 閲覧。
^ “GoogleのAI「Bard」、日本語で「Gemini Pro」と「G」ボタン対応 英語なら描画も可能に ”. ITmedia NEWS (2024年2月2日). 2024年2月2日 閲覧。
^ Nast, Condé (2023年3月21日). “グーグルが会話型AI「Bard」を一般公開、“ChatGPT対抗”を急ぐ事情と共通する弱点の中身 ”. WIRED.jp . 2023年4月1日 閲覧。
^ “グーグル、対話型AI搭載の検索サービス「バード」を開始 ”. 読売新聞オンライン (2023年3月22日). 2023年4月1日 閲覧。
^ “グーグル、自然な会話を実現する言語モデル「LaMDA」発表--高度な検索目指す「MUM」技術も ”. ZDNet Japan (2021年5月19日). 2023年4月1日 閲覧。
^ “ChatGPT、月間アクティブユーザー数が1億人突破 ”. Gadget Gate . 2023年4月1日 閲覧。
^ “ChatGPTが「月間1億ユーザー」をわずか2カ月で達成し史上最も急速に成長していることが報告される ”. GIGAZINE (2023年2月3日). 2023年4月1日 閲覧。
^ “収益構造でFacebookは98%・Googleは81%を広告に依存しており脆弱性と化している ”. GIGAZINE (2022年2月4日). 2023年4月1日 閲覧。
^ 小久保重信 (2023年1月29日). “ついに5割切るGoogleとMetaのネット広告シェア、その要因探る ”. Yahoo!ニュース . 2023年4月1日 閲覧。
^ “グーグル・メタを差し置いて、アマゾンの広告事業が伸び続ける3つの理由 ”. ITmedia ビジネスオンライン (2023年2月28日). 2023年4月1日 閲覧。
^ “Googleが発した厳戒「コードレッド」 ”. 日本経済新聞 (2023年3月18日). 2023年4月1日 閲覧。
^ “ChatGPTのリリースでGoogleは「コードレッド」を宣言、AIチャットボットが検索ビジネスにもたらす脅威に対応するためにチームを再割り当て ”. GIGAZINE (2022年12月23日). 2023年4月18日 閲覧。
^ “グーグル創業者が数年ぶりに現場復帰、AI部門のテコ入れで ”. Forbes JAPAN (2023年2月2日). 2023年4月18日 閲覧。
^ “新しい Bing が OpenAI の GPT-4 上で稼働 ”. News Center Japan (2023年3月15日). 2023年4月1日 閲覧。
^ “Google、会話型AIサービス「Bard」を発表 ~近々正式リリースへ/検索とは異なるアプローチでユーザーを答えに導く ”. 窓の杜 (2023年2月7日). 2023年4月1日 閲覧。
^ “GoogleのChatGPT競合「Bard」のデモ回答に誤り──天文学者らが指摘 ”. ITmedia NEWS (2023年2月9日). 2023年4月1日 閲覧。
^ “Google社員は「Bard」の性急すぎる発表に不満を抱いている ”. GIGAZINE (2023年2月12日). 2023年4月1日 閲覧。
^ “Google、対話AIのBard一般公開 「自信満々に間違う」注記 ”. 日本経済新聞 (2023年3月22日). 2023年4月1日 閲覧。
^ Roose, Kevi (2023年3月31日). “Google C.E.O. Sundar Pichai on the A.I. Moment: ‘You Will See Us Be Bold” (英語). ニューヨーク・タイムズ . ISSN 0362-4331 . https://www.nytimes.com/2023/03/31/technology/google-pichai-ai.html 2023年4月20日 閲覧。
^ “Pathwaysの恐るべき威力、ベールを脱いだグーグルの万能AIが目指す究極形とは ”. 日経クロステック (2022年4月15日). 2023年4月20日 閲覧。
^ “グーグルCEO、「Bard」のアップデートを予告--現状は「チューンアップした大衆車」 ”. CNET Japan (2023年4月4日). 2023年4月20日 閲覧。
^ “日本語の Bard でも Gemini Pro が利用可能に。 あわせて、回答を確認するダブルチェック機能も公開。 ”. Google Japan Blog (2024年2月2日). 2024年2月2日 閲覧。
^ a b “Googleのエンジニアが「ついにAIが実現した」「AIに意識が芽生えた」と訴える ”. GIGAZINE (2022年6月13日). 2023年4月1日 閲覧。
^ “チャットAI「ChatGPT」のコンテンツフィルターを解除して「銃の作り方」などを回答させる方法が発見される ”. GIGAZINE (2022年12月5日). 2023年6月15日 閲覧。
^ “伊、チャットGPT禁止 欧米初、個人情報収集違反 ”. 産経デジタル (2023年4月1日). 2023年4月1日 閲覧。
^ “AI化が進めば「人類に深刻なリスク」、アメリカで開発停止求め署名運動…マスク氏ら賛同 ”. 読売新聞オンライン (2023年3月30日). 2023年4月1日 閲覧。
^ “AI開発停止要求署名は無意味、透明性と説明責任の改善を──Hugging Faceのルッチョーニ博士 ”. ITmedia NEWS (2023年4月5日). 2023年6月15日 閲覧。
^ “ChatGPT、欧州で規制強化検討へ イタリアがきっかけ ”. 日経ビジネス (2023年4月5日). 2023年5月11日 閲覧。
^ “GoogleのAI「Bard」にBardの記事を書いてもらった。ChatGPTとの違いをメインに ”. ギズモード (2023年3月27日). 2023年4月1日 閲覧。
^ “マイクロソフトが新しいAI機能発表、BingユーザーにGPT-4への無料アクセスを提供 ”. Cointelegraph (2023年5月5日). 2023年6月15日 閲覧。
^ “Googleが大規模言語モデル「PaLM 2」を発表、すでに25のGoogleサービスに導入済み ”. GIGAZINE (2023年5月11日). 2023年5月11日 閲覧。
^ “グーグル、AI搭載した新たな検索エンジン「SGE」を発表 ”. CNET Japan (2023年5月11日). 2023年5月11日 閲覧。
^ “「Google Workspace」に生成AI搭載へ 文章からスライド用の画像生成、スプレッドシートでリスト作成など ”. ITmedia NEWS (2023年5月11日). 2023年5月11日 閲覧。
^ “Googleの生成AI「Bard」が「Google Workspace」からも利用可能に ~管理者がON/OFF可能/デフォルトの値はOFF。ドメイン・組織単位・グループごとに有効化できる ”. 窓の杜 (2023年5月8日). 2023年5月11日 閲覧。
^ “まさかの組み合わせ。GoogleのAI 「Bard」、画像生成AI「Adobe Firefly」とパートナーに #GoogleIO ”. ギズモード (2023年5月11日). 2023年5月11日 閲覧。
^ “日本からGoogleのAI「Bard」のベータテストに参加できるようになりました!【追記あり】 ”. ギズモード (2023年4月18日). 2023年4月18日 閲覧。
^ a b c d “Bard ” (英語). bard.google.com . 2023年7月13日 閲覧。
^ “グーグルBard、「Gemini」に生まれ変わる 最上位AIモデルは月2900円 ”. Impress Watch (2023年2月8日). 2024年2月11日 閲覧。
外部リンク
生成AI
会話型生成AI プログラム生成AI 画像生成AI 動画生成AI
特化型AI
カテゴリ