Google I/O '24 Keynote まとめ

2024/05/16に公開されました。
2024/05/16に更新されました。

米太平洋標準時 14日午前10:00(日本時間 15日午前2時)より開催されたGoogle I/O '24のKeynoteまとめです


author: teikoku-penguin

はじめに

こんにちは、teikoku-penguinです。

日本時間15日の午前2時(米国太平洋標準時間で14日午前10時)に米国カリフォルニアでGoogle I/O ‘24が開催されました。

主にGeminiなどの生成AIプロダクトについて語られています。

今回はそんなKeynoteで発表された内容の簡易的なまとめになります。

Google I/O ‘24 Keynote

AI Overviews

Geminiを用いてより長く複雑な検索や画像を用いた検索を処理できるようになります。

通常複雑な内容を調べようとすれば、順を追って情報を検索し、得た情報でさらに検索をしていきますが、AI Overviewsを用いればGeminiが代わりに複雑な内容を分解して検索し、概要としてまとめて提供してくれるようです。

SGE(Search Generative Experience)としてGoogle Search Labsから試験提供されていた機能で、リリースに伴いAI Overviewsと名前が変わりました。

米国で日本時間15日の午前2時から、その他の国では近日中に提供される予定と語られています。

Ask Photos

GeminiでGoogle Photoから特定の画像を検索できるようになるようです。

デモでは駐車場で料金の支払いをする際に自分の車のナンバーが思い出せない時、以前ならキーワード検索をして大量の写真の中からナンバープレートの写真を見つけるところ、Geminiに聞けばナンバープレートの写真を絞り込み、直接ナンバーを教えてくれる様子が見て取れます。

また、別のデモでは娘がいつ泳ぎを覚えたのか知りたい場合や上達する過程を追いたい場合にもGeminiが写真を探してまとめて表示してくれている様子が紹介されています。

今夏に展開予定で今後さらに色々な機能が追加されるようです。

いわゆる囲って検索です。

画像の中から気になった靴の部分を囲って検索などができます。

Androidで提供開始とのこと。

Gemini 1.5 Pro

世界中の開発者にGemini 1.5 Proが提供開始となります。

またGemini Advancedを利用しているユーザーは本日から35ヵ国語でGemini1.5 Proを利用できるようになったようです。

そして100万トークンの処理能力も驚くべきことですが、Googleは200万Context windowまで拡大したGemini 1.5 Proを開発者プレビューで提供開始しました。

Gemini 1.5 Flash

FlashはProと比較してより軽量で高速でより安価に利用できるよう設計されたモデル。

Gemini 1.5 Pro 100万トークン版と合わせてGoogle AI StudioとVertex AIで利用可能になりました。

また開発者は200万トークン版も利用可能になります。

Gems

Geminiを目的にあわせてカスタマイズできる機能。

予めプロンプトを設定して料理の専門家として振る舞うようにカスタマイズしたりできます。

プロンプトではGoogleドライブから資料を参照して返答に役立てることもできるようです。

Gemとして保存できるので何度も同じようなやり取りする場合に最適です。

今後数ヶ月以内に提供される見込みとのこと。

Project Astra

新しいAIアシスタントのプロジェクトです。

Geminiにカメラで撮影しているリアルタイムの映像を認識させて音声で質問すると音声と文章で返答する様子がデモされました。

デモではデスクに置かれた色鉛筆で何ができるかを答えさせたり、PCの画面に映し出されたコードを見せて何をするコードか答えさせたり、窓の外の景色からオフィスの場所を答えさせたり、キャッシュ機能を活かして少し前に映像に写っていた情報から置き場所を忘れたメガネの位置を答えさせる様子も披露されました。

メガネはGoogle Lensで、ホワイトボードに書かれたシステムのアーキテクチャ図から速度改善の案を提示させたり、猫のイラストと?が描かれた箱でシュレディンガーの猫と応えされるような連想ゲームをしたりと、Google Lensからの映像にも対応できるようです。

今後Gemini Advancedユーザー向けにまずはGemini Liveとして音声での質問やリアルタイムでの動画認識機能が提供されるようです。

Gemini for Google Workspace

Gemini 1.5 Proを搭載したサイドパネルが日本時間15日の午前2時(米国太平洋標準時間で14日午前10時)からWorkspace Labsで利用可能になりました。

またGeminiを搭載したサイドパネルがGemini for Google WorkspaceやAI Premiumを契約しているユーザーに来月から一般提供開始となるようです。

デモでは子どもの学校からのメールやそのメールに添付された資料を要約する様子などが披露されました。

他にもやり取りが続いて長くなってしまったメールのスレッドをボタン1つで要約するsummarize機能や、メールの情報を質問に基づいて検索、回答を生成するGmail Q&A機能、コンテキストに基づいた返信を自動で生成するContextual Smart Reply機能も紹介していて、これらの機能Wokrspace Labsユーザーに今月から7月にかけて提供が開始されるようです。

その他にもスプレッドシートやドライブ、カレンダーやメールなどWorkspaceを横断的に利用してメールに添付された領収用のPDFファイルから情報を抽出、Google Driveにフォルダを作って領収証をまとめ、領収証のサマリーをスプレッドシートに記載するといったことを自動化するData Q&A機能やAI Workflows機能もWorkspace Labsユーザー向けに9月から提供が開始されるようです。

AI Teammate

WorkspaceでGeminiを利用したAI BOTのようなサービスが今後登場します。

AI Teammateは独自のWorkspaceアカウントを持ち、仮想のチームメイトとしてプロジェクトや業務をサポートしてくれます。

デモではGoogle Chatでチームの一員として質問に答えたり、資料の作成依頼を受けて生成するといった様子が披露されました。

現在はプロトタイプを作成中とのことです。

NotebookLM

Gemini 1.5 ProがNotebookLMに導入され、音声で質問に答えるAudio Overviewが利用可能になります。

パーソナライズされたAI家庭教師としてますます期待できそうです。

Android

Gemini nano

今後GeminiはAndroid OSにも統合され、端末上で処理することでプライバシーを担保しながらユーザーの操作に関連するような回答を生成できるようになるようです。

また詐欺電話を検知し、警告ダイアログを表示する機能も搭載されるとのこと。

画像、音声、動画の生成モデル

Imagen3

今までで最も高性能な画像生成AIモデルでlabs.googleのImageFXから利用できるようです。

またVertexAIを利用する開発者にも近々提供されるとのこと。

Music AI SandBox

音楽生成のAIツールでプロンプトを用いてメロディーのループを作成したり、メロディーそのものを生成できます。

デモではミュージシャンがメロディーを考える際にツールでサンプルを生成する様子などが披露されました。

Veo

高性能なビデオ生成モデルでテキスト、ビデオ、画像のプロンプトから1080pの動画を作成できます。

現在は順番待ちリストに登録した一部のユーザーがlabs.googleのVideo FXというツールから利用できるようです。

視覚言語モデル

PaliGemma

Googleからオープンソースの画像認識モデルがリリースされました。

Gemma2

現在提供されているGemmaの次世代版で開発者からのより大きなモデルを望む声を受けパラメーター数が270億になるとのこと。

Nvidiaによって次世代GPUで実行するための最適化が行われておりVertex AIの単一のTPUホストで実行できるそうです。

数週間以内に提供が開始されるとのこと。

セキュリティー

SynthID

電子透かしの技術がアップデートされ、今まで生成した画像と音声にのみ対応だったものが文章と動画にも対応するようです。

Computing Resource

Trillium

第6世代で前世代と比較してチップあたりの処理効率が4.7倍のTPUが発表されました。

2024年後半に提供開始になるようです。

NVIDIA Blackwell GPU

NVIDIAから2025年初頭に発売される最先端のGPUです。

クラウドプロバイダーとしてGoogleが最初のプロバイダーの1つとのこと。

おわりに

生成AIでますます便利な時代がやってきますね。

6月や7月に提供が開始されるツールなど今後の生成AIとGoogleの動向が楽しみです。

紹介した内容以外にも細かいところで新規の機能やアップデートが発表されていますので、是非ご自身の目でも確認してみて下さい。

また最後になりますが、各プロダクトの公開日等は変更となる可能性も考えられますので考えられますので必ずしも記事に記載の次期ではない可能性に注意して下さい。

※本記事は、ジーアイクラウド株式会社の見解を述べたものであり、必要な調査・検討は行っているものの必ずしもその正確性や真実性を保証するものではありません。

※リンクを利用する際には、必ず出典がGIC dryaki-blogであることを明記してください。
リンクの利用によりトラブルが発生した場合、リンクを設置した方ご自身の責任で対応してください。
ジーアイクラウド株式会社はユーザーによるリンクの利用につき、如何なる責任を負うものではありません。