GCP AIの最新動向

2021/07/10に公開されました。
2021/07/10に更新されました。

GCP AIの最新動向を探る


author: izzo

はじめに

DXチームのizzoです。 長期のリモートワークで腰痛に悩まされる日々でしたが、毎日1時間程度のウォーキングを始めてからほぼ解消し、全体的に体調がよくなってきました。怪我の功名ですね。

背景

5月にローンチされたVertex AIから、Google Cloud AIプロダクトの拡充が加速しています。

AI民主化の流れも、より身近なところで実感できるようになってきました。我々エンジニアにとっても大きく話題となったGithub Copilotは記憶に新しく、すでにコーディングの際に恩恵を感じている方も多いことでしょう。

また、データサイエンティストの専門分野であったAI周辺技術も、クラウドによってデータエンジニア、ウェブエンジニアが容易に扱える領域になってきました。今後よりAIのニーズが高まるにつれ、データエンジニアにとって抑えておかなければいけない技術領域になってきたともいえるでしょう。 営業的な目線でもデータレイク、DWHプラスAIといったMLOpsを実現可能な環境構築、データ設計、BI化のお問い合わせが多くなってきていることを日々実感しています。

AIの周辺技術はGoogleが先導してきたということもありGCPで展開しいている各AIプロダクトも充実しています。ノンコードですぐに利用できるAutoML、Vision APIをはじめとして、BigQuery単体でも手軽にAI分析予測可能なBigQuery ML等、提供している領域は広範にわたります。

Vertex AI

Vertex AIはマネージド機械学習(ML)プラットフォームです。

オーバービュー

このプラットフォームは、企業において人工知能()モデルのデプロイおよび維持を迅速に行えるようにするものです。

機能は多岐にわたりますがVertexの機能として新たに組み込まれたFeature Storeにより、ユーザは機械学習の様々な機能を提供シェアし、再利用できるようになりました。特徴量の共有と再利用、トレーニング、推論で利用する特徴量をAPIで取得します。スケーラブル・低遅延で特徴量のオンラインサービングが容易になりました。 feature_store_image

デプロイ、継続的モニタリングサービスとしてはVertex Pipelinesがあります。AI Platform Pipelinesからの改名で、モデル用データの準備および分析、モデルトレーニング、並びにそれらを評価しプロダクション環境へデプロイを行う一連のワークフロー管理を提供しています。 vertex_pipelines_image

裏話となりますがVertexのローンチはGoogle Cloudチームによる反省の結果である、という背景もあるようです。 Google CloudのAI Platformでプロダクト管理を担当しているディレクターのCraig Wiley(クレイグ・ワイリー)氏は、次のように語っています。 「私見ではエンタープライズの機械学習は今危機にあります。その分野で何年も仕事した者の1人として現状を見れば、Harvard Business Reviewなどに論評を書いているアナリストの誰もが今や大半の企業が機械学習に投資をしたり投資に関心を示しているが、どこもそこから価値を得ていないと言っている。こんな状況はそろそろ変わるべきです」

Googleは多岐にわたるAIプロダクトをGCP上で展開してきましたが、プロダクションへ移行するためのプラットフォームとしては不十分であったため、エンタープライズMLOpsを実現するための統合されたプラットフォームとしてVertex AIを開発しました。Vertex AIによってモデルの全ライフサイクルを管理できるようになり、エンタープライズMLOpsを実現することでリアルな価値を生み出すことができる環境が整ってきたと言えるでしょう。

Notebooks のセットアップ

GCPでAIプロダクトを触るのが初めてという方のために、まずはインタラクティブなPythonコードをVertex AIで試せるよう、Notebooksのインスタンスを構成する方法をご説明します。

Notebooksを使用すると、JupyterLabにあらかじめパッケージ化されている仮想マシン(VM)インスタンスを作成し管理できます。 Notebooksインスタンスには、ディープラーニング パッケージスイート(TensorFlowおよびPyTorchフレームワークのサポートなど)がプリインストールされています。ニーズに合わせて、CPUのみのインスタンスかGPU対応のインスタンスを構成できます。

  1. CloudShellまたはCloudSDKがインストールされているターミナルから、最初に新しいインスタンスのいくつかの環境変数を定義します。
export INSTANCE_NAME="example-instance"
export VM_IMAGE_PROJECT="deeplearning-platform-release"
export VM_IMAGE_FAMILY="tf2-2-3-cpu"
export MACHINE_TYPE="n1-standard-1"
export LOCATION="us-central1-b"
  1. インスタンスを作成するには、次のコマンドを実行します。
gcloud notebooks instances create $INSTANCE_NAME \
  --vm-image-project=$VM_IMAGE_PROJECT \
  --vm-image-family=$VM_IMAGE_FAMILY \
  --machine-type=$MACHINE_TYPE --location=$LOCATION
  1. notebooks API使用許可を許諾します。
API [notebooks.googleapis.com] not enabled on project [PROJECT NUMBER].
Would you like to enable and retry (this will take a few minutes)?
(y/N)?  y
  1. ノートブックコンソールからインスタンスにアクセスします。 console_image

インスタンスは、デフォルトで外部IPアドレスを使用して作成されます。外部IPアドレスなしでインスタンスを作成する場合は、プライベートGoogleアクセスが有効になっているサブネットを指定する必要があります。詳細については、ネットワーク構成オプション を参照してください。

AIサービス全般に言えるのですが、インスタンス種別、利用時間によって、利用料金が高額になる場合がありますので、料金体系を理解したうえでご利用されることをお勧めします。

まとめ

GCPにおいてVertex AIローンチからFeature store、 Vertex Pipelines等が組み込まれ、エンタープライズのシステムに最短でMLOpsを進められるようフルマネージドでの環境が整ってきました。 今後データエンジニアリングの取り組みの中で、 MLOpsによる機械学習プロセスの高速化と継続的イテレーションによる価値創出は非常に重要な位置を占めていくことになるでしょう。

Vertex AIはさまざまな技術要素がありますし、特に今回ご紹介させていただいたFeature store、 Vertex Pipelinesに関してはより詳細をご紹介させていただく予定です。

GI CLoudではMLOpsを推進できるエンジニアを絶賛募集中です。 伊藤忠グループの豊富な案件の中で幅広くDX推進とスキルアップを図ることができますので、興味ある方は是非ご応募ください!

採用ページ

※本記事は、ジーアイクラウド株式会社の見解を述べたものであり、必要な調査・検討は行っているものの必ずしもその正確性や真実性を保証するものではありません。

※リンクを利用する際には、必ず出典がGIC dryaki-blogであることを明記してください。
リンクの利用によりトラブルが発生した場合、リンクを設置した方ご自身の責任で対応してください。
ジーアイクラウド株式会社はユーザーによるリンクの利用につき、如何なる責任を負うものではありません。