AI Infrastructure ML および DL モデルのトレーニング

【Next Tokyo ’24】セッションのアーカイブ動画とスライドを公開中です。生成 AI を中心とした Google Cloud のアップデートや顧客事例をチェックしましょう。

移動

AI インフラストラクチャ

あらゆる AI ワークロードに対応する、スケーラブルで高パフォーマンスかつ費用対効果の高いインフラストラクチャ。

お問い合わせ

高パフォーマンスのトレーニングから低コストの推論まで、あらゆるユースケースに対応する AI アクセラレータ
Google Kubernetes Engine または Google Compute Engine で GPU と TPU を使用してスケーリングを高速化
Vertex AI、Google Kubernetes Engine、Cloud HPC Toolkit 向けのデプロイ可能なソリューション
AI ハイパーコンピュータアーキテクチャをデプロイして、Google の AI Infrastructure を最大限に活用する

Google が Forrester Wave の AI Infrastructure のリーダーに選出

詳細

利点

パフォーマンスとコストを大規模に最適化する

Google Cloud では、GPU、TPU、CPU から選択して、ハイパフォーマンスのトレーニング、低コストの推��、大規模なデータ処理などのさまざまなユースケースに対応できます。

マネージドインフラストラクチャで迅速な結果を提供する

Vertex AI のマネージドインフラストラクチャを利用して、より迅速かつ効率的にスケーリングできます。ML 環境を迅速に設定し、オーケストレーションを自動化し、大規模なクラスタを管理して、低レイテンシアプリケーションを設定します。

AI に特化したソフトウェアによる開発

大規模なワークロードの管理に GKE を活用することで、AI 開発の生産性が向上します。自動スケーリング、ワークロードオーケストレーション、自動アップグレードのサポートを利用して、基盤モデルをトレーニングし、提供することができます。

主な機能

あらゆるユースケースに対応した柔軟でスケーラブルなハードウェア

AI ワークロードに万能な方法はありません。そのため、NVIDIA、Intel、AMD、Arm などの業界ハードウェアパートナーとともに、Google は、最もデータインテンシブなモデルをトレーニング、提供するための TPU、GPU、CPU 全体で、AI に最適化された幅広いコンピューティングオプションをお客様に提供します。

操作、管理、拡張が容易

これまで、Cloud TPU と Cloud GPU で大規模な AI ワークロードをオーケストレーションするには、障害、ロギング、モニタリング、その他の基本的なオペレーションの処理に手作業が必要でした。最もスケーラブルでフルマネージドの Kubernetes サービスである Google Kubernetes Engine（GKE）により、TPU と GPU の運用に必要な作業が大幅に簡素化されます。Cloud TPU と Cloud GPU での大規模な AI ワークロードオーケストレーションの管理に GKE を活用することで、AI 開発の生産性が向上します。

また、マネージドサービスによるインフラストラクチャ抽象化の手軽さを求める組織向けに、Vertex AI は、Cloud TPU と Cloud GPU を使用したさまざまなフレームワークとライブラリによるトレーニングをサポートするようになりました。

AI モデルを飛躍的にスケーリング

AI に最適化された Google のインフラストラクチャは、何十億ものユーザーにサービスを提供する YouTube、Gmail、Google マップ、Google Play、Android といった Google プロダクトに求められるグローバルなスケーラビリティとパフォーマンスを提供できるように構築されています。 Google の AI インフラストラクチャソリューションはすべて、Google Cloud の Jupiter データセンターネットワークによって支えられています。このネットワークは、基本的なサービスから高負荷 AI ワークロードに至るまでに対応する、業界最高水準のスケールアウト機能をサポートします。

柔軟性の高いオープンなプラットフォーム

数十年にわたり、Google は TensorFlow や JAX のような重要な AI プロジェクトに貢献してきました。 Google は PyTorch Foundation を創設し、最近では新しい業界コンソーシアムである OpenXLA プロジェクトを発表しました。さらに、Google は主要な CNCF オープンソースコントリビューターであり、TFX、MLIR、OpenXLA、KubeFlow、Kubernetes などの OSS への 20 年以上の貢献に加え、Project Jupyter や NumFOCverteUS などのデータサイエンスコミュニティにとって重要な OSS プロジェクトのスポンサーシップを行っています。

また、Google Cloud の AI インフラストラクチャサービスは、TensorFlow、PyTorch、MXNet などの多くの一般的な AI フレームワークに組み込まれているため、特定のフレームワークやハードウェアアーキテクチャに制約されることなく、お好みのフレームワークを使用し続けることができます。

ブログ

TPU v5p と AI ハイパーコンピュータを発表

導入事例

Google Cloud の AI インフラストラクチャを活用しているお客様

AI によってさまざまな業界でイノベーションへの道が開かれる中、企業は Google のオープンで柔軟かつ高性能なインフラストラクチャを活用するための手段として、Google Cloud を選んでいます。

News

Anthropic は Google Cloud とのパートナーシップを築き、信頼性の高い責任ある AI の実現を支援

所要時間: 5 分

Blog post

Cohere が Google Cloud TPU で言語モデルのトレーニングを加速している方法

所要時間: 10 分

News

Midjourney が AI 生成のクリエイティブプラットフォームを強化するために Google Cloud を選択

所要時間: 5 分

Blog post

Osmo が Google Cloud AI テクノロジーを活用して匂いをデジタル化した方法

所要時間: 5 分

Blog post

AI21 はトレーニングと推論に GPU と TPU を含む Google Cloud インフラストラクチャを活用

所要時間: 5 分

すべてのお客様を表示

GKE 上の AI Infrastructure ツール

Google Kubernetes Engine（GKE）のプラットフォームオーケストレーション機能を使用して、最適化された AI/ML ワークロードを実行します。

詳細

Google Cloud Basics

Deep Learning VM Image

Deep Learning VM Image は、データサイエンスと機械学習のタスクに最適化されています。主要な ML フレームワークとツールがプリインストールされており、GPU で動作します。

詳細

Google Cloud Basics

Deep Learning Containers

Deep Learning Containers は、パフォーマンスが最適化された一貫性のある環境であり、CPU または GPU でワークフローのプロトタイピングと実装を迅速に行うことができます。

詳細

Tutorial

Tensor Processing Unit は AI または ML 用にどのように最適化されていますか？

ML のコンピューティング要件と、TPU がどのようにタスク処理に特化して設計されているのかについて学習します。

詳細

Google Cloud Basics

TPU システムアーキテクチャ

TPU は Google が独自に開発した ASIC であり、ML ワークロードの高速化に使用されます。この TPU の基盤となるシステムアーキテクチャについて一から学びます。

詳細

お探しのものが見つからない場合

すべてのプロダクトドキュメントを見る

ユースケース

AI ハイパーコンピュータアーキテクチャ

使用例

大規模な AI トレーニングを加速

Cloud TPU マルチスライストレーニングは、数万個の TPU チップで高速かつ容易に信頼性の高い大規模な AI モデルのトレーニングを行えるフルス��ックテクノロジーです。

Google Cloud basics

Cloud TPU マルチスライスを使用して AI トレーニングをスケーリングする方法

Cloud TPU マルチスライスはフルスタックの大規模トレーニングテクノロジーで、最大数万のチップまで簡単かつ費用対効果の高いほぼ線形にスケールアップできます。

詳細

Quickstart

NVIDIA Nemo フレームワークを使用して大規模にトレーニングする

分散トレーニング用に Google Cloud HPC Toolkit と NVIDIA NEMO フレームワークをデプロイする方法について学習します。

詳細

使用例

AI を活用したアプリケーションの提供

Google Cloud のオープンソフトウェアエコシステムでは、使い慣れたツールとフレームワークでアプリケーションを構築しながら、AI ハイパーコンピュータアーキテクチャのコストパフォーマンスのメリットを活用できます。

Google Cloud basics

フルマネージド GKE での AI の実行

自動パイロットモードの Google Kubernetes Engine は、トレーニングや大規模言語モデル（LLM）のサービングなどの AI ワークロードを実行する一般的な方法です。

詳細

Google Cloud basics

Google Kubernetes Engine で Ray を始める

Ray.io は、クラスタ内の複数のノードで Python アプリケーションを簡単にスケールアップするためのオープンソースフレームワークです。

詳細

使用例

AI を大規模に提供してコストパフォーマンスを最大化する

Cloud TPU v5e GPU と NVIDIA L4 GPU は、最新の LLM や生成 AI モデルなどの幅広い AI ワークロードに対して、高性能で費用対効果の高い推論を実現します。どちらも、以前のモデルよりもコストパフォーマンスが大幅に向上します。また、Google Cloud の AI ハイパーコンピュータアーキテクチャにより、お客様はデプロイを業界をリードするレベルにスケーリングできます。

Google Cloud basics

Cloud TPU v5e が大規模な AI 推論を加速

Google Cloud TPU により、企業は最先端の AI モデルで推論をより迅速かつ大規模かつ低コストで実行できます。

詳細

Quickstart

単一の GPU で GKE を使用してモデルを提供する

単一の GPU を利用して GKE でオープンモデルを提供する方法について学習します。

詳細

Google Cloud basics

複数の GPU へのモデルのサービングをスケールする

GKE 上の複数の GPU に共通のオープンソースモデルのサービングをスケーリングする方法について学習します。

詳細

すべての技術ガイドを見る

料金

AI Infrastructure の料金は、選択したプロダクトに基づいて計算されます。Colab または Google Cloud の無料枠では、Google の AI Infrastructure を無料でお試しいただけます。

Cloud TPU	Cloud GPU
単一デバイスの TPU タイプと TPU Pod タイプの TPU 料金については、TPU の料金をご覧ください。	GPU の種類とリージョンごとの GPU の料金については、GPU の料金をご覧ください。

Cloud AI プロダクトは、Google の SLA ポリシーに準拠しています。これらの SLA ポリシーで保証されているレイテンシや可用性は、他の Google Cloud サービスと異なる場合があります。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

Google Cloud を無料で試す

開始にあたりサ��ートが必要な場合
お問い合わせ
信頼できるパートナーと連携する
パートナーを探す
もっと見る
すべてのプロダクトを見る

AI インフラストラクチャ

パフォーマンスとコストを大規模に最適化する

マネージド インフラストラクチャで迅速な結果を提供する

AI に特化したソフトウェアによる開発

主な機能

あらゆるユースケースに対応した柔軟でスケーラブルなハードウェア

操作、管理、拡張が容易

AI モデルを飛躍的にスケーリング

柔軟性の高いオープンなプラットフォーム

Google Cloud の AI インフラストラクチャを活用しているお客様

最新情報

ドキュメント

GKE 上の AI Infrastructure ツール

Deep Learning VM Image

Deep Learning Containers

Tensor Processing Unit は AI または ML 用にどのように最適化されていますか？

TPU システム アーキテクチャ

お探しのものが見つからない場合

AI ハイパーコンピュータ アーキテクチャ

大規模な AI トレーニングを加速

AI を活用したアプリケーションの提供

AI を大規模に提供してコスト パフォーマンスを最大化する

料金

次のステップ

開始にあたりサ��ートが必要な場合

信頼できるパートナーと連携する

もっと見る

マネージドインフラストラクチャで迅速な結果を提供する

TPU システムアーキテクチャ

AI ハイパーコンピュータアーキテクチャ

AI を大規模に提供してコストパフォーマンスを最大化する