レビュー:Google CloudAIが機械学習を照らします

Googleは、業界で最大の機械学習スタックの1つであり、現在、Google CloudAIと機械学習プラットフォームを中心としています。Googleは数年前にオープンソースとしてTensorFlowをスピンアウトしましたが、TensorFlowは依然として最も成熟しており、広く引用されているディープラーニングフレームワークです。同様に、Googleは数年前にオープンソースとしてKubernetesをスピンアウトしましたが、それでも依然として主要なコンテナ管理システムです。

Googleは、開発者、データサイエンティスト、機械学習の専門家にとってツールとインフラストラクチャのトップソースの1つですが、歴史的に、Google AIは、深刻なデータサイエンスやプログラミングのバックグラウンドを持たないビジネスアナリストにとってそれほど魅力的ではありませんでした。それは変わり始めています。

Google Cloud AIと機械学習プラットフォームには、AIビルディングブロック、AIプラットフォームとアクセラレータ、AIソリューションが含まれています。AIソリューションはかなり新しく、データサイエンティストではなくビジネスマネージャーを対象としています。Googleまたはそのパートナーからのコンサルティングが含まれる場合があります。

事前にトレーニングされているがカスタマイズ可能なAIビルディングブロックは、プログラミングやデータサイエンスに関する深い知識がなくても使用できます。それにもかかわらず、それらは実用的な理由で熟練したデータサイエンティストによってしばしば使用され、本質的には大規模なモデルトレーニングなしで物事を成し遂げるために使用されます。

AIプラットフォームとアクセラレータは、一般的に真面目なデータサイエンティスト向けであり、コーディングスキル、データ準備技術の知識、および多くのトレーニング時間を必要とします。関連するビルディングブロックを試した後でのみ、そこに行くことをお勧めします。

特にデータの準備において、GoogleCloudのAIオファリングにはまだいくつかの欠落しているリンクがあります。Google Cloudがデータのインポートと調整サービスに最も近いのは、TrifactaによるサードパーティのCloudDataprepです。私は一年前にそれを試しましたが、圧倒されました。ただし、Cloud AutoML Tablesに組み込まれている機能エンジニアリングは有望であり、そのようなサービスを他のシナリオで利用できるようにしておくと便利です。

AIの継ぎ目のない裏側は、永続的なモデルの偏り(多くの場合、トレーニングに使用される偏ったデータのため)とともに、倫理と責任(またはその欠如)に関係しています。Googleは2018年にAIPrinciplesを公開しました。これは進行中の作業ですが、Responsible AIに関する最近のブログ投稿で説明されているように、ガイダンスの基礎となっています。

AI市場(12社以上のベンダー)では多くの競争があり、パブリッククラウド市場(半ダース以上の信頼できるベンダー)では多くの競争があります。比較の正義を行うには、この記事の少なくとも5倍の長さの記事を書く必要があるので、それらを省略したくないので、ほとんどの製品比較を省略しなければなりません。最も明白な比較のために、私は要約することができます:AWSはGoogleが行うことのほとんどを行い、また非常に優れていますが、一般的に高い価格を請求します。

Google CloudAIビルディングブロック

Google Cloud AIビルディングブロックは、視覚、言語、会話、構造化データを追加するために独自のアプリケーションに組み込むことができる使いやすいコンポーネントです。AIビルディングブロックの多くは事前にトレーニングされたニューラルネットワークですが、箱から出してすぐにニーズに対応できない場合は、転移学習とニューラルネットワーク検索を使用してカスタマイズできます。AutoML Tablesは、データサイエンティストが表形式のデータセットに最適な機械学習モデルを見つけるために使用するプロセスを自動化するという点で、少し異なります。

AutoML

Google Cloud AutoMLサービスは、言語ペアの翻訳、テキスト分類、オブジェクト検出、画像分類、ビデオオブジェクトの分類と追跡のためにカスタマイズされたディープニューラルネットワークを提供します。トレーニングにはタグ付きデータが必要ですが、深層学習、転移学習、またはプログラミングに関する重要な知識は必要ありません。

Google Cloud AutoMLは、タグ付けされたデータ用に、Googleの戦闘でテストされた高精度のディープニューラルネットワークをカスタマイズします。 AutoMLは、データからモデルをトレーニングするときにゼロから開始するのではなく、自動ディープトランスファー学習(他のデータでトレーニングされた既存のディープニューラルネットワークから開始することを意味します)とニューラルアーキテクチャ検索(追加のネットワーク層の適切な組み合わせを見つけることを意味します)を実装します)言語ペアの翻訳および上記の他のサービスの場合。

各領域で、Googleはすでにディープニューラルネットワークとラベル付けされたデータの膨大なセットに基づいて1つ以上の事前トレーニングされたサービスを持っています。これらは変更されていないデータに対しても機能する可能性があり、時間とお金を節約するためにテストする必要があります。Google Cloud AutoMLを使用すると、必要な処理が実行されない場合でも、転送学習の実行方法やニューラルネットワークの設計方法を知らなくても、実行可能なモデルを作成できます。

転移学習は、ニューラルネットワークを最初からトレーニングするよりも2つの大きな利点があります。まず、ネットワークのほとんどのレイヤーがすでに十分にトレーニングされているため、トレーニングに必要なデータがはるかに少なくなります。次に、最終レイヤーのみを最適化するため、トレーニングが大幅に高速化されます。

以前はGoogleCloud AutoMLサービスがパッケージとしてまとめて提供されていましたが、現在は基本的な事前トレーニング済みサービスとともに一覧表示されています。他のほとんどの企業がAutoMLと呼んでいるものは、Google Cloud AutoMLTablesによって実行されます。

Google CloudAutoMLのレビュー全文を読む

AutoMLテーブル

多くの回帰および分類の問題に対する通常のデータサイエンスプロセスは、トレーニング用のデータテーブルを作成し、データをクリーンアップおよび調整し、機能エンジニアリングを実行し、最適化する手順を含め、変換されたテーブルですべての適切なモデルをトレーニングしようとすることです。最高のモデルのハイパーパラメータ。ターゲットフィールドを手動で特定すると、Google Cloud AutoMLTablesはこのプロセス全体を自動的に実行できます。

AutoML Tablesは、Googleのモデル動物園で構造化データを自動的に検索し、単純なデータセットの線形/ロジスティック回帰モデルから、より大きく、より複雑なデータセットの高度なディープアンサンブルおよびアーキテクチャ検索方法まで、ニーズに最適なモデルを見つけます。数値、クラス、文字列、タイムスタンプ、リストなど、さまざまな表形式のデータプリミティブの機能エンジニアリングを自動化し、欠落値、外れ値、その他の一般的なデータの問題を検出して処理するのに役立ちます。

そのコードレスインターフェースは、エンドツーエンドの機械学習ライフサイクル全体をガイドし、チームの誰もがモデルを簡単に構築して、より広範なアプリケーションに確実に組み込むことができるようにします。AutoML Tablesは、一般的な間違いを防ぐためのガードレールとともに、広範な入力データとモデルの動作の説明機能を提供します。AutoMLテーブルは、APIおよびノー​​トブック環境でも使用できます。

AutoML Tablesは、ドライバーレスAIや他のいくつかのAutoML実装およびフレームワークと競合します。

Vision API

Google Cloud Vision APIは、画像を分類してさまざまな特徴を抽出するための事前トレーニング済みの機械学習サービスです。画像は、画像に含まれる一般的なオブジェクトや動物(猫など)から、一般的な条件(夕暮れなど)、特定のランドマーク(エッフェル塔、グランドキャニオン)まで、事前にトレーニングされた何千ものカテゴリに分類できます。主要な色など、画像の一般的なプロパティを識別します。顔である領域を分離し、幾何学的(顔の向きとランドマーク)および感情分析を顔に適用できますが、有名人(特別な使用ライセンスが必要)を除いて、顔を特定の人物のものとして認識しません。 Vision APIは、OCRを使用して、50を超える言語とさまざまなファイルタイプの画像内のテキストを検出します。また、製品のロゴを識別し、成人を検出することもできます。暴力的で医療的なコンテンツ。

Google Cloud Machine LearningAPIのレビュー全文を読む

ビデオインテリジェンスAPI

Google Cloud Video Intelligence APIは、保存された動画とストリーミング動画の20,000を超えるオブジェクト、場所、アクションを自動的に認識します。また、シーンの変化を区別し、ビデオ、ショット、またはフレームレベルで豊富なメタデータを抽出します。さらに、OCRを使用してテキストの検出と抽出を実行し、露骨な内容を検出し、クローズドキャプションと字幕を自動化し、ロゴを認識し、顔、人物、ポーズを検出します。

メタデータを抽出して動画コンテンツのインデックス作成、整理、検索を行うには、Video IntelligenceAPIをお勧めします。ビデオを書き起こし、クローズドキャプションを生成し、不適切なコンテンツにフラグを付けてフィルタリングすることができます。これらはすべて、人間の書き起こしよりも費用効果が高くなります。ユースケースには、コンテンツのモデレーション、コンテンツの推奨事項、メディアアーカイブ、コンテンツターゲット広告が含まれます。

自然言語API

自然言語処理(NLP)は、Google検索とGoogleアシスタントへの入力をうまく機能させる「秘密のソース」の大きな部分です。Google Cloud Natural Language APIは、同じテクノロジーをプログラムに公開します。構文解析(下の画像を参照)、エンティティ抽出、感情分析、およびコンテンツ分類を10の言語で実行できます。あなたがそれを知っているならば、あなたは言語を指定するかもしれません。それ以外の場合、APIは言語の自動検出を試みます。リクエストに応じて早期アクセスが可能な別のAPIは、ヘルスケア関連のコンテンツに特化しています。

Google Cloud Machine LearningAPIのレビュー全文を読む

翻訳

Google Cloud Translation APIは、100を超える言語ペアを翻訳でき、指定しない場合はソース言語を自動検出できます。また、基本、高度、メディア翻訳の3つのフレーバーがあります。Advanced Translation APIは、用語集、バッチ翻訳、およびカスタムモデルの使用をサポートします。Basic Translation APIは、基本的に、コンシューマーのGoogle翻訳インターフェースで使用されるものです。AutoML Translationを使用すると、転移学習を使用してカスタムモデルをトレーニングできます。

Media Translation APIは、オーディオファイルまたはストリームのいずれかのオーディオ(音声)からコンテンツを12言語で直接翻訳し、句読点を自動的に生成します。ビデオと通話オーディオには別々のモデルがあります。

Google Cloud Machine LearningAPIのレビュー全文を読む