Watson wannabes:マシンインテリジェンスのための4つのオープンソースプロジェクト

昨年、IBMが再発明を推し進めてきた新しいエンタープライズ・サービスの一環として、ワトソンは「ジェパディ」を受賞した仕掛けではなく、ツールになりました。また、IBM独自の作成でもあります。

では、オープンソースコンポーネントを使用しているにもかかわらず、ワトソンのオーダーで自然言語の機械学習システムを作成する可能性はどのくらいありますか?ある程度、これはすでに起こっています-一部には、ワトソン自体が既存のオープンソース作業の上に構築されており、他の人はワトソンと並行して同様のシステムを開発しているためです。このような4つのプロジェクトを見てみましょう。

DARPA DeepDive

束の最大のブランドであるDARPAのDeepDiveプロジェクトは、ワトソンの平易な言語のクエリシステムをエミュレートすることを意図したものではなく、人間の指導によって時間の経過とともに意思決定を改善するワトソンの能力を目的としています。

このプロジェクトは、主にウィスコンシン大学のクリストファー・レ教授によって開発されたもので、オープンソースです(Apache2.0)。EE Timesによると、DeepDiveの主な目標は、非構造化データを分類するための自動化されたシステムを作成することです。1つの例では、技術ジャーナルの記事を分類します。DeepDiveの利用を計画している人は、SQLとPythonに精通している必要がありますが、システムはすでにWebページやPDFドキュメントなどのさまざまな従来のソースからデータを抽出することができます。

Apache UIMA

非構造化情報管理(UIMA)は、テキストコンテンツの分析を実行するための標準です。WatsonはUIMAの実装を使用しましたが、UIMAを使用するためにWatsonを経由する必要はありません。実際、IBMのUIMAアーキテクチャーはオープンソースであり、ApacheFoundationによって保守されています。複数のプログラミング言語をサポートし、定期的に(最近では2014年10月に)更新が追加されています。

現状のApacheUIMAは、完全な機械学習ソリューションになるにはほど遠いです。これは、IBMが作成した全体の一部であり、重要ではありますが、1つだけです。必要最低限​​のものを使用したくない場合は、処理にUIMAを活用し、主要なデータソースとしてウィキペディアを使用するYodaQAなどの派生プロジェクトの1つを選択できます。

OpenCog

OpenCogは、「研究科学者とソフトウェア開発者に、人工知能プログラムを構築して共有するための共通のプラットフォームを提供することを目的としています。」GNU Afferoライセンスの下でオープンソース化されたこのプロジェクトの野心は、作成者が「一般的にインテリジェントな」システムと呼んでいるもの、つまりドメイン中心の専門分野ではなく、人間のように広く理解している人工知能に燃料を供給することです。チェスは得意ですが、他には何もありません)。

OpenCogの作成者は、彼らのフレームワークが「研究用と営利企業の両方の自然言語アプリケーション」ですでに使用されていると主張しています。これにより、パイインザスカイAIの概念から少し離れ、ワトソンが住む実用的なQ&Aドメインに近づきます。

OAQA(質問応答システムのオープンな進歩)

名前が示すように、OAQAの使命は、「質問応答システム(自然言語で提起された質問に直接回答する言語ソフトウェアシステム)のエンジニアリングにおけるオープンな進歩」です。ワトソンの目的の1つのように聞こえますか?うん、特にOAQAがIBMとカーネギーメロン大学によって共同で開始されたので。Apache UIMAと同様に、OAQAはUIMAフレームワークを実装しますが、すぐに使用できるソリューションとは考えていません。それはツールキットです。

ご想像のとおり、各プロジェクトの大きな欠点の1つは、ワトソンほど洗練されたパッケージや洗練されたパッケージで提供されていないことです。ワトソンはビジネスコンテキストですぐに使用できるように設計されていますが、これらは手間のかかる作業を必要とする生のツールキットです。

さらに、ワトソンのサービスは、厳選された実世界のデータですでに事前トレーニングされています。これらのシステムでは、データソースを提供する必要があります。これは、プログラミング自体よりもはるかに大きなプロジェクトになる可能性があります。