顔認識とは何ですか?ビッグブラザーのAI

ビッグブラザーは、ストリートレベルのCCTV監視からあなたの顔を識別し、あなたが幸せか、悲しいか、怒っているかを判断できますか?その身分証明書は、未払いの令状であなたを逮捕することにつながる可能性がありますか?識別が正しくなく、実際に他の誰かに接続している可能性はどのくらいですか?いくつかのトリックを使用して監視を完全に打ち負かすことができますか?

反対に、許可された人物の顔のプリントをかざして、カメラと顔識別ソフトウェアで保護された金庫室に入ることができますか?許可された人の顔の3Dマスクを着用するとどうなりますか?

顔認識へようこそ—そして顔認識のなりすまし。

顔認識とは何ですか?

顔認識は、未知の人物を識別したり、顔から特定の人物の身元を認証したりするための方法です。これはコンピュータビジョンの一分野ですが、顔認識は特殊化されており、一部のアプリケーションではソーシャルバッグが付属し、なりすましに対する脆弱性もあります。

顔認識はどのように機能しますか?

初期の顔認識アルゴリズム(現在でも改善され、より自動化された形式で使用されています)は、生体認証(目の間の距離など)に依存して、測定された顔の特徴を2次元画像から一連の数値(特徴)に変換します。顔を説明するベクトルまたはテンプレート)。次に、認識プロセスは、これらのベクトルを、同じ方法でフィーチャにマッピングされた既知の顔のデータベースと比較します。このプロセスの複雑さの1つは、メトリックを抽出する前に、顔を正規化されたビューに調整して、頭の回転と傾きを考慮に入れることです。このクラスのアルゴリズムは幾何学的と呼ばれます。

顔認識への別のアプローチは、2D顔画像を正規化および圧縮し、これらを同様に正規化および圧縮された画像のデータベースと比較することです。このクラスのアルゴリズムは、測光と呼ばれます。

3次元顔認識では、3Dセンサーを使用して顔画像をキャプチャするか、異なる角度に向けられた3台の2D追跡カメラから3D画像を再構築します。3D顔認識は、2D認識よりもかなり正確です。

肌のテクスチャ分析は、人の顔の線、パターン、およびスポットを別の特徴ベクトルにマッピングします。2Dまたは3Dの顔認識に肌の質感分析を追加すると、特にそっくりさんや双子の場合に、認識精度を20〜25%向上させることができます。また、すべての方法を組み合わせて、マルチスペクトル画像(可視光と赤外線)を追加して、さらに精度を高めることもできます。

1964年にフィールドが開始されて以来、顔認識は年々向上しています。平均して、エラー率は2年ごとに半分に減少しています。

関連ビデオ:顔認識の仕組み

顔認識ベンダーテスト

米国国立標準技術研究所であるNISTは、2000年以来、顔認識アルゴリズムのテストである顔認識ベンダーテスト(FRVT)を実行しています。使用される画像データセットは主に法執行機関のマグショットですが、 Wikimediaで見られるような野生の静止画像、およびWebサイトからの低解像度画像。

FRVTアルゴリズムは、ほとんどが商用ベンダーによって提出されています。前年比では、パフォーマンスと精度が大幅に向上していることがわかります。ベンダーによると、これは主に深い畳み込みニューラルネットワークの使用によるものです。

関連するNIST顔認識テストプログラムは、人口統計学的効果、顔のモーフィングの検出、ソーシャルメディアに投稿された顔の識別、およびビデオ内の顔の識別を研究しました。以前の一連のテストは、1990年代に別のモニカである顔認識テクノロジー(FERET)の下で実施されました。

NIST

顔認識アプリケーション

顔認識アプリケーションは、主にセキュリティ、健康、マーケティング/小売の3つの主要なカテゴリに分類されます。セキュリティには法執行機関が含まれ、そのクラスの顔認識の使用は、人間よりも速く正確にパスポート写真に人を一致させるのと同じくらい良性であり、CCTVを介して人を追跡して比較する「PersonofInterest」シナリオのように不気味です。照合された写真データベースに。法執行機関以外のセキュリティには、携帯電話のフェイスロック解除や実験室や金庫室のアクセス制御などの一般的なアプリケーションが含まれます。

顔認識の健康アプリケーションには、患者のチェックイン、リアルタイムの感情検出、施設内での患者の追跡、非言語的患者の痛みのレベルの評価、特定の病気や状態の検出、スタッフの識別、施設のセキュリティが含まれます。顔認識のマーケティングおよび小売アプリケーションには、ロイヤルティプログラムのメンバーの識別、既知の万引き犯の識別と追跡、ターゲット製品の提案に対する人々とその感情の認識が含まれます。

顔認識の論争、偏見、禁止

これらのアプリケーションのいくつかが物議を醸していると言うことは控えめな表現になります。2019 New York Timesの記事で説明されているように、顔認識は、スタジアムの監視への使用から人種差別的なソフトウェアまで、物議を醸しています。

スタジアム監視?2001年のスーパーボウルでは顔認識が使用されました。ソフトウェアは、逮捕された人は誰もいなかったものの、未解決の令状の対象と思われる19人を特定しました(試行不足のためではありません)。

人種差別的なソフトウェア?いくつかの問題がありました。2009年の顔追跡ソフトウェアでは白人は追跡できますが黒人は追跡できませんでした。2015年のMITの調査では、当時の顔認識ソフトウェアが女性や/または男性よりも白人男性の顔ではるかにうまく機能することが示されました。黒い顔。

これらの種類の問題は、特定の場所または特定の用途のための顔認識ソフトウェアの完全な禁止につながりました。 2019年、サンフランシスコは、警察やその他の法執行機関による顔認識ソフトウェアの使用をブロックした最初の主要なアメリカの都市になりました。マイクロソフトは、顔認識に関する連邦規制を求めました。 MITは、Amazon Rekognitionが顔の画像から男性の性別よりも女性の性別を判断するのに問題があり、白人の女性の性別よりも黒人の女性の性別に問題があることを示しました。

2020年6月、Microsoftは、顔認識ソフトウェアを警察に販売しないこと、および販売しないことを発表しました。Amazonは、警察がRekognitionを1年間使用することを禁止しました。そしてIBMはその顔認識技術を放棄しました。ただし、iPhone(Face ID)やその他のデバイス、ソフトウェア、テクノロジーで広く採用されていることを考えると、顔認識を完全に禁止することは容易ではありません。

すべての顔認識ソフトウェアが同じバイアスに苦しんでいるわけではありません。2019 NIST人口統計効果研究は、MITの作業をフォローアップし、アルゴリズムによる人口統計バイアスが顔認識ソフトウェアの開発者間で大きく異なることを示しました。はい、顔識別アルゴリズムの誤一致率と誤不一致率には人口統計学的影響がありますが、ベンダーごとに数桁異なる可能性があり、時間の経過とともに減少しています。

顔認識のハッキング、およびなりすまし防止技術

顔認識による潜在的なプライバシーの脅威と、顔認証によって保護された価値の高いリソースへのアクセスの魅力を考えると、テクノロジーをハッキングまたはスプーフィングするための多くの努力がなされてきました。認証に合格するために、ライブ顔の代わりに顔の印刷画像、画面上の画像、または3D印刷マスクを提示できます。CCTV監視の場合、ビデオを再生できます。監視を回避するために、「CV Dazzle」ファブリックとメイクアップ、および/またはIR発光体を試して、ソフトウェアをだまして顔を検出しないようにすることができます。

もちろん、これらすべての攻撃に対するなりすまし防止技術を開発するための努力があります。印刷された画像を検出するために、ベンダーは、被写体がまばたきするのを待つ、モーション分析を実行する、または赤外線を使用して生きている顔と印刷された画像を区別するなどの活性テストを使用します。別のアプローチは、人間の皮膚がプリントやマスク材料と光学的に異なるため、マイクロテクスチャ分析を実行することです。最新のなりすまし防止技術は、主に深い畳み込みニューラルネットワークに基づいています。

これは進化する分野です。攻撃者となりすまし防止ソフトウェアの間で武器戦争が行われているほか、さまざまな攻撃および防御手法の有効性に関する学術研究も行われています。

顔認識ベンダー

Electronic Frontier Foundationによると、Idemia(旧称OT-MorphoまたはSafran)の子会社であるMorphoTrustは、米国で顔認識およびその他の生体認証技術の最大のベンダーの1つです。州のDMV、連邦および州の法執行機関、国境管理および空港(TSA PreCheckを含む)、および国務省向けのシステムを設計しました。その他の一般的なベンダーには、3M、Cognitec、DataWorks Plus、Dynamic Imaging Systems、FaceFirst、NECGlobalなどがあります。

NIST顔認識ベンダーテストでは、世界中のさらに多くのベンダーのアルゴリズムが一覧表示されます。さまざまな品質のいくつかのオープンソースの顔認識アルゴリズムと、顔認識を提供するいくつかの主要なクラウドサービスもあります。

Amazon Rekognitionは、顔の分析やカスタムラベルなど、オブジェクト、人物、テキスト、シーン、アクティビティを識別できる画像およびビデオ分析サービスです。Google Cloud Vision APIは、オブジェクトと顔を検出し、印刷されたテキストと手書きのテキストを読み取り、画像カタログにメタデータを組み込むことができる、事前にトレーニングされた画像分析サービスです。Google AutoML Visionを使用すると、カスタム画像モデルをトレーニングできます。

Azure Face APIは、画像内の顔と属性を認識し、最大100万人のプライベートリポジトリ内の個人と一致する個人識別を実行し、認識された感情認識を実行する顔検出を実行します。Face APIは、クラウドまたはコンテナーのエッジで実行できます。

認識トレーニング用の顔データセット

認識トレーニングに使用できるダウンロード可能な顔データセットは数十あります。すべての顔データセットが等しいわけではありません。画像サイズ、表現される人数、1人あたりの画像数、画像の状態、照明が異なる傾向があります。法執行機関は、現在の顔写真や運転免許証の画像など、非公開の顔データセットにもアクセスできます。

大規模な顔データベースのいくつかは、最大13,000人のユニークな人々がいるLabeled Faces in theWildです。初期のNISTテストに使用されるFERET。進行中のNISTFRVTで使用されているMugshotデータベース。SCFace監視カメラデータベース。顔のランドマークでも利用できます。ラベル付けされたウィキペディアの顔、最大1.5Kの一意のID。これらのデータベースのいくつかには、IDごとに複数の画像が含まれています。研究者イーサンマイヤーズからのこのリストは、特定の目的のために顔のデータセットを選ぶことに関するいくつかの説得力のあるアドバイスを提供します。

要約すると、顔認識は向上しており、ベンダーはほとんどのなりすましを検出することを学んでいますが、このテクノロジーの一部のアプリケーションについては議論の余地があります。NISTによると、顔認識のエラー率は2年ごとに半減しています。ベンダーは、畳み込みニューラルネットワークを組み込むことにより、なりすまし防止技術を改善しました。

一方、特に警察による監視での顔認識の使用を禁止するイニシアチブがあります。しかし、顔認識がどれほど普及しているかを考えると、顔認識を完全に禁止することは難しいでしょう。

機械学習とディープラーニングの詳細:

  • ディープラーニングと機械学習:違いを理解する
  • 機械学習とは何ですか?データから得られるインテリジェンス
  • ディープラーニングとは何ですか?人間の脳を模倣するアルゴリズム
  • 機械学習アルゴリズムの説明
  • 自動機械学習またはAutoMLの説明
  • 教師あり学習の説明
  • 半教師あり学習の説明
  • 教師なし学習の説明
  • 強化学習の説明
  • コンピュータビジョンとは何ですか?画像とビデオのAI
  • 顔認識とは何ですか?ビッグブラザーのAI
  • 自然言語処理とは何ですか?スピーチとテキストのためのAI
  • Kaggle:データサイエンティストが学び競争する場所
  • CUDAとは何ですか?GPUの並列処理