Perceptual Hash関連。

  • PhotoDNA
  • pHash
  • CSAI Match
  • Content Safety API

課題

  1. ロバスト性 vs 分離性のトレードオフ
     変形(圧縮、リサイズ、色変換、ノイズなど)には耐えたい(ロバスト性)が、内容が変わったらハッシュは大きく変わるべき(識別力/分離力)という相反性をどう調整するかが鍵。
     たとえば「最大ロバスト性を前提条件に、セキュリティ(改ざん検出能力)を優先して設計する」ような最適化アプローチが提案されている論文もあります。 SpringerOpen+1

  2. 時空間特徴をどう扱うか
     動画では「時間方向(フレーム間の変化)」も特徴になるため、単に各フレームを別々にハッシュするだけでは不十分。動きの連続性、シーン切替、速度変化などを考慮する設計が必要。

  3. 信号処理操作(リサンプリング、圧縮、切り取り、トリミング)への耐性
     動画の実運用ではエンコード形式の変換、部分カット、リサイズ、画質変化などが起こるため、それらを「知覚的に同じ」と見なす変形にはマッチできるようなハッシュ設計が必要。

  4. 攻撃・改変検出性
     知覚ハッシュは、意図的に編集・改変された素材を検出する能力も求められ、攻撃耐性(検出回避攻撃に対する強さ)が重要。実際、クライアント側スキャンの文脈で「ハッシュ回避攻撃」が可能であるという論文もあります。 USENIX+1

  5. 相互運用性と標準化
     企業ごと、プラットフォームごとに異なるハッシュ方式を使っていると、他プラットフォームでのマッチングができない問題が出てくる。Tech Coalition のハッシュ互換性プロジェクト (Video Hash Interoperability) は、この点を扱っています。 Tech Coalition

  6. 評価・実験データの課題
     ハッシュ方式を比較・評価するには、大規模な動画セットが必要ですが、CSAM 映像はセンシティブで扱いが制約されるため、公開データでの比較実験が限られているケースが多い。

そのほか