音声認識・検出

音声認識・検出

音声検索

通話録音をフリーワードであいまい検索

AnimoSearch

特長

AnimoSearch(アニモサーチ)とは・・・

「AnimoSearch」は、従来の言語辞書が必須であった音声認識技術とは異なり、当社独自開発のPhonetic Search(音素記号列マッチング検索)技術(※1)と「話し言葉」適応化技術により、動画・音声の超高速検索(100時間分のデータを1秒で検索)を実現しています。

従来、辞書が必要であった音声認識はテキスト化には向いていますが、辞書に無い言葉は原理的に認識することができないと言う欠点がありました。「AnimoSearch」は、音素記号列マッチング技術により、新語、固有名詞を含む自由なキーワードに加えて、似た発音でのあいまい検索をその場での検索可能となります。
「AnimoSearch」は、大量の動画・音声データから自由なキーワードを瞬時に検索できるという、人には困難でコンピュータが得意な全く新しい音声技術の新利用分野(⇒「音声検索」)を提案します。

「AnimoSearch」は、当社通話録音ソフトウェア「VoiceTracking」への検索ソフトウェア「AnimoSearch for VoiceTracking」として本年度中に販売開始を致します。

※1 Phonetic Search(音素記号列マッチング検索)技術:音声データを事前に音素記号列に変換した上で、検索キーワードの音素記号列とのマッチングにより超高速に検索する技術。音素列変換には株式会社富士通研究所の音声処理技術を適用しています。

活用シーンと導入効果

(1)放送メディア・インターネット動画サイト分野

  • インターネット上の動画投稿サイトを横断的に検索する音声版検索サイト
  • 動画投稿サイトのコンテンツ著作権監視
  • 放送局内素材コンテンツの番組編集時の効率的なコンテンツ検索

(2)電話応対分野(コールセンター)

  • コールセンターのお客様の声(VOC)から、マーケティング情報(トレンド)分析
  • 通話録音からの音声マイニング(商品改良情報の抽出)
  • 企業内の膨大な通話記録に関する企業防衛・コンプライアンス管理

主な特長

(1)超高速キーワード検索

  • 音素記号列のマッチング処理(記号列処理)により超高速の検索が可能
  • 100時間分の動画・音声データを1秒で検索可能(インテル®Xeon® Quad-Coreシステム)
  • 検索用音素記号列抽出(エンコード)も高速処理を実現(実データ時間長の約1%)

(2)フリーワード検索(語彙無制限)

  • 音声認識のような辞書を必要としないため、自由なキーワードで検索
  • 新語、固有名詞の検索も可能。ニュース等に出てくる新語、人名も検索可能

(3)あいまい検索

  • 正確なキーワードを憶えていなくても、似たようなキーワード(発音)で検索可能
  • 多言語展開:AnimoSearch音素符号列は国際発音記号(IPA)を網羅しています。今後順次英語版、中国語版を投入します。

AnimoSearch(音声検索)の 原理

AnimoSearch(音声検索)の 原理

 

機能

機能概要

1. Phonetic Search(音素記号列マッチング検索)型音声検索

  • 音声・動画の超高速・あいまい・フリーワード検索ソフトウェア
  • 「AnimoSearch」は、音声データを事前に符号(AnimoSearch符号列)化処理を行い、その符号化データに対して高速にキーワード(テキスト)検索処理を行うミドルウェア製品
  • AnimoSearchミドルウェアは、C++言語及びJava言語インタフェースを提供

2. 符号化機能(エンコード)

  • 動画・音声データから、AnimoSearch符号列を抽出する機能
  • 処理性能:音声データ時間長の2%の時間で処理可能 (当社計測値、intel Core2Duo 2.13GHz)
  • AnimoSearch符号列のデータ容量:元音声データ容量に対して約2%

3. 検索機能

  • AnimoSearch符号列化された動画・音声データベースから、任意のキーワードで検索を行う機能
  • 処理性能:100時間分の動画・音声データを1秒で検索可能 (当社計測値、intel Xeon QuadCore 3.33GHz)

AnimoSearch機能概要

AnimoSearch機能概要

構成イメージ

以下の構成イメージは、当社通話録音ソフトウェア「VoiceTracking」と連携したイメージです。

AnimoSearch構成イメージ

 

動作環境

OS Windows Server 2003 SP2(32/64bit)
※64bit OS上ではWOW64で動作します
ミドルウェア Javaインタフェース版:Java 1.5.0.10以降
CPU Intel Xeon Quad-Core 3.33GHz以上推奨
メモリ 4GB以上推奨
HDD Windowsシステム以外に5GB以上推奨、HDDの容量は、検索対象となる音声データ(符号列ファイル)の容量により増加します。