特長
AnimoSearchとは・・・
「AnimoSearch」は、従来の言語辞書が必須であった音声認識技術とは異なり、当社独自開発のPhonetic Search(音素記号列マッチング検索)技術(※1)と「話し言葉」適応化技術により、動画・音声の超高速検索(100時間分のデータを1秒で検索)を実現しています。
従来、辞書が必要であった音声認識はテキスト化には向いていますが、辞書に無い言葉は原理的に認識することができないと言う欠点がありました。「AnimoSearch」は、音素記号列マッチング技術により、新語、固有名詞を含む自由なキーワードに加えて、似た発音でのあいまい検索をその場での検索可能となります。
「AnimoSearch」は、大量の動画・音声データから自由なキーワードを瞬時に検索できるという、人には困難でコンピュータが得意な全く新しい音声技術の新利用分野(⇒「音声検索」)を提案します。
「AnimoSearch」は、当社通話録音ソフトウェア「VoiceTracking」への検索ソフトウェア「AnimoSearch for VoiceTracking」として本年度中に販売開始を致します。
※1 Phonetic Search(音素記号列マッチング検索)技術:音声データを事前に音素記号列に変換した上で、検索キーワードの音素記号列とのマッチングにより超高速に検索する技術。音素列変換には株式会社富士通研究所の音声処理技術を適用しています。
活用シーンと導入効果
(1)放送メディア・インターネット動画サイト分野- インターネット上の動画投稿サイトを横断的に検索する音声版検索サイト
- 動画投稿サイトのコンテンツ著作権監視
- 放送局内素材コンテンツの番組編集時の効率的なコンテンツ検索
- コールセンターのお客様の声(VOC)から、マーケティング情報(トレンド)分析
- 通話録音からの音声マイニング(商品改良情報の抽出)
- 企業内の膨大な通話記録に関する企業防衛・コンプライアンス管理
主な特長
(1)超高速キーワード検索- 音素記号列のマッチング処理(記号列処理)により超高速の検索が可能
- 100時間分の動画・音声データを1秒で検索可能(インテル®Xeon® Quad-Coreシステム)
- 検索用音素記号列抽出(エンコード)も高速処理を実現(実データ時間長の約1%)
- 音声認識のような辞書を必要としないため、自由なキーワードで検索
- 新語、固有名詞の検索も可能。ニュース等に出てくる新語、人名も検索可能
- 正確なキーワードを憶えていなくても、似たようなキーワード(発音)で検索可能
- 多言語展開:AnimoSearch音素符号列は国際発音記号(IPA)を網羅しています。今後順次英語版、中国語版を投入します。
AnimoSearch(音声検索)の 原理


