特長
Animo Paralinguistic Baseとは
音声に含まれる「パラ言語情報」を分析するための開発者向けライブラリです。音声には、イントネーション、リズム、ポーズ、声質といった「パラ言語情報」が含まれています。例えば同じ「そうですね」という言葉でも、イントネーションを変えれば質問調になったり、確認調になったりします。「パラ言語情報」には話者の意図や感情が表れているのです。Animo Paralinguistic Baseは、会話中の発話の長さ、回数、話速、間、あいづち、テンション値といった「パラ言語情報」の数値化・可視化を、ソフトウェアライブラリとしてSDK形式で提供します。
主な用途
- お客様と接する店頭の販売員の話し方分析(対話分析)
- お客様との対面販売での会話の構成の分析
- ベテランのトークの良さを数値的に分析
- 会議や打合せの発話から会議の効率を分析
機能
2人の会話の音声に対し、「対話分析」、「話速分析」、「テンション分析」等に関する100項目以上の音声特徴量を数値化
- 対話分析
各話者の発話割合、発話回数、発話の長さのほか、対話中の「かぶり」やあいづちの頻度等 - 話速分析
各話者の平均話速(1秒あたりのモーラ数)及び話速の推移を示す時系列 - テンション分析
発声の強さを独自の指標で数値化。声に含まれる様々な特徴量(基本周波数、スペクトル等)やその変化に基づく。平均値もしくは時系列として出力可能。
Animo Paralinguistic Baseが出力した数値を元に会議参加者の発言を分析した例
動作環境
OS | Windows 10/11 (32bit/64bit) Linux(CentOS、Ubuntu他) |
---|---|
メモリ | 約12.5MB(ヒープメモリ) |
演算量 | 約0.4 RTF(リアルタイム係数)(Intel™ Core i7™の場合) |
仕様
音声データ形式 | WAVファイル, 8000Hz, 16bit, リニアPCM |
---|---|
チャンネル数 | 送話1chと受話1chからなるステレオ、もしくはモノラル (モノラルの場合、一部の分析項目がサポートされません) |
対応言語 | C/C++ |
導入事例
- 株式会社NTTデータ様「表情や感情、声から印象を見える化「Com Analyzer TM」提供開始」