特長

Animo Paralinguistic Baseとは

音声に含まれる「パラ言語情報」を分析するための開発者向けライブラリです。音声には、イントネーション、リズム、ポーズ、声質といった「パラ言語情報」が含まれています。例えば同じ「そうですね」という言葉でも、イントネーションを変えれば質問調になったり、確認調になったりします。「パラ言語情報」には話者の意図や感情が表れているのです。Animo Paralinguistic Baseは、会話中の発話の長さ、回数、話速、間、あいづち、テンション値といった「パラ言語情報」の数値化・可視化を、ソフトウェアライブラリとしてSDK形式で提供します。

主な用途

  • お客様と接する店頭の販売員の話し方分析(対話分析)
  • お客様との対面販売での会話の構成の分析
  • ベテランのトークの良さを数値的に分析
  • 会議や打合せの発話から会議の効率を分析

機能

2人の会話の音声に対し、「対話分析」、「話速分析」、「テンション分析」等に関する100項目以上の音声特徴量を数値化

  1. 対話分析
    各話者の発話割合、発話回数、発話の長さのほか、対話中の「かぶり」やあいづちの頻度等
  2. 話速分析
    各話者の平均話速(1秒あたりのモーラ数)及び話速の推移を示す時系列
  3. テンション分析
    発声の強さを独自の指標で数値化。声に含まれる様々な特徴量(基本周波数、スペクトル等)やその変化に基づく。平均値もしくは時系列として出力可能。

Animo Paralinguistic Baseが出力した数値を元に会議参加者の発言を分析した例
Animo Paralinguistic Baseが出力した数値を元に会議参加者の発言を分析した例

動作環境

OS Windows 10/11 (32bit/64bit)
Linux(CentOS、Ubuntu他)
メモリ 約12.5MB(ヒープメモリ)
演算量 約0.4 RTF(リアルタイム係数)(Intel™ Core i7™の場合)

仕様

音声データ形式 WAVファイル, 8000Hz, 16bit, リニアPCM
チャンネル数 送話1chと受話1chからなるステレオ、もしくはモノラル
(モノラルの場合、一部の分析項目がサポートされません)
対応言語 C/C++

導入事例