音声認証 - 株式会社アニモ

概要

音声認証とは

音声によって本人確認を行うバイオメトリクス（生体情報）認証です。声紋分析から特徴データを抽出し、個人の音声モデルとして登録しておき、認証時に入力された音声と照合を行うことで、登録者本人の音声か否かを判定する声紋認証システムを構築するためのミドルウェアを提供します。本人確認の必要な電話サービスや情報システムへのログインにおいて、これまで煩雑であった本人確認が自然な流れで実現でき、非接触のマルチモーダル生体認証機能と一つとしてご利用できます。また、本人確認だけではなく話者識別として、ロボットや車載カーナビで話している人を区別したサービスを実現できます。
音声パスワードは自由に変更可能、バイオメトリクス情報の漏洩対策にも効果的です。

特長

新規の端末投資が不要 → ソフトウェアとマイクのみで実現、スマートフォンにも対応
言語に依存しない → グローバルなシステム展開が可能
心理的負担が少ない → 顧客満足度の向上を支援
複雑なパスワードの忘却やカード紛失の心配不要
冗長なキーボード操作・ボタン操作からの開放
音声認識や音声合成、テレフォニー技術との高い親和性

※高いマーケットシェア：ミック経済研究所の2008年調査にて3年連続シェア66％超
ミック経済研究所調べ「個人認証型セキュリティソリューション市場の現状と将来展望2008」より

適応分野の例

社内システムへのログイン（タブレット・スマートフォン端末）
テロ対策・犯罪捜査
テレフォンバンキング
eラーニング受講者管理
受発注システム（電話・インターネット）
入退室管理
勤怠管理システム
ワンタイムパスワードシステム
電子カルテ管理システム
ICカード・ソリューション

機能概要

認証方式

音声モデルサイズ 15KB/キーワード	あらかじめ自分で決めたフレーズ（6音節程度：名前やID番号等）をパスワードに利用登録時3回／照合時1回発声セキュリティポリシーによって、複数回の認証結果スコアの足し合わせ、平均値取得も可能発声内容かつ音声の個人性両方の一致を要する二重セキュリティ（他人に音声キーワードを知られたとしても、本人自身の音声でなければ認証されない） VoiceGATE Ⅲ SDK
音声モデルサイズ 100KB/100人	通常の会話（自由発話）から照合本人に意識させず、バックグラウンドでモニタリングとしての本人確認も可能登録時10秒以上／照合時2秒以上発声 VoiceSync Ⅴ SDK
	キーワード方式（VoiceGATE Ⅲ SDK）とフリーワード方式（VoiceSync Ⅴ SDK）の組み合わせによる強固なセキュリティを実現

音声認証API

音声登録、音声照合、音声チェックなど必要なAPIを提供。

端末組み込み向け製品

キーワード方式音声認証ライブラリ VoiceGATE Ⅲ SDK

有効音声チェック、登録処理、照合処理など音声認証に必要なAPIを提供
低メモリで動作
マルチプラットフォーム対応
サンプルプログラム同梱

フリーワード方式音声照合・話者識別ライブラリ VoiceSync Ⅴ SDK

キーワード方式／フリーワード方式両対応
話者識別システムへの応用開発が可能

動作環境

VoiceGATE Ⅲ SDK / VoiceSync Ⅴ SDK　共通 (VoiceSync Ⅴのスマホ動作につきましてはご連絡下さい)

Windows版	OS	Windows 10/11 (64bit), Windows Server 2012/2016/2019
	開発環境	Microsoft Visual Studio 2019以降
Linux版	OS	VoiceGATE Ⅲ：Linux Ubuntu14～19 VoiceSync Ⅴ：Linux Ubuntu18～19
	開発環境	glibc 2.4以降
Android版	OS	VoiceGATE Ⅲ：Android OS 4～10
iPhone版	OS	VoiceGATE Ⅲ：iOS 12, 13

仕様

	VoiceGATE Ⅲ	VoiceSync Ⅴ
認証方式	キーワード方式	フリーワード方式
必要処理量	80MIPS	約５%RTF(※1)
コードサイズ	約100KB	約300MB
RAMサイズ	約200KB	スレッドあたり約500MB(※2)
音声データ形式	WAVファイル, 8000Hz/11025Hz, 16bit, モノラル, リニアPCM	WAVファイル, 8000Hz/11025Hz/16000Hz, 16bit, モノラル, リニアPCM
音声モデルサイズ	5～15KB	約100KB(100人の場合)
対応言語	C／C＋＋	C／C＋＋

※1Real Time Factor（実時間比の処理時間）　Intel® Core™ i7-8550U CPU 1.80GHz, 16GB(RAM), Windows10 Proで測定。

製品体系・価格

製品名称	価格
VoiceSync Ⅴ SDK	オープン価格
VoiceGATE Ⅲ SDK	オープン価格

※	VoiceSync Ⅴ SDK, VoiceGATE Ⅲ SDKは、開発機１台あたりの価格です。その１台とは別に、システムやアプリケーションに組み込んでご利用になる場合は、別途ご契約手続きならびにライセンス料金が必要となります。ライセンス料金につきましては、個別にお問合わせ願います。