音声認識・検出

音声認識・検出

音声認証

音声認証/話者識別ライブラリ

VoicePassport

 

特長

音声認証とは

voiceprint音声によって本人確認を行うバイオメトリクス(生体情報)認証です。 声紋分析から特徴データを抽出し、個人の音声モデルとして登録しておき、 認証時に入力された音声と照合を行うことで、登録者本人の音声か否かを判定する声紋認証システムを構築するためのミドルウェアを提供します。 本人確認の必要な電話サービスや情報システムへのログインにおいて、 これまで煩雑であった本人確認が自然な流れで実現でき、非接触のマルチモーダル生体認証機能と一つとしてご利用できます。また、本人確認だけではなく話者識別として、ロボットや車載カーナビで話している人を区別したサービスを実現できます。
音声パスワードは自由に変更可能、バイオメトリクス情報の漏洩対策にも効果的です。

特長

  • 新規の端末投資が不要 arrow-red-mini ソフトウェアとマイクのみで実現、スマートフォンにも対応
  • 言語に依存しない arrow-red-mini グローバルなシステム展開が可能
  • 心理的負担が少ない arrow-red-mini 顧客満足度の向上を支援
  • 複雑なパスワードの忘却やカード紛失の心配不要
  • 冗長なキーボード操作・ボタン操作からの開放
  • 音声認識音声合成、テレフォニー技術との高い親和性

※高いマーケットシェア:ミック経済研究所の2008年調査にて3年連続シェア66%超
ミック経済研究所調べ「個人認証型セキュリティソリューション市場の現状と将来展望2008」より

適応分野の例

  • 社内システムへのログイン(タブレット・スマートフォン端末)
  • テロ対策・犯罪捜査
  • テレフォンバンキング
  • eラーニング受講者管理
  • 受発注システム(電話・インターネット)
  • 入退室管理
  • 勤怠管理システム
  • ワンタイムパスワードシステム
  • 電子カルテ管理システム
  • ICカード・ソリューション

機能概要

認証方式

キーワード方式
音声モデルサイズ
15KB/キーワード
  • あらかじめ自分で決めたフレーズ(6音節程度:名前やID番号等)をパスワードに利用
  • 登録時3回/照合時1回発声
  • セキュリティポリシーによって、複数回の認証結果スコアの足し合わせ、平均値取得も可能
  • 発声内容かつ音声の個人性両方の一致を要する二重セキュリティ
    (他人に音声キーワードを知られたとしても、本人自身の音声でなければ認証されない)
  • VoiceGATE Ⅲ SDK

 

フリーワード方式 音声モデルサイズ
100KB/100人
  • 通常の会話(自由発話)から照合
  • 本人に意識させず、バックグラウンドでモニタリングとしての本人確認も可能
  • 登録時10秒以上/照合時2秒以上発声
  • VoiceSync Ⅴ SDK

 

多段階認証方式
  • キーワード方式(VoiceGATE Ⅲ SDK)とフリーワード方式(VoiceSync Ⅴ SDK)の組み合わせによる強固なセキュリティを実現

 

音声認証API

音声登録、音声照合、音声チェックなど必要なAPIを提供。

端末組み込み向け製品

キーワード方式音声認証ライブラリ VoiceGATE Ⅲ SDK

  • 有効音声チェック、登録処理、照合処理など音声認証に必要なAPIを提供
  • 低メモリで動作
  • マルチプラットフォーム対応
  • サンプルプログラム同梱

フリーワード方式音声照合・話者識別ライブラリ VoiceSync Ⅴ SDK

  • キーワード方式/フリーワード方式両対応
  • 話者識別システムへの応用開発が可能

動作環境

VoiceGATE Ⅲ SDK / VoiceSync Ⅴ SDK 共通  (VoiceSync Ⅴのスマホ動作につきましてはご連絡下さい)

Windows版 OS Windows 8.1/10 (64bit), Windows Server 2012/2016/2019
開発環境 Microsoft Visual Studio 2019以降
Linux版 OS VoiceGATE Ⅲ:Linux Ubuntu14~19
VoiceSync Ⅴ:Linux Ubuntu18~19
開発環境 glibc 2.4以降
Android版  OS VoiceGATE Ⅲ:Android OS 4~10
iPhone版  OS VoiceGATE Ⅲ:iOS 12, 13

仕様

VoiceGATE Ⅲ VoiceSync Ⅴ
認証方式 キーワード方式 フリーワード方式
必要処理量 80MIPS 約5%RTF(※1)
コードサイズ 約100KB 約300MB
RAMサイズ 約200KB スレッドあたり約500MB(※2)
音声データ形式 WAVファイル, 8000Hz/11025Hz,
16bit, モノラル, リニアPCM
WAVファイル, 8000Hz/11025Hz/16000Hz,
16bit, モノラル, リニアPCM
音声モデルサイズ 5~15KB 約100KB(100人の場合)
対応言語 C/C++ C/C++

  ※1Real Time Factor(実時間比の処理時間) Intel® Core™ i7-8550U CPU 1.80GHz, 16GB(RAM), Windows10 Proで測定。

製品体系・価格

製品名称 価格
VoiceSync Ⅴ SDK オープン価格
VoiceGATE Ⅲ SDK オープン価格
VoiceSync Ⅴ SDK, VoiceGATE Ⅲ SDKは、開発機1台あたりの価格です。その1台とは別に、システムやアプリケーションに組み込んでご利用になる場合は、別途ご契約手続きならびにライセンス料金が必要となります。ライセンス料金につきましては、個別にお問合わせ願います。

 

導入事例

テレホンバンキングにおける本人認証
音声による本人認証でセキュリティ強化と利便性向上の両面を実現
スマホを音声でロック解除
音声認証技術で、ロック解除と同時にアプリ起動を実現
eラーニングシステムの受講者認証
ログイン認証、音声による本人確認