音声合成

音声合成

標準テキスト音声合成

実績ナンバーワンの日本語テキスト音声合成ライブラリ

FineSpeech V2.1

音声合成FineSpeech(ファインスピーチ)はテキストを音声に変換するシステムです。プロのナレーションに匹敵する品質を実現し、社会・産業のあらゆるシーンで活躍しています。

コールセンターにおける自動音声応答(IVR)、交通や災害の情報を提供するシステム、カーナビゲーションシステム・VICS・DSRC端末の読み上げ機能やエージェント機能、人とロボットの対話システム、携帯電話でのメール読み上げなどで利用されています。また最近、工場や工事現場での組立支援・出荷前検査・車両点検や保線などで音声合成による作業指示で使われはじめています。

さまざまな用途に対応できるように、組み込み型、サーバー型(MRCP)、クラウド型(PaaS/SaaS)など、複数の形態を用意しています。

FineSpeechは、日本ではじめて、「うれしい声」、「悲しい声」、「怒った声」、「冷たい声」などの感情音声、個人の声質を再現する個人音声合成など、高機能でより人間らしい表情豊かな音声読み上げを実現してきました。これからも幅広い分野でご利用いただける先進的な音声合成をめざします。

Animoで買う
Amazonで買う
Yahoo!で買う

デモンストレーション

サンプル音声

FineSpeech V2.1による合成音声を試聴できます。

「朝早く、バンガローに電報が届いた。」

8.0kHz 16.0kHz 22.05kHz
男声 speaker speaker speaker
女声 speaker speaker speaker

FineSpeech V2.1による感情音声合成を試聴できます。

「新しいメールが、届いています。」

うれしい 悲しい 怒った 冷たい 平常
speaker speaker speaker speaker speaker

(サンプリング周波数:22.05kHz)

特長

  1. 優れた合成品質、多重処理性能、安定性
    1. 新開発の波形生成アルゴリズムによる高い合成品質
    2. 音声合成の多重処理に最適化したプログラムコード
    3. n128多重@Pentium4/3GHz
  2. コールセンターにおける『音声合成サーバ』として、各種IVRに対応
  3. 各種CPU/OSへ最適化した合成エンジンを提供
    1. nx86, SH, MIPS, PowerPC, ARM
    2. Win32, WinCE, Linux, ITRON, Symbian
  4. 各種利用分野に向けた幅広いソリューションを提供
    1. コンテンツ用 単語辞書・プリプロセッサのカスタマイズ提供
    2. ご指定のナレーター音声によるカスタマイズ波形DBの開発

機能

  1. TT-6004仕様をネイティブサポート
  2. Microsoft Speech API (SAPI) サポート
  3. Speech Synthesis Markup Language (SSML) サポート
    • SSMLはWorld Wide Web Consortium(W3C)が勧告する、音声合成記述言語で、XML準拠のマークアップ言語です。
  4. 高度な日本語構文/韻律解析処理

動作環境

OS Windows版 Windows 7 / 8 / 8.1 / 10 (32/64bit)
Windows Server 2003 SP2 / 2003 R2 SP2 / 2008 SP2 (32/64bit)
Windows Server 2012 SP2 (64bit)
※64bit OS上ではWOW64で動作します
Linux版 Red Hat Enterprise Linux Version 5 / 6 / 7 (32/64bit)
CPU Intel Pentium プロセッサ1GHz以上推奨、または同等性能の互換CPU
メモリ 1GB以上推奨
HDD インストール領域として約155MB
開発環境 Microsoft Visual Studio 6以降

【 FineSpeechその他動作実績 】

OS Mac OS X、CentOS4、CentOS5、Windows CE 4.x、Windows CE 5.x、μItron、T-Engine、VxWorks、他
CPU PowerPC G4/5、ARM系、SH系、MIPS系、他

仕様

単語辞書サイズ ~1.5MB(16.5万語)
波形DBサイズ 30MB~850MB/声質(コーパスベース方式)
サンプリング周波数 8.0kHz、16.0kHz、22.05kHz
出力データ形式 16bit Linear PCM、μ Law PCM
多重度 192プロセス※1

※1.WindowsXP SP3、メモリ 2GB、CPU Pentium4 3GHzで測定

オプション

住所処理Optionライブラリ 日本の住所を正しく読み上げるためのライブラリです。郵政公社の住所データに準拠しています。
氏名処理Optionライブラリ 日本人の姓名を正しく読み上げるためのライブラリです。氏名辞書には、約16万の姓名が格納されています。
感情合成オプション 『うれしい声』、『悲しい声』、『怒った声』、『冷たい声』の4種類の感情表現した音声での読み上げ機能を提供します。(FineSpeech Ver.2)
子供声合成オプション 子供声音声合成を行うためのオプションです。声の種類は6歳の男の子です。(FineSpeech Ver.2)
個人音声合成 <関連製品> 咽頭摘出などによって発声機能が損なわれる方向けに、手術前に音声を収録し、 PDA上で ご本人の音声によって、自由会話文を読み上げることのできる音声合成を製作するサービスです。
個人音声合成のページをご覧ください。

 

製品体系・価格

製品名称 価格
FineSpeech SDK V2.1 PC版 200,000円+消費税
Animoで買う
Amazonで買う
Yahoo!で買う
FineSpeech SDK V2.1 Embedded版 600,000円+消費税 -
FineSpeech SDK V2.1 感情合成オプション 100,000円+消費税
Animoで買う
Amazonで買う
Yahoo!で買う
FineSpeech SDK V2.1 子供声合成オプション 100,000円+消費税
Animoで買う
Amazonで買う
Yahoo!で買う
住所処理Optionライブラリ 94,800円+消費税
Animoで買う
Amazonで買う
Yahoo!で買う
氏名処理Optionライブラリ 94,800円+消費税
Animoで買う
Amazonで買う
Yahoo!で買う
FineSpeechで作成された合成音声ファイルをご利用になられる場合や、 FineSpeechのライブラリおよび辞書類を、 システムやアプリケーションに組み込んでご利用になる場合は、 別途ご契約手続きならびにライセンス料金が必要となります。 ライセンス料金につきましては個別にお問合わせ願います。

 

導入事例

携帯電話での音声読上げ機能
視覚障害の方や高齢者の方のために、合成音声で画面の内容や操作ガイドを読み上げ
保線システムおける音声自動応答案内
高品質な合成音声で作業案内を実施
防災情報・災害情報
防災放送の高度化・高品質化
道路交通情報をハイウェイラジオで配信
最新の道路交通情報をドライバーに配信