音声合成

音声合成

高品質音声合成ライブラリ

ベストセラー音声合成ライブラリの最新版

FineSpeech V4 SDK

音声合成FineSpeech(ファインスピーチ)はテキストを音声に変換するシステムです。プロのナレーションに匹敵する品質を実現し、社会・産業のあらゆるシーンで活躍しています。

コールセンターにおける自動音声応答(IVR)、交通や災害の情報を提供するシステム、カーナビゲーションシステム・VICS・DSRC端末の読み上げ機能やエージェント機能、人とロボットの対話システム、携帯電話でのメール読み上げなどで利用されています。また最近、工場や工事現場での組立支援・出荷前検査・車両点検や保線などで音声合成による作業指示で使われはじめています。

さまざまな用途に対応できるように、組み込み型、サーバー型(MRCP)、クラウド型(PaaS/SaaS)など、複数の形態を用意しています。

FineSpeechは、日本ではじめて、「うれしい声」、「悲しい声」、「怒った声」、「冷たい声」などの感情音声、個人の声質を再現する個人音声合成など、高機能でより人間らしい表情豊かな音声読み上げを実現してきました。これからも幅広い分野でご利用いただける先進的な音声合成をめざします。

サンプル音声

FineSpeech V4、V3、V2 による音声合成の聞き比べができます。(すべて22.05kHz)
読み上げ文章 FineSpeech V4 FineSpeech V3 FineSpeech V2
お電話ありがとうございます。アニモ百貨店の商品をご案内いたします。 speaker speaker speaker
アニモでは、生活に役立つサービスからビジネスユースの音声処理ソフトウエアまで取り揃えております。 speaker speaker speaker
FineSpeech V4 ボイスモデル サンプル音声
女性の声 男性の声
ボイスモデル ユキ ボイスモデル ケイコ ボイスモデル サトシ ボイスモデル タカシ
speaker speaker speaker speaker

 

特長

  1. 複数の声(ボイスモデル)を混ぜ合わせて、新しい声を作れる「ボイスモーフィング機能」を実装。
    アプリケーションプログラムから、声の表情を多彩に作り出せます。ボイスモーフィング機能
防災放送に!
読み上げる情報の重要度に合わせて、声の緊迫感をコントロール。
情報の重要度をより的確に伝えられます。
カーナビゲーションシステムに!
周囲の雑音レベルに合わせて、声の通りやすさをコントロール。
騒音環境下でも的確に情報を伝達できます。
エンターテインメントソフトに!
二人の声を混ぜ合わせて新しい声を生成。多彩な声のバリエーションを作れます。
  1. ボイスモデルの製作コストが、従来の1/5に。
    芸能人や声優の声をベースにしたボイスモデルを、短期間・ローコストで作れます。
    ボイスモデルの製作コスト
  1. FineSpeechシリーズのユーザー資産を最大限に活用しつつ、最新機能をご利用可能です。
① プログラミングモデルAPIは共通。ユーザープログラムの移行は極めて簡単です。
② ユーザー言語辞書ファイル・表音文字列データは共通。そのままご利用可能です。
③ 氏名処理オプション・住所処理オプションも利用可能。

 

仕様

単語辞書サイズ ~1.5MB (16.5万語)
ボイスDBサイズ 約5MB (声種あたり)
サンプリング周波数 8kHz, 16kHz, 22.05kHz
出力データ形式 16bit Linear PCM, μ Law PCM

 

動作環境

OS Windows版 Windows 7/8/8.1/10 (32/64bit)
Windows Server 2008 SP2 (32/64bit) / 2008 R2 (64bit) / 2012 (64bit)
Linux版 RedHat Enterprise Linux Version 5/6/7 (32/64bit)
その他 お問い合わせください
CPU Intel Pentium プロセッサ1GHz以上推奨、または同等性能の互換CPU
メモリ 2GB以上推奨
HDD インストール領域として約100MB
開発環境 Microsoft VisualStudio 2008以降

 

製品体系

FineSpeech V4 SDK FineSpeech SDK本体(ライブラリ)です。
ボイスモデル ケイコ FineSpeech V2の話者「ケイコ」と同じ女声のボイスモデルです。
ボイスモデル タカシ FineSpeech V2の話者「タカシ」と同じ男声のボイスモデルです。
ボイスモデル ユキ FineSpeech V3の話者「ユキ」と同じ女声のボイスモデルです。
ボイスモデル サトシ FineSpeech V3の話者「サトシ」と同じ男声のボイスモデルです。
子供ボイスモデル 子供のボイスモデルです。6歳の男の子です。(9月発売予定)
感情ボイスモデル 女性の『平静』・『うれしい声』・『悲しい声』・『怒った声』・『冷たい声』の5種類の感情表現のボイスモデルです。(9月発売予定)
住所処理Optionライブラリ 日本の住所を正しく読み上げるためのライブラリです。日本郵便株式会社の住所データに準拠しています。
氏名処理Optionライブラリ 日本人の姓名を正しく読み上げるためのライブラリです。氏名辞書には、約16万の姓名が格納されています。
  • 従来のFineSpeech V2、V3の波形DBはご使用いただけません。
    新たにFineSpeech V4専用のボイスモデルをご購入いただく必要があります。
  • 価格はすべてオープン価格です。お問い合わせください。

FineSpeechで作成された合成音声ファイルをご利用になる場合や、FineSpeechのライブラリおよび辞書類を、システムやアプリケーションに組み込んでご利用になる場合は、別途ご契約手続きならびにライセンス料金が必要となります。ライセンス料金につきましては個別にお問合わせ願います。