日本語音声合成システムOpen JTalkと音声認識エンジンJuliusのMacPorts
携帯やスマートフォン、iPadなどでは音声検索をする機能やアプリがあって、なかなかの認識精度だと感心することがあります。
http://www.google.co.jp/mobile/default/onsei.html
音声認識技術の水準は着実に上がっていると思いますが、そんな中でも昨年のCEATECH Japan 2010で公開されて大きな注目を集めた音声対話システムがMMDAgentです。
mmdagent.jp
MMDAgentで使われている日本語音声合成・認識システムは、名古屋工業大学の徳田・李研究室が公開しているOpen JTalkとJuliusです。これらに関してはMacなどUnixで動作します。
徳田・南角研究室 - 有効なWikiNameではありません
Open JTalk
GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine
MacPortsを作って登録申請したところ、本家リリース版に収録の運びとなりました。sudo port install open_jtalk juliusで、音声合成・認識エンジンの他、公開されている日本語の音声データも同時にインストールされて、すぐ試すことができます。
- open_jtalk_demoコマンドを起動して、標準入力にしゃべらせたい日本語を入力すると音声が出力されます。
- julius_demoコマンドを実行して、マイクに向かって何かしゃべってみてください。MacBook Proなどのラップトップにはマイクも内蔵されているのでそのまま試せます。