macports

MMDAgent-1.1をOS X Lionで動かすMacPorts

MMDAgentは、音声認識エンジンJuliusや音声合成システムOpen JTalkを利用したオープンソースの音声インタラクションシステム構築ツールキットです。MMD (MikuMikuDance) のモデルやモーションのデータを利用した3D描画やリップシンクが実現されていて、リア…

MacPorts最新版&コミッタ

OS X LionことMac OS X v10.7がリリースされ、MacPortsもバージョンアップしています。現時点の最新版は2.0.1です: The MacPorts Project -- Download & Installation手元のマシンにOSからクリーンインストールした上で、XcodeとJRE、MacPortsをインストー…

能動学習システムDUALISTを日本語テキストに適用する

機械学習手法に基づくテキスト分類は十分な学習データがあれば高い精度が期待できますが、分類ラベルを人手でつける作業に手間がかかります。そこで、効率的に分類器を学習させる手法として、効果的な分類対象を優先的にラベル付けさせる能動学習(active lea…

日本語の単語分割

日本語の単語分割処理は、一般に、単語辞書と単語間連接の規則や学習データに基づいて行われます。オープンソースとして有名なものがいくつもあります。 KAKASI - 漢字→かな(ローマ字)変換プログラム JUMAN - KUROHASHI-KAWAHARA LAB chasen legacy -- an ol…

MeCabで日本語WordCount on Hadoop

HadoopにはWordCountのサンプルがついてきますが、英語テキスト用です。日本語を対象にする場合、MeCabを使って単語分割を行いたいところです。MeCabにはSWIGのJavaバインディングが用意されていて、JNI経由でMeCabの機能を使えるようになります。このときの…

Apache Mahout 0.5 Released

Mahoutのバージョン0.5がリリースされました。 Apache MahoutMacPortsのパージョンも更新される予定です。

MacPortsでMahoutを動かす

Hadoop同様、MahoutもMacPortsに登録されたので、最新版に更新すると利用できます。このとき、Hadoopのportも同時にインストールされます。Mahoutの利用例は次のサイトで参照できますが、以下ではHadoopを使ったNaive-Bayes分類の例を行ってみます。 Log In …

MacPortsでHadoopを動かす

HadoopのMacPortsが登録されたので、次のように、最新の状態に更新すると利用できます。 $ sudo port selfupdate ... $ sudo port install hadoop ---> Fetching hadoop ---> Verifying checksum(s) for hadoop ---> Extracting hadoop ---> Applying patche…

Hadoop安定版0.20.203.0

Hadoopの安定版0.20.203.0が5月11日にリリースされたと公式ホームページにお知らせがあります。 http://hadoop.apache.org/common/releases.htmlところがダウンロードサイトには現時点でRC1版しか置いてありません。これはなぜなのか分かりませんが、何か不…

日本語構文解析システムKNPのMacPorts

KNPのMacPortsを登録しました。 http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp.htmlMacPortsを登録するにあたっては、universal buildへの対応が一つポイントかと思います。KNPの場合、デフォルトでTinyCDBを利用しますが、tinycdbのportがuniversal build…

Open JTalkの合成音声をJuliusで音声認識

MacPortsでインストールしたOpen JTalkの合成音声を、Juliusで音声認識させてみます。マイクのないMacでJuliusをテストするという想定です。まず、MacPortsでopen_jtalk, julius, ssrcをインストールします。 $ sudo port install open_jtalk julius ssrc 次…

Julius-4.2のMacPortsで日本語音声認識

JuliusのバージョンアップにあわせてMacPortsを更新しました。実は前回登録したportでは正しくインストールできなくて、いくつか修正しています。MacPortsでは最終的なインストールの前に仮のインストール先にファイルをコピーするdestroot処理を行うのです…

MMDAgent 安定版 version 1.0公開

音声対話システムMMDAgentの安定版version 1.0が5月1日に公開されました。これに伴い、音声合成システムOpen JTalkと音声合成エンジンJuliusも更新されています。mmdagent.jp Open JTalk GitHub - julius-speech/julius: Open-Source Large Vocabulary Conti…

Hadoop + Maven + Mahout で大規模機械学習

大規模データの機械学習処理に、Hadoop上で動作するMahoutを利用することができます。 Apache MahoutMacへのインストールは次の記事が参考になります。 機械学習/MacでMahoutを使う - とうごろうぃきMahoutの最新リリース版0.4は、Apache Hadoop 0.20.2で動…

自然言語処理・機械学習ツールのMacPortsを登録

自分用にと思って作っていた自然言語処理・機械学習用のMacPortsですが、せっかくなので本家に登録してみました。TinySVM: Support Vector Machines YamCha: Yet Another Multipurpose CHunk Annotator Google Code Archive - Long-term storage for Google …

日本語音声合成システムOpen JTalkと音声認識エンジンJuliusのMacPorts

携帯やスマートフォン、iPadなどでは音声検索をする機能やアプリがあって、なかなかの認識精度だと感心することがあります。 http://www.google.co.jp/mobile/default/onsei.html音声認識技術の水準は着実に上がっていると思いますが、そんな中でも昨年のCEA…

JumanのMacPortsを登録しました

自分用に私家版のMacPortsをいくつか作成していましたが、せっかくなので本家に登録依頼を出してみることにしました。まずは手始めに簡単そうなJumanのportをTracのTicketに登録。 MacPortsすると2日ほどして、コミッターの方がPortfileに修正などを施してく…

MacPortsで自然言語処理の環境を整える

MacPortsを利用するとソースファイルの取得からビルド・インストールまで自動的に実行してくれるので、大変重宝しています。 The MacPorts Project -- Homeちなみに最近では、Homebrewというパッケージ管理環境が、MacPortsよりもビルドが軽いということもあ…