2011-04-01から1ヶ月間の記事一覧

Hadoop + Maven + Mahout で大規模機械学習

大規模データの機械学習処理に、Hadoop上で動作するMahoutを利用することができます。 Apache MahoutMacへのインストールは次の記事が参考になります。 機械学習/MacでMahoutを使う - とうごろうぃきMahoutの最新リリース版0.4は、Apache Hadoop 0.20.2で動…

Wikipediaテキストを利用した自然言語処理

nlp

Wikipediaは比較的まとまったテキストが手に入る優れた題材として自然言語処理の研究にも利用されています。Wikipediaのテキストデータはダンプサイトからダウンロードできます。"Wikipedia:データベースダウンロード"のページからたどれます。 Wikipedia:デ…

自然言語処理・機械学習ツールのMacPortsを登録

自分用にと思って作っていた自然言語処理・機械学習用のMacPortsですが、せっかくなので本家に登録してみました。TinySVM: Support Vector Machines YamCha: Yet Another Multipurpose CHunk Annotator Google Code Archive - Long-term storage for Google …

日本語音声合成システムOpen JTalkと音声認識エンジンJuliusのMacPorts

携帯やスマートフォン、iPadなどでは音声検索をする機能やアプリがあって、なかなかの認識精度だと感心することがあります。 http://www.google.co.jp/mobile/default/onsei.html音声認識技術の水準は着実に上がっていると思いますが、そんな中でも昨年のCEA…

Emacs-23.3+IMEパッチ+フォント設定

Emacsの最新版23.3がリリースされたのを知り、早速ビルドしてみました。 Emacs23 (Cocoa Emacs) 入門から中毒まで : 紹介マニアIMEパッチは一つ前のバージョンのものinline_patch-23.2-beta3しかありませんが、そのまま問題なく当たるようです。ところが、ma…

JumanのMacPortsを登録しました

自分用に私家版のMacPortsをいくつか作成していましたが、せっかくなので本家に登録依頼を出してみることにしました。まずは手始めに簡単そうなJumanのportをTracのTicketに登録。 MacPortsすると2日ほどして、コミッターの方がPortfileに修正などを施してく…

MacPortsで自然言語処理の環境を整える

MacPortsを利用するとソースファイルの取得からビルド・インストールまで自動的に実行してくれるので、大変重宝しています。 The MacPorts Project -- Homeちなみに最近では、Homebrewというパッケージ管理環境が、MacPortsよりもビルドが軽いということもあ…

KindleでWebに公開されているまとまった文章を読む

AmazonのKindleを持っていますが、これまでAmazonで有料の電子書籍を購入したことがまだなく、Webで一般に公開されている書籍のデータを自分のPCで変換して取り込んでいます。 http://www.amazon.com/gp/feature.html?ie=UTF8&docId=1000234621コンピュータ…