BSD/LGPL/GPLのトリプルライセンスで公開された日本語形態素解析用辞書UniDic

UniDicは比較的短い単位で語を分割する形態素解析システム用の日本語辞書です。標準的な表記や音声言語処理に適した発音の情報などが付けられていて、例えば「すもも」に対して標準的な表記である「李」、「言う」の発音として「ユウ」ではなく実際の発音に近い「ユー」が記述されています。以前から再配布できない形では公開されていましたが、最近、BSD/LGPL/GPLのトリプルライセンスでMeCab用の辞書unidic-mecabがリリースされました:
UniDic プロジェクト日本語トップページ - OSDN

unidic-mecabのバイナリ版をMacPortsのportにパッケージして、MeCabで使えるようにしてみました:

$ sudo port selfupdate
$ sudo port clean mecab-utf8
$ sudo port install mecab-utf8 +unidic
$ mecab
すもももももももものうち
すもも スモモ スモモ 李 名詞-普通名詞-一般
も モ モ も 助詞-係助詞
もも モモ モモ 桃 名詞-普通名詞-一般
も モ モ も 助詞-係助詞
もも モモ モモ 桃 名詞-普通名詞-一般
の ノ ノ の 助詞-格助詞
うち ウチ ウチ 内 名詞-普通名詞-副詞可能
EOS

ちなみに、MacPortsのbuildbotとしてSnow LeopardとLion用に引き続き、Mountain Lion用も稼働しています。これでboostのような、うんざりするほど長いコンパイル処理はなくなりますね:
http://lists.macosforge.org/pipermail/macports-announce/2012-December/000025.html