NAIST-jdicをChaSenとMeCabで利用する

日本語形態素解析ChaSenMeCabMacPorts (chasen, mecab) が、解析器本体 (chasen-base, mecab-base) と辞書データおよび全体の3つのportに分かれました。
MeCabの全体のportがエンコーディングごとに用意されています。MacPortsでは依存関係を指定するときに、portのオプションまで限定することができません。そのためこれまでは、UTF-8版のMeCabを依存関係に指定しておいて、まだインストールされていないときに自動的に入れるようにすることができませんでした。今回、エンコードごとにportとして独立させたので、例えばcabochaやmecab-javaのportからUTF-8MeCabが自動的に入るようになりました。

オプションに+dartscloneを指定すると、dartsの代替であるdarts-cloneが、chasenmecab両方のportで利用可能です。データがコンパクトに表現されるので、辞書データの容量が削減されます。
Google Code Archive - Long-term storage for Google Code Project Hosting.

また、両者とも辞書としてデフォルトのIPAdicの他に、オプションに+naistjdicを指定してNAIST-jdicが利用できるようになっています。最新版はMeCab用の0.6.3b-20111013です。
NAIST Japanese Dictionary プロジェクト日本語トップページ - OSDN
NAIST-jdicには基本的な語彙が抜けているという指摘がありましたが、現時点ではどうなっているのでしょうか。辞書を構築する作業は地道で大変手間がかかると思いますが、そうした成果を自由に使うことができるというのは恵まれていてありがたい限りです。
Re: 「る次」(るじ)ってなんでしょう (mecab-users 426) - MeCab - OSDN

通常のEUC-JP版IPAdicのMeCabをインストールするときは、単にsudo port install mecabを実行するだけです。例えば、UTF-8NAIST-jdicのMeCabを使う場合は、sudo port install mecab-utf8 +naistjdicとします。解析器本体と辞書のportが同時にインストールされるので、すべて削除するときは、sudo port uninstall mecab mecab-*とする必要があります。更新するときは、sudo port upgrade mecabとします。なお、オプションで+utf8が指定されていた場合は、mecab-utf8がインストールされます。

C/C++以外のスクリプト言語PerlPythonRubyJavaからMeCabを使うためのインタフェースのportも更新されています。Perlであればp5-mecabPythonはpy-mecabRubyはrb-mecabJavamecab-javaが対応します。ただし、言語側のバージョンごとにp5.8-mecab, p5.10-mecab, p5.12-mecab, p5.14-mecab, py24-mecab, py25-mecab, py26-mecab, py27-mecabのサブポートが指定できて、Ruby1.9用はrb19-mecabとなります。

MeCabのホームページはSourceForgeですが、現在、googlecodeでリファクタリングが進められているようです。
Google Code Archive - Long-term storage for Google Code Project Hosting.

ちなみに、mecab-javaの最新版0.98のソースですが、SourceForgeにはmecab-javaではなくmecab-win32の中に置かれていますね。しばらく見つけられませんでした…。
MeCab - Browse /mecab-win32/0.98 at SourceForge.net