読者です 読者をやめる 読者になる 読者になる

PHPでMecabを使う方法

PHP

せっかくツイッタータイムラインデータが使えるので、Mecabを使ってみました。

Mecabのインストール

Mecab本体を下記ページからダウンロードし解凍します。
http://code.google.com/p/mecab/downloads/detail?name=mecab-0.994.tar.gz

$ wget http://mecab.googlecode.com/files/mecab-0.994.tar.gz
$ tar zxfv mecab-0.994.tar.gz
$ cd mecab-0.994
$ ./configure --enable-utf8-only

Mecabの辞書のインストール

Mecabに必要な辞書を下記ページからダウンロードし解凍します。
http://code.google.com/p/mecab/downloads/detail?name=mecab-ipadic-2.7.0-20070801.tar.gz

$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
$ tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --enable-utf8-only
$ make
$ make install

PHP-Mecabのインストール

下記コマンドでインストールすることによりPHPからMecabを操作することができるようになります。

$ pear channel-discover pecl.opendogs.org
$ pear remote-list -c opendogs
$ sudo pear install opendogs/mecab-beta
$ make
$ make install

インストールの途中にmecabの設定ファイルが聞かれますので下記のように設定します。

specify pathname to mecab-config [no] : /usr/local/bin/mecab-config

インストールが終わるとphp.iniへの編集が求められますので、下記コマンド等でphp.iniを開き、エクステンションとしてmecabを追加します。

$ sudo vi /etc/php.ini

php.iniに下記文章を追記

extension=mecab.so

あとは、apacheを再起動し、php.iniを再度読み込ませればOKです。

$ apachectrl restart

PHP-Mecabの使い方

$mecab = new wbMecab();
$mecab->keyword('今日は天気がいいですね。');

上記は簡単なサンプルですが品詞や読み方等も引き出すことが可能です。