PHPでMecabを使う方法
せっかくツイッターのタイムラインデータが使えるので、Mecabを使ってみました。
Mecabのインストール
Mecab本体を下記ページからダウンロードし解凍します。
http://code.google.com/p/mecab/downloads/detail?name=mecab-0.994.tar.gz
$ wget http://mecab.googlecode.com/files/mecab-0.994.tar.gz $ tar zxfv mecab-0.994.tar.gz $ cd mecab-0.994 $ ./configure --enable-utf8-only
Mecabの辞書のインストール
Mecabに必要な辞書を下記ページからダウンロードし解凍します。
http://code.google.com/p/mecab/downloads/detail?name=mecab-ipadic-2.7.0-20070801.tar.gz
$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --enable-utf8-only $ make $ make install
PHP-Mecabのインストール
下記コマンドでインストールすることによりPHPからMecabを操作することができるようになります。
$ pear channel-discover pecl.opendogs.org $ pear remote-list -c opendogs $ sudo pear install opendogs/mecab-beta $ make $ make install
インストールの途中にmecabの設定ファイルが聞かれますので下記のように設定します。
specify pathname to mecab-config [no] : /usr/local/bin/mecab-config
インストールが終わるとphp.iniへの編集が求められますので、下記コマンド等でphp.iniを開き、エクステンションとしてmecabを追加します。
$ sudo vi /etc/php.ini
php.iniに下記文章を追記
extension=mecab.so
あとは、apacheを再起動し、php.iniを再度読み込ませればOKです。
$ apachectrl restart
PHP-Mecabの使い方
$mecab = new wbMecab();
$mecab->keyword('今日は天気がいいですね。');
上記は簡単なサンプルですが品詞や読み方等も引き出すことが可能です。
参考リンク
- Mac Lion と CentOS と Ubuntu に MeCab をインストールする方法
- PHP で Mecab を使って日本語形態素解析の結果を簡単に取得するまでの設定まとめ
- MeCabで形態素解析してみた【PHP】
- [PHPウェブプログラミングのTRY PHP http://www.tryphp.net/2012/01/10/phpapptwitter-user_timeline/:title=Twitter API user timeline 指定ユーザー タイムライン つぶやき ツイート 一覧 表示 取得 php oauth接続]