APIを利用して文章から要点キーワードを簡単抽出する方法
- ヤフーが『キーフレーズ抽出Web API』公開、日本語解析し特徴的な表現抽出
- 文章から要点となるキーワードを抽出する。
ってのを発見したのでとりあえず使ってみた。
リンク
ちなみに「形態素解析」って文章を分解してくれる面白いAPIも提供されてます。
require_once 'XML/Unserializer.php'; $keyword = "京ミッドタウンから国立新美術館まで歩いて5分で着きます。"; $keyword = mb_convert_encoding( $keyword , "utf-8" , "sjis" ); $keyword = urlencode( $keyword ); $apikey = "ディベロッパーKey"; $url = "http://jlp.yahooapis.jp/KeyphraseService/V1/extract?appid={$apikey}&sentence={$keyword}"; $file = file_get_contents( $url ); $Unserializer =& new XML_Unserializer( array('parseAttributes' => true, 'targetEncoding' => 'utf-8' ) ); $status = $Unserializer->unserialize($file); if (PEAR::isError($status)) { die($status->getMessage()); } $xml = $Unserializer->getUnserializedData(); var_dump( $xml ); exit;