2013/02/26

形態素解析エンジンmecabのAPI - MECAPI

形態素解析エンジン mecab のオンライン版がないかと探していたら MECAPI というサービスがあったので、ちょっとAPIを使って遊んでみる。

API仕様

MECAPIのページにも書いてますが、sentenceパラメータに日本語のフレーズを渡すと、形態素に分解して品詞などを返してくれます。デフォルトのレスポンス形式はXMLですが、formatパラメータに、jsonを指定することで、JSON形式での取得も可能です。

エンドポイント
http://yapi.ta2o.net/apis/mecapi.cgi?sentence=解析する文章&format=json  (GET)

レスポンス例

JSONのレスポンスは、こんな感じ。mecabの出力結果がそのままJSON文字列として取得できる。surfaceは、表層形のこと。featureは、カンマ区切りみたいだけど、JSON化して欲しかったなぁー。
[
    {"surface":"今日","feature":"名詞,副詞可能,*,*,*,*,今日,キョウ,キョー"},
    {"surface":"は","feature":"助詞,係助詞,*,*,*,*,は,ハ,ワ"},
    {"surface":"雨","feature":"名詞,一般,*,*,*,*,雨,アメ,アメ"},
    {"surface":"だ","feature":"助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ"}
]

サンプル

PHPで簡単に実装してみた。JSON形式でレスポンスを取得している。とてもシンプルなAPIなので、これっぽっちでサンプルが完成する。
<?php
$phrase = '今日は雨だ';
$json = json_decode(
    file_get_contents(
        'http://yapi.ta2o.net/apis/mecapi.cgi?sentence='
        .urlencode($phrase)
        .'&format=json')
    );

var_dump($json);
 


まとめ

mecab は、サーバーなどにインストールして形態素解析ライブラリとして使うこともできるので、本格的にアプリケーションに組み込むなら、APIではなくインストールの方を勧めします。

0 件のコメント:

コメントを投稿