もはだな|形態素解析周辺の情報について

形態素解析周辺情報

使用ソフトウェア

- mecab 0.996
- IPA 辞書
- その他独自ユーザ辞書を追加しています

品詞について

品詞について

mecab本家のこちらを参照してください。品詞IDの定義
念のために本家サイトからのコピーを置いておきます

その他,間投,*,* 0
フィラー,*,*,* 1
感動詞,*,*,* 2
記号,アルファベット,*,* 3
記号,一般,*,* 4
記号,括弧開,*,* 5
記号,括弧閉,*,* 6
記号,句点,*,* 7
記号,空白,*,* 8
記号,読点,*,* 9
形容詞,自立,*,* 10
形容詞,接尾,*,* 11
形容詞,非自立,*,* 12
助詞,格助詞,一般,* 13
助詞,格助詞,引用,* 14
助詞,格助詞,連語,* 15
助詞,係助詞,*,* 16
助詞,終助詞,*,* 17
助詞,接続助詞,*,* 18
助詞,特殊,*,* 19
助詞,副詞化,*,* 20
助詞,副助詞,*,* 21
助詞,副助詞/並立助詞/終助詞,*,* 22
助詞,並立助詞,*,* 23
助詞,連体化,*,* 24
助動詞,*,*,* 25
接続詞,*,*,* 26
接頭詞,形容詞接続,*,* 27
接頭詞,数接続,*,* 28
接頭詞,動詞接続,*,* 29
接頭詞,名詞接続,*,* 30
動詞,自立,*,* 31
動詞,接尾,*,* 32
動詞,非自立,*,* 33
副詞,一般,*,* 34
副詞,助詞類接続,*,* 35
名詞,サ変接続,*,* 36
名詞,ナイ形容詞語幹,*,* 37
名詞,一般,*,* 38
名詞,引用文字列,*,* 39
名詞,形容動詞語幹,*,* 40
名詞,固有名詞,一般,* 41
名詞,固有名詞,人名,一般 42
名詞,固有名詞,人名,姓 43
名詞,固有名詞,人名,名 44
名詞,固有名詞,組織,* 45
名詞,固有名詞,地域,一般 46
名詞,固有名詞,地域,国 47
名詞,数,*,* 48
名詞,接続詞的,*,* 49
名詞,接尾,サ変接続,* 50
名詞,接尾,一般,* 51
名詞,接尾,形容動詞語幹,* 52
名詞,接尾,助数詞,* 53
名詞,接尾,助動詞語幹,* 54
名詞,接尾,人名,* 55
名詞,接尾,地域,* 56
名詞,接尾,特殊,* 57
名詞,接尾,副詞可能,* 58
名詞,代名詞,一般,* 59
名詞,代名詞,縮約,* 60
名詞,動詞非自立的,*,* 61
名詞,特殊,助動詞語幹,* 62
名詞,非自立,一般,* 63
名詞,非自立,形容動詞語幹,* 64
名詞,非自立,助動詞語幹,* 65
名詞,非自立,副詞可能,* 66
名詞,副詞可能,*,* 67
連体詞,*,*,* 68

複合名詞の品詞について

複合名詞は独自に処理を行っています。
基本的には名詞はこのようになります。

名詞,複合名詞
さらに、追加のバリエーションがあります。
これらは内部処理のために追加していますが、現状表示もしています。
名詞,複合名詞,前接続不可
名詞,複合名詞,後接続不可
特殊な場合として、複合処理をしても上記に当てはまらない場合があります。
例えば人名の場合辞書側でデータを持っていれば姓、名に分かれますが、複合処理を行っても「固有名詞,人名,一般」となります。
このような例は他にもいくつかあります。出来る限り影響のない自然と思われる範囲で対応を行っています。
$ curl -G http://mohadana-khondalit.sqale.jp/api/v1/parse --data-urlencode sentence="山田太郎"|jq
{
  "status": 200,
  "message": "Success",
  "results": [
    {
      "surface": "山田",
      "reading": "ヤマダ",
      "pronunciation": "ヤマダ",
      "pos": "名詞",
      "pos_detail": [
        "固有名詞",
        "人名",
        "姓"
      ],
      "conjugated_form": null,
      "conjugated_type": null,
      "infinitive": "山田"
    },
    {
      "surface": "太郎",
      "reading": "タロウ",
      "pronunciation": "タロー",
      "pos": "名詞",
      "pos_detail": [
        "固有名詞",
        "人名",
        "名"
      ],
      "conjugated_form": null,
      "conjugated_type": null,
      "infinitive": "太郎"
    }
  ]
}

$ curl -G http://mohadana-khondalit.sqale.jp/api/v1/parse --data-urlencode sentence="山田太郎" -d complex|jq
{
  "status": 200,
  "message": "Success",
  "results": [
    {
      "surface": "山田太郎",
      "reading": "ヤマダタロウ",
      "pronunciation": "ヤマダタロー",
      "pos": "名詞",
      "pos_detail": [
        "固有名詞",
        "人名",
        "一般"
      ],
      "conjugated_form": null,
      "conjugated_type": null,
      "infinitive": null
    }
  ]
}