syncha

SynCha 0.3.1.1

はじめに 更新履歴 ダウンロード 準備 使い方 出力フォーマット 注意点 参考文献 English

はじめに

SynChaは日本語の述語項構造解析器です.文章中に出現する述語とその格要素を同定します. 稀に名詞句間の共参照関係も同定します.

更新履歴

    • v0.3.1.1: 古いperlのversionでしか動かなくなっていたのを修正.
    • v0.3.1:cabochaを"-f 1 -n 1"オプションで動かすように修正.
    • v0.3: 共参照解析の処理を追加.
    • v0.2.2: 入出力をeuc-jpからutf8に変更.
    • 空行を入力した際にエラーが出るバグを修正
    • v0.2.1: 半角文字列に関するおかしな振舞いを修正
    • v0.2: 解析対象をn文前までに変更.nはオプションで変えられるはず.
    • 基本的にnを大きくすると解析が非常に遅くなります.
    • (default: n = 2)

ダウンロード

準備

    • cabochalp_solveをインストールしてパスを通す.
    • synchaをダウンロードして展開する.
      • % tar xvfz syncha-0.3.1.1.tgz

使い方

    • cabochaとlp_solveがインストールされていれば特に何もせずに動くと思います
    • 標準入力から文章を入力すれば以下のような結果が返ってきます.
      • % cat dat/sample/test.in | ./syncha * 0 4D 0/1 0.000000 政府 名詞,一般,*,*,,,政府,セイフ,セイフ,, O id="2" は 助詞,係助詞,*,*,,,は,ハ,ワ,, O * 1 2D 2/3 2.292374 低 接頭詞,名詞接続,*,*,,,低,テイ,テイ,, O 所得 名詞,一般,*,*,,,所得,ショトク,ショトク,, O 者 名詞,接尾,一般,*,,,者,シャ,シャ,, O id="1" を 助詞,格助詞,一般,*,,,を,ヲ,ヲ,, O * 2 3D 1/1 1.096540 支援 名詞,サ変接続,*,*,,,支援,シエン,シエン,, O する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル,, O ga="2" o="1" type="pred" * 3 4D 0/1 0.000000 計画 名詞,サ変接続,*,*,,,計画,ケイカク,ケイカク,, O ga="2" id="3" type="noun" を 助詞,格助詞,一般,*,,,を,ヲ,ヲ,, O * 4 -1D 1/2 0.000000 発表 名詞,サ変接続,*,*,,,発表,ハッピョウ,ハッピョー,, O し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ,, O ga="2" o="3" type="pred" た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ,, O 。 記号,句点,*,*,,,。,。,。,, O EOS * 0 1D 1/2 1.668537 関係 名詞,サ変接続,*,*,,,関係,カンケイ,カンケイ,, O 省庁 名詞,一般,*,*,,,省庁,ショウチョウ,ショーチョー,, O id="5" の 助詞,連体化,*,*,,,の,ノ,ノ,, O * 1 2D 0/1 0.000000 協力 名詞,サ変接続,*,*,,,協力,キョウリョク,キョーリョク,, O ga="5" id="4" o="3" type="noun" を 助詞,格助詞,一般,*,,,を,ヲ,ヲ,, O * 2 -1D 1/1 0.000000 要請 名詞,サ変接続,*,*,,,要請,ヨウセイ,ヨーセイ,, O する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル,, O ga="2" o="4" type="pred" 。 記号,句点,*,*,,,。,。,。,, O EOS EOT

出力フォーマット

    • typeの値が"pred"である形態素が述語の主辞を表します.
    • typeの値が"noun"である形態素が事態性名詞の主辞を表します.
    • ga/o/niが述語(もしくは事態性名詞)のガ格/ヲ格/ニ格を表し,同じ値を持つidを主辞とする名詞句が格要素を表します.
    • eqの値が同じ主辞を含む名詞句間に共参照関係があることを表します.

注意点

参考文献

    • 飯田龍, 小町守, 井之上直也, 乾健太郎, 松本裕治. 述語項構造と照応関係のアノテーション: NAISTテキストコーパス構築の経験から. 自然言語処理, Vol.17, No.2, pp.25-50, 2010.
    • Ryu Iida, Massimo Poesio. A Cross-Lingual ILP Solution to Zero Anaphora Resolution. The 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies (ACL-HLT 2011), pp. 804-813. 2011.

ryu.iida@nict.go.jp