プレプリント / バージョン1

新聞記事からの因果関係を含む文の抽出手法

##article.authors##

DOI:

https://doi.org/10.51094/jxiv.839

キーワード:

因果関係、 半教師あり学習、 文解析

抄録

本論文では,新聞記事から因果関係を含む文を自動的に抽出する手法を提案する.現在,ウェブページや新聞記事を含む大規模な機械可読文書が入手可能であり,その中には実アプリケーションに役立つ様々な情報が存在し,テキストマイニング技術を用いることで獲得することが可能である.そのような情報の一つに因果関係があり,本研究では因果関係の存在を示す手掛りとなる表現に基づいた因果関係を含む文の抽出を行った.その結果,人手により作られた辞書やパターンを用いず,自動的に因果関係を含む文を抽出することができた.本手法は,素性として構文的な素性と,意味的な素性を用いた.また,追加学習データを自動的に獲得することができる.その結果,性能が向上し,F 値 0.797 を達成した.

利益相反に関する開示

本論文に公表すべきCOIはありません.

ダウンロード *前日までの集計結果を表示します

ダウンロード実績データは、公開の翌日以降に作成されます。

引用文献

R. Higashinaka and H. Isozaki, “Corpus-based question answering for why-questions,” Proc. IJCNLP, pp.418–425, 2008.

石井裕志,馬強,吉川正俊,“因果関係ネットワークの増分的な構築について,” 情報処理学会創立 50 周年記念(第 72 回)全国大会,pp.239–240, 2010.

青野壮志,太田学,“要因検索による因果関係ネットワークの構築と因果知識の獲得,” Forum on Data Engineering and Information Management, 2010.

H. Sakaji, S. Sekine, and S. Masuyama, “Extracting causal knowledge using clue phrases and syntactic patterns,” 7th International Conference on Practical Aspects of Knowledge Management (PAKM), pp.111–122, 2008.

R. Girju, “Automatic detection of causal relations for question answering,” ACL Workshop on Multilingual Summarization and Question Answering, pp.76–83, 2003.

C.S. Khoo, J. Kornfilt, R.N. Oddy, and S.H. Myaeng, “Automatic extraction of cause-effect information from newspaper text without knowledge-based inferencing,” Literary and Linguistic Computing, vol.13, no.4, pp.177–186, 1998.

D.-S. Chang and K.-S. Choi, “Incremental cue phrase learning and bootstrapping method for causality extraction using cue phrase and word pair probabilities,” Inf. Process. Manage., vol.42, no.3, pp.662–678, 2006.

T. Inui, H. Takamura, and M. Okumura, “Latent variable models for causal knowledge acquisition,” 8th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing2007), pp.85–96, 2007.

S. Bthard and J.H. Martin, “Learning semantic links from a corpus of parallel temporal and causal relations,” Proc. ACL-08, pp.177–180, 2008.

庵 功雄,新しい日本語学入門,スリーエーネットワーク,2001.

坂本大祐,坂地泰紀,酒井浩之,増山繁,“企業業績要因文における因果関係の有無判定手法の提案,” 言語処理学会第 15 回年次大会,pp.925–928, 2009.

小林暁雄,増山繁,関根聡,“Wikipedia と汎用シソーラスを用いた汎用オントロジー構築手法,” 信学論(D),vol.J93-D, no.12, pp.2597–2609, Dec. 2010.

池原悟,宮崎正弘,白井諭,横尾昭男,中岩浩巳,小倉健太郎,大山芳史,林良彦,日本語語彙大系,岩波書店,1997.

工藤拓,松本裕治,“チャンキングの段階適用による日本語係り受け解析,” 情処学論,vol.43, no.6, pp.1834–1842, 2002.

乾孝司,乾健太郎,松本裕治,“接続標識「ため」に基づく文章集合からの因果関係知識の自動獲得,” 情処学論,vol.45, no.3, pp.919–933, 2004.

C. Fellbaum, WordNet, An Electronic Lexical Database, The MIT Press, 1998.

A. Blum and T. Mitchell, “Combining labeled and unlabeled data with co-training,” COLT: Proc. Workshop on Computational Learning Theory, pp.92–100, 1998.

D. Yarowsky, “Unsupervised word sense disambiguation rivaling supervised methods,” Proc. 33rd Annual Meeting of the Association for Computational Linguistics, pp.189–196, 1995.

ダウンロード

公開済


投稿日時: 2024-08-03 09:18:45 UTC

公開日時: 2024-08-21 01:35:57 UTC
研究分野
情報科学