選択制限規則に基づくメタファー識別手法
DOI:
https://doi.org/10.51094/jxiv.1080キーワード:
メタファー、 選択制限規則、 BERT抄録
メタファーは文学作品や日常会話において頻出する言語表現である.機械翻訳をはじめとする自然言語処理においてメタファーを扱うためにはコーパスが必要となるが,メタファーは定まった形式を持たないゆえに大規模なデータ収集には困難が伴うことが指摘されてきた.本論文では,コーパス構築の容易化のため,メタファーと非メタファーを自動識別する手法を提案する.提案手法では,メタファーが選択制限規則の侵犯を生じる傾向を持つ点に着目し,BERTの事前学習済みモデルを用いた識別を行う.即ち,識別対象箇所に対し,BERTに穴埋め予測をさせることで選択制限規則を侵犯しない語が得られると仮定し,当該予測語と対象箇所の実際の語とのコサイン類似度を比較することで,選択制限規則の侵犯度合いを定量的に表し,メタファーか否かを判断する.BERTの予測語群からコサイン類似度を算出する方法について3種類の方式を考案し,実験により識別精度の比較を行った結果,最良ケースにおいてF値約0.881が得られ,一定の有効性を持つことが確認された.
利益相反に関する開示
本研究に関して開示すべき利益相反(COI)はありません。ダウンロード *前日までの集計結果を表示します
引用文献
伊藤薫, "比喩表現コーパスの構築と問題点 -言語学の立場から-", 言語処理学会年次大会, 2014.
Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova, "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding", arXiv preprint arXiv:1810.04805, 2018.
真鍋陽俊, 岡照晃, 海川祥毅, 高岡一馬, 内田佳孝, 浅原正幸, "複数粒度の分割結果に基づく日本語単語分散表現", 言語処理学会年次大会, 2019.
高橋水晶, 坂野遼平, "選択制限規則に基づくメタファーの識別", データ工学と情報マネジメントに関するフォーラム, 2023.
最上英明, "メタファーと認知", 香川大学一般教育研究, Vol. 46, pp. 71–80, 1994.
田畑博敏, "隠喩へのイニシエーション", 鳥取大学教養部紀要, Vol. 19, pp. 1–22, 1985.
瀬田幸人, "メタファーについて", 岡山大学大学院教育学研究科研究集録, Vol. 142, pp. 49–59, 2009.
杉本巧, "隠喩は何をなすのか", 広島大学大学院教育学研究科紀要. 第二部, 文化教育開発関連領域, Vol. 52, pp. 159–166, 2004.
徳永健伸, 寺井あすか, "比喩理解のための言語処理", 言語, Vol. 37, No. 8, pp. 46–53, 2008.
大竹孝樹, 横井祥, 井之上直也, 高橋諒, 栗原樹生, 乾健太郎, "言語モデルによる物語中のイベントの顕現性推定", 言語処理学会年次大会, 2020.
浅原正幸, 今田水穂, 保田祥, 小西光, 前川喜久雄, "Web を母集団とした超大規模コーパスの開発 : 収集と組織化", 国立国語研究所論集, Vol. 7, pp. 1–26, 2014.
Tohoku NLP Group, "Pretrained Japanese BERT models", https://github.com/cl-tohoku/bert-japanese
WorksApplications, "chiVe: Sudachi による日本語単語ベクトル", https://github.com/WorksApplications/chiVe
工藤拓, "MeCab: Yet Another Part-of-Speech and Morphological Analyzer", https://taku910.github.io/mecab/
SamuraiT, "mecab-python3", https://github.com/SamuraiT/mecab-python3
ダウンロード
公開済
投稿日時: 2025-02-07 08:13:11 UTC
公開日時: 2025-02-12 23:33:47 UTC
ライセンス
Copyright(c)2025
高橋, 水晶
坂野, 遼平

この作品は、Creative Commons Attribution-NoDerivatives 4.0 International Licenseの下でライセンスされています。