Preprint / Version 1

Cross-Bootstrapping: An Automatic Extraction Method of Solution-Effect Expressions from Patent Documents


  • Hiroki Sakaji Research Faculty of Information Science and Technology, Hokkaido University
  • Hirofumi Nonaka Department of Business Administration,Faculty of Business Administration,AICHI INSTITUTE OF TECHNOLOGY
  • Hiroyuki Sakai Faculty of Science and Technology, Department of Science and Technology, SEIKEI University
  • Shigeru Masuyama Toyohashi University of Technology



Patent Mining, Information Extraction, Text Mining, Bootstrapping


特許文書から直接的なユーザの便益に相当する表現と,技術上の解決課題を示す表現を自動的に抽出するアルゴリズム「Cross-Bootstrapping」を提案する.特許出願件数は年間 40 万件にものぼり,1 文書当りの文章量も膨大であるため,出願動向調査に有用なパテントマップ(特許出願動向を可視化したもの)を手作業で作成するには多大な時間とコストを要するため,その作成に役立つ情報を自動的に抽出する技術が求められている.そこで,本研究ではパテントマップの作成に役立つ「直接的なユーザの便益に相当する表現」と「技術上の解決課題を示す表現」を自動的に抽出する.本手法は,二つの手がかりと統計情報を用いて,ブートストラップ的に表現対を抽出する.また,辞書や人手により作成したパターンを用いず,自動的に表現を抽出することができる.最後に本手法の評価実験を行い,F 値 0.89 と高い性能を達成したことを確認した.

Conflicts of Interest Disclosure

There is no COI to disclose in this paper.

Submitted: 2024-08-03 09:03:27 UTC

Published: 2024-08-21 01:36:38 UTC
Information Sciences