知財管理2021年月号に、「AIを用いた特許調査における業務効率化に関する研究」と題する記事があった。内容は、AIを用いたスクリーニング調査において、教師データが調査結果にどういう影響を与えるかの検証結果である。
検証の対象となった調査ツールは、見つけたい発明と類似の公報を正例、類似しない公報を負例として学習を行い、学習済みのモデルを使って調査を行うというタイプのものである。教師データは多い方が正解率が上がることや、教師データの正例と負例との距離が近いほど正解率は下がるといった結果は感覚的なところと整合していた。少し違っていたのが、学習に用いる項目数(特許請求の範囲、要約、発明等)が多い方が正解率が下がったという結果である。「釣り具分野」でしか検証されていないし、今回だけの結果でどうこうということはないが、そういうこともあるんだなと。あと、教師データは、文字数を統一(短い教師データは、同じ文章をコピペ)すると正解率が上がった。
こうした結果を見ると、どういう細工をするとどういう結果が出るのか、といったAIの癖みたいなものを理解していないと、ツールを使いこなせないという印象である。
最近では、所望の発明を自然文で入力すると、それに近い公報を検索するAI調査のツールもあるが、それにしてもどういう表現をするかによって結果が異なるということがありそう。
0 件のコメント:
コメントを投稿