(登録例)
発明は、帳票の画像からテキストデータを読み取る学習モデルを生成するためのデータセットを生成し、当該データセットを用いて機械学習を行う装置に関する。
【請求項1】
文字情報を含む画像データから前記文字情報を読み取り、読み取った前記文字情報の前記画像データにおける位置について推定するための学習モデルに関する機械学習を行う情報処理装置であって、
前記画像データを取得する画像データ取得部と、
前記画像データに含まれる前記文字情報の位置を識別し、読取項目として認識する読取項目認識部と、
読取項目における前記文字情報の文字認識を行い、テキストデータを生成するテキストデータ生成部と、
前記テキストデータと、あらかじめ記憶されている前記画像データに含まれる前記文字情報を示す正解テキストデータとを読取項目ごとに比較し、一致しているか否かの判定を行い、一致していると判定された前記テキストデータを前記画像データ単位で抽出する正解データ抽出部と、
抽出された前記テキストデータと、抽出された前記テキストデータの基になる前記画像データにおける読取項目の位置とに基づいて機械学習を行い、前記学習モデルの生成または更新を行う学習部と、を備え、
前記正解データ抽出部は、前記テキストデータと前記正解テキストデータとを比較して前記テキストデータの合致度を算出し、算出した合致度が所定の閾値以上の場合、前記テキストデータと前記正解テキストデータとが一致していると判定する、情報処理装置。
文字情報を含む画像データから前記文字情報を読み取り、読み取った前記文字情報の前記画像データにおける位置について推定するための学習モデルに関する機械学習を行う情報処理装置であって、
前記画像データを取得する画像データ取得部と、
前記画像データに含まれる前記文字情報の位置を識別し、読取項目として認識する読取項目認識部と、
読取項目における前記文字情報の文字認識を行い、テキストデータを生成するテキストデータ生成部と、
前記テキストデータと、あらかじめ記憶されている前記画像データに含まれる前記文字情報を示す正解テキストデータとを読取項目ごとに比較し、一致しているか否かの判定を行い、一致していると判定された前記テキストデータを前記画像データ単位で抽出する正解データ抽出部と、
抽出された前記テキストデータと、抽出された前記テキストデータの基になる前記画像データにおける読取項目の位置とに基づいて機械学習を行い、前記学習モデルの生成または更新を行う学習部と、を備え、
前記正解データ抽出部は、前記テキストデータと前記正解テキストデータとを比較して前記テキストデータの合致度を算出し、算出した合致度が所定の閾値以上の場合、前記テキストデータと前記正解テキストデータとが一致していると判定する、情報処理装置。
発明のポイントは、画像データをOCRで読み取り、その読取りの精度が高かった正解データのセット(画像データとテキストデータ)のみを学習に用いる点である。
出願人は、意見書において、引用文献1は、「OCR処理に成功した場合、失敗した場合のいずれも機械学習を行うことで、文書帳票の書式の統計的な情報を反映させ、過学習を防止するものです。」と述べ、「一致している帳票のテキストデータのみを機械学習の対象とするために抽出する構成を付加することは、その目的に反するものであり、阻害要因を有します。」と主張した。
補正に関していうと、画像データ単位で正解データを抽出するという構成を加えた。引用文献1に記載の画像処理装置は、「項目単位で一致/不一致の判定を行い、一致していない場合には、確認画面をモニタに出力し、作業者の入力により確認を行う構成」であることから、画像単位では正解データを抽出しないということを言いたいようである。
本件は、発明の目的の違いに起因する構成の違いを請求項に反映させることにより、特許査定を得た例と言える。
0 件のコメント:
コメントを投稿