ディープラーニングOCR

ディープラーニングOCR

ディープラーニングOCRツールは、ディープラーニング光学式文字認識を使用して画像からテキストを読み取ります。
このツールは、文字を見つけて認識します。追加のトレーニングなしで、次の文字の読み取りに適しています。
  • 水平方向
  • 文字の高さ(ピクセル数)の85%~115%の高さ
  • ラテン文字(大文字または小文字)、数字、または!#$%&()*+,-./:;<=>?@[]^_`{|}~"'\€£¥のいずれかが含まれる。
ディープラーニングOCRのROI(関心領域)は、分析領域を制限するために使用でき、ほとんどの場合、パフォーマンスの向上につながります。さらに、水平方向ではないテキストに調整を行うのにも使用できます。
Average Character Height(平均文字高さ)は、分析領域内の文字(特に大文字)の平均高さに設定する必要があります。たとえば、画像に1つ目は24ピクセルの高さで、2つ目は40ピクセルの高さの2種類の文字が含まれている場合、各種類の文字数に関係なく、Average Character Height(平均文字高さ)は32に設定する必要があります。
Character Width Scale(文字幅スケール)は、非常に狭いまたは幅の広い記号があるフォントを、より一般的な縦横比に再形成するのに役立ちます。Character Width Scale(文字幅スケール)は、分析された領域を横軸でスケーリングします。これで、結果の質が向上する可能性があります。さらに、後続の文字との間のスペースが狭いテキストを読み取るのに役立ちます。
認識される文字のセットを制限するには、Character Range(文字範囲)を使用できます。この文字列は、次の規則に従ってフォーマットする必要があります。
  • 使用可能な文字はカンマで区切る必要があります。
  • 使いやすいように、連続した範囲の文字または数字は、start_character-ending_character(A-Z、1-6など)として記述できます。
  • カンマとバックスラッシュにはバックスラッシュを1つ前置する必要があります。
たとえば、文字範囲が、A-F,g-o,0-9,X,Y,Z,-,\\,\,である場合、ABCDEFXYZghijklmno0123456789-\文字のみが認識されます。
Minimum Confidence(最小確信度)パラメータは、文字の最小スコアを変更するために使用できます。デフォルトでは、このしきい値は80%に設定されています。
Contrast Threshold(コントラストしきい値)とText Color(テキストの色)パラメータは、1文字の希望するコントラスト間隔を設定します。これは、フォルスポジティブ(偽陽性)の数を減らすために使用されます。
  • Text Color(テキストの色):Bright(明るい)。コントラストがコントラストしきい値より大きい文字のみが返されます。
  • Text Color(テキストの色):Dark(暗い)。コントラストがコントラストしきい値より小さい文字のみが返されます。
  • Text Color(テキストの色):Any(任意)。コントラストがコントラストしきい値よりも小さいか、コントラストしきい値よりも大きい文字のみが返されます。
ディープラーニングOCRの設定
設定
説明
Minimum Confidence(最小確信度)
アルゴリズムまたは出力に含める文字に必要な最小スコアを設定します。
この値を下方に調整すると、確信度がわずかに低いデコードが含まれるようになり、最終的に目的の出力を得ることができる場合があります。たとえば、上記の例は厳しすぎて、最終的にはさまざまな文字をデコードしません。この値を99から98に下げると、良好な結果になります。
Average Character Height(平均文字高さ)
スライダを使用して、デコードしようとしているテキストの平均ピクセルの高さに近い値を選択します。パフォーマンスは、この値が平均文字高さ(ピクセル数)に近づくほど向上します。
  • 最小値:8
  • デフォルト値:25
  • 最大値:200
Text Color(テキストの色)
返す文字に必要な極性を設定します。
  • 最小値:-100
  • デフォルト値:0
  • 最大値:100
デフォルト値:Any(任意)
Contrast Threshold(コントラストしきい値)
検出された文字のコントラストのしきい値を設定します。
デフォルト値:0.0f
Character Width Scale Percentage(文字幅スケールのパーセント)
所定の係数(%)で画像幅をスケールします。
  • 最小値:10%
  • デフォルト値:100%
  • 最大値:1000%
Character Range(文字範囲)
必要な文字のセットを制限します。
デフォルト値:\"A-Z,a-z,0-9,\\\\\\\\,/,-\
String Match(文字列の一致)
ツールが合格するために、デコードしたOCR出力に含める必要がある文字列を定義します(たとえば、サブストリング)。デフォルトでは、一致する文字列が、結果のOCR出力に含まれている場合、ツールは合格します。文字列の前後に追加文字を加えることができます。Regexチェックボックスを有効にし、
^<stringToE
xactMatch>
$
構文を使用して、完全一致動作を実装します。
RegExは、複雑な文字列一致ロジックにも使用できます。詳細については、RegExセクションを参照してください。
Timeout(タイムアウト)
ツールが機能しなくなるまでの時間を設定します。
Invert(反転)
このツールの結果を反転します。
RegExでディープラーニングベースのOCRを使用するには、RegExチェックボックスを有効にして、OCRツールが検出する式を指定します。次の例は、式^22\d{3}を検索します。