OCR de aprendizaje profundo

OCR de aprendizaje profundo

La herramienta Reconocimiento óptico de caracteres (OCR) de aprendizaje profundo lee el texto de las imágenes mediante el aprendizaje profundo.
Esta herramienta localiza y reconoce caracteres sin aprendizaje adicional:
  • Orientación horizontal
  • Altura de entre 85 y 115 % de la altura del carácter (en pixeles)
  • Contiene letras latinas (mayúsculas o minúsculas), dígitos, o uno de estos símbolos: !#$%&()*+,-./:;<=>?@[]^_`{|}~"'\€™¥
Utilice la región de interés del OCR de aprendizaje profundo para limitar el área analizada, lo que puede mejorar el rendimiento. Por otra parte, se puede utilizar para ajustar texto sin orientación horizontal.
Configuración de la OCR de aprendizaje profundo
Configuración
Descripción
Confianza mínima
El parámetro Confianza mínima se puede usar para cambiar la calificación mínima de un carácter. De forma predeterminada, este umbral se establece en 80 %.
Reducir este valor puede ayudar a incluir decodificaciones de confianza ligeramente menor, para obtener finalmente la salida deseada. Por citar un caso, el ejemplo anterior es demasiado estricto y no decodifica varios caracteres. Reducir este valor de 99 a 98 produce un resultado favorable.
Altura promedio de los caracteres
La Altura promedio de los caracteres se debe ajustar a la altura promedio de los caracteres (específicamente, de las letras mayúsculas) en el área analizada. Por ejemplo, si una imagen contiene dos tipos de caracteres: uno de 24 pixeles de alto y otro de 40 pixeles de alto, la altura promedio de los caracteres se debe ajustar en 32, independientemente del número de caracteres de cada tipo.
Utilice el control deslizante para seleccionar un valor que sea cercano a la altura promedio en pixeles del texto que está intentando decodificar. El rendimiento mejora cuando este valor se aproxima a la altura promedio de los caracteres (en pixeles).
  • Valor mínimo: 8
  • Valor predeterminado: 25
  • Valor máximo: 200
Espaciado entre caracteres
La distancia entre caracteres se denota como una fracción de la Altura del carácter.
Color del texto
Establezca la polaridad requerida para la identificación de un carácter.
  • Brillante: Solo se identifican caracteres con contraste superior al Umbral de contraste.
  • Oscuro: Solo se identifican caracteres con contraste inferior al Umbral de contraste.
  • Cualquiera: Solo se identifican caracteres con contraste inferior o superior al Umbral de contraste.
Valor predeterminado: Cualquiera
Umbral de contraste
Establece el umbral de contraste de los caracteres detectados.
Valor predeterminado: 0
Porcentaje de la escala de ancho de los caracteres
Escala el ancho de la imagen según el factor indicado (%).
  • Valor mínimo: 10 %
  • Valor predeterminado: 100 %
  • Valor máximo: 1000 %
Rango de caracteres
Active el Rango de caracteres para limitar el conjunto de caracteres reconocidos.
Esta secuencia se debe formatear de acuerdo con las siguientes reglas:
  • Los caracteres permitidos deben separarse con comas.
  • Para facilitar el uso, se puede escribir un rango continuo de letras o dígitos como starting_character-ending_character; por ejemplo: A-Z o 1-6.
  • Las comas y diagonales invertidas deben ir precedidas por una diagonal invertida.
Por ejemplo, un Rango de caracteres igual a A-F,g-o,0-9,X,Y,Z,-,\\,\, solo permite reconocer los caracteres ABCDEFXYZghijklmno0123456789-\.
Rango de caracteres
Ofrece la opción de limitar el ajuste de los caracteres deseados al devolver el resultado.
Coincidencia de secuencias
Define una secuencia que debe estar dentro de la salida de OCR decodificada, para que la herramienta apruebe (por ejemplo, subsecuencia). De forma predeterminada, la herramienta aprueba si la coincidencia de secuencias es parte de la salida de OCR resultante. Esto permite agregar otros caracteres antes y después de la secuencia.
Habilite la casilla de verificación RegEx y utilice la sintaxis
^<stringToExactMatch$
para implementar el comportamiento de las coincidencias exactas.
RegEx también se puede utilizar para la lógica de coincidencia de secuencias complejas. Consulte la sección # para ver más detalles.
Tiempo de espera
Establece un tiempo, después del cual la herramienta falla.
Inversión del resultado Aprobado/Reprobado
Invierte los resultados de esta herramienta.