Ajuste de la OCR de aprendizaje profundo avanzado

Ajuste de la OCR de aprendizaje profundo avanzado

Configure los ajustes de la OCR de aprendizaje profundo avanzado como un porcentaje del espacio entre caracteres, un porcentaje de desalineación vertical, los caracteres mínimos para crear una línea, aplanar y reglas gramaticales.
Ajuste de la OCR de aprendizaje profundo avanzado
Configuración
Descripción
Porcentaje máximo de espacio entre caracteres
El espacio horizontal máximo entre las cajas de caracteres unidos se indica como un porcentaje de la altura del carácter A.
Porcentaje máximo de desalineación vertical
La desalineación vertical máxima entre las cajas de caracteres unidos se indica como un porcentaje de la altura del carácter A.
Caracteres mínimos para crear una línea
Determina el número mínimo de caracteres para crear una línea.
Valor predeterminado: 1
Una línea se conoce comúnmente como un bloque o palabra para el uso de esta herramienta.
Aplanar
Si se cumple, esta función concatena las palabras de cada línea en una sola cadena de resultados. De lo contrario, cada palabra es una cadena de resultados por separado.
Reglas gramaticales
Utilice reglas gramaticales para verificar la estructura del texto en cuanto a gramática, caracteres y limitaciones de formato, y abreviaturas o acrónimos.
Los elementos del patrón detectados mediante reglas gramaticales pueden ser:
  • Caracteres individuales: caracteres operativos que se escapan: Utilice una barra invertida para tratar los caracteres operativos como normales: \\, \*, \?, \., \+, \-, \], \[, \), \(.
  • Clase de caracteres: conjunto de caracteres entre corchetes []. Le permite hacer coincidir cualquier carácter del conjunto especificado. Por ejemplo:
    • Lista de caracteres: [abc] coincide con cualquiera de los caracteres a, b o c.
    • Rango: [a-z] coincide con cualquiera de los caracteres de la a a la z.
    • Combinación de caracteres: [a-zA-Z12] coincide con cualquiera de los caracteres de la a a la z, de la A a la Z y 1,2.
    • Clases de caracteres predefinidos:
      • \d es equivalente a [0-9]
      • \w corresponde a [a-zA-Z0-9_]
      • . (punto) coincide con cualquier carácter individual (\w más caracteres especiales )
    Dentro de una clase de caracteres, los siguientes caracteres requieren escape con una barra invertida //,\\, \-, \]. Por ejemplo, [a.*|] es un patrón válido que coincide con los caracteres: a,.,*,|.
  • Cadena: una secuencia extendida creada mediante la concatenación de caracteres individuales y clases de caracteres. Por ejemplo:
    • abc: coincide con el texto abc
    • [Aa]bc: coincide con textos: abc y Abc
    • \dabc: coincide con textos: 0abc, 1abc, ..., 9abc
  • Alternativa: se usa para hacer coincidir un patrón u otro. Es una secuencia de cadenas separadas por el símbolo de barra vertical | entre paréntesis (). Por ejemplo:
  • Operadores especiales: pueden modificar o repetir la expresión anterior. Por ejemplo:
    • * (asterisco): significa cero o más incidencias de la expresión anterior (en particular, ".*" significa cualquier secuencia), pero intenta hacer coincidir tantos caracteres como es posible.
    • + (signo más): significa una o más incidencias del elemento anterior, lo que maximiza el número de caracteres coincidentes.
    • ? (signo de interrogación): significa cero o una incidencia del elemento anterior, con preferencia por uno.
    • *? (asterisco indefinido): significa cero o más incidencias de la expresión anterior, pero intenta hacer coincidir la menor cantidad de caracteres posible.
    • +? (signo más indefinido): significa una o más incidencias, pero minimiza el número de caracteres coincidentes.
    Se pueden agregar operadores especiales después del elemento de patrón; por ejemplo: [ABC]*, [0-9]?, (ABC|DEF)+. Sin embargo, no se pueden utilizar operadores especiales dentro de elementos de patrón alternativos.