Deep Learning OCR

Deep Learning OCR

Lo strumento Deep Learning OCR (Optical Character Recognition) legge il testo dalle immagini utilizzando il riconoscimento ottico dei caratteri con tecnologia Deep Learning.
Questo strumento individua e riconosce i caratteri. Senza ulteriore addestramento, è in grado di leggere caratteri:
  • Orientati orizzontalmente
  • Con un'altezza tra 85% e 115% (in pixel)
  • Contenenti caratteri latini (maiuscoli o minuscoli), cifre o uno dei seguenti: !#$%&()*+,-./:;<=>?@[]^_`{|}~"'\€£¥
La regione di interesse dello strumento Deep Learning OCR può essere utilizzata per limitare l'area analizzata e, nella maggior parte dei casi, consente di migliorare le prestazioni. Inoltre, può essere utilizzata per regolare il testo che non è orientato orizzontalmente.
L'opzione Average Character Height (Altezza media caratteri) deve essere impostata sull'altezza media dei caratteri (in particolare, lettere maiuscole) nell'area analizzata. Ad esempio, se un'immagine contiene due tipi di caratteri, uno alto 24 pixel e l'altro alto 40 pixel, l'altezza media dei caratteri deve essere impostata su 32, indipendentemente dal numero di caratteri di ciascun tipo.
L'opzione Character Width Scale (Scala larghezza caratteri) consente di ridefinire la forma dei caratteri con simboli eccezionalmente stretti o larghi fino a ottenere proporzioni più tipiche. La scala della larghezza dei caratteri ridimensionerà l'area analizzata sull'asse orizzontale. Può migliorare la qualità dei risultati. Inoltre, può essere utile per leggere un testo con spazi ristretti tra caratteri successivi.
Per limitare il set di caratteri riconosciuti, è possibile utilizzare l'opzione Character Range (Intervallo di caratteri). Questa stringa deve essere formattata in base alle seguenti regole:
  • I caratteri consentiti devono essere separati da virgole.
  • Per una maggiore facilità d'uso, è possibile scrivere un intervallo continuo di lettere o cifre come starting_character-ending_character, ad esempio A-Z o 1-6.
  • La virgola e la barra rovesciata devono essere precedute da una barra rovesciata.
Ad esempio, per un intervallo di caratteri uguale a A-F,g-o,0-9,X,Y,Z,-,\\,\, verranno riconosciuti soli i caratteri ABCDEFXYZghijklmno0123456789-\,.
Il parametro Minimum Confidence (Confidenza minima) può essere utilizzato per modificare il punteggio minimo di un carattere. Per impostazione predefinita, questa soglia è impostata su 80%.
I parametri Contrast Threshold (Soglia di contrasto) e Text Color (Colore del testo) impostano l'intervallo di contrasto desiderato di un carattere e vengono utilizzati per ridurre il numero di falsi positivi:
  • Text Color (Colore del testo): Bright (Chiaro): vengono restituiti solo i caratteri con contrasto superiore alla soglia di contrasto.
  • Text Color (Colore del testo): Dark (Scuro): vengono restituiti solo i caratteri con contrasto inferiore alla soglia di contrasto.
  • Text Color (Colore del testo): Any (Qualsiasi): vengono restituiti solo caratteri con contrasto inferiore alla soglia di contrasto o superiore alla soglia di contrasto.
Impostazioni di Deep Learning OCR
Impostazione
Descrizione
Minimum Confidence (Confidenza minima)
Imposta un punteggio minimo richiesto per un carattere da includere nell'algoritmo o nell'output.
la regolazione verso il basso di questo valore può aiutare a includere decodifiche con una confidenza leggermente inferiore per ottenere in definitiva l'output desiderato. Ad esempio, l'esempio sopra riportato è troppo rigido e in definitiva non decodifica vari caratteri. Riducendo questo valore da 99 a 98 si ottiene un risultato positivo.
Average Character Height (Altezza media caratteri)
Utilizzare il cursore per selezionare un valore vicino all'altezza media in pixel del testo che si sta tentando di decodificare. Le prestazioni migliorano quanto più questo valore è vicino all'altezza media dei caratteri (in pixel).
  • Valore minimo: 8
  • Valore predefinito: 25
  • Valore massimo: 200
Text Color (Colore del testo)
Consente di impostare una polarità richiesta per un carattere da restituire.
  • Valore minimo: -100
  • Valore predefinito: 0
  • Valore massimo: 100
Valore predefinito: Any (Qualsiasi)
Contrast Threshold (Soglia di contrasto)
Imposta una soglia per un contrasto di caratteri trovati.
Valore predefinito: 0,0 f
Character Width Scale Percentage (Percentuale di scala della larghezza dei caratteri)
Scala la larghezza dell'immagine in base a un determinato fattore (%).
  • Valore minimo: 10%
  • Valore predefinito: 100%
  • Valore massimo: 1000%
Character Range (Intervallo di caratteri)
Limita il set di caratteri desiderati.
Valore predefinito: \"A-Z,a-z,0-9,\\\\\\\\,/,-\
String Match (Corrispondenza stringa)
Definisce una stringa che deve essere contenuta all'interno dell'output OCR decodificato affinché lo strumento restituisca un esito positivo (ad es. la sottostringa). Per impostazione predefinita, lo strumento restituisce un esito positivo se la stringa di corrispondenza è contenuta nell'output OCR risultante. Ciò consente di aggiungere ulteriori caratteri prima e dopo la stringa.
Abilitare la casella di controllo Regex e utilizzare la sintassi
^<stringToExactMatch$
per implementare il comportamento di corrispondenza esatta.
RegEx può essere utilizzato anche per la logica di corrispondenza stringa complessa. Per ulteriori dettagli, fare riferimento alla sezione RegEx.
Timeout
Consente di impostare un intervallo di tempo dopo il quale lo strumento restituisce esito negativo.
Invert (Inverti)
Capovolge i risultati di questo strumento.
Per utilizzare il riconoscimento ottico dei caratteri basato su Deep Learning con RegEx, abilitare la casella di controllo RegEx e fornire un'espressione che lo strumento OCR deve individuare. L'esempio seguente cerca l'espressione ^22\d{3}.