Cet outil localise et reconnaît les caractères. Sans formation supplémentaire, il est adapté à la lecture de caractères :
Orienté horizontalement
Hauteur comprise entre 85 % et 115 % de la hauteur du caractère (en pixels)
Contient des lettres latines (majuscules ou minuscules), des chiffres ou l'un des éléments suivants : !#$%&()*+,-./:;<=>?@[]^_`{|}~"'\€£¥
L'outil Deep Learning OCR (OCR basée sur le Deep Learning) peut être utilisé pour limiter la zone analysée, ce qui, dans la plupart des cas, permet d'améliorer les performances. En outre, il peut être utilisé pour s'adapter à un texte qui n'est pas orienté horizontalement.
La hauteur moyenne des caractères doit correspondre à la hauteur moyenne des caractères (en particulier des lettres majuscules) dans la zone analysée. Par exemple, si une image contient deux types de caractères : l'un a une hauteur de 24 pixels et l'autre de 40 pixels, la hauteur moyenne des caractères doit être fixée à 32, quel que soit le nombre de caractères de chaque type.
L'échelle de largeur des caractères permet de modifier les polices dont les symboles sont exceptionnellement étroits ou larges afin d'obtenir un rapport d'aspect plus classique. L'option Character Width Scale (Échelle de largeur de caractère) permet de mettre à l'échelle la zone analysée sur l'axe horizontal. Elle peut améliorer la qualité des résultats. En outre, elle peut faciliter la lecture d'un texte comportant des espaces réduits entre les caractères suivants.
Pour limiter l'ensemble des caractères reconnus, il est possible d'utiliser l'option Character Range (Plage de caractères). Cette chaîne doit être formatée selon les règles suivantes :
Les caractères autorisés doivent être séparés par des virgules,
Pour faciliter l'utilisation, une plage continue de lettres ou de chiffres peut être écrite sous la forme caractère_de_début-caractère_de_fin, par exemple : A-Z ou 1-6
La virgule et la barre oblique inverse doivent être précédées d'une barre oblique inverse.
Par exemple, une plage de caractères A-F,g-o,0-9,X,Y,Z,-,\\,\, ne reconnaîtra que les caractères ABCDEFXYZghijklmno0123456789-\.
Le paramètre Minimum Confidence (Confiance minimale) peut être utilisé pour modifier le score minimal d'un caractère. Par défaut, ce seuil est fixé à 80 %.
Les paramètres Contrast Threshold (Seuil de contraste) et Text Color (Couleur du texte) définissent l'intervalle de contraste souhaité d'un caractère, qui sont utilisés pour réduire le nombre de faux positifs :
Couleur du texte : Bright (Clair) : seuls les caractères dont le contraste est supérieur au seuil de contraste sont renvoyés.
Couleur du texte : Dark (Foncé) : seuls les caractères dont le contraste est inférieur au seuil de contraste sont renvoyés.
Couleur du texte : Any (Sans importance) : seuls les caractères dont le contraste est inférieur ou supérieur au seuil de contraste sont renvoyés.
Paramètres d'OCR basée sur le Deep Learning
Minimum Confidence (Confiance minimale) |
Définit le score minimal requis pour un caractère à inclure dans l'algorithme ou la sortie.
En abaissant cette valeur, il est possible d'inclure des décodages dont le degré de confiance est légèrement inférieur afin d'obtenir le résultat souhaité. Par exemple, l'exemple ci-dessus est trop strict et ne décode finalement pas certains caractères. L'abaissement de cette valeur de 99 à 98 donne un résultat favorable.
|
Average Character Height (Hauteur moyenne des caractères) |
Utilisez le curseur pour sélectionner une valeur proche de la hauteur moyenne en pixels du texte à décoder. Plus cette valeur est proche de la hauteur moyenne des caractères (en pixels), plus les performances s'améliorent.
Valeur minimale : 8 Valeur par défaut : 25 Valeur maximale : 200
|
Text Color (Couleur du texte) |
Définissez la polarité requise pour qu'un caractère soit renvoyé.
Valeur minimale : -100 Valeur par défaut : 0 Valeur maximale : 100
Valeur par défaut : Any (Sans importance)
|
Contrast Threshold (Seuil de contraste) |
Fixe un seuil pour le contraste des caractères trouvés.
|
Character Width Scale Percentage (Pourcentage de l'échelle de largeur des caractères) |
Met à l'échelle la largeur de l'image selon le facteur donné (%).
Valeur minimale : 10 % Valeur par défaut : 100 % Valeur maximale : 1 000 %
|
Character Range (Plage de caractères) |
Limite l'ensemble de caractères souhaités.
Valeur par défaut : \"A-Z,a-z,0-9,\\\\\\\\,/,-\
|
String Match (Correspondance de chaîne) |
Définit une chaîne qui doit être contenue dans la sortie décodée de l'OCR pour que l'outil passe (par exemple, sous-chaîne). Par défaut, l'outil passe si la chaîne de correspondance est contenue dans le résultat de l'OCR. Cela permet d'ajouter des caractères supplémentaires avant et après la chaîne.
Cochez la case Regex et utilisez la syntaxe pour appliquer la correspondance exacte.
RegEx peut également être utilisé pour une logique de correspondance de chaîne complexe. Reportez-vous à la section RegEx pour plus de détails.
|
Timeout (Délai de mise en veille) |
Définit une durée après laquelle l'outil échoue.
|
Invert |
Inverse les résultats de cet outil.
|
Pour utiliser la reconnaissance optique des caractères (OCR) basée sur le Deep Learning avec RegEx, cochez la case RegEx et indiquez une expression que l'outil OCR doit localiser. L'exemple suivant recherche l'expression ^22\d{3}.