3840 mots, temps de lecture 20 minutes.
La transcription automatique des textes débute par la réalisation d’une photo numérique. Les images peuvent être celles de fragments de textes comme une citation, une phrase, un titre, un paragraphe, une page complète. Des outils de sélection intégrés au navigateur ou au système d’exploitation facilitent la capture de portions de textes à transcrire. Avec les smartphones, plusieurs applications autorisent la photographie et ensuite l’OCR (Optical Character Recognition). Des cas de textes plus complexes se présentent aussi souvent. Textes et images peuvent voisiner sur une même page. Plusieurs images de pages peuvent être assemblées en un seul document PDF dont la transcription globale est souhaitée. Les langues peuvent aussi varier, les textes contenir des typographies inhabituelles, être dans certains cas manuscrits. Des documents peuvent finalement contenir des formules mathématiques et des tableaux de données. Pour tenter de répondre à certains de ces cas, quatre logiciels populaires pour ordinateurs et smartphones sont successivement testés, pour leurs capacités de reconnaissance optique.
Tout d’abord, une extension de navigateur est présentée, nommée « OCR Image Reader ». Elle permet la capture et la reconnaissance optique de portions de textes, le tout de manière aisée et gratuite. Nous nous intéressons ensuite aux possibilités des smartphones. Installées par défaut sous Android, les applications Lens et Keep de Google sont passées en revue pour leurs fonctionnalités d’OCR et dans certains cas d’HTR (Handwritten text recognition). Lens permet l’OCRisation de fragments de textes. Une traduction automatique intégrée peut ensuite être activée. Keep a pour objet la prise de note. Une fonctionnalité d’OCR se montre également présente dans l’interface web associée à l’application. La suite des logiciels propriétaires Mathpix est passée en revue dans la quatrième partie. Mathpix propose une gamme d’applications pour smartphones et ordinateurs, spécifiquement dédiée à la reconnaissance de contenus trouvés dans le domaine des mathématiques. Après cliché d’un fragments ou bien chargement d’images et de PDF complets, une plateforme web permet la reconnaissance et facilite l’édition des captures et reconnaissances. Le cas des équations mathématiques et des tableaux de données est testé dans plusieurs conditions. Des discussions portent finalement sur les formats possibles pour encoder les formules mathématiques. Les rendus des équations en PNG, TeX, MathML et SVG sont comparés.
Plan
- OCR Image Reader, une extension de navigateur par Brian
- Google Lens
- Google Keep
- Mathpix, une appli d’OCRisation dédiée aux mathématiques
- 4.1 Avec le smartphone
- 4.2 Depuis l’ordinateur, avec MathPix Snipping Tool
- 4.2.1 Équations mathématiques, formats de saisie et rendus dans le navigateur
- 4.2.2 Tableaux de données
- 4.3 Snip Web, plateforme de transcription et d’édition
- 4.4 La revue Spectra de Mathpix
- Autres applis pour l’OCR et les maths
1. OCR Image Reader, une extension de navigateur par Brian
Nous avons fréquemment besoin de choses simples. Des petits travaux de capture et d’OCR de fragments de textes imprimés peuvent être faites à l’aide d’un simple navigateur. Ces logiciels présentent l’avantage d’être indépendants du système d’exploitation et de pouvoir intégrer des fonctionnalités supplémentaires. Une option simple pour étendre les possibilités consiste à installer des extensions. L’extension « OCR Image Reader de Brian » est essayée. Le prénom « Brian » du développeur est ici conservé car deux extensions portent le même nom – OCR Image Reader, et celle de Brian brille par son efficacité.

Après installation, une icône s’ajoute dans la barre des extensions. Lorsque activé, un outil permet de sélectionner dans le navigateur une portion de texte. Parmi les options, il est possible de choisir la langue du texte et le niveau de précision souhaité. Dans notre exemple, le français (French) est choisi, de même que Better Accuracy. Dans le résultat du traitement, les retours à la ligne du texte original sont conservés, ce qui rend plus aisée la relecture et l’éventuelle suppression des césures.

L’extension de Brian s’appuie sur la bibliothèque javascript libre « tesseract.js« . Celle-ci supporte plus de 100 langues, la détection automatique de l’orientation du texte, la détection de scripts et se montre en constante évolution. Pas de limitation sur les volumes, pas de publicité si les bonnes options sont activées. Cependant, l’écriture manuscrite, les formules mathématiques et les tableaux de données ne sont pas reconnus. Le code source de Brian est de plus ouvert et disponible pour Firefox, Chrome, Edge et Opera.
- Site web d’OCR Image Reader, pour Windows, Apple, Linux, par Brian Girko : Lien
- Code source, par Brian Girko : Lien
- Extension pour Firefox : Lien
- Extension pour Chrome : Lien
- https://en.wikipedia.org/wiki/Tesseract_(software)
2. Google Lens
Intégré aux smartphones sous Android ou iOS, Google Lens rend possible la reconnaissance des contenus des images, que celles-ci soient une représentation d’un texte simple, un QR code, un code-barre, des objets du commerce, des plantes vertes ou une race de chat, etc. Seule la question de la reconnaissance des textes imprimés et manuscrits (OCR et HTR) est ici considérée.
La transcription proposée par Lens fonctionne bien sur les imprimés. L’HTR se montre moins fonctionnel. Une écriture manuscrite appliquée permet d’obtenir cependant des résultats. Le texte reconnu par Lens s’affiche en surbrillance dans l’écran. Il peut ensuite, si besoin, être traduit instantanément dans une autre langue, de français en anglais par exemple. Après sélection, la traduction apparait en réalité augmentée dans l’écran.

L’application peut afficher les résultats d’opérations simples, mais prendre une calculatrice se montre cependant plus judicieux. Google Lens permet l’extraction des données textuelles d’un tableau, cependant, les colonnes sont reconnues sans insertion de séparateur entre les contenus.

Parmi les applications notables de Lens, figure la recherche d’image inversée (trouver des images apparentées à une image ou à une portion d’image prise précédemment), la traduction automatique. Des aides au devoirs sont proposées et ici non testées.
- https://fr.wikipedia.org/wiki/Google_Lens
- Google Lens, Recherchez ce que vous voyez : Lien
- https://en.wikipedia.org/wiki/Reverse_image_search
3. Google Keep
Disponible sous Android et iOS, Google Keep est une application mobile spécifiquement dédiée à la prise de notes. Des textes saisis depuis le clavier virtuel peuvent être mémorisés sous forme de notes, de listes de tâches à effectuer, d’images ou de sons captés. Les notes prises depuis le smartphone sont de plus synchronisées avec une plateforme web. Elles peuvent, après connexion au compte Google, être consultées depuis tout navigateur à l’adresse https://keep.google.com/.
La plateforme web embarque des fonctionnalités d’OCR. Pour extraire le texte d’une image, il suffit de prendre une photo dans Keep. L’image devient alors accessible sous forme de note. En sélectionnant celle-ci dans l’application web, un menu apparait dans lequel on choisit l’option « Extraire le texte de l’image ». L’OCR marche bien sur les imprimés, même avec un cliché médiocre.

- https://fr.wikipedia.org/wiki/Google_Keep
- Keep, Consignez l’essentiel et travaillez plus efficacement : Lien
4. Mathpix, l’appli d’OCRisation des mathématiciens
Les étudiants et professionnels des mathématiques ont des exigences tout à fait particulières pour OCRiser leurs textes, articles et manuscrits, auxquelles les applications Mathpix pour mobile et ordinateur tentent de répondre. Fondée en 2016 par Nicolas Jimenez et Kaitlin Cunningham, la prometteuse société new-yorkaise s’est spécialisée dans la capture, l’OCR et l’HTR, l’assistance à l’édition de documents susceptibles de contenir des textes et des éléments textuels, des graphiques, des formules mathématiques, des tableaux de données, et finalement des molécules chimiques. Mathpix propose à un public, plutôt universitaire, intéressé par l’édition des textes mathématiques des outils partiellement gratuits. La limite est actuellement fixée à 10 captures et 20 PDF gratuits par mois.
Après inscription sur le site, des applications pour iOS et Android, ainsi que MacOS, Windows et Linux peuvent être téléchargées et installées. Les images de textes sont prises soit à l’aide du smartphone sur lequel Mathpix est installé, soit capturées depuis l’écran de l’ordinateur, à l’aide d’un outil de sélection. Il est aussi possible de charger des documents PDF complets. Ceux-ci seront classés et archivés dans une collection personnelle, sur les serveurs de Mathpix.
Dans la documentation en anglais, le terme Snip est souvent employé. Il signifie en français « coupure de ciseau », « capture rapide », portion de texte capturé (à ne pas confondre avec Snap, qui signifie entre autres choses, prendre une photo de manière non formelle).
- https://mathpix.com/
- Appli pour smartphone : https://mathpix.com/mobile-downloads
- Appli pour ordinateur : https://mathpix.com/desktop-downloads
- Extension de chrome, pour acquérir des PDF du web : https://mathpix.com/docs/snip/extension-overview
- Documentation (en anglais) : https://mathpix.com/docs/snip/overview
4.1 Avec le smartphone
Les équations écrites manuellement sont en général bien reconnues et peuvent être, pour les plus simples, résolues de manière automatique, avec indication des étapes clés puis tracé du graphe. Comme avec Keep, les vues sur smartphone et ordinateur sont automatiquement synchronisées, si bien que les captures et PDF peuvent être visionnés sur le web depuis tout appareil lié à un compte Mathpix.



- Mathpix Snip, The Solver, Documentation : Lien
Des tests supplémentaires sont faits sur l’image d’une portion d’un manuscrit dans lequel texte et équation mathématique voisinent. La résolution de l’image est très moyenne. Les fans d’histoire des mathématiques auront reconnu l’écriture d’Henri Poincaré (1854-1912).

Un autre test est lancé. Le document est cette fois-ci un tapuscrit mathématique des années 1950, extrait des archives du « groupe Bourbaki ».

4.2 Depuis l’ordinateur, avec MathPix Snipping Tool
Sur ordinateur, lorsque l’application MathPix Snipping Tool est lancée, on accède à la fonctionnalité « Create Snip from screenshot / Créer une capture à partir de l’écran ».
4.2.1 Équations mathématiques, formats de saisie et rendus dans le navigateur
MathPix se montre nativement conçu pour reconnaître les équations mathématiques. Plusieurs choix sont techniquement possibles pour saisir les équations mathématiques et les restituer sur le web. Les options d’encodage faites par Mathpix sont ici étudiées, à partir d’un PDF donné en exemple dans la documentation officielle. Le texte, typique de la physique mathématique, contient des équations.

Équation [1] : Suite à la sélection manuelle de l’équation, l’image est encodée en PNG, envoyée et mémorisée dans un espace web personnel, localisé aux États-Unis, sur les serveurs de Mathpix. (Ne pas se servir de Mathpix en cas de données confidentielles semble une bonne idée.)

L’OCR est lancé sur l’image et l’équation devient alors disponible pour l’utilisateur en trois formats différents, TeX, MathML et SVG. Les encodages et rendus de ces divers formats sont ici testés et discutés.
a/ Équation [1] en TeX :
\mathbf{i} \gamma^\mu D_\mu \Psi+12 \frac{1}{C} \pi G\left(\bar{\Psi} \gamma_\mu \Psi\right) \gamma^\mu \Psi-m \psi=0
Le gras sur le premier « i » (mathbf) de l’équation serait à corriger en « mathf ».
- Aide:Formules TeX, Wikipédia : https://fr.wikipedia.org/wiki/Aide:Formules_TeX
b/ Équation [1] en MathML :
<math xmlns="http://www.w3.org/1998/Math/MathML" display="block">
<mrow>
<mi mathvariant="bold">i</mi>
</mrow>
<msup>
<mi>γ</mi>
<mi>μ</mi>
</msup>
<msub>
<mi>D</mi>
<mi>μ</mi>
</msub>
<mi mathvariant="normal">Ψ</mi>
<mo>+</mo>
<mn>12</mn>
<mfrac>
<mn>1</mn>
<mi>C</mi>
</mfrac>
<mi>π</mi>
<mi>G</mi>
<mfenced open="(" close=")" separators="|">
<mrow>
<mrow>
<mover accent="true" accentunder="false">
<mrow>
<mi mathvariant="normal">Ψ</mi>
</mrow>
<mo stretchy="false">¯</mo>
</mover>
</mrow>
<msub>
<mi>γ</mi>
<mi>μ</mi>
</msub>
<mi mathvariant="normal">Ψ</mi>
</mrow>
</mfenced>
<msup>
<mi>γ</mi>
<mi>μ</mi>
</msup>
<mi mathvariant="normal">Ψ</mi>
<mo>−</mo>
<mi>m</mi>
<mi>ψ</mi>
<mo>=</mo>
<mn>0</mn>
</math>
- MathML : https://fr.wikipedia.org/wiki/MathML
c/ Équation [1] en SVG (image vectorielle au format XML, reprise du code source de Snip Web). Les blocs XML de l’encodage sont ici mis en évidence par ajout d’un retour à la ligne :
<svg style="vertical-align: -1.469ex;" xmlns="http://www.w3.org/2000/svg" width="41.866ex" height="4.07ex" role="img" focusable="false" viewBox="0 -1149.5 18504.6 1799" aria-hidden="true">
<g stroke="currentColor" fill="currentColor" stroke-width="0" transform="scale(1,-1)">
<g data-mml-node="math">
<g data-mml-node="TeXAtom" data-mjx-texclass="ORD">
<g data-mml-node="mi">
<path data-c="1D422" d="M72 610Q72 649 98 672T159 695Q193 693 217 670T241 610Q241 572 217 549T157 525Q120 525 96 548T72 610ZM46 442L136 446L226 450H232V62H294V0H286Q271 3 171 3Q67 3 49 0H40V62H109V209Q109 358 108 362Q103 380 55 380H43V442H46Z"></path>
</g>
</g>
<g data-mml-node="msup" transform="translate(319,0)">
<g data-mml-node="mi">
<path data-c="1D6FE" d="M31 249Q11 249 11 258Q11 275 26 304T66 365T129 418T206 441Q233 441 239 440Q287 429 318 386T371 255Q385 195 385 170Q385 166 386 166L398 [pourtant humainement illisible...]
Le format TeX est largement utilisé par les mathématiciens pour éditer leurs équations. Cependant, dans l’optique d’une publication des résultats de l’OCR sur le web, les navigateurs n’interprètent de manière native que MathML, HTML ainsi que des formats images comme SVG, PNG, JPG, etc. Plusieurs outils permettent alors le transcodage de TeX et LaTeX vers MathML.
La solution retenue par Mathpix pour diffuser sur le web les équations consiste à transcoder le code TeX en SVG, non en MathML, PNG ou JPG. Les rendus de ces diverses options peuvent être comparés sous WordPress, sans plugin.
Rendu de l’équation [1] en MathML :
Rendu de l’équation [1] en SVG :
De nombreuses plateformes dédiées à la publication d’articles scientifiques en preprint, comme par exemple « arxiv.org » optent pour un encodage des équations mathématiques en MathML, dans la version HTML des articles. Ce format permet notamment le copié-collé des équations. Cependant, les résultats se montrent graphiquement plus aboutis en SVG.
La plateforme web de Mathpix opte pour une représentation en SVG des équations mathématiques. De plus, ce format permet d’encoder des éléments graphiques non mathématiques, comme par exemple des molécules chimiques, des graphes et graphiques. Certaines images SVG se montrent humainement à peu près lisibles, comme par exemple le diagramme pommes-bananes listé ci-dessous.
<svg class="chart" width="420" height="150" aria-labelledby="title desc" role="img">
<title id="title">Le diagramme pomme-banane</title>
<desc id="desc">4 pommes; 8 bananes; 15 kiwis; 16 oranges; 23 citrons</desc>
<g class="bar">
<rect width="40" height="19"></rect>
<text x="45" y="9.5" dy=".35em">4 pommes</text>
</g>
<g class="bar">
<rect width="80" height="19" y="20"></rect>
<text x="85" y="28" dy=".35em">8 bananes</text>
</g>
<g class="bar">
<rect width="150" height="19" y="40"></rect>
<text x="150" y="48" dy=".35em">15 kiwis</text>
</g>
<g class="bar">
<rect width="160" height="19" y="60"></rect>
<text x="161" y="68" dy=".35em">16 oranges</text>
</g>
<g class="bar">
<rect width="230" height="19" y="80"></rect>
<text x="235" y="88" dy=".35em">23 citrons</text>
</g>
</svg>
- MathJax, une bibliothèque javascript opensource pour transcoder à la volée du code source TeX en MathML ou en SVG : Lien
- TEMML. Un service de conversion en ligne de LaTeX vers MathML : Lien
- LaTeX to Image converter. Un service de conversion en ligne de LaTeX vers PNG, JPG et SVG : Lien
- Wikipedia:Rendering math : Un essai sur les avantages et inconvénients de divers choix technologiques pour le rendu des mathématiques dans les plateformes web (en anglais) : Lien
- Wikipédia, fr, Aide:Formules TeX : https://fr.wikipedia.org/wiki/Aide:Formules_TeX
- WikiLivres, LaTeX/Écrire des mathématiques : https://fr.wikibooks.org/wiki/LaTeX/%C3%89crire_des_math%C3%A9matiques
4.2.2 Le cas des tableaux de données
La reconnaissance optique de tableaux de données manuscrits reste de nos jours un problème difficile, que les textes soient manuscrits ou imprimés. Des essais de capture sont faits sur une image pré-traitée et binarisée, dans le but de faciliter la reconnaissance optique. La reconnaissance de l’ensemble du tableau ne fonctionne pas avec MathPix, au moment de l’écriture de cet article. Pour être reconnu de manière approximative, le tableau doit être découpé en images de chacune des colonnes. Un texte est choisi dans la littérature. Il s’agit d’un tapuscrit du Médiéviste et l’Ordinateur, en date de 1979, dans lequel les tableaux sont manuscrits. Le coût de revient d’un traitement de texte fonctionnant à l’aide de cartes perforées est étudié.

Un test est finalement effectué avec quelque chose de beaucoup plus facile. Un tableau imprimé, en provenance d’un livre moderne est capturé avec smartphone et post-édité dans MathPix. Le tableau est reconnu dans son ensemble, avec une belle certitude. La disposition des écrans dans la plateforme est la suivante :

Nommée Snip Web, la plateforme web de MathPix se montre dédiée à l’édition intégrée des captures. Dans l’image d’écran ci-dessus, la liste des différentes captures se trouve à gauche, sous forme de vignettes. Puis vient au centre le panneau d’édition sur lequel on peut travailler en double vue : image agrandie à gauche, texte OCRisé et édition en Mathpix-Markdown à droite. Le dernier volet à droite affiche les différents formats d’exports du texte édité.
Dans le tableau, la structure tabulaire du texte est bien capturée et transcrite en un langage de balisage léger (Markdown) qui facilite l’écriture de textes simples et tabulés sur le web. Ne reste plus ensuite qu’à enlever manuellement les césures, et hop, le tableau est transcrit !
| Nom | Fonctions |
| :---: | :---: |
| Charles Henry Ambroise CARON (1823- ?) | Chargé de cours de mathématiques acces-
soires (1849-1851) |
| Eugène MONCOURT (1826-?) | Chargé de cours de mathématiques acces-
soires (1851-1852) |
Rendu sous WordPress, après correction manuelle du tableau :
Nom | Fonctions |
Charles Henry Ambroise CARON (1823-?) | Chargé de cours de mathématiques accessoires (1849-1851) |
Eugène MONCOURT (1826-?) | Chargé de cours de mathématiques accessoires (1851-1852) |
4.3 Snip Web, une plateforme pour l’édition d’articles complets
Complémentaire des applications de capture sur smartphone et navigateur, la plateforme Snip Web est dédiée à l’édition de fragments de textes, comme vu précédemment, ou bien d’articles complets. Des textes complets contenant des mélanges de textes classiques, d’équations, de tableaux, d’images, de graphes, etc, peuvent ainsi être édités, éventuellement de manière collaborative, par des groupes de transcripteurs. Des documents scientifiques de qualité professionnelle sont attendus en retour, en divers formats.
Le format d’édition développé par MathPix est Mathpix Markdown ». Dans cet encodage, les formules mathématiques sont saisies en TeX. Les titres, divisions de texte, listes d’items et tableaux de données peuvent être encodés, au choix de l’auteur, en LaTeX, Markdown ou HTML.
Sous Snip Web, les équations se distinguent par leur rendu italique. Elles peuvent être contenues dans la ligne courante avec le métacaractère LaTeX ($) ou bien présentées sous forme de bloc centré ($$), entre deux paragraphes. Des exports sont ensuite possibles vers les formats Markdown, « Mathpix Markdown », DOCX, LaTeX, HTML, PDF ou bien encore Overleaf, pour édition d’un article mathématique sur une plateforme web LaTeX.
- Documentation Snip Web (en anglais) : https://mathpix.com/docs/snip/editor-overview
- Documentation Mathpix Markdown (en anglais) : https://mathpix.com/docs/mathpix-markdown/overview

A titre d’exemple des possibilités de Snip Web, le texte « Bienvenue dans le Snip Editor de Mathpix !, un essai » est édité et rendu public pour les lecteurs de cet article. Une plateforme est ainsi mise à disposition, dans laquelle la question des notes de bas de page n’est pas oubliée. Certains des exemples vus précédemment sont repris :
- Bienvenue dans le Snip Editor de Mathpix !, un essai, en HTML : https://snip.mathpix.com/pierre.couchet/notes/83aa51c2-37ed-4d88-861e-9cae0bec2f02
- Bienvenue dans le Snip Editor de Mathpix !, un essai, en Mathpix Markdown : https://snip.mathpix.com/pierre.couchet/notes/83aa51c2-37ed-4d88-861e-9cae0bec2f02/raw
- Bienvenue dans le Snip Editor de Mathpix !, un essai du même code dans codimd.math.cnrs.fr: https://codimd.math.cnrs.fr/s/JSBo7kFCA
Il est à noter que cette plateforme web éditoriale et collaborative a été adaptée de la brique logicielle libre CodiMD, utilisée en France par plusieurs institutions. Parmi celles-ci se trouvent l’éducation nationale et la communauté des mathématiciens du CNRS. En 2020, le logiciel libre a été renommé HedgeDoc par les développeurs.
- CodiMD dans apps.education.fr : https://codimd.apps.education.fr/s/H6nqsVq2y#
- CodiMD dans codimd.math.cnrs.fr : https://codimd.math.cnrs.fr
- HedgeDoc et CodiMD : https://hedgedoc.org/history/
4.4 La revue Spectra, par Mathpix
La société Mathpix publie aussi une revue numérique en accès libre, nommée « Spectra« . Ce journal en langue anglaise, dont les articles sont non examiné par les pairs, couvre les domaines des mathématiques, statistiques, physique, chimie, ingénierie, etc. Les publications acceptées sont au format « Mathpix Markdown » ou bien Markdown simple. Pour stimuler les soumissions, des compétitions sont organisées, récompensées par un prix de deux mille dollars, sur la base d’un vote des utilisateurs.
5. Autres applis pour l’OCR et les maths
Cette question de l’OCR des mathématiques n’est pas vraiment nouvelle et se montre importante, pour plusieurs publics, parmi lesquels les lycéens à la recherche d’aides, les professeurs de mathématiques et de physique, le public des malvoyants. Plusieurs applications autres que MathPix ciblent des lecteurs de diverses catégories.
5.1 OCR depuis le smartphone
- Text Fairy (OCR Text Scanner) : Lien
5.2 Mathématiques
Derrière le vétéran WolframAlpha, plusieurs logiciels plus ou moins équivalents peuvent faciliter certaines tâches, notamment la saisie et la restitution des équations et tableaux de données. Des publics étudiants et professionnels des mathématiques sont visés.
Public étudiant :
- Photomath, une application smartphone, sortie en 2014 : Lien
- Socratic, appli rachetée par Google : Lien
- Microsoft Math Solver, un classique pour l’apprentissage de l’algèbre : Lien
- « search by image math » sur Google Play : Lien
Public universitaire :
- WolframAlpha, solution payante
- Pix2Text (P2T), une application présentée comme une alternative à Mathpix : Lien
- SimpleTex, voisin de MathPix et pour l’instant gratuit avec publicité, en anglais et chinois : Lien
En conclusion
Des extensions de navigateurs, comme par exemple OCR Image Reader, de Brian, se montrent fort pratiques pour l’OCR au quotidien. Les applications pour smartphone Google Lens, Google Keep et Mathpix permettent de capturer et souvent reconnaitre des portions de textes imprimés ou manuscrits au format image. Elles s’adressent à divers publics. Assez spécialisée, la suite de logiciels Mathpix permet la capture, la reconnaissance et sous certaines conditions la résolution des équations mathématiques. Des tableaux de données peuvent aussi être automatiquement transcrits au format Mathpix Markdown. Enjoy Maths !
One Reply to “Quatre logiciels populaires pour l’OCR, l’HTR, la reconnaissance optique des équations mathématiques et des tableaux de données”