Utilisation de l'OCR pour convertir des images en texte sélectionnable
Objectifs
Les objectifs de cette vidéo sont :
- Comprendre le processus de numérisation et de conversion des documents scannés en PDF.
- Maîtriser l'utilisation de la reconnaissance optique de caractères (OCR) dans Adobe Acrobat.
- Savoir choisir entre les modes de sortie ClearScan et image indexée en fonction des besoins spécifiques.
Résumé
Découvrez comment convertir des documents scannés en fichiers PDF exploitables grâce à la reconnaissance optique de caractères (OCR) dans Acrobat.
Description
Dans cette leçon, nous explorons le processus de création de fichiers PDF à partir de documents scannés en utilisant Adobe Acrobat. Un document scanné est initialement un ensemble d'images qui ne peuvent pas être exploitées numériquement. Pour y remédier, Acrobat propose une fonction de reconnaissance optique de caractères (OCR) qui permet de convertir ces images en texte sélectionnable et modifiable.
Nous verrons comment utiliser cette fonctionnalité sur des fichiers déjà scannés, en explorant les paramètres de conversion, notamment le choix de la langue et les deux modes de sortie principaux: l'image indexée et le mode ClearScan. Chaque mode a ses avantages, ClearScan permettant en général de réduire considérablement la taille du fichier final tout en maintenant une haute qualité visuelle.
Cette leçon vous guidera également sur la vérification et la correction des erreurs de reconnaissance pour garantir l'exactitude du texte converti. Vous apprendrez à utiliser les outils de recherche et de correction des mots suspects identifiés par le logiciel.