Optimisation de PDF scannés avec Acrobat

Découvrez comment convertir des documents scannés en fichiers PDF exploitables grâce à la reconnaissance optique de caractères (OCR) dans Acrobat.

Détails de la leçon

Description de la leçon

Dans cette leçon, nous explorons le processus de création de fichiers PDF à partir de documents scannés en utilisant Adobe Acrobat. Un document scanné est initialement un ensemble d'images qui ne peuvent pas être exploitées numériquement. Pour y remédier, Acrobat propose une fonction de reconnaissance optique de caractères (OCR) qui permet de convertir ces images en texte sélectionnable et modifiable.

Nous verrons comment utiliser cette fonctionnalité sur des fichiers déjà scannés, en explorant les paramètres de conversion, notamment le choix de la langue et les deux modes de sortie principaux: l'image indexée et le mode ClearScan. Chaque mode a ses avantages, ClearScan permettant en général de réduire considérablement la taille du fichier final tout en maintenant une haute qualité visuelle.

Cette leçon vous guidera également sur la vérification et la correction des erreurs de reconnaissance pour garantir l'exactitude du texte converti. Vous apprendrez à utiliser les outils de recherche et de correction des mots suspects identifiés par le logiciel.

Objectifs de cette leçon

Les objectifs de cette vidéo sont :

  • Comprendre le processus de numérisation et de conversion des documents scannés en PDF.
  • Maîtriser l'utilisation de la reconnaissance optique de caractères (OCR) dans Adobe Acrobat.
  • Savoir choisir entre les modes de sortie ClearScan et image indexée en fonction des besoins spécifiques.

Prérequis pour cette leçon

Les prérequis pour suivre cette vidéo incluent :

  • Une connaissance de base de l'utilisation d'Adobe Acrobat.
  • Des compétences en informatique pour manipuler des fichiers scannés et des PDF.

Métiers concernés

Ce sujet est particulièrement pertinent pour :

  • Les archivistes qui doivent transformer des archives papier en documents numériques exploitables.
  • Les secrétaires administratifs et juridiques qui gèrent de nombreux documents scannés.

Alternatives et ressources

Les alternatives possibles incluent :

  • Utilisation de logiciels de reconnaissance de texte comme ABBYY FineReader.
  • Utilisation de solutions en ligne gratuites telles que Online OCR.

Questions & Réponses

L'utilisation de l'OCR permet de transformer un fichier de simples images en texte sélectionnable, copiable et éditable. Cela rend le contenu du document exploitable de manière numérique et améliore l'accessibilité et la recherche de texte dans le fichier PDF.
Les deux principaux modes de sortie OCR dans Adobe Acrobat sont ClearScan et l'image indexée. ClearScan vectorise les textes pour créer des fichiers plus légers tandis que l’image indexée conserve les images originales et ajoute une couche de texte derrière.
Acrobat propose une fonctionnalité de recherche des suspects, qui identifie et propose des corrections pour les mots mal reconnus. L'utilisateur peut accepter ou modifier les suggestions pour assurer l'exactitude du texte après OCR.