Comprendre les styles de sortie PDF avec OCR
Explorez les différences entre les options de sortie PDF : image indexable et texte formaté.
Introduction
Acrobat Professional 8
Introduction
Création
Catalogage – Archivage
Commentaires et révision
Assemblage et modification de fichiers PDF
Impression – fonctions prépresse
Interactivité de base
Formulaires
Signatures – Authentification
Protection – Restrictions
JavaScript (initiation)
Traitement par lot
Fonctions inclassables
Détails de la leçon
Description de la leçon
Dans cette leçon, nous allons introduire les deux principaux styles de sortie PDF proposés lors de la reconnaissance optique de caractères (OCR) : l'image indexable et le texte formaté. L'image indexable conserve l'aspect original du document en ajoutant un calque de texte invisible permettant la recherche et la sélection de texte. En revanche, le texte formaté ne conserve pas l'aspect visuel mais tente de recréer une version textuelle du document, potentiellement perdant en mise en page originale.
Nous expliquerons comment choisir entre ces options en fonction de vos besoins, notamment pour la préservation de documents juridiques ou pour la simple extraction d’informations textuelles. Cette compréhension est essentielle pour quiconque utilise des outils comme Adobe Acrobat pour l'archivage ou la gestion documentaire.
Des exemples concrets montrent comment utiliser ces options, y compris comment copier du texte reconnu et l’utiliser dans d'autres applications comme Wordpad. Finalement, nous couvrirons l’importance de la compression des images et comment ajuster les paramètres de sous-échantillonnage pour optimiser la taille des fichiers PDF.
Objectifs de cette leçon
L'objectif de cette vidéo est d'apprendre à utiliser efficacement les outils de reconnaissance optique de caractères et comprendre les choix de styles de sortie PDF disponibles, afin de mieux gérer et archiver des documents numérisés.
Prérequis pour cette leçon
Les prérequis pour cette vidéo comprennent une maîtrise de base des logiciels de gestion de PDF comme Adobe Acrobat et une compréhension des concepts de numérisation.
Métiers concernés
La compétence décrite dans cette vidéo est utile pour les juristes, gestionnaires de documents, conservateurs d'archives, et responsables de la gestion de la connaissance.
Alternatives et ressources
Des alternatives à Adobe Acrobat incluent des logiciels comme Foxit PhantomPDF, Nuance Power PDF, et des options open source comme OCRmyPDF.
Questions & Réponses