Comment extraire les données d’un PDF, PDF scanné ou formulaire PDF vers Excel ?

Dans l’article Imprimer des feuilles ou des classeurs Excel sur page ou en PDF, nous avons vu les démarches à suivre pour créer un PDF à partir d’Excel.
Aujourd’hui vous allez découvrir comment faire l’inverse, c’est-à-dire convertir un fichier PDF en Excel pour utiliser aisément les données converties sous Excel, et c’est ça ce qui nous intéresse ! 

Voilà précisément ce que nous allons étudier dans ce cours très important : 
  • Comment convertir un ou plusieurs fichiers PDF en Excel ? 
  • Comment extraire des données d’un fichier PDF et les envoyer automatiquement vers Excel ? 
  • Comment extraire des données des PDFs scannés vers Excel ? 
  • Comment extraire des données d’un formulaire PDF vers Excel ?
PDF to Excel


Vous savez sans doute qu’exporter des données d’un PDF vers Excel se fait à l’aide des logiciels appelés convertisseurs de PDF (Gratuits ou payants), ils sont nombreux mais ce sont leurs résultats efficaces qui font la différence.

La plus simple solution pour extraire des données d’un PDF vers Excel 

Cette solution se base sur le principe du copier/coller :
  • Ouvrez donc votre fichier PDF.
  • Sélectionnez vos données et faites copier.
Convertir pdf en excel facilement


  • Collez-les ensuite dans une feuille Excel, et voilà vous avez terminé.
C’est simple comme solution d’obtenir des données d’un PDF, mais elle ne peut pas marcher dans plusieurs cas surtout si vous avez par exemple un PDF scanné !

Utilisation d’un convertisseur PDF

L’utilisation d’un convertisseur PDF est une solution indispensable et avantageuse qui fait gagner du temps et de l’effort.

Quel est le meilleur convertisseur PDF ?

Je ne peux pas vous le dire ; moi ; car ce n’est pas ma spécialité, cependant ce que je peux vous conseiller c’est de chercher, de demander l’avis des internautes dans les groupes de discussion, de tester… l’essentiel c’est de trouver celui qui vous rend le service que vous estimez.

Pour mon cas, j’utilise PDFelement, un logiciel puissant, facile à utiliser et qui fournit des fonctionnalités très importantes. Vous pouvez donc le tester via sa version d’essai gratuite avec des options limitées mais intéressantes.

Dans ce cours, je vais donc vous montrer comment utiliser l’une de ses fonctionnalités pour répondre à nos questions posées au début de cet article :

Téléchargez PDFelement gratuitement et sans abonnement

PDFelement, en plus de la conversion PDF en Excel, permet de lire et de modifier les fichiers PDF, de créer des fichiers PDFs à partir de plusieurs documents :Word, Excel, Powerpoint, image… Il permet aussi de créer des formulaires interactifs… il supporte 8 langues en plus le français bien sûr.

Téléchargez et installez PDFelement en cliquant sur le lien qui suit, puis suivez les explications qui viennent :

Comment convertir un ou plusieurs fichiers PDF vers Excel ?

Méthode 1 :

  • Ouvrez PDFelement, et à partir de son interface d’accueil cliquez sur Convertir PDF

Bouton convertir pdf de pdfelement


Note : PDFelement permet de convertir des PDFs vers différents formats de fichier :Word, Excel, Powerpoint, Image, ePub , HTML…. mais ce qui nous intéresse nous ici c’est Excel.


  • Sélectionnez votre fichier PDF et cliquez sur Ouvrir
  • Dans la boite de dialogue qui s’ouvre devant vous, choisissez l’emplacement où vous voulez enregistrer votre fichier, le nom du fichier résultat et sélectionnez Excel dans la zone Type, puis cliquez sur Enregistrer.

Nommer le fichier excel converti

Et pour effectuer la conversion, PDFelement vous recommande tout d’abord d’installer le plug-in OCR « Reconnaissance optique de caractères ».


Installer le plug-in OCR
  • Après avoir installé ce plug-in, Cliquez sur Terminer une fois la conversion terminée.
  • Ouvrez maintenant votre fichier converti à partir de l’emplacement que vous avez défini précédemment.
  • Voici mon résultat que j’ai obtenu :

Résultat de conversion pdf en excel


Méthode 2 :

  • Cliquez sur Ouvrir un fichier pour ouvrir votre PDF.

Bouton ouvrir pdf dans pdfelement


  • Sous l’onglet Accueil, cliquez sur En Excel

Bouton En Excel pdfelement


Puis suivez les mêmes étapes vues en dessus pour compléter la conversion.

Convertir plusieurs PDFs vers Excel :

Dans la version d’essai gratuite, vous avez le droit à choisir deux fichiers seulement.
  • A partir de l’interface d’accueil, cliquez sur Traitement par lots.

Convertir plusieurs PDF en Excel


  • Dans la boite de dialogue qui s’ouvre, cliquez sur le grand signe d’addition +, puis sélectionnez vos fichiers PDFs.

Ajouter des PDFs pour la conversion par lots


  • Dans la zone Format de sortie sélectionnez Excel, puis choisissez votre dossier de destination.

Conversion PDF en Excel par lots


  • Cliquez enfin sur Commencer.
  • Après la conversion, cliquez sur Terminer et consultez vos fichiers convertis.

Résultat de conversion par lots pdf en excel

Jusqu’à présent, nous avons vu comment convertir la totalité d’un fichier PDF en Excel. Dans sa version payante, PDFelement n’impose aucune limite sur le nombre de pages de votre PDF à convertir.
Découvrons dans la partie suivante comment choisir une portion du PDF qui contient les données que nous voulons utiliser sous Excel.

Comment extraire des données d’un fichier PDF et les envoyer automatiquement vers Excel ?

Je vais utiliser dans cet exemple un fichier PDF que j’ai converti à partir d’Excel, ce fichier a été traité dans le cours 9 cas qui expliquent comment utiliser la fonction NB.SI.ENS

Vous pouvez le télécharger ici : Exemple pdf
  • Ouvrez donc ce fichier dans PDFelement.
Supposons que nous voulons extraire les données des 5 premières lignes et les 3 dernières pour les utiliser sous Excel.

  • Pour ce faire, cliquez sur l’onglet Formulaire puis sur Extraction des données.

Extraire données pdf vers Excel



  • Vous voyez apparaître cette boite de dialogue :

Extraire les données du pdf marqué


  • Sélectionnez la deuxième option : Extraire les données du PDF marqué puis validez.
  • Sélectionnez maintenant la zone désirée du tableau.

Paramétrer la zone à extraire du pdf


  • Dans la zone Propriétés, vous pouvez donner un nom significatif par exemple : Lignes1à5. Vous pouvez aussi choisir la langue correspondante aux données ; ici c’est le français.
Vous avez la possibilité également de sélectionner une autre zone de votre PDF et définir à elle les propriétés convenables (Nom et langue).

Extraire plusieurs parties du pdf


  • Si vous avez fini votre marquage, cliquez sur Oui dans la petite barre en dessus de la page :
  • Enregistrez ensuite vos paramètres définis sous un nom signifiant : Extraction2champs

Enregistrer paramètres d'extraction de données  d'un pdf


  • Dans la boite du dialogue cliquez sur Commencer.

Commencer l'extraction des données du pdf vers Excel


  • Donnez un nom significatif à votre fichier qui sera converti.

Enregsitrement du fichier csv converti


Note : PDFelement enregistre ce fichier sous l’extension .csv, mais il sera ouvert dans Excel.
  • Cliquez à la fin de la conversion sur Terminer.
Votre fichier est ouvert automatiquement avec Excel.

Vous obtenez donc vos données extraites dans une seule cellule, mais vous pouvez les convertir en colonne à l’aide de l’outil Convertir du texte en colonne sous l’onglet Données.
Voici un article dans lequel j’ai expliqué comment traiter ces types de fichiers CSV sous forme de tableau : Comment importer un fichier texte ou l'exporter dans Excel ?

Comment extraire des données des PDF scannés vers Excel ?

Cette fonctionnalité, je l’ai trouvée surprenante, en effet, si par exemple quelqu’un vous envoie une facture qu’il a scannée et mise dans un PDF et que vous aimez traiter ses données sous Excel, vous pouvez alors le faire à l’aide de cette fonctionnalité sous PDFelement.
  • Ouvrez donc votre PDF scanné, ou bien ouvrez ce fichier que j’ai scanné, il contient le même tableau vu dans l’exemple précédent. Cliquez ici : PDF scanné
  • Allez dans Formulaire et cliquez sur Extraction des données.

Extraire des données du pdfscanné vers Excel


  • Sélectionnez ensuite : Extraire les données du PDF marqué puis cliquez sur Suivant.
  • Commencez à marquer la zone de données à extraire à l’aide de votre souris.
  • Dans la zone Propriétés, donnez un nom significatif puis enregistrez vos paramètres.
  • Cliquez maintenant sur Oui pour démarrer l’extraction.

Paramétrer l'extraction de données du pdf scanné


  • Cliquez à la fin de la conversion sur Terminer.
Qu’en dites-vous de ce résultat ??!!

Comment extraire des données d’un formulaire PDF vers Excel ?

Cette fonctionnalité est forte intéressante elle aussi !
Et pour vous montrer comment faire pour extraire des données d’un formulaire PDF, veuillez télécharger ce PDF que j’ai créé aussi sous PDFelement, cliquez ici : Formulaire PDF
  • Ouvrez le formulaire avec PDFelement.
Remarquez que PDFelement vous signale que ce PDF est interactif, c’est-à-dire que vous pouvez saisir des données dans les champs qu’il contient.

Formulaire interactif
  • Allez dans l’onglet Formulaire et cliquez sur Extraction des données.
  • Dans la boîte de dialogue qui s’affiche, choisissez Extraire les données des champs du formulaire PDF et cliquez sur Suivant.

Extraire les données des champs du formulaire PDF


  • Cliquez sur le bouton Commencer.
  • Donnez un nom pour le fichier csv que vous allez obtenir et choisissez son emplacement.
  • Cliquez enfin, sur Terminer.
PDFelement vous ouvre automatiquement le fichier Excel obtenu.

Données extraites du formulaire pdf vers Excel


Vous pouvez donc le mettre en forme et le préparer pour accueillir les futures données extraites.

Données extraites du formulaire pdf mises en forme


Nous arrivons à la fin de ce cours, vous venez donc de découvrir une solution efficace pour extraire des données d’un pdf quelque soit son type et ceci à l’aide de PDFelement.
Je vous conseille enfin de le tester et de profiter de sa version d’essai gratuite, et si vous vous intéresserez à l’utiliser sans limite, voici le lien de son site fournisseur :


PARTAGEZ
    Blogger Comment
    Facebook Comment

3 commentaires:

  1. Post intéressant mais une question me viens en tête, ce que ceci est marche bien avec quelle version d'Excel ? Merci

    RépondreSupprimer
  2. bonjour, est possible d'extraire des données d'un formulaire qui a été rempli à la main et après le convertir en excel?

    RépondreSupprimer

Votre commentaire m'intéresse beaucoup :)