C’est n’est pas nouveau Google indexe et suggère également les PDF sur certaines requêtes. Dès lors il important d’optimiser les pdf tout comme les contenus d’un site. En effet, les pdf sont aussi crawlés et indexés par les robots des moteurs de recherche comme Google.
Ils constituent un excellent moyen pour se positionner sur une requête dans les moteurs de recherche. Association : comment optimiser vos fichiers PDF pour le SEO, à travers cet article, nous allons voir les astuces et techniques pour vous permettre d’optimiser vos contenus pdf.
Les associations, au regard de leur activité, doivent produire plusieurs types de documents (rapport d’activité, document de communication, …). Ces documents sont Diffusés sur le web via leur site internet. On recommande en effet d’optimiser les fichiers PDF afin de faciliter leur indexation par Google.
Avant de démarrer votre travail d’optimisation, il est nécessaire de répertorier tous vos fichiers PDF. Passez ensuite en revue les fichiers indexés par Google à l’aide de la commande suivante : site : votreurl.com file type:PDF . Par exemple faisons une recherche sur les pdf du site d’action contre la faim , tapant cette commande voici ce qui s’affiche.
Le résultat affichent une trentaine de pages de pdf indexés.
Pour vous aider dans ce travail, voici un tableau de suivi : https://bit.ly/optimsation-pdf-seo
Voici une infographie sur les bonnes pratiques et astuces pour vous aider à bien référencer vos contenus PDF.
Cependant voici quelques inconvénients de l’indexation de PDF:
- c’est n’est page de page web donc l’absence de navigation
- Étant donné que les documents PDF ne sont pas écrits en HTML, il est impossible de placer une balise canonique en intégrant une ligne de code dans la partie du <head> document .
- Ils sont difficiles à désindexer, il est effet impossible d’ajouter de balise meta robots noindex. Pour ce faire, il faut ajouter une instruction X-Robots-Tag dans le fichier .htaccess ou httpd.conf situé à la racine du site. voici le code intégrer :
<Files ~ "\.pdf$"> Header set X-Robots-Tag "noindex, nofollow"</Files>
Ensuite, vous devez ajouter le code ci-dessous dans le fichier robots.txt situé à la racine du site les instructions suivantes pour empêcher le crawl :
« Disallow: /*.pdf #ne pas crawler les fichiers PDF
Disallow: /pdf/ # Bloquer le répertoire /pdf/ ( s’il s’agit de groupe) »
Pour suivre le téléchargement de vos fichiers PDF vous pouvez consulter: TP: Suivre les téléchargements et Comment tracker les téléchargements d’un document PDF ?.
N’hésitez pas à consulter mes articles précédents COMMENT RENFORCER LA CONFIANCE DE SES DONATEURS ?
Sources
https://www.360-webmarketing.fr/12-conseils-pour-optimiser-le-referencement-de-vos-fichiers-pdf/
https://www.noiise.com/ressources/seo/pdf-et-seo-galere-ou-opportunite/
https://maxelik.com/comment-optimiser-un-pdf-pour-un-meilleur-referencement-naturel/