Lorsque l’on gère un site web, l’erreur de protocole http 404, la fameuse « page not found », est inévitable. Elle est rarement due à un problème de réseau et c’est au webmaster de la réparer directement dans le code. Heureusement, il existe plusieurs solutions.
Pourquoi les erreurs 404 apparaissent ?
L’erreur 404 est sans doute la plus connue de toutes puisque c’est celle qui fait apparaître le message « Error 404 page not found » au lieu de la page souhaitée lorsque l’internaute clique sur un lien. Une erreur 404, c’est donc quand la page est introuvable, soit qu’elle n’existe plus, soit qu’elle a été déplacée.
Techniquement, le message « page not found » est envoyé par le serveur HTTP. C’est le protocole d’erreur 404 et il permet au serveur de signaler qu’il ne parvient pas à trouver la page recherchée, mais que le problème ne vient pas du réseau. Les erreurs 404 sont fréquentes et inévitables parce qu’un site Internet entretenu est, par nature, en perpétuel mouvement.
Inspecter le code pour connaître l’origine de la « page not found »
Dans la plupart des cas, il n’existe pas des centaines d’origines possibles à une erreur 404. Si la page est introuvable, c’est presque systématiquement parce qu’elle n’existe plus, a été déplacée, ou bien parce que l’URL n’a pas été correctement retranscrite.
Lorsque vous procédez à la refonte de votre site ou à une modification de son arborescence, veillez donc à prendre en compte le déplacement de ces pages ou la suppression des anciennes. De même, vous devez prendre la peine de modifier les URLs qui pointent vers d’anciennes pages. Heureusement, il existe des outils pour vous aider dans cette tâche qui peut rapidement s’avérer laborieuse.
Les différents outils pour réparer une erreur 404
Pour réparer une erreur 404, vous devez d’abord la détecter et c’est justement ce qu’il y a de plus difficile à faire. Pour vous aider et être presque sûr de n’en laisser aucune s’échapper, vous pouvez utiliser un logiciel que l’on appelle un crawler.
Un crawler, de l’anglais « crawl » (littéralement : ramper) est un petit logiciel qui va remonter toute l’arborescence de votre logiciel ainsi que tous les backlinks qui y sont intégrés pour ensuite vous communiquer chaque fois que l’erreur http 404 lui aura été renvoyée. Vous obtiendrez ainsi une liste de toutes les erreurs 404 dont la responsabilité est interne à votre site.
Ensuite, pour rendre votre recherche complète, vous pouvez utiliser la search console de Google. L’avantage principal de cet outil, c’est qu’il vous permet de repérer les erreurs 404 dont l’origine est externe à votre site web, comme une URL périmée dans un article qui cite votre blog. En revanche, l’inconvénient de cette search console, c’est qu’il existe toujours un décalage temporel entre ce qu’elle vous renvoie comme information et la réalité.
Comment régler un problème interne au code ?
Comme nous le disions plus tôt, vous pouvez facilement repérer les sources d’erreur 404 internes au code de votre site en utilisant un logiciel de crawler. Vous trouverez de nombreux logiciels de crawler gratuit sur Internet et de nombreux articles pour vous aider à en trouver un. Certains logiciels sont payants et disposent d’options supplémentaires, mais un crawler gratuit suffira pour commencer.
Une fois votre crawler lancé et l’analyse de votre site effectuée, une liste des erreurs 404 vous est transmise. Il ne vous reste alors plus qu’à les réparer manuellement. Supprimez les pages incriminées et les liens qui mènent vers des pages inexistantes, faites le ménage, modifiez les liens dont l’URL n’est plus à jour et prenez le temps de vérifier tout le maillage interne de votre site. Certains optent pour le remplacement par un code « soft 404 », toutefois cette pratique n’est pas recommandée par Google.
Réparer les erreurs 404 internes n’est vraiment pas compliqué et ne demande que d’y consacrer un peu de son temps. Si vous prenez l’habitude de le faire le plus fréquemment possible, vous aurez moins de travail et vous réduirez considérablement le nombre d’erreurs 404 sur lesquelles pourraient tomber vos visiteurs.
Comment réparer une erreur 404 externe ?
Une erreur 404 est externe quand elle ne correspond pas à une URL périmée mise en lien dans un de vos articles ou qu’elle ne correspond pas à une page supprimée ou déplacée. Une erreur 404 est donc externe quand le contenu d’un autre site intègre un lien qui renvoie vers une page de votre site qui a été déplacée ou supprimée.
Nous vous avons expliqué comment repérer ces 404 externes grâce à la Search Console de Google. Ensuite, vous avez malheureusement peu de pouvoir sur l’existence de ces erreurs. Vous pouvez contacter le webmaster du site en question pour lui demander gentiment de modifier l’URL si la page a été déplacée, ou pour l’informer que la page n’existe plus. S’il le souhaite ou que le site est encore actif, il modifiera peut-être le lien.
En revanche, si vous n’obtenez aucune réponse ou que le site est inactif depuis trop longtemps, vous pouvez programmer un protocole http 301 pour que les utilisateurs cliquant sur le lien soient redirigés vers la page de votre choix. Cela demande un petit exercice de programmation et un peu de temps pour l’intégrer au code, mais c’est une bonne solution pour une 404 qui vous ennuie particulièrement.
Le problème des erreurs 404 existera toujours
Malheureusement pour les nombreux webmasters un peu maniaques qui ne supportent pas de recevoir une longue liste d’erreurs 404 externes, force est de constater qu’il en existera toujours. Le maillage des sites, et à plus grandes échelles celui d’Internet, est immense et en constante modification, tant et si bien qu’il est impossible de ne pas avoir de problème de protocole http 404.
Pour prendre le problème du bon côté, vous pouvez commencer par être un webmaster attentif à ses propres erreurs 404, mais aussi à celles des autres en prenant soin de modifier les URL quand on vous contacte pour le faire. Vous pouvez aussi prendre le problème avec le sourire en personnalisant votre page d’erreur 404, que ce soit pour la rendre jolie, drôle ou poétique. Inspirez-vous sur le site bonjour404.fr qui recense les meilleurs spécimens.