Quelles informations sont contenues dans le fichier de logs serveur ?
Les fichiers de log serveur contiennent toutes les actions demandées sur le serveur avec un certain nombre d’informations associées :
- l’IP du client qui est à l’origine de la requête sur le serveur
- L’identité du client telle que déterminée sur la machine cliente. Cette information est rarement renseignée et n’est pas exploitée dans SEO Logs.
- L’identifiant de l’utilisateur qui a demandé le document. Peu intéressant sauf si vous avez beaucoup de documents accessibles par mot de passe. L’outil n’exploite pas cette donnée
- L’heure de la demande est ensuite indiquée au format jour/mois/année:heure:minutes:secondes zone
- La requête avec plusieurs informations intéressantes.
- On retrouve ainsi la méthode utilisée : Head (ne demande que des informations sur la ressource, sans demander la ressource elle-même), Get (demande simple d’une ressource, ne modifie pas la ressource), Post (méthode utilisée lorsqu’une requête modifie la ressource)
- Sur cette même ligne, on retrouve la ressource qui a été demandée
- Enfin, figure le protocole utilisé et la version de http
- Le code de réponse renvoyé par chaque url correspond au statut renvoyé par le serveur : code de réponse positif (réponses qui commence par 2), code de redirections (codes qui commencent par 3), codes d’erreurs côté client (codes commençant par 4), codes d’erreurs côté serveur (codes commençant par 5)
- Vient ensuite la taille de l’objet retourné au client (hors en-têtes). En cas de contenu vide, il y aura un “-” dans cette case, qui peut être remplacé par 0
- Le referer est le site d’où la requête a été lancée. Cela peut être une page qui fait un lien vers la ressource, ou bien une page qui inclut cette ressource
- Enfin, vient la ligne qui concerne le user agent. Il s’agit d’une identification envoyé par le client sur lui-même. C’est grâce à cette information que l’on peut extraire des logs les visites des bots comme Googlebot ou Bingbot.