Ou plus précisément le moteur de recherche de microsoft : SearchLive ? J'aimerais bien le savoir en fait ! Régulièrement je regarde les statistiques des visiteurs sur TourDeJeu, sans doute mon côté gestionnaire plongé dans les chiffres qui ressort. Nous avons plusieurs outils, mais j'ai pris l'habitude d'utiliser le script "Les visiteurs" installé depuis le tout début du site ! J'ai alors noté il y a quelques jours qu'un nouveau site nous envoyait pas mal de personnes. Encore loin du volume de maître Google, mais en seconde position tout de même. C'est le "nouveau" moteur de recherche de la compagnie Microsoft, search.live. Un peu étonné d'une aussi rapide percée (pas loin de 100 personnes par jour tout de même), mais bon, c'est le leader mondiale de l'informatique qui est derrière tout cela, alors pourquoi pas. Mais quand même, ca m'intrigue. Je surveille donc pendant une semaine cette percée, qui est devenue finalement très régulière. Ce soir encore, à l'heure ou j'écris, Google.fr approche des 200 visiteurs, et second Search.live fait 65 avec un dernier visiteur il n'y a pas 10mn.

Ca m'intrigue tellement, que j'essaie de trouver un peu sur le net des infos comme quoi le search.live fait une percée, qu'il est en train de faire une remontée fulgurante, ou je ne sais quoi. Mais rien, ou presque. Ils ont bien sorti une nouvelle version, mais le baromètre xiti ne note rien de spécial. Je décide donc de savoir au moins sur quels critères les gens arrivent sur TourDeJeu. Peut-être bien qu'un mot clef comme "Jeu" nous fait sortir sur la première page ? Déception, ce n'est pas le cas. C'est quel mot alors ? Une idée... ? C'est introuvable :)

J'épluche alors un peu l'outil des visiteurs pour avoir un exemple et surprise, voici le lien du référent. Bref c'est le mot clef "autre" qui amène sur TourDeJeu. Et en plus c'est extraordinaire, TourDeJeu n'apparait pas dans les 10 premières pages de cette recherche. Je n'ai pas eu le courage d'aller plus loin pour vérifier ! Je ne pige plus rien. Mais confirmation, notre outil interne annonce 421 occurences de "autre", soit le 5eme score ! Je fonce sur AwStats installé chez notre hébergeur, et c'est du même ordre, environ 500 ! AwStat annonce même 9% d'un moteur de recherche inconnu dans la liste de tous les meilleurs moteurs, faisant passer Google de 90% en août, a 83% en Septembre !

Qu'a cela ne tienne, ce moteur doit être tellement récent que ces outils ne sont pas à jour et doivent mal décrypter la requète http, je file donc télécharger un log brut. C'est gros et indisgeste un log brut, mais tant pis. Cela reste facile à trouver, et sans aucune surprise, la requête est d'un classique désarmant... Je dois m'y résoudre, c'est bien le mot-clef "autre" qui amène tous ces visiteurs. Sauf que, c'est quand même bizarre, ca vient toujours des mêmes machines, sur un nom de domaine qui ne m'evoque rien : phx.gbl

Finalement, c'est Google qui va me donner la réponse. Sur une requête FORM+LIVSOP qui donne rapidement des résultats très interessant. D'une part ce n'est pas propre à TourDeJeu, mais en plus ca semble être une grosse embrouille. Ce site à l'air particulièrement remonté, rien que le titre fait peur : Microsoft-is-lying-and-screwing-up-your-log-files. J'ai parcouru les quelques liens, ils ont tous le même problème, et arrivent tous aux mêmes conclusions : c'est un bot de Microsoft !

Au moins ca semble logique. Ils font des tests, soit disant pour améliorer la qualité, et utilisent des bots un peu différents pour cela. Mais c'est assez limite comme méthode quand même. Des bots il en passe des centaines par jour, et celui de msn n'est pas le dernier, le livebot passant vraiment vraiment très souvent. Mais là, ils faussent completement les statistiques. Pour TourDeJeu ce n'est pas grave, juste décevant, mais je comprends que certains webmaster soient remontés au point de bannir les adresses internet concernées.

Etant méfiant jusqu'au bout, je reste d'une part assez surpris par la méthode, je crois vraiment qu'ils n'ont pas besoin de cela et que cela ne peut aboutir qu'a de la mauvaise publicité, mais aussi par le peu de bruit que cela fait. Et pourtant cela fait un mois que ça dure. En attendant les données venant du SearchLive sont inexploitables, et ce n'est pas demain la veille qu'ils viendront taquiner Google. Surtout avec ce genre de méthodes.