Hubert Wassner, enseignant informatique à l'ESIEA, a réalisé une intéressante cartographie sémantique du top 10 (selon wikio) des blogs francophones.
Tout d'abord quelques explications sur la sémantique et sur la méthode utilisée :
La sémantique est l'analyse du sens des mots, c'est donc un savoir faire typiquement humain. Cependant une analyse fine de la masse d'information accessible sur internet peut permettre de calculer des distances entre les mots. Cela ne donne pas directement leur sens mais on peut utiliser cette information pour construire une carte de manière automatique.
On visualise leur distances sémantique que l'on a calculé grâce à des requêtes sur un moteur de recherche. Des liens élastiques sont simulé pour essayent de faire respecter toutes les distances entre les mots analysé. Le résultat est un graphe ou les mots son disposé sur un plan de manière a respecter au mieux possible les distances sémantiques.
Exemple avec TechCrunch, Presse Citron, FredCavazza, Loïc le Meur, Mashable, Embruns, Versac, KelBlog, BigBangBlog et GuiM.fr : En utilisant un logiciel d'analyse, Hubert Wassner a crée une cartographie sémantique de ces blogs. Voici la vidéo qui montre la carte en train de se construire...
Comme Hubert, je remarque que les blogs de TechCrunch, FredCavazza, Mashable et GuiM.fr sont proches puisque centrés sur les mêmes thèmes (high-tech, geek, tech et NTIC) alors que BigBangBlog, qui est plus généraliste, est donc plus éloigné.
Voir aussi cet autre exemple où cette technique s'est révélé très efficace puisqu'elle donne les réponses aux questions d'un quizz: La sémantique c'est fantastique.
Qu'en pensez-vous ? Quelle analysez tirez-vous de ces résultats ? Moi je trouve cela passionnant, et je vais regarder étudier cela de plus près...
NDLA : Lire aussi le judicieux commentaire laissé par Hubert sur la définition du web 3.0, dit web sémantique.