Quelles sources les blogueurs citent-ils le plus souvent ? C’est une question que vous vous êtes sans doute déjà posée, et à laquelle vous vous êtes certainement dit qu’il était difficile d’apporter une réponse claire et précise. Détrompez-vous… S’il y a des sites dont vous souhaitez connaître les sources, faites-en simplement la liste… et suivez la procédure suivante !

Etape 1. téléchargez le plug-in Navicrawler 1.7.1 ; il permet de lancer des procédures d’auto-navigation (crawl) sur les sites que vous souhaitez explorer (n= > 5). Au fil de la navigation, le logiciel enregistrera tous les liens sortants. Au bout d’une vingtaine de minutes, il aura collecté une vaste base d’hyperliens. Ceux-ci étant trop nombreux que pour pouvoir être intégrés dans un graphe lisible, il vous faudra opérer une sélection.

Etape 2. Vous ne devrez garder que les liens les plus influents, ceux que les blogueurs ont cités à plusieurs reprises. Il existe pour cela une fonction qui vous permet de réduire votre base de données pour ne garder que les liens les plus cités. Il vous faut également exclure les liens que vous jugez non-pertinents. Si votre étude porte sur les blogs de journalisme politique, il vous faut par exemple exclure, un par un, les blogs technologiques, sportifs, promotionnels etc. Au terme de cette procédure de nettoyage, vous pourrez classer les différents liens en fonctions de sous-thématiques, et exporter votre base de données sous format .gnp.

Etape 3. Dans le logiciel Gephi 0.7, ouvrez le fichier (.gnp) que vous venez de constituer.  Un graphe apparait dans la fenêtre centrale. Pour le rendre un peu plus lisible, il vous suffit d’ouvrir l’onglet « layout » et de lancer l’algorithme « force atlas ». Si la structure n’est pas assez aérée, vous pouvez introduire une valeur plus grande dans « repulsion strength« … Bon, les différentes fonctions du programme sont un peu trop nombreuses pour pourvoir être expliquées ici. Je vous conseille donc de télécharger le manuel explicatif que voici.

Les résultats : J’ai testé le programme sur base d’un très petit noyau. Le coeur de mon réseau est constitué de 7 ou 8 blogs de journalistes politiques francophones.  On retrouve, à gauche du graphe, les questions de politique fédérale et et de communication politique (Charles Bricman, Fabrice Grosfilley, Michel Geyer, Michel Henrion). A droite, les questions communautaires et de politique des minorités (Mehmet Koksal, Henri Goldman, Marcel Sel…). Au centre du réseau, se trouvent les sources communes à tous blogueurs (Le Soir, La Libre).

La taille d’un point (noeud) représente sa centralité, un indice qui est fonction du nombre du nombre de fois que le point figure dans les chemins les plus courts (entre les différents points du réseau). Si je le voulais, je pourrais parfaitement faire en sorte que la taille d’un noeud indique une autre variable, comme le nombre de liens entrants (ce qui constitue un bon indicateur de l’autorité du blog). Cela nous permettrait de mettre en évidence la présence de blogs qui, bien que peu connectés, sont régulièrement cités par d’ autres blogs (blogs.rtlinfo.be). Dernière chose : la couleur d’un lien indique la direction de ce lien : chaque lien a la couleur du noeud dont il sort.

Critique : Je trouve les deux programmes très bien pensés, mais j’ai tout de même rencontré quelques difficultés, en cours de route. Permettez-moi de vous en faire part… :

(1) Avec l’utilisation de la fonction de navigation automatique, certains liens sortants sont pris comme des « sources privilégiées » alors qu’il ne s’agit que d’hyperliens présents au sein de commentaires de lecteurs. Seule solution : examiner chaque site dans le détail.

(2) Quand deux ou trois URL renvoient vers un même site – comme c’est souvent le cas – les nœuds apparaissent en double ou en triple. Il faut les fusionner en transformant les lignes de codes au sein du fichier .gnp. Si quelqu’un connaît un autre moyen de les fusionner, qu’il/elle me le dise… je suis preneur.

(3) Un blog peut constituer une source influente aux yeux d’autres blogueurs, sans que l’observateur en prenne conscience ; soit parce que ces blogueurs s’éloignent du champ thématique circonscrit par le chercheur, soit parce qu’ils font partie de systèmes d’échange distincts, ou de sous-graphes faiblement connectés au graphe initial (cutpoint). C’est pas simple : il faut trouver un juste milieu entre cohérence et précision.

Voilà. J’espère avoir pu vous être utile. Si vous avez des conseils, des questions, des suggestions, écrivez-moi ! Bonne chance.