Je n’ai pas été assez clair dans mon dernier billet, donc voici quelques petites précisions :

(1) La couleur des liens indique leur direction (les liens sortants ont la même couleur que le noeud dont ils sortent). On voit ainsi que le blog de Ch. Bricman a de nombreux liens sortants [et réciproques].  En théorie des graphes, on appelle ça un « hub« . Mais un hub n’est pas nécessairement une autorité, c’est-à-dire qu’il ne possède pas nécessairement le plus grand nombre de « liens entrants ».

(2) La taille des points (centralité) indique quant à elle le nombre de fois qu’une personne apparaît sur les chemins (courts) qui parcourent le réseau (average shortest path), tous chemins confondus (les liens entrants mais aussi les liens sortant). C’est là une information importante, mais qui n’indique pas grand chose d’autre que la capacité des acteurs à employer des hyperliens pour citer de nombreux autres membres du réseau.

(3) Par ailleurs – comme on l’a fait remarquer ce matin – il y a des journaux en ligne qui citent des blogs sans utiliser le moindre hyperlien : il est nécessaire de revoir ce travail de mapping en intégrant les médias traditionnels dans l’analyse. Je crois  d’ailleurs que c’est un travail qui a récemment été initié par une doctorante de l’ULB (J. De Maeyer).

Pour une introduction à Navicrawler, c’est ici.

Et pour un introduction à Gephi 0.7, c’est ici

Publicités

Pour ceux que ça intéresse, voici une carte de la blogosphère journalistique belge francophone.

(1) Le blog le plus central, celui qui apparaît le plus souvent sur les chemins les plus courts (entre les différents points du réseau) est celui de Charles Bricman. Viennent ensuite les plateformes de la Libre Belgique et du Soir (Politic Twist et  Saga Belgica). En dehors de ces deux plateformes, les blogs des journaux sont plutôt isolés (cf. bas de graphe) : La Libre Belgique a un grand nombre de blogs, mais qui restent assez peu connectés au reste de la blogosphère.

(2) On observe aussi une séparation gauche / droite : Les blogs de gauche et les blogs relatifs aux questions de minorités sont concentrés en haut du graphe. Les blogs libéraux sont plus éparpiés (Grand Barnum, On Vote Pour Eux …).

(3) On voit enfin que les sites plus fréquentés ne sont pas nécessairement les sites les plus centraux et les mieux connectés. Des sites fort fréquentés – comme « Parlemento » de Mehmet Koksal, le blog de Marcel Sel, ou de Henri Goldman – passent presque inaperçus au sein du graphe…


1. Qu’est-ce qu’un graphe ?

Dans la théorie des graphes, un individu est un noeud (n), et on le représente par un point. Les noeuds peuvent soit être être connectés les uns aux autres, par des liens. Pour désigner un ensemble de deux ou trois noeuds (N = {n1, n2}), on utilise les mots « diade » ou « triade ».

Ensuite, pour désigner un ensemble de liens, on utilise la lettre (L). Et pour désigner un lien spécifique entre deux noeuds on écrit l1 = < n1, n2>. Si l’on s’abstient de tenir compte les liens réflexifs (loops), le nombre maximum de liens entre g acteurs, au sein d’un graphe, est égal à g(g-1)/2. Ces liens peuvent être représentés sous forme de matrices sociales (sociomatrix).

n1 n2 n3 n4 n4
n1 1 0 0 0
n2 1 1 0 0
n3 1 0 1 0
n4 1 0 0 1
n5 1 0 0 0

Ensuite, vient la question la cohésion, ou de la connectivité du graphe, c’est-à-dire de son aptitude à rester entier en dépit de la disparition de noeuds et de liens. D’un seul noeud peut dépendre la connectivité de tout graphe, auquel cas on appelle ce noeud “cutpoint”. Les liens entre cutpoints on les appelle “ponts” (bridges), ou des “liens faibles”. Dans la graphe suivant, c’est le blog du journaliste politique Jean-Paul Marthoz qui joue le rôle de cutpoint. On voit que, sans lui, le sous-graphe francophone (en rouge) serait déconnecté du sous-graphe anglophone (en bleu).

Il y est maintenant possible d’élaborer des graphes plus élaborés qui contiennent différentes sortes de liens (graphes mutlivariés), ou des graphes qui représentent, non seulement les liens entre acteurs, mais aussi les liens entre agrégats d’acteurs (hypergraphes). Au sein de ces agrégats, on peut mesurer non seulement la densité des liens, mais aussi leur “centralité”.

Mais dans l’étude des réseaux de journalistes, on s’intéresse également à des variables relationnelles autres que la densité ou la centralité : on s’intéresse par exemple au prestige de X aux yeux d’Y, ou l’autorité de X sur Y… D’où l’intérêt d’identifier des relations directionnelles (arcs), représentées par des flèches. La valeur simple d’une relation directionnelle est notée X (xij= la valeur de la relation x qui va de ni à nj).

2. Comment visualiser un réseau social ?

Voici un graphe produit à l’aide d’un outil de mapping nommé « Gephi« . Chaque noeud représente l’URL d’un blog de journalisme politique belge. Les liens directionnels représentent quant à eux des hyperliens contenus dans les « blogrolls » des différents sites explorés. Au sein de chaque site, il a fallu exclure les URL hors-thème, pour ne garder qu’une petite dizaine de « sites voisins ».

Voici enfin un graphe un peu plus étendu. Le coeur du réseau est constitué des liens qui ont cités sur le blog de J.-P. Marthoz, au cours de l’année 2010, ainsi que de ceux qu’il a placés dans sa blogroll. La taille des noeuds représente la centralité dans le réseau (betweeness centrality). Ce genre de représentation graphique pose au moins un problème : elle sous-évalue les sites qui ne contiennent que peu de liens hypertextes ; c’est pourquoi il est utile de compléter le travail de mapping d’URL par un travail d’analyse sémantique.

___

Programme de mapping : Gephi 0.7

Module à installer sur Firefox : Navicrawler 1.7.1

MediaLab Science Po’ Paris

Mapping controversies du MIT

Blog d’une doctorante de l’ULB, sur la visualisation de réseaux sociaux

Je viens d’assister au fascinant discours de la journaliste iranienne Shadi Sadr. Shadi une activiste des droits de la femme qui s’est fait arrêter, en 2009, par la police iranienne. Elle a été relâchée après une dizaine de jours de détention. Elle affirme aujourd’hui que les médias sociaux favorisent les politiques répressives du régime iranien. Les autorités iraniennes, ainsi qu’un certain nombre de groupuscules conservateurs, ont en effet recours à des moyens sophistiqués permettant de collecter des informations relatives aux opposants politiques et de diffuser de fausses informations. Ils s’efforcent par exemple d’accéder au courrier électronique des citoyens gênants, de récolter des informations à leur sujet, d’usurper des identités etc.

Shadi Sadr

Bizarrement, en 2009, dans la presse américaine et européenne, on parle alors essentiellement des réseaux sociaux comme d’un moyen de lutte du « mouvement vert« . Mark Pfeifle, ancien conseiller auprès de la Maison Blanche, avait même – pour la petite anecdote – proposé de nobéliser les fondateurs de Twitter, en raison des « bienfaits » que la société californienne avait prodigué au peuple iranien. La réalité – précise Shadi Sadr – c’est que ces outils de networking ont plus été des outils de contrôle, que des outils d’empowerment. Elle n’est pas la première à faire cette observation. Déjà en juin 2009, Ethan Zuckerman (Berkmann Center, Uni. Harvard) – fondateur de Global Voices – annonçait que Twitter «avait été utilisé comme une chaîne de désinformation par des groupes vraisemblablement de mèche avec le gouvernement; ils ont surtout tenté de faire peur à la population pour la dissuader de retourner manifester».

Qu’en est-il enfin du potentiel de Twitter comme source d’information journalistique ? Une ancienne journaliste de The Independant (Megan Knight, Uni. Lancaster) a cherché à répondre à cette question. Pour ce faire, elle a procédé à une analyse d’articles de presse – britanniques et américains – parus pendant la période des élections iraniennes de 2009 . Les 365 articles sélectionnés font mention de 755 sources. Résultats de son étude : 23% des articles mentionnent les réseaux sociaux (social media). Mais, seuls 8% de ces articles renvoient à une réelle citation. Conclusion : Twitter est sans doute un outil de fantastique, mais on a surévalué tant son potentiel politique, ou démocratique, que son potentiel journalistique (en terme d’enquête, d’investigation)… Comment expliquer cette sorte de mirage collectif de l’année passée? Je ne sais pas…

« Le journaliste qui était intermédiaire, qui était sur le terrain pour rapporter ce qui se passait, la révolution iranienne, un avion qui se crashe et autre, ben aujourd’hui il est en concurrence avec Monsieur-tout-le-monde qui, aujourd’hui, est avec son téléphone portable, et envoie directement l’information. Avec la puissance supplémentaire que simplement, le journalistes qui… ils sont en nombre limité, une population  limitée, voilà (…) tandis que M. et Mme tout-le-monde, sont partout. Twitter c’est comme si on avait une rédaction de 25 millions de personnes, partout en même temps, et dès qu’il se passe quelque chose, boum, on l’envoie sur Twitter, c’est relayé automatiquement ; et donc quand je suis ce qui se passe en Iran sur Twitter, je suis dans la même position qu’un journaliste de CNN qui est dans la foule » (Interview avec un ancien journaliste de Trends, Juillet 2009).

Pour ceux qui n’ont pas pu l’écouter, voici l’enregistrement de l’émission de « Place de la Toile » (France Culture) du 8 janvier 2010 sur Twitter et l’information en ligne. Vous pouvez y entendre les témoignages d’Eric Scherer, journaliste à l’AFP, Stéphane Alliès (Mediapart), Alexandre Hervaud (Ecrans.fr) et Alice Antheaume (20minutes). C’est ici.

Vous connaissez Géphi? C’est un outil de mapping, ou si vous préférez de visualisation de réseaux sociaux à partir de différents noms de domaines (URL). C’est peut-être pas le meilleur logiciel de tous, mais j’en suis plutôt content… ça me semble être un bon choix  pour les chercheurs qui étudient des réseaux de petite taille (moins de 500 individus). Voici la marche à suivre : (1) Installer Navicrawler (sur votre browser Firefox), http://www.webatlas.fr/index.php?option=com_content&view=article&id=56&Itemid=74 ; (2) Installer Géphi : http://gephi.org/community/download/#windows ; (3) Importer les URL des sites dans Navicrawler (onglet « file ») ; (4) Exporter les sites liés en .gdf ; (5) Lancer Géphi ; (6) Importer le fichier .gdf dans Géphi ; (7) cliquer sur l’algorithme « Force Atlas », dans l’onglet « Spacialize ».


Bonne chance !