(NB: les sites web TOR issus du Dark Web sont reconnaissables par leur extension .onion. Pour accéder à ces sites web il faut installer TOR Browser)
Objectifs :
- Identifier de nouvelles sources d’informations
- Identifier de nouvelles librairies
- Identifier les zones et les liens d’influence de deux librairies du dark web
Volumétrie :
- 2 343 sites
- 2 618 liens pondérés
Principaux algorithmes utilisés :
- Pondération : HITS
- Colorisation : Link Communities
- Layout : GEM (Frick) avec utilisation du nombre de liens sortants
Le graphe initial :
Nous avons découvert récemment l’apparition de deux nouveaux sites dans le Dark Web, plutôt surprenants :
clivl6rf3vft7ihw.onion et flibustahezeous3.onion
Добре дошли в Моята библиотека! (Bulgare) et Флибуста (Russe)
Voici ce que nous obtenons en générant ce premier graphe pour analyse de l’écosystème :
Nous remarquons 2 sites qui se distinguent, en bleu (de la même communauté que nos seeds initiaux), ce sont des hubs :
- mx7rwxcountermqh.onion : une liste des bibliothèques numériques référencées sur TOR ;
- jdpskjmgy6kk4urv.onion : référence de liens TOR.
Le premier site nous semble intéressant à intégrer dans notre infosphère initiale comme nouveau seed. De même l’ensemble des liens qu’il comprend pourra nous permettre de dresser une cartographie des bibiliothèques numériques sur TOR.
Voici un zoom de nos deux seeds initiaux sur le nouveau graphe :
Nous voyons ainsi apparaître les liens communautaires communs à nos deux sites. En prenant du recul, nous allons voir l’ensemble des interactions relatives aux communautés de cette infosphère :
Autre visualisation, même layout :
Et voici, le graphe final de l’analyse partielle :
Autre point de vue : e-libraries-tor.pdf
Découverte du Dark Web, 1/10 : des noms de domaine TOR à vendre (.onion)
Découverte du Dark Web, 3/10 : les moteurs de recherche TOR