Des graphes... aux mots, ep2

La suite de mon talk de Que Du Web 2017 à Deauville.
On y parle Graphes, Histoire (petite et grande), algorithmes et applications pratiques notamment au SEO.

Dans ce second épisode, j’essaye de vous convaincre que les arbres et les graphes font en fait partie de notre histoire, et ont toujours servi à organiser et transmettre la connaissance.

(Voir la vue d’ensemble de la présentation avec tous les épisodes)

Les slides correspondants :

Le transcript

Dans l’épisode 1, on a vu que les graphes sont partout, y compris dans la vie de tous les jours.
Et je vous disais que l’histoire de graphes, des arbres, remonte à plus loin encore…

Pour essayer de vous en convaincre, on va faire ensemble quelques aller-retour dans le temps.
Voici un outil moderne, « Answer the public », qui montre les questions associées à un terme, ici « graphe », sous forme d’arborescence.
C’est une représentation habituelle quand on cherche à définir des personas ou quand on fait des mindmaps. J’ai dit moderne ?

En fait, c’est une représentation très ancienne, assez fréquente.
J’ai sélectionné par exemple cet arbre de la nature et de la logique, de Llull, qui contient, ici sur les feuilles de droite, 10 types de question. On retrouve la définition de personna, les questions de answer the public.
Mais aussi, au centre, un arbre de Porphyre qui indique, sous forme structurée, les relations entre différents concepts.
Et là, on est chez les grecs, Au IIIème siècle. On parle d’ontologie, de hiérarchie, d’arborescence, et on pourrait remonter ainsi jusque Aristote, en -350.

En parlant d’arborescence, en SEO vous savez peut être que les concepts de Trust Flow, de Pagerank Thématique, sont basés sur une arborescence de catégories définies à l’origine par l’annuaire DMOZ : des catégories définies et alimentées par des humains.

Là encore, rien de neuf.
En 1780, dans l’encyclopédie de Diderot et d’Alembert, la table des matières n’est rien d’autre qu’un arbre, qui représente sous une forme structurée et hiérarchisée les différentes branches de sciences

Quand je vous dit Encyclopédie, vous pensez sans doute à Wikipédia avant de penser à la Version historique. Ok.
Voilà Wikipédia.
Ensemble phénoménal de pages interconnectées, un graphe très complexe.
Mais si on regarde la vue d’ensemble, en termes de clusters, voici ce qu’on obtient:

Avec une petite légende pour mettre les points sur les cluster…
on retombe sur un visuel très proche de la table des matières de l’encyclopédie.

Et c’est vrai à différents niveaux, ici par exemple pour montrer ce qui tourne autour du transhumanisme.
Grace au graphe, on voit des choses, des relations qui seraient difficiles à assimiler, à synthétiser en lisant les 23000 pages.
Donc les graphes, et notamment les arbres, ont toujours servi à représenter, organiser, transmettre la connaissance.

Voilà un autre exemple historique, encore de Llull.
Et je vous montre celui là, car c’est l’arbre de la connaissance.

Et de l’arbre de la connaissance au graphe de la connaissance, le Knowledge Graph de Google, il n’y a qu’un pas.
C’est un Graphe qui permet de définir des relations entre entités nommées : dates, évènements, lieux, personnes…
Ici, le Knowledge Graph de Raymon Lulle.
C’était une petite révolution quand Google l’a présenté 2012. Nouveau, vraiment ?

Oui et non. Voici ce qu’on peut considérer comme l’ancêtre du Knowledge Graph.
Un diagramme de l’an 1000, qui rassemble les différents concepts clés de l’époque, avec des relations diverses entre eux.
On y trouve notamment les 4 éléments, qu’on va croiser de nouveau plus loin : je vous parlerai tout à l’heure d’Euler et de l’eau, qui ont donné naissance à la théorie des graphes.

Là, si vous en doutiez, depuis le début je ne vous parle que de SEO.
Que ce soit du point de vue de l’utilisateur, du moteur ou du référenceur, les concepts d’arbre et de graphe sont au coeur du problème.
Les « nouveautés » apparentes du SEO, le KG, l’intention et les personas, le cocon sémantique, les chemins utilisateur, les mindmaps, l’arborescence des contenus, le Topical TF…
Ce sont en fait des concepts aux racines millénaires.
Il y a souvent, à la base, un arbre. Ou quand l’objet à étudier est plus complexe, un graphe.

Voici justement un exemple plus complexe : un graphe basé sur un dataset de 200k tweets fourni par Aysun
(@AysunAkarsu , lien interactif à venir)
Ceux qui RT tout le monde.
Les stars.
Et ceux qui ont une communauté très dense (ou un réseau de bots).

Pour construire ce second graphe, je n’ai retenu que les hashtags, qui sont donc les nœuds du graphe, et je les ai reliés quand il étaient cités dans le même tweet.
Ensuite, un algo de type pagerank pour faire ressortir les termes les plus importants.
En « Vrai », c’est un graphe interactif, mais il y a déjà des choses intéressantes à noter, par exemple, pour les tweets FR, « Google » est ici, c’est le plus gros, au dessus de tout.

Pour les anglophones, ce qui a le plus de poids, ce sont des concepts comme webmarketing, growthhacking. « Google » est ici, plutôt excentré et moins important.
L’analyse est basique, mais c’est pour montrer que même sur des graphes un peu complexes, on peut voir des choses pas toujours évidentes sans.

J’espère qu’à ce stade, je vous ai convaincu d’une chose :
Graphe, arbres, en tant que visualisation, sont essentiels pour structurer l’information, et pour transmettre une information complexe de manière fiable.
Si on creuse coté Neurosciences, on y trouve d’ailleurs des justifications, liées à la façon dont notre cerveau perçoit et modélise le monde.

Et notre cerveau justement, est un graphe de neurones interconnectés.
Ce graphe est cependant trop complexe pour que la visu brute soit utile.
Si je vous montrais un graphe de votre cerveau, vous n’auriez aucune idée de comment il fonctionne.
On pourrait dire que c’est pareil pour un site web complexe par exemple.
Donc, dans ces cas là, comment on fait ? Les graphes ne servent plus à rien passé une certaine complexité ?

C’est ce qu’on va voir dans le prochain épisode…

Des graphes… aux mots, ep2

Le transcript

Une réflexion au sujet de « Des graphes… aux mots, ep2 »