Le crawl, c’est pas de la brasse

Ou : « Des algos au coeur des crawlers »

Le Crawl, c’est la base de tout moteur de recherche. Et pourtant, il est difficile de bien crawler un site, surtout pour en extraire de la data exploitable.
Dans ce talk, je fais un retour d’expérience lié à ce que nous avons appris avec le service Cocon.Se.

Ce qui marche, ce qui ne marche pas; les algorithmes qui aident à repousser les contraintes…
Une présentation plutôt technique, mais avec plein d’images et de couleurs !

C’était à Que Du Web à Deauville, en 2016.
Une orga qui a assuré, une ambiance familiale que je n’ai retrouvé ailleurs, un plaisir rare !

(Slides à venir)

Dans la même série, vous pouvez également consulter :