Dans le numéro de mai de Pour la science, il y a un article très intéressant intitulé "L'émergence de la science du Web", écrit par Tim Berners-Lee, "Mr. World Wild Web", et par Nigel Shadbolt, professeur d'intelligence artificielle à l'Université de Southampton en Angleterre et directeur de la technologie à la compagnie de Web sémantique Garlik Ltd. La science du Web est une
"nouvelle discipline [qui] est appelée à modéliser la structure du Web, à articuler les principes architecturaux qui ont nourri son phénoménal essor et à découvrir comment les interactions humaines en ligne sont déterminées par les conventions sociales en même temps qu'elles les modifient. Il s'agit aussi de dégager les principes susceptibles de garantir la croissance de la Toile, de régler des questions complexes telles que la protection de la vie privée et les droits de propriété intellectuelle."
Jusque-là tout va bien : il s'agit d'étudier les propriétés émergentes du Web (comment sont-elles apparues ?) et de savoir comment les maîtriser. En effet, certaines propriétés sont désirables ("Par exemple, garantir que toute page puisse présenter un lien vers n'importe quelle autre page donne une puissance à la fois locale et globale au Web."), mais toutes ne le sont pas, exemple : "la possibilité de construire un site contenant des milliers de liens artificiels, obtenus par des robots logiciels uniquement pour améliorer le classement du site par les moteurs de recherche".
Je commence à être perdu quand j'apprends que "la connectivité du Web suit une distribution du degré de connectivité en loi de puissance", une découverte issue de la théorie des graphes. Quelqu'un peut me faire un dessin ? Non, personne ?
En tout cas, les choses s'améliorent quand les auteurs parlent analyse de la blogosphère et Web sémantique : c'est non seulement intéressant, mais aussi compréhensible. Ainsi, la présentation du langage RDF, qui se superpose au langage HTML dans le Web sémantique, est aussi simple que le langage lui-même, basé sur le modèle du triplet, qui associe un sujet, un prédicat et un objet. Exemple (personnel) : Babar [sujet] est le mari [prédicat] de Céleste [objet]. RDF contraint ainsi l'interprétation des données sur le Web, ce qui peut donner des résultats de recherche très ciblés.




