PERSPECTIVE NUMERIQUE:PropositionCodageIEML

Expérience de métrologie sémantique distribuée pour le web temps réel
Vers une Monnaie Complexe ?

OlivierAuber 2009.

L'appellation "web temps réel" recouvre un ensemble de pratiques émergentes rendues possibles grâce à des plates formes propriétaires de type Twitter et des réseaux distribués fondés sur des logiciels libres de type Identica. Les micro-messages échangés sur le web temps réel s'imposent depuis seulement deux ans comme de nouveaux vecteurs d'information, de confiance et de recommandations entre usagers du réseau. Cette nouvelle forme du web apparaît comme une nouvelle frontière dans le domaine du "search" de l'information "brûlante" comme en témoignent les récents accords entre Twitter d'une part, et les moteurs de recherche Google et Bing d'autre part.

Le présent projet vise à surmonter plusieurs lacunes du web temps réel, à savoir notamment sa relative incapacité à consolider le flux des messages sous une forme structurée exploitable en temps réel et a posteriori, ceci à toutes les échelles, depuis celle de l'utilisateur avec son cercle de relations, jusqu'à celle globale d'une certaine thématique faisant l'objet d'échanges dans toutes les langues possibles. Contrairement aux systèmes de traitements et des visualisation de données a posteriori (data mining), notre projet s'appuie sur un traitement a priori par l'énonciateur même des expressions composant ses messages, avec l'assistance d'un thésaurus évolutif de tags fondé sur le langage IEML en cours de mise au point par Pierre Lévy à l'Université d'Ottawa.

Une maquette fonctionnelle a déjà été réalisée en ce sens avec la complicité de plusieurs utilisateurs de Twitter et d'Identica. Elle a montré que cette démarche active de pré-traitement par les utilisateurs est non seulement possible, mais que ceux-ci en perçoivent les bénéfices, notamment pour donner une image plus tangible aux liens qui les réunissent et aux fruits de leurs échanges. Nous entrevoyons à travers cette première expérience que cela pourrait conduire à de nouvelles pratiques culturelles, comme par exemple le "CV performatif" réunissant les compétences tangibles des personnes, ceci s'opposant à l'habituel CV déclaratif...

Nous proposons de poursuivre cette exploration en mettant au point, d'une part des outils de pré-traitements IEML semi-automatiques qui simplifieront la tâche des utilisateurs, d'autre part des outils temps réel d'analyse de flux et de visualisation qui permettront aux utilisateurs d'obtenir une synthèse directe des échanges en train de s'effectuer. La mise au point et l'expérimentation de ces outils en version Bêta s'effectuera avec un groupe d'utilisateurs volontaires.

Au final, la perspective dégagée par ce projet est de proposer une approche sémantique d'un web temps réel distribué pouvant être agrégé en n'importe quel point du réseau.

Livrables :

Un client web Identica IEML
Une application mobile Identica IEML
Un logiciel d'analyse de flux Identica et de visualisation temps réel.

Licences : ces logiciels seront publiés sous licence GPL

Partenaires potentiels:

Université d'Ottawa, Laboratoire de Pierre Lévy.
Université Paris VIII, Laboratoire Paragraph.
Société StatusNet, éditrice du logiciel Laconica/Identica
Société Ligamen
Gnuside / Glen Roland, développeur et éditeur de la plateforme TwitBank

Historique de l'idée
Cette idée a été émise lors d'échanges sur Twitter en mars 2009: http://twitter.com/OlivierAuber/status/1376626256
give 1 #exploracoeur @plevy for #*w.a.-d.-' (expérimenter) #TwitBank http://tinyurl.com/c7ylzb et faire le lien avec l'arbre via #IEML

Maquette fonctionnelle
Une série d'échanges de ce type entre plusieurs personnes sur le réseau Identica et la plate forme Twitter au printemps 2009 a conduit à ces visualisations en utilisant les possibilités
IEML, la plate forme TwitBank d'analyse de flux et de visualisation (graphe), et la plateforme Ligamen? de visualisation (arbre des compétences):

Liens

Liens vers des projets proches

Discussion

OlivierAuber > PierreLevy

Bonjour pierre,

Je t'assure que jusqu'à maintenant, je n'avais vu autour de moi,
malgré mes tentatives d'explication, que des gens qui ne comprenaient
pas ieml, et d'un seul coup, mes petits bricolages ont produit des
déclics!

Je me suis plu à imaginer un client léger pour twitter (ou plutot pour
Laconica/identica) qui permettrait lorsque l'on formule un échange
avec une syntaxe de type :

@jean 10 @marcel pour ta super traduction
(Jean donne 10 unité monétaires à Marcel pour sa traduction)

.. de détecter le mot "traduction" et de proposer à la manière d'un
correcteur orthographique divers équivalents ieml qui pourraient
correspondre au sens que Jean veut formuler.

Après validation, le correcteur ré-écrirait le message en encapsulant
le ou les tags ieml dans le message de manière visible ou invisible de
la part des utilisateurs. Bien entendu, le tag ieml entré par jean
viendrait grossir la compétence "traduction" de Marcel compilée et
visualisé sur une plateforme ou une autre.

Il me parait évident que quelque chose comme cela figure dans ta
feuille de route. Ma question est quand?

Si cet horizon est encore lointain par manque de moyen et de temps de
ta part, il me parait possible de le rapprocher cet horizon en
s'appuyant sur la communauté des développeurs et des utilisateurs
pilotes rassemblés autour d'Identica, de la TwitBank et d'Apprendre
2.0 qui sont particulièrement actifs et souples.

Ton manque de moyen et de temps que tu me signalais il y a peu
pourrait être compensé avantageusement de cette manière.

Mettre de l'ieml dans le microblogging implique de travailler avec les
développeurs de ces systèmes. Ce qui me parait difficile avec ceux de
Twitter me parait plus facile avec ceux de Laconica.

Voilà, cette idée est peut-être très naïve. Tout celà est peut-être
déjà en route avec Laconica ou d'autres.?

J'aimerais en savoir plus

PierreLevy > OlivierAuber

Samuel Szoniecki (samszoAT free DOT fr) a DEJA développé un outil qui
ressemble beaucoup à celui que tu imagines, mais pour traduction
semi-automatique des tags delicious. Contacte-le.
Pour Twitter, ma petite équipe prévoit qqch de beaucoup plus ambitieux
(moteur de recherche nouveau genre), qui sera basé sur la prochaine
version du dictionnaire incluant...
(a) la nouvelle syntaxe conforme au parser IEML,
(b) la formalisation du réseau sémantique entre les termes IEML de la
base de donnée XML sous-jacente au dictionnaire et
(c) une foule de nouveaux termes.
Honnêtement, je ne penses pas que ça vaille le coup de programmer une
appli AVANT d'avoir cette nouvelle version, parce que tout serait à
refaire après.
C'est surtout (a) et (b) qui prennent du temps, parce qu'il faut un
parser pour le langage (très élaboré, incluant des opérations de
génération automatiques d'arbres d'expressions IEML) de définition des
relations + un programme qui tisse les liens automatiquement à partir
de ce langage...
Je vais poster dans une dizaine de jours un nouvel article expliquant
VRAIMENT (pour la première fois) IEML...

PierreLevy > OlivierAuber

OK bricole, mais sache que ce n'est encore que bricolage

OlivierAuber > PierreLevy

Merci pour le contact de Samuel. Je vais le contacter.

J'avoue que je ne comprends pas bien les intentions du moteur de
recherche tel que tu le décris pour le moment. S'il s'agit d'exploiter
la base des twitts telle qu'elle est actuellement structurée par le
graphe social et les hashtags, quel peut être l'apport d'IEML?
Franchement quelque chose m'échappe. S'il s'agit de proposer un
nouveau type de structuration de Twitter, il faudra intervenir sur
Twitter lui même, ce qui paraît difficile. D'où l'idée de se
rapprocher de Laconica qui est sans doute plus souple et qui présente
l'avantage d'être opensource. J'espère que j'y verrai plus clair avec
ton article.

Vu de ma fenêtre, l'intérêt d'IEML est d'être une passerelle
potentielle en le langage naturel et la machine, qui peut en retour
donner toutes sortes de visualisations à l'homme - non pas le "user"
ni le "customer" hein;-) - des structures sémantiques qu'il forme et dans
lesquelles il évolue.

Je ne vois pas comment cette passerelle peut être automatisée pour le
langage courant. Et à supposer que cela soit possible, je me demande
si cela ne serait pas contre productif en terme d'appropriation de la
démarche, voire si cela ne provoquerait pas des mouvements de rejet
face à ce qui pourrait être vécu légitimement comme un système à
déposséder les hommes de leurs propres mots.

Vu de ma fenêtre toujours, IEML pourrait être une sorte d'extension du
langage humain qui démultiplierait ses possibilités d'expression et
d'interaction par l'intermédiaire des visualisations qu'il
permettrait. Pour que le bénéfice social et psychologique de ce
langage soit avéré - en gros qu'un sens émerge de la boucle de
rétroaction - il me semble qu'il faut qu'il y ait quelque part une
démarche volontaire pour pratiquer cette langue.

C'est pourquoi l'idée sans soute modeste d'employerr IEML pour décrire
volontairement l'objet des échanges me paraît pertinente. Lorsque dans
l'exemple cité dans mon précédent mail (@jean 10 @marcel pour ta super
traduction) Jean crédite crédite Marcel non seulement d'une valeur
quantitative éventuelle en "hashtagmoney" mais aussi de la compétence
de "traduire", compétence que Marcel pourra faire valoir par la suite
auprès d'autres par le biais des arbres de compétences par exemple. Le
bénéfice social de cet échange semble évident pour Jean et pour
Marcel. A aucun moment, ils n'ont été dépossédés de leurs mots, de
leurs intentions réciproque et de leurs désirs, ceci d'autant plus que
ces échanges ne transitent pas par un opérateur intermédiaire en
position de monopole.

Voilà, cette idée me donne envie de bricoler, sans y passer trop de
temps une petite maquette. Rien ne sera automatisé. Avec quelques
complices, nous ne ferons que piocher dans le dictionnaire IEML au fil
de quelques échanges. Cela n'a pas d'autre vocation que de réfléchir
en agissant et d'aider peut-être à clarifier certains points dans le
domaine explosif et chaotique des monnaies virtuelles.

Comme je n'ai pas malheureusement pas de moyens ni de temps à
consacrer au développement d'un client léger permettant d'aller plus,
cela s'arrêtra là, à moins que l'exprérience en inspire d'autres, qui
sait?

J'attends ton article avec impatience pour en savoir plus sur cette
histoire de moteur.

A suivre... sur Twitter avec le hashtag #IEML