Reconnaitre les noms d’auteur (1)

Edmond Jurien de La Gravière, croquemitaine pour robot

Sur Wikipedia et dans les bases bibliographiques, les auteurs d’un ouvrage sont généralement regroupés et non distingués. Par exemple, sur l’article Henri François Potier de La Germondaye figure la référence bibliographique :

Jean-Luc Fray, Céline Pérol, L’historien en quête d’espaces, 2004, p. 410.

Pour un humain francophone de culture européenne ou québecoise, il est facile d’identifier deux auteurs distincts, et d’identifier leurs prénoms respectifs. L’information résultante pourrait s’écrire ainsi : prénom1 = Jean-Luc ; nom1= Fray ; prénom2=Céline ; nom2= Pérol.

Mais comment mon robot peut-il parvenir à distinguer individuellement chaque auteur, et distinguer les prénoms des noms ? Voilà un sacré défi… Première étape aujourd’hui, la reconnaissance de motifs et l’apprentissage automatique du robot.

N’ayez pas peur, c’est pas très compliqué.

Lire la suite

Publicités

Les non-humains de la communauté

La place des robots dans Wikipedia.

Chacun sait que les bots font beaucoup d’éditions sur les différentes wikipedia. Mais paradoxalement dans les études sur Wikipédia, l’action et l’influence des bots est toujours négligée, jugée marginale ou bien simplement assimilée à celle des humains.

Compte-rendu d’un papier dans la revue de sociologie d’une faculté allemande. Les bots de wikipédia servent de prétexte à une étude dans le domaine à la mode de l’analyse des réseaux sociaux. Le papier ne porte pas sur l’aspect technique des robots (programmation). D’ailleurs ce papier, rédigé par deux étudiants, est intéressant dans le contexte d’une découverte des bots de Wikipédia ; mais pour le reste…

Robot pour attirer les lecteurs (CC: Pascal Gautier)

L’étude porte sur la Wikipedia en allemand (DE). Les auteurs ont notamment utilisé les données et statistiques du Toolserver (un ensemble d’ordinateurs en Allemagne hébergeant de nombreux outils et logiciels utilisé par les projets Wikimedia).

Source :

Robin D. Fink et Tobias Liboschik, « Nicht-menschliche Mitglieder der Wikipedia-Gemeinschaft », in Soziologisches Arbeitspapier, n° 28, déc. 2010, Dortmund : Technische Universität, ISSN 1612-5355 lien

Approche

En moyenne sur la Wikipedia allemande fin 2010, durant une semaine, 60 bots étaient actifs et produisaient 10% du « volume » [?] total des éditions (15% du nombre), ce qui équivaut au volume d’éditions des IP.

Lire la suite