Les filles sont comme des limaces : analyse du discours sexiste

Les filles sont comme des limaces — elles servent certainement à quelque chose, mais il est difficile d’imaginer à quoi. — Calvin

Photo : Peter van der Sluijs

Écho du buzz Internet à propos du sexisme dans la communauté geek, quelques discussions sont apparues parmi les contributeurs de Wikipédia à propos d’un (soit-disant) sexisme latent dans la communauté Wikipédia et d’un (prétendu) biais sexiste dans le traitement encyclopédique des articles.

Zou ! L’idée d’un outil d’analyse textuelle du sexisme me titille soudain. Un robot pour traquer le sexisme ? Un détecteur de discours pourri ? Un outil pour établir des graphiques colorées de la proportion de machos ? Il est permis de rêver !

Lire la suite

Publicités

SGI-Wikipedia : Grosse tête, petit bilan

Les personnalités dans Wikipedia EN: et leurs liens quand citées dans le même article. ©SGI

Un superordinateur SGI UV 2000 a importé dans sa méga mémoire tous les articles de la Wikipédia en anglais ; de quoi permettre au chercheur Kalev Leetaru, des analyses originales de Wikipédia et faire de la publicité commerciale pour les capacités de cette machine informatique dans l’exploration de grosses données (big data). Un ordinateur qui permettrait « de trouver des réponses aux problèmes les plus difficiles du monde ».

Cette fouille de données a été axée sur deux types de données tirées des articles :
* les dates
* les localisations géographiques
* les connexions entre articles (wikiliens et catégories?)
* La classification des articles en terme de sentiment négatif (guerres) ou positif Lire la suite

Tendance lexicale du bistro

Suite à la suggestion de Hervé (TigH), une analyse lexicale simpliste (méthode La Rache™) de l’usage de quelques expressions sur le Bistro de Wikipédia. Le bot a cherché les occurrences de début de mots (vandal*, troll*, clan*) ; j’ai pas vérifié les risques d’erreur.

Zut, j’arrive pas à intégrer en format interactif (javascript Google docs). Tant pis, voilà en image… Chaque point représente un mois, depuis mai 2005 jusqu’à juin 2012 (incomplet car nous sommes le 15 juin). Faudrait pondérer en proportion du total mensuel de mots rédigés sur le bistro, mais bon…

Lire la suite

Reconnaitre les noms d’auteur (1)

Edmond Jurien de La Gravière, croquemitaine pour robot

Sur Wikipedia et dans les bases bibliographiques, les auteurs d’un ouvrage sont généralement regroupés et non distingués. Par exemple, sur l’article Henri François Potier de La Germondaye figure la référence bibliographique :

Jean-Luc Fray, Céline Pérol, L’historien en quête d’espaces, 2004, p. 410.

Pour un humain francophone de culture européenne ou québecoise, il est facile d’identifier deux auteurs distincts, et d’identifier leurs prénoms respectifs. L’information résultante pourrait s’écrire ainsi : prénom1 = Jean-Luc ; nom1= Fray ; prénom2=Céline ; nom2= Pérol.

Mais comment mon robot peut-il parvenir à distinguer individuellement chaque auteur, et distinguer les prénoms des noms ? Voilà un sacré défi… Première étape aujourd’hui, la reconnaissance de motifs et l’apprentissage automatique du robot.

N’ayez pas peur, c’est pas très compliqué.

Lire la suite

Les non-humains de la communauté

La place des robots dans Wikipedia.

Chacun sait que les bots font beaucoup d’éditions sur les différentes wikipedia. Mais paradoxalement dans les études sur Wikipédia, l’action et l’influence des bots est toujours négligée, jugée marginale ou bien simplement assimilée à celle des humains.

Compte-rendu d’un papier dans la revue de sociologie d’une faculté allemande. Les bots de wikipédia servent de prétexte à une étude dans le domaine à la mode de l’analyse des réseaux sociaux. Le papier ne porte pas sur l’aspect technique des robots (programmation). D’ailleurs ce papier, rédigé par deux étudiants, est intéressant dans le contexte d’une découverte des bots de Wikipédia ; mais pour le reste…

Robot pour attirer les lecteurs (CC: Pascal Gautier)

L’étude porte sur la Wikipedia en allemand (DE). Les auteurs ont notamment utilisé les données et statistiques du Toolserver (un ensemble d’ordinateurs en Allemagne hébergeant de nombreux outils et logiciels utilisé par les projets Wikimedia).

Source :

Robin D. Fink et Tobias Liboschik, « Nicht-menschliche Mitglieder der Wikipedia-Gemeinschaft », in Soziologisches Arbeitspapier, n° 28, déc. 2010, Dortmund : Technische Universität, ISSN 1612-5355 lien

Approche

En moyenne sur la Wikipedia allemande fin 2010, durant une semaine, 60 bots étaient actifs et produisaient 10% du « volume » [?] total des éditions (15% du nombre), ce qui équivaut au volume d’éditions des IP.

Lire la suite

Comment expliquer Wikipedia à un lapin

Joseph Beuys, Comment expliquer les tableaux à un lièvre mort, 1965

Le désir d’un blog.

Un carnet pour suivre mon travail sur Wikipédia. Pour analyser ma démarche, et faire peut-être partager mes motivations et méthodes à d’autres contributeurs ou des curieux. La notion de work in progress, l’analyse du processus, blabla… un tic, hein ? Lire la suite