lundi 12 septembre 2011

Ghostwriter in the Shell


 La génération automatique de contenu est un vieux rêve.

D'accord, c'est surtout un vieux rêve des éditeurs, qui aimeraient bien se passer de l'élément humain si coûteux, nécessaire à la rédaction d'articles de sport ou de romans de gare décents : l'utilisation d'une syntaxe correcte et le maintien d'une cohérence au fil du récit reste jusqu'ici l'apanage des seuls humains - et ces caractéristiques sont le plus souvent rédhibitoire pour les éventuels lecteurs.


Sauf que.


“Le Wisconsin semble être dans le siège du conducteur, en route vers une victoire, alors qu'il mène 51-10 après le troisième quart-temps. Le Wisconsin a ajouté à son avance quand Russell Wilson a rencontré Jacob Pedersen pour un touchdown de huit yards pour porter le score à 44-3 [...] .”

Une chronique sportive plutôt classique, traduite depuis le site d'information sur le football américain BTN. Mais cet article n'a pas été écrit par un humain, il est le fruit d'un savant algorithme, mis au ont par Narrative Science, une start-up d'Evanston (USA, Illinois) qui s'appuie sur plus d'une décennie de recherches menée par ses deux co-fondateurs et directeurs d'un laboratoire de recherche à l'université de Northwestern, Kris Hammond et Larry Birnbaum.

Le résultat est plus qu'étonnant, il est incroyable, et les experts en intelligence artificielle eux-même sont impressionnés par ces résultats.

Narrative ScienceLe logiciel, explique Narrative Science, fait des recoupements sur la base des données qu'il a déjà analysées par le passé, de manière à extraire des concepts (tels que "effort d'équipe", "percée d'un joueur" par exemple dans le cas du sport) et s'en sert pour générer les bords du puzzle que va constituer son article. Il repère ensuite les éléments les plus importants et s'en sert pour remplir les blancs à l'aide d'un vocabulaire également adapté.

Les résultats sont là puisque le site du Big Ten Network a enregistré pour la saison 2010 une hausse de 40 pour cent de sont trafic concernant les matchs de football américain par rapport à l'année précédente.

Les deux dirigeants de Narrative Science insistent cependant sur le fait que leur technologie est avant tout conçue comme un outil à bas coût pour permettre d'étendre et d'enrichir la couverture de l'actualité pour des budgets d'éditeurs restreints. C'est-à-dire qu'ils n'envisagent absolument pas de remplacer les vrais journalistes par des machines - pour le moment. Malgré cela, leur entreprise compte déjà 20 clients (certain encore en train d'effectuer des tests) pour des domaines aussi divers que le sport, l'économie, les résultats de sondages ou des textes publicitaires et Kris Hammond promet que d'ici 5 ans un ordinateur pourra remporter le prix Pulitzer. Affaire à suivre.

Ce billet est le fruit du travail cérébral d'un humain (AOC), assisté de manière uniquement limité par des ordinateurs pour des travaux de rédaction, de vérification orthographique, de recherche et de publication.

Aucun commentaire:

Enregistrer un commentaire

Avant de publier votre commentaire, lisez-le vous à voix haute. Si vous sonnez comme un connard supprimez-le.
Sinon, c'est probablement que vous l'avez mal lu.