Nozzl : agence de presse robotisée


Gauthier Dupraz
Samedi 7 Janvier 2012

Depuis sa fondation en 2010 à Portland aux Etats-Unis, le site Nozzl.com se présente comme un véritable Reuters ou AFP automatisé. « A la recherche d’un moyen de créer un nouveau type de média en ligne », deux journalistes Steve Woodward, John Hamlin et un ingénieur informaticien Brian Hendrickson, sont à l’origine de cette start-up. A l’heure où les nouveaux outils du web ne cessent de se développer, Nozzl.com apporte une nouvelle dimension à l’information en ligne.


Nozzl : agence de presse robotisée
Le site créé dans l’Oregon se veut être un agrégat d’éléments informatifs et journalistiques rassemblés et classés par thème afin d’optimiser les recherches de ses usagers. Actuellement, il décompte entre 2 000 et 3 000 visiteurs par semaine et ses trois fondateurs gèrent à eux seuls la maintenance du site. Formule tronquée du mot  "nozzle" qui signifie gicleur ou embout (de tuyau), cette "agrégateur" selon le terme technique, met automatiquement à jour "différentes informations à partir d’une variété de sources". Elle puise des données essentiellement à partir des sites de journaux en lignes, les agences de presse, les blogs, les flux RSS* ou encore les réseaux sociaux (Twiteer, facebook etc.). Ces infos classées chronologiquement, sont répertoriées par sujet en lien avec l’actualité nationale et internationale. Les éléments défilent en continu sur le site à la manière de cotes boursières fluctuant sur les écrans des places financières.
Déjà utilisée par Google actualité, cette innovation dans le domaine de l’information est due à un logiciel ou algorithme qui "rassemble des données disponibles en ligne" et les publie sous forme de liens (ou raccourcis) dans des fenêtres de lecture intitulées widget*, classées pas thème. Là se trouve la vraie originalité de la plateforme.
Mais Steve Woodward le PDG de Nozzl.com, insiste sur le fait que ce site n’est pas limité seulement à un ensemble robotisé. "Il repose en réalité sur l’aspect humain et informatique". Selon leur pertinence informative et journalistique, l’équipe de Nozzl sélectionne les sources d’informations et agence le système en fonction de ces critères. "Certains de nos concurrents Topix et Fwix, utilisent exclusivement des algorithmes de recherche alors que pour notre part nous ajoutons une intelligence humaine pour sélectionner les flux de données".

De l’information classée uniquement par ordre chronologique

Page d'accueil de Nozzl.com où les infos défilent sur les fenêtres ou widget - Crédit photo: Gauthier Dupraz
Page d'accueil de Nozzl.com où les infos défilent sur les fenêtres ou widget - Crédit photo: Gauthier Dupraz
Le logiciel se veut exhaustif dans la classification des informations qu’il récolte. Mais cette opération se limite à un classement chronologique. A contrario, les éléments ne sont pas hiérarchisés suivant leur intérêt journalistique et informatif. Par exemple, un tweet et un article du New York Times bénéficient du même espace et de la même considération sans quelconque discrimination qualitative. Face à la masse d’informations collectées, l’internaute peut se sentir submergé même s’il est possible de figer le flux continu grâce à un bouton "pause". Dans le cas contraire, les moteurs de recherche classiques type Google ou Bing, semblent plus fonctionnels en livrant des informations à la demande. Pour autant, ils ne référencient pas les tweets ou commentaires de blog comme Nozzl.com.
Cependant, Steve Woodward explique clairement que l’usage de leur plateforme est essentiellement dirigé à l’attention des professionnels des médias. Ce site peut répondre aux attentes des journalistes à la recherche des actualités les plus récentes. Pour autant la start-up n’est "pas encore en mesure de savoir quels médias consultent leur site" précise le PDG.
Le système n’est tout de même pas infaillible. En consultant l’actualité de la rubrique "guerre en Afghanistan" par exemple, le lecteur tombe par hasard sur un article de la BBC portant sur la crise grecque. S. Woodward ne nie pas que le l’ordinateur commet parfois quelques maladresses. "Le système n’est pas encore parfait. La plupart du temps ces coquilles sont dues à des erreurs d’appréciation du robot. Ce dernier recherche des articles en fonction du vocable que nous lui avons transmis." Parfois le logiciel trouve certains des mots clés indiqués par le webmaster dans des articles sans rapport avec le sujet en question. Cette étape conduit souvent à ce que des données hors-de-propos s’immiscent dans un thème en particulier comme dans le cas cité plus haut. Le PDG ajoute que dans ce type de situation si cette difficulté persiste l’équipe redéfinit sa recherche afin d’éliminer les résultats inappropriés.
Malgré ces imperfections, Nozzl pose une interrogation au sein du monde journalistique, quant à savoir si les « agrégateurs » d’informations remplaceront un jour les agences de presse ?

Lexique :

- Widget : assemblage de langage de programmation script (Javascript) et informatique (HTML, CSS etc.) se traduisant sous la forme d’applications utilisant eux-mêmes des outils permettant d'obtenir de l'information (calculatrice, post-it, lecteur RSS etc.).

- CSS : Les Cascading Style Sheets, littéralement feuilles de style en cascade, sont un langage informatique. Il sert à décrire la présentation des documents HTML et XML. Ce langage est largement utilisé dans la conception de sites web.

- RSS : (syndication de contenu) : forme de syndication dans laquelle une partie d'un site est accessible depuis d'autres sites

Liens :

- "Voici venu le temps des journalistes robotisés" (readwriteweb.com)

- Définitions et termes techniques (futura-sciences.com)

Lu 5245 fois
Notez



           

Nouveau commentaire :
Twitter


Twitter
Rss
Podcast
Facebook

Amérique sur le ring, un webdoc des étudiants de l'EJDG. A retrouver sur lesinrocks.com

La campagne présidentielle vue par les étudiants de l'EJDG en partenariat avec le Dauphiné Libéré


Partager ce site


Inscription à la newsletter


Paperblog : Les meilleurs actualités issues des blogs