Compte-rendu du deuxième atelier du Labo BnF sur le « Motion picture »

2010/12/09 § Poster un commentaire

Le second atelier organisé par le Labo BnF avait pour thème le motion picture et les problèmes d’indexation qu’il génère.

Le « motion picture »

Bruno rives est parti d’un constat : le motion picture, entendu dans un sens très large (cours en ligne, visualisation 3D interactives, docu sur un Iphone 4, etc.) est partout, dans l’enseignement, la radio, la presse.

Mais le montage, l’indexation, les annotations restent encore complexes. Tout l’enjeu est donc d’amener les professionnels à s’approprier ces outils.

Orange Labs et l’indexation

Henri Sanson d'Orange Labs

Le premier intervenant (Henri Sanson) a rendu compte du travail d’Orange Labs (dont on peut voir un aperçu sur Quaero).

L’entreprise tente de répondre aux demandes des utilisateurs, désireux d’accéder à des outils simples et à des repères, au moment où la masse de contenus devient démesurée.

  • De l’information brute à l’information sémantique

La question est de savoir comment passer de l’information brute (la vidéo) à une information sémantique (c’est le premier axe de recherche d’Orange Labs).

Par exemple, si vous voulez accéder, dans une vidéo, à un certain passage, il vous faut bien savoir où se trouve ce passage…Et pour savoir que ce passage existe, il faut bien qu’il ait été indexé et qu’un moteur de recherche vous permette de le découvrir.

  • La sémantique lexicale

Ici intervient la sémantique lexicale. C’est, dans ce cas, le repérage et la transcription d’un passage à partir de mots-clés présents dans la vidéo (intervention d’un invité, de l’animateur, etc.).

Si Pernault parle par exemple dans son journal du prix de la baguette de pain, de la neige ou des santons d’Aix-En-Provence, un algorithme de recherche sera capable de repérer ces termes.

Leur indexation dans les moteurs de recherche, puis leur recherche par l’utilisateur, seront ainsi facilités.

Ces mots-clés produits innocemment deviennent ainsi des métadonnées, c’est-à-dire des informations qui permettent d’identifier cette vidéo.

  • Présentation de l’information

Le second axe de recherche d’Orange Labs est une conséquence du premier : la présentation intelligente de l’information.

Puisque la linéarité, à l’origine imposée par le format, est ici décomposée, pour tenir compte des besoins de l’utilisateur, il faut bien fournir une interface qui organise l’accès à ces besoins. Après l’extraction des données intervient donc son découpage.

  • Pertinence du découpage

Si la procédure a l’air simple, elle se révèle en fait très complexe. Dans le cas des journaux télévisés par exemple, 30 petites secondes peuvent contenir un grand nombre d’informations à traiter séparément.

Pour gérer cette complexité, des outils et des règles heuristiques sont donc nécessaires. Ils permettent notamment de reconnaître des visages et des voix.

Par ailleurs, si un algorithme automatique est utilisé, pour récupérer les sous-titres (qui peuvent être fournis par des partenaires d’Orange Labs), l’humain est aussi présent pour désosser le contenu, l’observer, vérifier le résultat obtenu par les technologies.

Google/Youtube : indexation et montage vidéo

Grégory Quillard de Youtube/Google

Grégory Quillard, de Google/Youtube, a ensuite présenté les outils de sa compagnie (Youtube Video Editor) pour amener les utilisateurs à monter eux-mêmes leurs vidéos, traiter leurs métadonnées et sous-titres.

Google utilise ici tous ses moyens pour permettre un référencement international d’une même vidéo. Ainsi, les tags/sous-titres des utilisateurs sont traduits via Google Translate afin d’accroître son audience (vision de l’utilisateur) et de toucher davantage de gens (vision de Google).

L’indexation collaborative (les professionnels parlent aussi de folksonomies), garante d’un meilleur référencement, est également encouragée : un utilisateur peut proposer ses tags/sous-titres/titres à un autre utilisateur, propriétaire de la vidéo.

Avec plus de 35 heures de vidéo/minute et 2 milliards de stream/jour, on comprend que l’indexation, c’est-à-dire la facilité à retrouver un contenu, à partir de la pertinence des métadonnées, soit une priorité pour Google.

Indexation et livre

Demain, avec le partage des annotations, commentaires, à l’intérieur même des livres, ou dans le cas des livres enrichis qui comprennent des objets multimédias, ces technologies d’indexation seront essentielles.

Là encore, c’est l’intelligence collective qui pourrait être couplé à la technologie. La BnF, grâce à son partenariat avec Wikipédia, a par ailleurs déjà entamé ces expérimentations.

Les deux logiques de la folksonomie

On a ici affaire à mon avis à deux logiques :

  • La première, celle de Google, exploite en quelque sorte une main-d’oeuvre gratuite en jouant sur les ressorts de popularité (plus les informations de votre vidéo seront pertinents, mieux vous serez vus : soignez donc vos métadonnées). L’utilisateur a ici le rôle du producteur de métadonnées, réexploitées par Google.
  • La seconde, celle de la BnF, parie sur le bénévolat et l’investissement naturel des utilisateurs, dont la gratification est personnelle. L’utilisateur a ici le rôle du vérificateur des métadonnées mais également des machines qui les produisent. C’est quand même plus rassurant…
Advertisements

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

Qu’est-ce que ceci ?

Vous lisez actuellement Compte-rendu du deuxième atelier du Labo BnF sur le « Motion picture » à SoBookOnline.

Méta

%d blogueurs aiment cette page :