Du bon usage des photos de stock

Le service TinEye de la société canadienne Idée était depuis 2008 le seul outil gratuit permettant d’effectuer des recherches inversées d’images. La nouvelle fonctionnalité Search by Image [SbI dans la suite de ce billet] proposée récemment par Google Images porte désormais ce type de recherche à une échelle bien plus vaste. Cette nouveauté a d’ailleurs été accueillie sportivement mais avec un peu d’inquiétude par TinEye.

La base de TinEye référence des images ajoutées par un robot crawlant le Web. Mais elle contient également des images provenant de contributeurs partenaires tels que GettyImages, iStockphoto, Photoshelter, etc. Il s’agit là d’un point fort du service puisque ces collections intégrées constituent une partie organisée et contrôlée de la base indexée permettant à l’aide du moteur d’identifier parfois l’origine probable d’une image utilisée sur le Web.

Cependant, bien que TinEye revendique deux milliards d’images indexées, sa base demeure peu volumineuse par rapport à celle du mastodonte Google Images. Et surtout, l’utilisateur ne peut effectuer qu’un nombre limité de recherches: 50 dans une même journée et 150 par semaine. Pour s’affranchir de cette limitation, il doit souscrire un abonnement commercial qui autorise aussi l’automatisation des recherches à l’aide de l’API du système.

Le service gratuit et grand public de TinEye apparaît donc comme un produit d’appel – au demeurant fort utile – qui permet à la société Idée de proposer ensuite une offre commerciale comme il en existe d’autres réservées au monde professionnel1.

Google SbI quant à lui opère sur une base d’images bien plus grande que TinEye et n’impose pas de limite dans le temps au nombre de recherches effectuées. Par contre, toutes les images retrouvées proviennent du crawling réalisé par les robots du moteur. Aucune image indexée n’a été préalablement sélectionnée et éditorialisée dans une collection fournie par un prestataire quelconque. Ces différences majeures conduisent donc à considérer que pour un utilisateur “lambda” n’ayant pas investi dans un service professionnel, TinEye et Google SbI sont complémentaires plutôt que concurrents.

Analyser l’utilisation des photos de stock

Jusqu’à l’apparition de Google SbI, seules des recherches inversées très ponctuelles étaient possibles à l’aide de TinEye; il n’était guère envisageable de réaliser une analyse exhaustive des images utilisées sur un site complet, sauf à acquérir une licence d’un logiciel professionnel (et encore…). La conjugaison des deux services permet dorénavant de conduire rapidement des études intéressantes sur les utilisations des photos de stocks par les sites d’entreprises ou institutionnels. Voici quelques exemples.

Soit le site daucy.fr d’une marque bien connue sur le marché des légumes en conserve2 .

Une analyse globale de ce site permet d’identifier 627 images différentes réparties ainsi:

  • 352 photos de produits comportant le nom de la marque,
  • 68 images “de service” (boutons, lignes, signes graphiques divers),
  • 207 photos d’illustration choisies d’après le contexte de la page où elles apparaissent mais qui ne comportent pas le nom de la marque.

La méthodologie suivie pour repérer les images de stock utilisées est simple. Elle ne concerne bien évidemment que la dernière catégorie d’images. Deux “filtres” successifs sont mis en œuvre. Il s’agit d’analyser d’abord chacune de ces 207 photos à l’aide de Google SbI. Ensuite, les photos qui ne paraissent pas issues de banques de stock selon ce premier crible sont analysées à l’aide de TinEye.

Le procédé permet de repérer rapidement 106 photos clairement issues de banques de stock et 101 photos qui, selon nos deux logiciels détectives, sont inconnues ailleurs que sur daucy.fr. Mais cette répartition presque exactement à parts égales ne constitue en fait qu’une limite basse pour les photos de stock. Tout d’abord, le service TinEye n’a pu être utilisé dans cette expérience sur toutes les images que nous souhaitions analyser en raison des limitations temporelles expliquées ci-dessus. Ensuite, le fait qu’une image ne soit pas reconnue dans les index de Google SbI et TinEye ne signifie pas qu’elle ne provient pas d’une banque de stock. C’est ainsi que les nombreuses photos de recettes qui figurent sur le site en question proviennent presque certainement toutes de microstocks ou de banques généralistes ou spécialisées dans le culinaire3 qui demeurent à l’écart des crawlers des deux services. Au final donc, seule une poignée de photos d’illustration de ce site ont été réalisées expressément pour le commanditaire. La plupart des images où ne figurent pas le nom de la marque n’ont aucun lien avec la réalité de l’entreprise. Ce sont des images décoratives composées a priori et partagées par de nombreux autres sites.

On rétorquera sans doute que ce phénomène d’utilisation massive des images de stock est bien connu. Certes, mais il est désormais possible de quantifier précisément le ratio entre photos de stock et photos originales utilisées sur un site. Et pour les raisons qui viennent d’être données, ce ratio sur lequel les studios graphiques ne communiquent pratiquement jamais est toujours plus élevé que celui établi par l’investigation réalisable maintenant avec la recherche inversée. Cette possibilité d’analyse et de quantification d’une pratique très répandue est certainement nouvelle. On peut cependant aller plus loin en examinant plus précisément la nature de ces images partagées et détecter ainsi quelques utilisations curieuses ou même problématiques des photos de stock.

Examinons par exemple la page intitulée “Les légumes : indispensables pour un repas équilibré“:


Les trois images sont des photos de stock provenant des banques Getty Images (1) et iStockphoto (2 et 3), et elles sont utilisées sur de nombreux sites variés comme on peut s’en rendre compte à l’aide des requêtes suivantes sur Google SbI: 1, 2, 3.

En fait presque toutes les photos de légumes frais qui figurent sur ce site proviennent de stocks et un esprit un peu taquin pourrait penser que la marque préfère présenter ces belles images de produits appétissants plutôt que les légumes qu’elle utilise réellement4.

Mais après tout, une carotte est toujours une carotte et l’on peut estimer que ces images qui se retrouvent dans d’autres contextes que celui de l’entreprise n’ont pas grande importance. L’usage de photos passe-partout devient par contre plus problématique quand il s’agit d’images de personnes. Examinons maintenant la page “Dans les ateliers de production“:


En un clic, on s’aperçoit que la jeune femme en blanc qui illustre le paragraphe “Qualité” travaille aussi dans un laboratoire vétérinaire, dans le secteur pharmaceutique, dans le contrôle qualité, dans un laboratoire d’investigation criminelle, etc. Et toutes ces activités concomitantes se déroulent en Asie, en Europe, aux États-Unis.

Un autre clic nous apprend que la chercheuse en petits pois du second paragraphe est aussi secrétaire dans une agence du Crédit Agricole, teste des produits médicaux, participe au denier du culte en Allemagne, sans oublier qu’elle a aussi une carrière bien remplie d’astrologue.

La tromperie peut être encore plus flagrante. Pour ce dernier exemple, quittons nos légumes et observons le site de la très sérieuse Fédération Bancaire Française, sur sa page “Découvrez les métiers de la banque“.

Lorsque l’on clique sur l’un des métiers mentionnés en lien, une fiche descriptive apparaît, souvent terminée par un témoignage. Tous les portraits qui accompagnent ces témoignages sont factices. Ce sont des photos de stock. Ainsi, Olivier (trader à Paris) poursuit de multiples carrières aux quatre coins du monde et Étienne (juriste en banque de détail) n’en finit pas de se démultiplier pour satisfaire tous ses brillants employeurs. Ces pratiques que l’on aurait pu croire réservées aux pires sites de rencontre passaient auparavant facilement inaperçues. L’honorable institution qu’est la FBF est pourtant bien coupable de bidonnages, moins spectaculaires mais aussi intéressants que celui qui vient de se dérouler sur TF1.

Témoignages bidonnés sur le site de la Fédération Bancaire Française

Les professionnels de la photographie ont en général bien accueilli Google SbI. Ils voient dans cette fonctionnalité une aide à l’identification des usages illicites des photos. Mais au delà de cette “chasse aux photos volées”, les services de recherche inversée constituent aussi des outils fort utiles pour l’amélioration des usages iconographiques. Les directeurs artistiques doivent devenir extrêmement attentifs lorsqu’ils choisissent des images. Il est indispensable qu’ils identifient systématiquement les usages passés éventuels d’une photo qui retient leur attention. Les agences peuvent aussi mettre en évidence auprès de leurs clients les effets pervers de la concentration et de l’assèchement des sources d’images. Les photographes enfin disposent avec ces outils d’un moyen d’influencer leurs commanditaires afin de mettre en avant leurs images personnalisées et créatives.

Sur Google Search by Image, voir aussi l’article À la recherche d’un singe photographe.

  1. En France, le service professionnel le plus connu est PixTrakk, développé conjointement par LTU Technologies, PixWays, et TNS Media Intelligence. []
  2. Ce choix est presque totalement arbitraire. Un seule critère est ici important: afin que l’analyse décrite ci-dessous ne demande pas trop de temps tout en demeurant significative, le site devait contenir entre 500 et 1000 images environ. Il convient aussi de préciser que la marque possède d’autres sites: daucyfoodservices.com, daucyculture.fr, daucy.com, daucykid.com. []
  3. On peut citer par exemple StockFood et Option Photo. []
  4. Il en est de même bien sûr chez ses concurrents comme on peut s’en assurer en lançant des recherches Google SbI sur chacune des images de légumes qui figurent dans les pages de cette liste. []

16 Reponses à “ Du bon usage des photos de stock ”

  1. Merci Patrick pour ce signalement. Google Sbl a l’air très efficace.
    Mais son fonctionnement me semble finalement bien plus mystérieux que Nadia. http://culturevisuelle.org/viesociale/2012
    Quels sont les critères de la “ressemblance”? Comment sont trouvées les photos de la rubrique “Images similaires”? Est-ce que ce sont les mêmes critères que pour trouver les images identiques? Ca colle pas trop mal sur les images genre coucher de soleil, mais sur les autres, le résultat est surprenant.

    Dans un autre ordre d’idée, la rubrique “Images similaires” ne sera-t-elle pas dans l’avenir le jackpot de Google. Si une banque d’images paie, ses images seraient proposées prioritairement dans la rubrique “Images similaires”?

  2. La fonctionnalité “Similar Images” n’est pas nouvelle sur Google Images. Elle date d’octobre 2009. “Search by Image” par contre est bien une nouveauté importante, et je suis d’accord, c’est efficace. Je ne suis pas du tout convaincu par contre que la présentation qui mixe les résultats des deux types de recherche soit une bonne idée. Je pense qu’une distinction claire aurait été préférable. Il s’agit de deux types de recherches bien distincts.
    Je crois qu’il est impossible de répondre à tes questions concernant les critères de ressemblance et d’identité utilisés car Google ne communique jamais avec précision sur les algorithmes qui sont mis en oeuvre dans ses outils. Tout au plus peut-on dire qu’ils utilisent certainement des techniques semblables à celles de ses concurrents comme les fingerprints chez TinEye.
    Il est possible effectivement que Google monétise une jour le rank de ses résultats de recherche par similarité, mais il faudrait pour cela qu’ils établissent des partenariats avec des banques d’images. Je ne crois pas que cela existe pour l’instant.

  3. J’ai été voir le lien d’octobre 2009. Si j’en juge par leur exemple, la similarité semble venir des mots clefs. Ce qui ôterait tout mystère au fonctionnement de la fonction “similaire”. Mais ce n’est pas ce que j’ai constaté en me livrant à quelques tests.
    Alors est-ce que cela n’a jamais été le cas, ou que est ce que pour développer la fonction “Search by Images”, ils ont développé des algorithmes basés sur le contenu visuel de l’image qu’ils ont intégrés progressivement à la fonction “similaires”?

    Mixer les deux types de recherche pourra avoir du sens économiquement s’ils établissent un partenariat avec les banques d’images lorsque la fonction sera devenue populaire.

  4. “Similar Images” et “Search by Image” s’appuient sur l’analyse du contenu des images. Pour les principes expliqués sommairement voir sur Wikipedia.
    Sur “Search by Image”, voir aussi l’expérience intéressante décrite ici.

  5. Vincent Lecourt le 28 juin 2011 à 23:13

    Billet passionnant! J’ai l’impression que search by image ne fonctionne pas avec Flickr. J’ai testé avec quelques photos issues du compte de B. Obama, sans succès. J’ai également essayé avec des clichés issus de ma galerie et qui ont été repris sur plusieurs blogs, mais silence radio (http://flic.kr/p/914vHU).

  6. @Vincent: Merci pour l’appréciation. Une bonne cinquantaine d’occurrences de votre photo de DSK sont identifiées par SbI. Le cliché de votre compte Flickr figure en page 3 des résultats du moteur.

  7. Vincent Lecourt le 30 juin 2011 à 20:40

    @Patrick: merci d’avoir pris le temps de regarder. Je n’ai pas dû coller la bonne url de la photo, d’où l’absence de réponses de SbI . Je pensais (naïvement) qu’il suffisait de reprendre le lien proposé par Flickr dans l’option “partager”, mais en fait cela renvoie à la page Flickr dans son entier et pas uniquement au fichier image avec son extension jpg

  8. [...] Du bon usage des photos de stock – Déjà vu [...]

  9. [...] fonctionnalité Seach by Image [SbI] de Google facilite comme nous l’avons vu l’analyse des utilisations variées des images de stock; elle ouvre également de réelles possibilités dans le cas de ces anciennes photos remises en [...]

  10. [...] récents, les outils de recherche d’images évoqués dans deux billets précédents (ici et là) permettent d’identifier facilement nombre de peintures, sculptures, œuvres [...]

  11. [...] lire chez Patrick : du bon usage des photos de stock et A la recherche d’un singe [...]

  12. [...] en particulier les chercheurs attentifs aux images, telles que Google Images Sort by subject ou Search by Image. Le livre est toutefois complété par un blog que le lecteur intéressé par l’actualité [...]

  13. [...] Google, encyclopédie des images. Alors que l’image était un fichier opaque inaccessible au search, le lancement par Google de la recherche par image ramène le visuel dans l’indexabilité numérique et transforme son immense mémoire visuelle en espace de consultation encyclopédique. Une révolution qui ne fait que commencer, et qui a déjà largement transformé la nature de l’information visuelle (lire: Patrick Peccatte: “Du bon usage des photos de stock“). [...]

  14. Je reviens sur ce billet (toujours aussi intéressant) pour signaler en écho (lointain) ce tumblr très “culture visuelle” assez désopilant réalisé par une agence de com. Une initiative très sympa (et soignée, ce qui ne gâche rien) ;-)
    http://danslavielibrededroits.tumblr.com/
    AM

  15. [...] Exemple: 3.1 Du bon usage des photos de stock [...]

Adresser une réponse