Photos numériques: Présentation des métadonnées

Avec la photo numérique est apparu un nouveau vocabulaire. Les métadonnées, et les acronymes EXIF et IPTC en font partie. Ils constituent également un excellent exemple de technologie dont on parle depuis longtemps, sans disposer pour autant, d’outils réellement efficaces pour les exploiter. Aujourd’hui ce n’est plus le cas: les logiciels grand public offrent un support complet et satisfaisant de ces informations.

Photos numériques: Présentation des métadonnées

Voici donc un bref rappel de ce que sont les métadonnées, et comment les utiliser.

Méta données

Définissons d’abord le mot métadonnée: Une métadonnée est une information ou un ensemble d’informations sur une donnée ou une ressource. Si l’on considère une image ou une photo comme une ressource, les métadonnées de cette image sont donc des informations la décrivant.

Dans le domaine de la photo numérique, les deux modèles de métadonnées qui reviennent le plus souvent sont EXIF et IPTC. Ils sont universellement utilisés, reconnus, et peuvent donc être considérés comme des standards de fait.

EXIF

Le format EXIF (EXchangeable Image File) a été élaboré en 1995, par un organisme japonais, le JEIDA ( Japan Electronic Industry Development Association ). L’objectif de ce format est de donner les informations techniques de prise de vue (équipement, vitesse, ouverture, utilisation du flash, …).

On y trouve également des informations de géo-localisation.

Le format a évolué jusqu’à la version 2.2, sortie en 2002. En l’absence d’une organisation de standardisation capable de le soutenir, le format n’est plus maintenu. Il est cependant utilisé par la quasi-totalité des constructeurs d’appareils photos.

Les champs EXIF sont très nombreux. Le tableau ci-dessous donne un exemple des champs EXIF enregistrés par un Canon 40D. Vous pouvez trouver la liste complète de ces champs sur le site exif.org.

EXIFMakerNotes
FileNameIMG_5773.CR2MacroModeNormal
MakeCanonSelfTimer10 s
ModelCanon EOS 40DQualityRAW
OrientationHorizontal (normal)CanonFlashModeExternal flash
ExposureTime1/125ContinuousDriveSingle
FNumber8.0FocusModeOne-shot AF
ApertureValue8.0RecordModeCR2
ExposureProgramManualContrastNormal
ExposureModeManualSaturationNormal
ISO200MeteringModeEvaluative
ExifVersion0221FocusRangeNot Known
DateTimeOriginal2008:09:30 07:50:49CanonFirmwareVersionFirmware Version 1.0.3
CreateDate2008:09:30 07:50:49LensTypeCanon EF-S 17-55mm f/2.8 IS USM
ExposureCompensation0LongFocal55 mm
MeteringModeMulti-segmentShortFocal17 mm
FlashOnFocalUnits1
FocalLength31.0 mmMaxAperture2.8
ColorSpacesRGBMinAperture23
ExifImageWidth3888FlashActivity141
ExifImageHeight2592FlashBitsE-TTL, External
BitsPerSample8 8 8MeasuredEV6.00
WhiteBalanceAutoFocusDistanceUpper2.18
SceneCaptureTypeStandardFocusDistanceLower1.87
GPSVersionID2.2.0.0ColorTemperature5200

IPTC

Un peu d’histoire

L’International Press Telecommunications Council (IPTC), est un consortium regroupant la plupart des agences de presses du monde. Fondée en 1965, ses objectifs sont de développer, maintenir et promouvoir des standards d’échange des données dans le domaine de la presse et du journalisme.

Avec l’aide d’autres associations, telles que la NAA (Newspaper Association of America), le consortium a défini un modèle de données appelé IPTC-NAA. Ce modèle a ensuite évolué, portant le nom de IIM (Information Interchange Model). La version 4 apparue en octobre 1997 est appelée IIMV4.

La société Adobe s’est appuyé sur ce standard pour définir son propre modèle, destiné à son logiciel PhotoShop. Apparu en 2001, le modèle XMP est une amélioration notable du modèle standard. Il reprend les champs de IIM, en ajoute d’autres, et offre beaucoup plus de souplesse:

  • La taille des champs n’est plus limitée,
  • Le multilinguisme est géré, ainsi que les accentuations (unicode),
  • Le modèle est extensible.

Pour faire évoluer le standard IIM obsolescent, l’IPTC et Adobe ont crée un groupe de travail appelé IPTC for XMP (ITPC4XMP). En 2005, ce groupe de travail donne naissance au modèle IPTC Core 1.0, chargé de remplacer les modèles existants basés sur IIM.

Basé sur XMP, IPTC Core 1.0, reprend la plupart des champs définis par IIM, et en ajoute de nouveaux, pour une meilleure description du contenu (Intellectual Genre, IPTC Scene), et la gestion des droits (Rights Usage Terms). Certains champs disparaissent, comme Category et subCategory.

C’est une évolution de ce modèle IPTC qui est aujourd’hui utilisé par la plupart des logiciels du marché, qu’ils soient commerciaux ou open source.

Les champs

Lorsque cet article a été publié, la gestion des métadonnées IPTC par les logiciels, ne me semblait pas très claire. Tous les logiciels n’utilisaient pas le même modèle (IIM / XMP), et n’utilisaient pas non plus les mêmes conventions pour les noms des champs. Certains se contentaient d’empiler les différentes informations saisies dans un champ mot-clé.

Depuis les choses évoluent positivement: la plupart des logiciels se basent sur le modèle IPTC Standard, et les conventions de nommage sont plus cohérentes. Nous n’avons donc plus trop à nous poser de questions concernant les champs à utiliser, ne pas utiliser …

Pour garder une certaine compatibilité avec le modèle IIM, et leurs versions antérieures, certains logiciels conservent toutefois des champs et des noms de champs, qui sont obsolètes aujourd’hui.

Le tableau suivant présente la plupart des champs du modèle IPTC Core 1.0:

Description de l’image

ChampDescriptionCommentaires
Date CreatedDate de créationAttention, existe déjà dans les champs EXIF
Intellectual genre (1)domaineDescription du sujet traité (pas forcement du contenu)
Scene code (1)SceneDescription de la scène figurant sur la photo (exemple: actualité, interview, rétrospective, …)
Sublocation / LocationLieu / EmplacementLieu de prise de vue
CityVille-
Province or StateRégion-
CountryPays-
Country codeCode du pays2 à 3 caractères. Les codes sont normalisés – ISO 3160

Description du contenu

ChampDescriptionCommentaire
HeadlineTitre principal EntêteCe champ peut-être considéré comme une description ou un sous-titre.
DescriptionDescriptionDescription de la photo
KeywordsMots-ClésChamp libre permettant une description précise de la scène
Subject Code (1)RubriqueClassification du sujet (exemple: Police/Arrestation, Finances/Banque, Médias/Cinéma …). Peut-être comparé aux rubriques d’un journal.
Description WriterAuteur de la description

Status

ChampDescriptionCommentaire
TitleTitre du documentTitre principal
Job IdIdentifiant de la tâche
InstructionsInstructionsChamp libre
Provider / CreditLineFournisseur
SourceSource
Copyright NoticeMentions légalesCopyright © – 2008 – Emmanuel GEORJON
Rights Usage TermsConditions d’utilisationLicense Creative Commons NA-BY-…

Contact

ChampDescriptionCommentaire
CreatorCréateur
Creator’s jobtitleFonction du créateur
AddressAdresseCoordonnées du créateur
CityVilleCoordonnées du créateur
CountryPaysCoordonnées du créateur
Email address(es)Adresse de messagerieCoordonnées du créateur
Phone number(s)Numéro de téléphoneCoordonnées du créateur
Postal CodeCode postalCoordonnées du créateur
State/ProviceRégionCoordonnées du créateur
Web URL(s)-

(1) Les codes sont nomenclaturés. Les listes sont disponibles sur le site de l’IPTC

Ou sont stockées les métadonnées

Les balises EXIF sont de type interne: elles sont systématiquement stockées dans l’image. Pour les informations IPTC, les choses sont un peu plus compliquées: Dans le cas des fichiers JPEG, elles sont internes. Dans le cas des fichiers RAW, elles sont souvent stockées dans un fichier annexe, pourtant le même nom que la photo, mais suffixé différemment, l’extension souvent rencontré étant XMP.

Lorsque vous effectuez des opérations sur des fichiers RAW, veillez bien à ce que les fichiers XMP s’il y en a, suivent les fichiers «image».

Concurrents ou complémentaires

Le début de cet exposé sous-entend que les balises EXIF sont dédiées aux informations techniques de la prise de vue, tandis que les balises IPTC permettent une description sémantique du contenu de la photo.

Cette affirmation est plus ou moins vraie: certains champs EXIF permettent de décrire la photo (Exif ImageDescription, Exif Artist, Exif Copyright …). De même, les champs IPTC permettent de définir des dates de prises de vue, alors que ces informations sont déjà stockées dans le modèle EXIF.

Mais concrètement, la plupart des logiciels adoptent cette dichotomie EXIF/technique et IPTC/sémantique.

A quoi servent les métadonnées

Comme expliqué précédemment, les données EXIF sont plutôt orientées « prise de vue ». Ces informations servent

  • aux logiciels, pour identifier le matériel utilisé,
  • aux photographes, pour comprendre les paramètres d’une prise de vue.

Si vous avez l’habitude de consulter régulièrement des galeries photos comme FlickR, ou 500px, vous avez sans doute consulté les données de prises de vue. Ces informations viennent des données EXIF. C’est un formidable outil d’apprentissage.

Vous pouvez consulter les données EXIF des photos dispnibles sur n’importe quel site avec des extensions comme Exif Viewer pour Microsoft Edge, ou pour Chrome.

Le rôle des balises IPTC est ce qui a réellement motivé mon intérêt pour les métadonnées:

  • Un simple classement par répertoire ne suffit pas à classer efficacement des photos: Aussi élaborée qu’elle soit, une arborescence de répertoire ne permet pas de classements multicritères,
  • Après 10, 20 ou 30 ans, comment retouver des photos, dont nous avons le souvenir, sans pour autant avoir garder en mémoire les circonstances de prises de vue ?

Les balises IPTC nous permettent une descriptions détaillée, et multi-critères de nos photos: le lieu, l’évènement, le sujet, l’auteur, le reportage, s’il s’agit d’une photo de nuit, en extérieur, qui se trouve dessus, … Dans le cas des fichiers JPEG, les informations étant stockées dans le fichier, elles sont définitivement associées à l’image, et elles peuvent être indexées par des logiciels ou le système d’exploitation que vous utilisez.

Exemple d’utilisation:

  • Lors du classement de mes photos, je m’assure que le prénom des personnes y figure, et j’indique également si les personnes sont seuls, à deux ou plusieurs.
  • Dans la capture d’écran ci-dessous, j’utilise l’explorateur de fichier (Windows), pour rechercher une photo avec Théo et Louis uniquement (donc paramètres Louis, Theo, deux).
  • J’aurais pu de la même façon recherche les photos de Louis uniquement (avec louis, seul), ou des portraits de Louis (louis, portrait).

Exemple de recherche sous Windows
Exemple de recherche sous Windows

Les outils

Quasiment tous les outils savent, aujourd’hui, gérer l’édition des données ITPC et EXIF. Si vous avez l’intention de vous lancer dans une indexation sérieuse de vos photos, il faut cependant veiller à deux points:

  • Compatibilité avec la norme IPTC, et respect de l’utilisation des champs. Certains logiciels stockent l’intégralité des données saisies dans deux ou trois champs, au lieu d’utiliser les champs IPTC adéquats.
  • Stockage des métadonnées, dans les fichiers eux-mêmes, et pas dans un catalogue propre au logiciel. Cela vous permettra ultérieurement, de changer de logiciel, sans difficultés.

Conclusion

Si vous êtes un photographe régulier, l’indexation de votre production va devenir une évidence (si ce n’est pas déjà le cas). Les métadonnées constitue un excellent moyen pour le faire. Elle permet une classification, un tri ou des recherches selon plusieurs critères, et garantissent l’indépendance vis-à-vis des outils d’édition que vous utilisez.

Références

Commentaires