Voici donc un bref rappel de ce que sont les métadonnées, et comment les utiliser.
Méta données
Définissons d’abord le mot métadonnée: Une métadonnée est une information ou un ensemble d’informations sur une donnée ou une ressource. Si l’on considère une image ou une photo comme une ressource, les métadonnées de cette image sont donc des informations la décrivant.
Dans le domaine de la photo numérique, les deux modèles de métadonnées qui reviennent le plus souvent sont EXIF et IPTC. Ils sont universellement utilisés, reconnus, et peuvent donc être considérés comme des standards de fait.
EXIF
Le format EXIF (EXchangeable Image File) a été élaboré en 1995, par un organisme japonais, le JEIDA ( Japan Electronic Industry Development Association ). L’objectif de ce format est de donner les informations techniques de prise de vue (équipement, vitesse, ouverture, utilisation du flash, …).
On y trouve également des informations de géo-localisation.
Le format a évolué jusqu’à la version 2.2, sortie en 2002. En l’absence d’une organisation de standardisation capable de le soutenir, le format n’est plus maintenu. Il est cependant utilisé par la quasi-totalité des constructeurs d’appareils photos.
Les champs EXIF sont très nombreux. Le tableau ci-dessous donne un exemple des champs EXIF enregistrés par un Canon 40D. Vous pouvez trouver la liste complète de ces champs sur le site exif.org.
EXIF | MakerNotes | ||
---|---|---|---|
FileName | IMG_5773.CR2 | MacroMode | Normal |
Make | Canon | SelfTimer | 10 s |
Model | Canon EOS 40D | Quality | RAW |
Orientation | Horizontal (normal) | CanonFlashMode | External flash |
ExposureTime | 1/125 | ContinuousDrive | Single |
FNumber | 8.0 | FocusMode | One-shot AF |
ApertureValue | 8.0 | RecordMode | CR2 |
ExposureProgram | Manual | Contrast | Normal |
ExposureMode | Manual | Saturation | Normal |
ISO | 200 | MeteringMode | Evaluative |
ExifVersion | 0221 | FocusRange | Not Known |
DateTimeOriginal | 2008:09:30 07:50:49 | CanonFirmwareVersion | Firmware Version 1.0.3 |
CreateDate | 2008:09:30 07:50:49 | LensType | Canon EF-S 17-55mm f/2.8 IS USM |
ExposureCompensation | 0 | LongFocal | 55 mm |
MeteringMode | Multi-segment | ShortFocal | 17 mm |
Flash | On | FocalUnits | 1 |
FocalLength | 31.0 mm | MaxAperture | 2.8 |
ColorSpace | sRGB | MinAperture | 23 |
ExifImageWidth | 3888 | FlashActivity | 141 |
ExifImageHeight | 2592 | FlashBits | E-TTL, External |
BitsPerSample | 8 8 8 | MeasuredEV | 6.00 |
WhiteBalance | Auto | FocusDistanceUpper | 2.18 |
SceneCaptureType | Standard | FocusDistanceLower | 1.87 |
GPSVersionID | 2.2.0.0 | ColorTemperature | 5200 |
IPTC
Un peu d’histoire
L’International Press Telecommunications Council (IPTC), est un consortium regroupant la plupart des agences de presses du monde. Fondée en 1965, ses objectifs sont de développer, maintenir et promouvoir des standards d’échange des données dans le domaine de la presse et du journalisme.
Avec l’aide d’autres associations, telles que la NAA (Newspaper Association of America), le consortium a défini un modèle de données appelé IPTC-NAA. Ce modèle a ensuite évolué, portant le nom de IIM (Information Interchange Model). La version 4 apparue en octobre 1997 est appelée IIMV4.
La société Adobe s’est appuyé sur ce standard pour définir son propre modèle, destiné à son logiciel PhotoShop. Apparu en 2001, le modèle XMP est une amélioration notable du modèle standard. Il reprend les champs de IIM, en ajoute d’autres, et offre beaucoup plus de souplesse:
- La taille des champs n’est plus limitée,
- Le multilinguisme est géré, ainsi que les accentuations (unicode),
- Le modèle est extensible.
Pour faire évoluer le standard IIM obsolescent, l’IPTC et Adobe ont crée un groupe de travail appelé IPTC for XMP (ITPC4XMP). En 2005, ce groupe de travail donne naissance au modèle IPTC Core 1.0, chargé de remplacer les modèles existants basés sur IIM.
Basé sur XMP, IPTC Core 1.0, reprend la plupart des champs définis par IIM, et en ajoute de nouveaux, pour une meilleure description du contenu (Intellectual Genre, IPTC Scene
), et la gestion des droits (Rights Usage Terms
). Certains champs disparaissent, comme Category
et subCategory
.
C’est une évolution de ce modèle IPTC qui est aujourd’hui utilisé par la plupart des logiciels du marché, qu’ils soient commerciaux ou open source.
Les champs
Lorsque cet article a été publié, la gestion des métadonnées IPTC par les logiciels, ne me semblait pas très claire. Tous les logiciels n’utilisaient pas le même modèle (IIM / XMP), et n’utilisaient pas non plus les mêmes conventions pour les noms des champs. Certains se contentaient d’empiler les différentes informations saisies dans un champ mot-clé.
Depuis les choses évoluent positivement: la plupart des logiciels se basent sur le modèle IPTC Standard, et les conventions de nommage sont plus cohérentes. Nous n’avons donc plus trop à nous poser de questions concernant les champs à utiliser, ne pas utiliser …
Pour garder une certaine compatibilité avec le modèle IIM, et leurs versions antérieures, certains logiciels conservent toutefois des champs et des noms de champs, qui sont obsolètes aujourd’hui.
Le tableau suivant présente la plupart des champs du modèle IPTC Core 1.0:
Description de l’image
Champ | Description | Commentaires |
---|---|---|
Date Created | Date de création | Attention, existe déjà dans les champs EXIF |
Intellectual genre (1) | domaine | Description du sujet traité (pas forcement du contenu) |
Scene code (1) | Scene | Description de la scène figurant sur la photo (exemple: actualité, interview, rétrospective, …) |
Sublocation / Location | Lieu / Emplacement | Lieu de prise de vue |
City | Ville | - |
Province or State | Région | - |
Country | Pays | - |
Country code | Code du pays | 2 à 3 caractères. Les codes sont normalisés – ISO 3160 |
Description du contenu
Champ | Description | Commentaire |
---|---|---|
Headline | Titre principal Entête | Ce champ peut-être considéré comme une description ou un sous-titre. |
Description | Description | Description de la photo |
Keywords | Mots-Clés | Champ libre permettant une description précise de la scène |
Subject Code (1) | Rubrique | Classification du sujet (exemple: Police/Arrestation, Finances/Banque, Médias/Cinéma …). Peut-être comparé aux rubriques d’un journal. |
Description Writer | Auteur de la description | – |
Status
Champ | Description | Commentaire |
---|---|---|
Title | Titre du document | Titre principal |
Job Id | Identifiant de la tâche | – |
Instructions | Instructions | Champ libre |
Provider / CreditLine | Fournisseur | – |
Source | Source | – |
Copyright Notice | Mentions légales | Copyright © – 2008 – Emmanuel GEORJON |
Rights Usage Terms | Conditions d’utilisation | License Creative Commons NA-BY-… |
Contact
Champ | Description | Commentaire |
---|---|---|
Creator | Créateur | – |
Creator’s jobtitle | Fonction du créateur | – |
Address | Adresse | Coordonnées du créateur |
City | Ville | Coordonnées du créateur |
Country | Pays | Coordonnées du créateur |
Email address(es) | Adresse de messagerie | Coordonnées du créateur |
Phone number(s) | Numéro de téléphone | Coordonnées du créateur |
Postal Code | Code postal | Coordonnées du créateur |
State/Provice | Région | Coordonnées du créateur |
Web URL(s) | – | - |
(1) Les codes sont nomenclaturés. Les listes sont disponibles sur le site de l’IPTC
Ou sont stockées les métadonnées
Les balises EXIF sont de type interne: elles sont systématiquement stockées dans l’image. Pour les informations IPTC, les choses sont un peu plus compliquées: Dans le cas des fichiers JPEG, elles sont internes. Dans le cas des fichiers RAW, elles sont souvent stockées dans un fichier annexe, pourtant le même nom que la photo, mais suffixé différemment, l’extension souvent rencontré étant XMP.
Lorsque vous effectuez des opérations sur des fichiers RAW, veillez bien à ce que les fichiers XMP s’il y en a, suivent les fichiers «image».
Concurrents ou complémentaires
Le début de cet exposé sous-entend que les balises EXIF sont dédiées aux informations techniques de la prise de vue, tandis que les balises IPTC permettent une description sémantique du contenu de la photo.
Cette affirmation est plus ou moins vraie: certains champs EXIF permettent de décrire la photo (Exif ImageDescription, Exif Artist, Exif Copyright …). De même, les champs IPTC permettent de définir des dates de prises de vue, alors que ces informations sont déjà stockées dans le modèle EXIF.
Mais concrètement, la plupart des logiciels adoptent cette dichotomie EXIF/technique et IPTC/sémantique.
A quoi servent les métadonnées
Comme expliqué précédemment, les données EXIF sont plutôt orientées « prise de vue ». Ces informations servent
- aux logiciels, pour identifier le matériel utilisé,
- aux photographes, pour comprendre les paramètres d’une prise de vue.
Si vous avez l’habitude de consulter régulièrement des galeries photos comme FlickR, ou 500px, vous avez sans doute consulté les données de prises de vue. Ces informations viennent des données EXIF. C’est un formidable outil d’apprentissage.
Vous pouvez consulter les données EXIF des photos dispnibles sur n’importe quel site avec des extensions comme Exif Viewer pour Microsoft Edge, ou pour Chrome.
Le rôle des balises IPTC est ce qui a réellement motivé mon intérêt pour les métadonnées:
- Un simple classement par répertoire ne suffit pas à classer efficacement des photos: Aussi élaborée qu’elle soit, une arborescence de répertoire ne permet pas de classements multicritères,
- Après 10, 20 ou 30 ans, comment retouver des photos, dont nous avons le souvenir, sans pour autant avoir garder en mémoire les circonstances de prises de vue ?
Les balises IPTC nous permettent une descriptions détaillée, et multi-critères de nos photos: le lieu, l’évènement, le sujet, l’auteur, le reportage, s’il s’agit d’une photo de nuit, en extérieur, qui se trouve dessus, … Dans le cas des fichiers JPEG, les informations étant stockées dans le fichier, elles sont définitivement associées à l’image, et elles peuvent être indexées par des logiciels ou le système d’exploitation que vous utilisez.
Exemple d’utilisation:
- Lors du classement de mes photos, je m’assure que le prénom des personnes y figure, et j’indique également si les personnes sont seuls, à deux ou plusieurs.
- Dans la capture d’écran ci-dessous, j’utilise l’explorateur de fichier (Windows), pour rechercher une photo avec Théo et Louis uniquement (donc paramètres
Louis
,Theo
,deux
). - J’aurais pu de la même façon recherche les photos de Louis uniquement (avec
louis
,seul
), ou des portraits de Louis (louis
,portrait
).
Les outils
Quasiment tous les outils savent, aujourd’hui, gérer l’édition des données ITPC et EXIF. Si vous avez l’intention de vous lancer dans une indexation sérieuse de vos photos, il faut cependant veiller à deux points:
- Compatibilité avec la norme IPTC, et respect de l’utilisation des champs. Certains logiciels stockent l’intégralité des données saisies dans deux ou trois champs, au lieu d’utiliser les champs IPTC adéquats.
- Stockage des métadonnées, dans les fichiers eux-mêmes, et pas dans un catalogue propre au logiciel. Cela vous permettra ultérieurement, de changer de logiciel, sans difficultés.
Conclusion
Si vous êtes un photographe régulier, l’indexation de votre production va devenir une évidence (si ce n’est pas déjà le cas). Les métadonnées constitue un excellent moyen pour le faire. Elle permet une classification, un tri ou des recherches selon plusieurs critères, et garantissent l’indépendance vis-à-vis des outils d’édition que vous utilisez.
Références
- Site officiel de l’IPTC –IPTC
- Le site «non officiel» de l’EXIF –exif.org
- (plus ancien) Métadonnées: une initiation Dublin Core, IPTC, Exif, RDF, XMP, etc. – Patrick Peccatte –PIM – Philosophie, Informatique, Mathématiques
Commentaires