Commons:Données exploitables par des programmes

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Commons:Machine-readable data and the translation is 85% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Machine-readable data and have to be approved by a translation administrator.
Outdated translations are marked like this.

Shortcut: COM:MRD

Sur Wikimédia Commons, de nombreuses métadonnées (incluant la licence et l'auteur) ne sont pas exploitables par des programmes. Il existe un module d'API, iiprop=extmetadata, qui peut être utilisé pour extraire certaines valeurs (exemple), mais comme les informations sont entrées comme texte libre dans la page de description du fichier, le résultat n'est pas parfait. Le projet en cours, données structurées de Commons, vise à déplacer les métadonnées, en tant que données entièrement structurées, ce qui devrait au final permettre de remplacer les données exploitables par des programmes présentées sur cette page.

Dans l'intervalle, et pour faciliter la transition à venir vers des données structurées, Wikimédia Commons utilise une série de modèles qui sont exploitables par des programmes de plusieurs manières, via les balises HTML. Certains scripts utilisent déjà cette possibilité. Il est important de noter que ces données sont disponibles pour tous les wikis qui utilisent Wikimédia Commons, où elles peuvent être lues dans le code HTML de la page Fichier: tout comme les autres données locales.

Données exploitables par des programmes

Données exploitables par des programmes ajoutées par des modèles de type infobox

Voici différents éléments HTML des modèles de description qui permettent de lire les informations:

  • Les microformats qui suivent les standards et peuvent être lus par des parser déjà existants.
  • Les attributs id (identifiants) des balises <td> sont des valeurs personnalisées qui permettent de compléter ces balises, ils doivent pouvoir être lus par des outils adaptés. La plupart des boîtes d'information les plus courantes ont deux colonnes : la première contient les noms des champs et la seconde contient les valeurs associées à ces champs
    • Traditionnellement, les attributs id des balises <td> étaient utilisés pour marquer l'appel au nom d'un champ dans la première colonne d'une ligne. Pour obtenir la valeur associée, il faut récupérer le contenu de la cellule <td> suivante, située dans la seconde colonne.
    • Les modèles {{Creator}} et {{Institution}} ont une structure plus compliquée, ce qui fait que les cellules contenant les données sont marquées par des balise avec des attributs utilisant une couleur de fond magenta.
Modèle Nom du paramètre du modèle Description identifiant de l'attribut de la balise <td> microformats Commentaire
{{Information}} description description du fichier fileinfotpl_desc hProduct.description. Contient souvent plusieurs langues, annotées avec le modèle {{Lang}}.
{{Information}} date date de création de l’œuvre originale fileinfotpl_date hCalendar vevent.dtstart Contient la date de publication soit seule, soit en complément de la date de création. Ces deux dates ont un sens différent du point de vue des droits d'auteur. L'utilisation du modèle {{Date context}} permet de mentionner cette différence. Microformat ajouté par le modèle {{Date}}.
{{Information}} source source du fichier fileinfotpl_src Contient souvent des tableaux complets. Nous ne disposons pas encore de moyens efficaces de gérer ce type de modèle décrivant des sources. Les modèles décrivant les sources font souvent référence à des identifiants dans des catalogues, mais ces derniers ne sont pas non plus des données exploitables par des programmes.
{{Information}} author auteur du fichier fileinfotpl_aut Ceci peut être un auteur, un créateur et/ou un détenteur des droits de manière indifférenciée. Contient souvent le modèle {{Creator}}, décrit plus bas.
{{Information}} permission licence/permission pour le fichier fileinfotpl_perm
{{Information}} other versions autres version du fichier fileinfotpl_ver
{{Artwork}} description description de l’œuvre fileinfotpl_desc hProduct.description
{{Artwork}} date date de création de l’œuvre originale fileinfotpl_date hCalendar vevent.dtstart Microformat ajouté par le modèle {{Date}}
{{Artwork}} source source du fichier fileinfotpl_src
{{Artwork}} artist créateur de l’œuvre fileinfotpl_aut "hProduct.fn value"
{{Artwork}} author auteur de l’œuvre d'art fileinfotpl_aut "hProduct.fn value"
{{Artwork}} permission licence/permission pour le fichier et l’œuvre fileinfotpl_perm
{{Artwork}} other versions autres versions du fichier fileinfotpl_ver
{{Artwork}} title titre de l’œuvre fileinfotpl_art_title hProduct.fn
{{Artwork}} object type objet de type œuvre d'art fileinfotpl_art_object_type
{{Artwork}} medium Techniques ou matériaux utilisés pour créer l'œuvre fileinfotpl_art_medium
{{Artwork}} dimensions dimensions de l’œuvre fileinfotpl_art_dimensions
{{Artwork}} gallery institution détenant l’œuvre fileinfotpl_art_gallery
{{Artwork}} location localisation de l’œuvre au sein de l’institution fileinfotpl_art_location hProduct.locality
{{Artwork}} accession number numéro d'inventaire de l'œuvre fileinfotpl_art_id hProduct.identifier
{{Artwork}} object history historique de l'œuvre fileinfotpl_art_object_history
{{Artwork}} exhibition history historique d'exposition de l'œuvre fileinfotpl_art_exhibition_history
{{Artwork}} credit line modalités d'entrée de l'œuvre dans la collection du musée fileinfotpl_art_credit_line
{{Artwork}} inscriptions Description des inscriptions, filigranes, sous-titres, armes sur l'œuvre fileinfotpl_art_inscriptions
{{Artwork}} notes Commentaires sur l’œuvre d'art fileinfotpl_art_notes
{{Artwork}} references Références liées à l’œuvre d'art fileinfotpl_art_references
{{Book}} Author auteur du livre fileinfotpl_author
{{Book}} Editor éditeur du livre fileinfotpl_book_editor
{{Book}} Translator traducteur du livre fileinfotpl_book_translator
{{Book}} Illustrator illustrateur du livre fileinfotpl_book_illustrator
{{Book}} Title titre du livre fileinfotpl_book_title
{{Book}} Subtitle sous-titre du livre fileinfotpl_book_subtitle
{{Book}} Series title titre de la série à laquelle appartient le livre fileinfotpl_book_series-title
{{Book}} Authority file données du contrôle d'autorité fileinfotpl_book_authority
{{Book}} Publisher éditeur du livre fileinfotpl_book_publisher
{{Book}} Printer imprimeur du livre fileinfotpl_book_printer
{{Book}} Year of publication date ou année de publication du livre fileinfotpl_date
{{Book}} Place of publication lieu ou ville de publication du livre fileinfotpl_book_place-of-publication
{{Book}} Language langue du livre fileinfotpl_book_language
{{Book}} Description description du livre fileinfotpl_desc
{{Creator}} Name Nom de l'auteur creator vCard.fn
{{Creator}} Alternative names Autres noms du créateur fileinfotpl_creator_alt-name_value vCard.nickname
{{Creator}} Description Nationalité et profession du créateu fileinfotpl_creator_desc_value vCard.note
{{Creator}} Date of death Date de décès du créateur fileinfotpl_creator_deathdate_value
{{Creator}} Date of birth Date de naissance du créateur fileinfotpl_creator_birthdate_value vCard.bday
{{Creator}} Location of birth/death Lieu de décès du créateur fileinfotpl_creator_deathloc_value
{{Creator}} Location of birth Lieu de naissance du créateur fileinfotpl_creator_birthloc_value
{{Creator}} Work period Période d'activité de l'auteur fileinfotpl_creator_work-period_value
{{Creator}} Work location Période d'activité de l'auteur fileinfotpl_creator_work-location_valuev
{{Creator}} Image Portrait ou photo représentant le créateur fileinfotpl_creator_image
{{Creator}} Authority file Contrôle d'autorité en lien avec le créateur fileinfotpl_creator_authority_value


{{FileContentsByBot}} (divers) variable, merci de vous référer à la page : {{FileContentsByBot}} (various) hproduct-by-bot jeu de données de grande taille et en constante augmentation, merci de vous référer à cette page : {{FileContentsByBot}}
{{Photograph}} title Titre de la photographie fileinfotpl_art_title hProduct.fn
{{Photograph}} description Description de la photographie fileinfotpl_desc hProduct.description
{{Photograph}} original description description d'archive d'origine de la photographie fileinfotpl_desc hProduct.description
{{Photograph}} date Date de création de l’œuvre d'art originale fileinfotpl_date hCalendar vevent.dtstart Microformat ajouté par le modèle {{Date}}
{{Photograph}} medium Technique ou support de la photographie fileinfotpl_art_medium
{{Photograph}} dimensions Dimensions de la photographie fileinfotpl_art_dimensions
{{Photograph}} artist Auteur de la photographie fileinfotpl_aut "hProduct.fn value"
{{Photograph}} institution institution détenant l’œuvre d'art fileinfotpl_art_gallery
{{Photograph}} location Emplacement de la photographie au sein de l'institution fileinfotpl_art_location hProduct.locality
{{Photograph}} source source du fichier fileinfotpl_src
{{Photograph}} permission licence/permission pour le fichier et l’œuvre fileinfotpl_perm
{{Photograph}} other versions autres version du fichier fileinfotpl_ver
{{Photograph}} accession number numéro d'inventaire de la photographie hProduct.identifier

Format alternatif pour CommonsMetadata

Comme le format basé sur le tableau et l'identifiant s'est avéré difficile à ajouter aux modèles qui ne sont pas formatés de la même manière que modèle "information" de Commons, CommonsMetadata fournit un format alternatif, similaire à celui des bandeaux de licence : le modèle contenant les informations doit tout entier être compris dans une balise de la classe fileinfotpl et la balise contenant les informations spécifiques doit se trouver dans un élément de classe fileinfotpl_* (avec les mêmes noms que ci-dessus, mais en tant que classe et non en tant qu'id).

Données exploitables par des programmes ajoutées par des modèles de licences

Mis en place en octobre 2010, en utilisant les classes <span class="licensetpl_XXX">

licensetpl
un élément identifiant une licence. Intègre tout le code décrivant la licence et ne doit contenir qu'UNE SEULE licence, ne doit pas en contenir plusieurs.
licensetpl_short
nom abrégé de la licence : “Domaine public”, “CC-BY-SA-3.0”, “CC-by-2.0-FR”, etc.
licensetpl_long
nom complet de la licence : “Domaine public”, “Creative Commons Attribution-Share Alike 3.0”,
licensetpl_attr_req
si un crédit est nécessaire. Mettre “true” si le crédit est nécessaire ou “false” sinon.
licensetpl_attr
le crédit, si requis : texte libre.
licensetpl_link_req
si un lien vers la licence est nécessaire pour cette licence. Mettre “true” si le lien est nécessaire ou “false” sinon.
licensetpl_link
le lien vers le texte complet de la licence. “www.creativecommons.org/licenses/by-sa/XXX/YYY”
licensetpl_nonfree
“true“ s'il s'agit d'une licence non libre (non utilisé sur Commons, mais seulement sur des wikis ayant une politique de Doctrine d'Exemption (PDE))

Lorsqu'il y a plusieurs blocs licensetpl pour la même œuvre, il convient de les englober dans un bloc de niveau supérieur ayant pour classe : licensetpl_wrapper.

Modèles insérant ces informations

  • Templates setting licensetpl include:

{{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} et {{LGPL}}.

Données exploitable par des programmes ajoutées par des modèles de mise en forme

Les modèles de mise en forme, prévus pour présenter de manière harmonisée différentes familles de bandeaux autres que des bandeaux de licences, véhiculent des données lisibles par des machines identifiant ces familles.

Modèle Objet Nom de la classe
{{Restriction-Layout}} utilisé par des avertissement concernant des restrictions d'usage restrictiontemplate
{{FoP-Layout}} utilisé par les bandeaux sur la liberté de panorama foptemplate
{{Partnership-Layout}} utilisé par les modèles de partenariat partnershiptemplate
{{Source-Layout}} utilisé par les modèles génériques décrivant la source d'une œuvre sourcetemplate
{{Created with}} utilisé par les modèles créé avec ... createdwithtemplate

Données exploitables par des programmes ajoutées par des modèles de restrictions d'usage non liées au droit d'auteur

Les modèles concernant les restrictions légales indépendantes des droits d'auteurs contiennent ces classes afin d'identifier des types de restrictions spécifiques.

Modèle(s) Objectif Nom de la classe
{{Trademarked}} Images en tant que marques déposées restriction-trademarked
{{Copydesign}} Représentation d'objet(s) dont le design est protégé par les droits d'auteur restriction-design
{{Communist symbol}} Symboles communistes restriction-communist
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} Biens culturels italiens restriction-ita-mibac
{{Australian Commonwealth reserve}} Réserves australiennes restriction-aus-reserve
{{Personality rights}} {{Romania personality rights}} Droits de la personnalité restriction-personality
{{2257}} Avertissement concernant la loi des États-Unis sur la protection des enfants et l'obscénité (Child Protection and Obscenity Enforcement Act) restriction-2257
{{Costume}} Costumes restriction-costume
{{Fan art}} Fan art restriction-fan-art
{{Currency}} Monnaie restriction-currency
{{IHL Symbol}} Symboles dont l'usage est restreint par le droit international humanitaire restriction-ihl
{{Nazi symbol}} Symboles nazis et fascistes restriction-nazi
{{Insignia}} Insigne officiel restriction-insignia

Données exploitables par des programmes ajoutées par des modèles spécifiques

D'autres données expoloitables par des programmes sont insérées. En voici une liste non exhaustive :

{{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
{{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>

Données exploitables par des programmes ajoutées par des modèles de localisation

Le modèle {{Location}} et les modèles similaires ajoutent des informations géographiques exploitables par des programmes au format suivant : <span class="geo">12.34;24.68</span> (latitude et longitude sous la forme de nombre à virgule flottante, séparés par un point-virgule). Les coordonnées utilisent le système WGS 84 (utilisé par le GPS et la plupart des cartes en ligne). Voir la page Commons:Géolocalisation pour plus de détails.

Utilisation

API de MediaWiki

L’API de MediaWiki renvoie actuellement une quantité limitée de métadonnées. Voyez la requête suivante :

(Ouvrir dans le bac-à-sable API) qui renvoie des informations comme Credit, Artist, LicenseUrl et Copyrighted et est utilisé par Media Viewer, notamment.

Scripts utilisant des données destinées aux programmes

Outils externes

Voir aussi

Comment définir de nouvelles données exploitables par des programmes

  • si possible, encadrez les données réelles, pas les en-têtes d'un champ. Cette méthode était utilisée historiquement dans tous les modèles Information, mais s'avère bien plus difficile à continuer à utiliser sur le long terme.
  • N'incluez que les données, pas les éléments de mise en forme de ces données.
  • Partez du principe que le formatage de données sera perdu lors de la conversion des données. L'habillage graphique ne fait pas partie des informations.
  • N'incluez pas plusieurs unités d'information dans un même champ de données. Il y a une différence entre une date de publication et une date de création. Les deux sont des dates, mais les deux sont des 'champs de données' différents. De même, CC-by-SA-4.0-3.0-2.5 n'est pas l'identifiant d'une licence, il y a en fait trois licences dont le nom commence par CC-by-SA-.
  • Assurez-vous que les valeurs des données ont une unité, ou qu'elles sont exprimées dans des unités cohérentes.
  • Don't wrap multiple units of information inside one field. There is a difference between a publication date and a creation date. Both are dates, but both are different 'data fields'. Also CC BY-SA-4.0-3.0-2.5 is not a license name, those would be 3 licenses with the name CC BY-SA-##.
  • Make sure that the data value has one unit, or outputs one consistent unit.

Problèmes

Il y a un petit nombre de choses qui ne sont PAS ou très difficilement reconnaissables. Cela comprend :

  • Derivative works
  • Works included in works. See also Category:FoP_templates
  • licenses derivates or works included in works are a mess.
  • Author vs. Copyright holder
  • usernames vs 'real names'
  • Catalogue IDs etc
  • VRTS permissions
  • Publication date vs creation date