Commons:Машиночитаемые данные

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Commons:Machine-readable data and the translation is 95% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Machine-readable data and have to be approved by a translation administrator.
Outdated translations are marked like this.

Shortcut: COM:MRD

На Викискладе многие метаданные (включая лицензию и автора) не доступны в машиночитаемой форме. Существует API-модуль iiprop=extmetadata, который может быть использован для получения некоторых значений (пример), но так как информация введена в свободной текстовой форме на самой странице описания файла, это не идеальный вариант. Проводимый проект Структурированные данные на Викискладе направлен на перемещение метаданных в виде полностью структурированных данных и в конечном итоге заменит машиночитаемые данные, представленные на этой странице.

Тем временем, чтобы облегчить переход к более структурированным данным в будущем, Викисклад использует набор стандартных шаблонов, которые были сделаны машиночитаемыми определённым образом, через HTML-элементы. Некоторые скрипты уже используют это. Стоит отметить, что эти данные доступны для любой вики, использующей Викисклад, где они могут быть прочитаны из HTML страницы «File:», как и другие локальные данные.

Машиночитаемые данные

Машиночитаемые данные, задаваемые информационными шаблонами-карточками

Есть несколько стандартных шаблонов-инфобоксов, помечающих различные элементы шаблона различными тегами, что позволяет парсинг информации. Используются несколько различных стилей тегов:

  • Метки микроформатов следуют индустриальным стандартам и могут быть разобраны уже существующими инструментами.
  • Атрибуты id (идентификаторы) тега <td> являются пользовательской разметкой, которая позволяет задавать более полные теги, которые могут быть прочитаны пользовательскими инструментами. Наиболее универсальные инфобоксы имеют двухстолбцовую структуру: столбец № 1 содержит имя поля, а столбец № 2 значение
    • Традиционно атрибуты id (идентификаторы) тега <td> использовались для отметки имени, данного ячейке в первом столбце строки. Для получения данных вам нужно будет получить содержимое следующей ячейки <td> во втором столбце.
    • Шаблоны {{Creator}} и {{Institution}} имеют более сложную структуру, поэтому ячейки с фактическими данными помечены атрибутами пурпурного цвета.
Шаблон Название параметра шаблона Описание Атрибут id у <td> Микроформат Комментарий
{{Information}} description описание файла fileinfotpl_desc hProduct.description. Часто содержит несколько языков, оформленных шаблоном {{Lang}}.
{{Information}} date дата создания оригинальной работы fileinfotpl_date hCalendar vevent.dtstart Иногда дополнительно содержит дату публикации или содержит только ее. Эти две даты имеют разное значение для защиты прав. Если используется {{Date context}}, может показать разницу. Микроформат, добавленный шаблоном {{Date}}
{{Information}} source источник файла fileinfotpl_src Часто содержит целые таблицы. Пока что у нас нет хороших способов обращения с этими шаблонами источников. Шаблоны источников часто содержат идентификаторы каталогов, но и они не машиночитаемы.
{{Information}} author автор файла fileinfotpl_aut Это может быть автор, создатель и/или обладатель авторских прав и используется по-разному. Часто содержит шаблон {{Creator}}, описание которого приведено ниже.
{{Information}} permission разрешение/лицензия для файла fileinfotpl_perm
{{Information}} other versions другие версии файла fileinfotpl_ver
{{Artwork}} description описание художественного произведения fileinfotpl_desc hProduct.description
{{Artwork}} date дата создания оригинала художественного произведения fileinfotpl_date hCalendar vevent.dtstart микроформат, добавленный шаблоном {{Date}}
{{Artwork}} source источник файла fileinfotpl_src
{{Artwork}} artist создатель художественного произведения fileinfotpl_aut "hProduct.fn value"
{{Artwork}} author автор произведения fileinfotpl_aut "hProduct.fn value"
{{Artwork}} permission разрешение/лицензия для файла и художественного произведения fileinfotpl_perm
{{Artwork}} other versions другие версии файла fileinfotpl_ver
{{Artwork}} title заголовок художественного произведения fileinfotpl_art_title hProduct.fn
{{Artwork}} object type тип объекта художественного произведения fileinfotpl_art_object_type
{{Artwork}} medium техника или способ создания художественного произведения fileinfotpl_art_medium
{{Artwork}} dimensions размеры художественного произведения fileinfotpl_art_dimensions
{{Artwork}} gallery учреждение, в котором хранится художественное произведение fileinfotpl_art_gallery
{{Artwork}} location местоположение художественного произведения внутри учреждения fileinfotpl_art_location hProduct.locality
{{Artwork}} accession number Инвентарный номер художественного произведения fileinfotpl_art_id hProduct.identifier
{{Artwork}} object history история объекта художественного произведения fileinfotpl_art_object_history
{{Artwork}} exhibition history история выставок художественного произведения fileinfotpl_art_exhibition_history
{{Artwork}} credit line создатель художественного произведения fileinfotpl_art_credit_line
{{Artwork}} inscriptions краткое посвящение художественного произведения fileinfotpl_art_inscriptions
{{Artwork}} notes заметки о художественном произведении fileinfotpl_art_notes
{{Artwork}} references ссылки, связанные с художественным произведением fileinfotpl_art_references
{{Book}} Author автор книги fileinfotpl_author
{{Book}} Editor редактор книги fileinfotpl_book_editor
{{Book}} Translator переводчик книги fileinfotpl_book_translator
{{Book}} Illustrator иллюстратор книги fileinfotpl_book_illustrator
{{Book}} Title заголовок книги fileinfotpl_book_title
{{Book}} Subtitle подзаголовок книги fileinfotpl_book_subtitle
{{Book}} Series title название серии книг fileinfotpl_book_series-title
{{Book}} Authority file данные нормативного контроля fileinfotpl_book_authority
{{Book}} Publisher издатель книги fileinfotpl_book_publisher
{{Book}} Printer печатник книги fileinfotpl_book_printer
{{Book}} Year of publication дата или год публикации книги fileinfotpl_date
{{Book}} Place of publication место или город публикации книги fileinfotpl_book_place-of-publication
{{Book}} Language язык книги fileinfotpl_book_language
{{Book}} Description описание книги fileinfotpl_desc
{{Creator}} Name имя создателя creator vCard.fn
{{Creator}} Alternative names другие имена создателя fileinfotpl_creator_alt-name_value vCard.nickname
{{Creator}} Description национальность и профессия(и) создателя fileinfotpl_creator_desc_value vCard.note
{{Creator}} Date of death дата смерти создателя fileinfotpl_creator_deathdate_value
{{Creator}} Date of birth дата рождения создателя fileinfotpl_creator_birthdate_value vCard.bday
{{Creator}} Location of birth/death место смерти создателя fileinfotpl_creator_deathloc_value
{{Creator}} Location of birth место рождения создателя fileinfotpl_creator_birthloc_value
{{Creator}} Work period период активности создателя fileinfotpl_creator_work-period_value
{{Creator}} Work location место работы создателя fileinfotpl_creator_work-location_valuev
{{Creator}} Image портрет или фото, изображающие создателя fileinfotpl_creator_image
{{Creator}} Authority file авторитетный контроль, связанный с создателем fileinfotpl_creator_authority_value


{{FileContentsByBot}} (различные) по-разному, пожалуйста, обсуждайте шаблон {{FileContentsByBot}} (various) hproduct-by-bot большой набор данных, который продолжает расти, обсуждайте шаблон {{FileContentsByBot}}
{{Photograph}} title название фотографии fileinfotpl_art_title hProduct.fn
{{Photograph}} description описание фотографии fileinfotpl_desc hProduct.description
{{Photograph}} original description первоначальное описание фотографии в архиве fileinfotpl_desc hProduct.description
{{Photograph}} date дата создания оригинала произведения fileinfotpl_date hCalendar vevent.dtstart микроформат, добавленный шаблоном {{Date}}
{{Photograph}} medium техника или материал фотографии fileinfotpl_art_medium
{{Photograph}} dimensions размеры фотографии fileinfotpl_art_dimensions
{{Photograph}} artist создатель фотографии fileinfotpl_aut "hProduct.fn value"
{{Photograph}} institution учреждение, в котором хранится художественное произведение fileinfotpl_art_gallery
{{Photograph}} location местонахождение художественного произведения внутри учреждения fileinfotpl_art_location hProduct.locality
{{Photograph}} source источник файла fileinfotpl_src
{{Photograph}} permission разрешение/лицензия для файла и художественного произведения fileinfotpl_perm
{{Photograph}} other versions другие версии файла fileinfotpl_ver
{{Photograph}} accession number номер, по которому доступна фотография hProduct.identifier

Другой возможный формат метаданных Commons

Из-за того, что формат таблица+идентификатор очень сложно добавлять в шаблоны, отличающиеся по формату от шаблона Информация в Commons, в качестве другого возможного формата можно использовать CommonsMetadata, похожий на шаблоны лицензий: весь информационный шаблон должен заключаться в класс fileinfotpl, а тег, содержащий конкретную информацию, должен иметь класс fileinfotpl_* (с такими же именами, как и выше, но для классов, а не для идентификаторов).

Машиночитаемые данные, задаваемые шаблонами лицензий

Появилось в октябре 2010 года с использованием классов <span class="licensetpl_XXX">

licensetpl
Элемент, идентифицирующий лицензию. Служит «обёрткой» для всего кода лицензии, должен быть ЕДИНСТВЕННОЙ лицензией, а не мульти-лицензией.
licensetpl_short
Короткое название лицензии: «Public domain», «CC BY-SA 3.0», «CC by 2.0 fr» и т. п.
licensetpl_long
Длинное название лицензии: «Public domain», «Creative Commons Attribution-Share Alike 3.0».
licensetpl_attr_req
Требуется ли атрибуция: «true» (истина) или «false» (ложь).
licensetpl_attr
Требуемая атрибуция: текст в свободной форме.
licensetpl_link_req
Требуется ли для этой лицензии ссылка на лицензию: «true» или «false».
licensetpl_link
Ссылка на документ лицензии: «www.creativecommons.org/licenses/by-sa/XXX/YYY»
licensetpl_nonfree
«true», если это несвободная лицензия (не используется на Викискладе, только для вики-проектов с ПДИ)

Несколько блоков licensetpl для одного произведения могут быть заключены в общий блок, имеющий класс licensetpl_wrapper.

Шаблоны, задающие эту информацию

Машиночитаемые данные, задаваемые шаблонами форматирования

Шаблоны форматирования стилей, созданные для единого оформления различных семейств шаблонов, не связанных с лицензией, содержат машиночитаемые данные, позволяющие идентифицировать эти данные.

Шаблон Назначение название класса
{{Restriction-Layout}} используется в сообщениях с предупреждениями restrictiontemplate
{{FoP-Layout}} используется шаблонами, касающимися свободы панорамы foptemplate
{{Partnership-Layout}} используется шаблонами об организациях-партнёрах partnershiptemplate
{{Source-Layout}} используется общими шаблонами источников sourcetemplate
{{Created with}} используется шаблонами «Создано с помощью…» createdwithtemplate

Машиночитаемые данные, задаваемые шаблонами, не касающимися охраны авторских прав

Шаблоны, описывающие правовые ограничения, не связанные с авторскими правами, содержат эти классы, чтобы идентифицировать специфичные шаблоны ограничений.

Шаблон(ы) Цель название класса
{{Trademarked}} Изображения с торговой маркой restriction-trademarked
{{Copydesign}} Дизайн, на который действуют авторские права. restriction-design
{{Communist symbol}} Коммунистические символы restriction-communist
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} Репродукции итальянских произведений restriction-ita-mibac
{{Australian Commonwealth reserve}} Заповедники Австралии restriction-aus-reserve
{{Personality rights}} {{Romania personality rights}} Права личности restriction-personality
{{2257}} Сообщение, связанное с Актом по защите детей и борьбе с непристойностью (США) restriction-2257
{{Costume}} Костюмы restriction-costume
{{Fan art}} Фан-арт restriction-fan-art
{{Currency}} Валюта restriction-currency
{{IHL Symbol}} Cимволы, использование которых регулируется Международным гуманитарным правом. restriction-ihl
{{Nazi symbol}} Нацистские и фашистские символы restriction-nazi
{{Insignia}} Официальные знаки отличия restriction-insignia

Машиночитаемые данные, задаваемые особыми шаблонами

Задаются и другие машиночитаемые данные. Некоторые из них приведены ниже:

{{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
{{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>

Машиночитаемые данные, задаваемые шаблонами местоположения

{{Location}} и подобные шаблоны добавляют машиночитаемые данные георасположения в следующем формате: <span class="geo">12.34;24.68</span> (широта и долгота как числа с плавающей запятой, разделённые точкой с запятой). Координаты используют систему WGS 84 (ту же, которую использует GPS и большинство онлайн-карт). Более подробную информацию смотрите на странице Викисклад:Geocoding.

Использование

MediaWiki API

Сейчас MediaWiki API обслуживает ограниченное количество метаданных. Рассмотрим следующий запрос:

(Открыть в API-песочнице) который возвращает некоторые полезные параметры, такие как Credit, Artist, LicenseUrl и Copyrighted и используется, например, виджетом Media Viewer.

Скрипты, использующие машиночитаемые данные

Внешние инструменты

Смотрите также

Определение новых машиночитаемых данных

  • Когда возможно, заключайте "настоящие" данные, а не заголовок поля. Этот последний метод раньше использовался для всех наших информационных шаблонов, но его значительно сложнее поддерживать при длительном выполнении.
  • Заключайте данные, а не форматирование данных.
  • Ожидайте, что форматирование "потеряется" при преобразовании данных. Визуальное оформление не несет информацию.
  • Не заключйте много единиц информации в одно поле. Есть разница между датой публикации и датой создания. И та, и другая являются датой, но обе являются "полями данных". Аналогично CC-by-SA-4.0-3.0-2.5 это название не одной лицензии, а три лицензии с названиями CC-by-SA-##.
  • Убедитесь, что значения данных имеют одинаковые единицы измерения или дают одну постоянную единицу измерения.
  • Don't wrap multiple units of information inside one field. There is a difference between a publication date and a creation date. Both are dates, but both are different 'data fields'. Also CC BY-SA-4.0-3.0-2.5 is not a license name, those would be 3 licenses with the name CC BY-SA-##.
  • Make sure that the data value has one unit, or outputs one consistent unit.

Проблемы

Есть несколько вещей, которые пока НЕ учитываются или плохо учитываются. К ним относятся:

  • Производные произведения
  • Произведения, вошедшие в другие произведения. См. также Category:FoP_templates
  • Производные лицензии или произведения, включенные в произведения, ведут к неразберихе.
  • Автор / правообладатель
  • Имена пользователей / 'настоящие имена'
  • Идентификаторы каталогов и т. д.
  • Разрешения VRTS
  • Дата публикации / дата создания