Commons:Machine-readable data/uk

Shortcut: COM:MRD

На Вікісховищі чимало метаданих (включно з ліцензією та автором) не є машиночитабельними. Існує модуль API, iiprop=extmetadata який може використовуватись для отримання деяких значень (приклад), але якщо оскільки інформація вводиться на самій сторінці опису файлу як простий текст, це рішення неідеальне. Є плани перенести метадані в базу даних$ref, але це відбудеться ще не скоро.

Щоб якось тимчасово вирішити цю проблему і спростити перехід на більш структуровані дані в майбутньому, Вікісховище використовує набір стандартних шаблонів, зроблених в певний спосіб машиночитабельними за допомогою елементів HTML. Деякі скрипти вже використовують це нововведення. Те, що ці дані доступні в будь-якій вікі, яка використовує Вікісховище, і де вони можуть бути зчитані з коду HTML сторінки файлу, як і інші локальні дані, нічого не вартує.

Машиночитабельні дані

Машиночитабельні дані, що встановлюються шаблонами-картками

Ось декілька стандартних шаблонів-карток із позначенням кожного елемента в шаблоні іншим тегом для уможливлення синтаксичного аналізу інформації. Використовується декілька різних стилів тегів:

  • Мікроформатні теги відповідають індустріальним стандартам і можуть бути проаналізовані вже існуючими інструментами.
  • ID-атрибути <td> (ідентифікатори) — це нестандартні позначення, що дозволяють використання повніших тегів, які мають зчитуватись нестандартними інструментами. Багато найуніверсальніших шаблонів мають двостовпцеву структуру: стовпець #1 містить назву поля, а стовпець #2 містить значення
    • Традиційно id-атрибути <td> використовувались для позначення виклику назви у першому стовпці в рядку. Щоб отримати дані Вам треба було б отримати вміст комірки <td> в другому стовпці.
    • Шаблони {{Creator}} і {{Institution}} мають складнішу структуру, тож комірки з дійсними даними позначені властивостями на фоні кольору маджента.
Шаблон Назва параметра шаблону Опис <td> ідентифікатор Мікроформат Коментар
{{Information}}descriptionопис файлуfileinfotpl_deschProduct.description.Often contains multiple languages annotated with {{Lang}}.
{{Information}}dateдата створення оригінальної роботиfileinfotpl_datehCalendar vevent.dtstartмікроформат, доданий шаблоном {{Date}}
{{Information}}sourceджерело файлуfileinfotpl_srcOften contains entire tables. We have no good way to deal with this source templates yet. Source templates often have references to catalogue IDs, but these are also not machine readable.
{{Information}}authorавтор файлуfileinfotpl_autThis can be author, creator and/or copyright holder and is used mixed. Often contains the {{Creator}} template which is described below.
{{Information}}permissionдозвіл/ліцензія файлуfileinfotpl_perm
{{Information}}other versionsінші версії файлуfileinfotpl_ver
{{Artwork}}descriptionопис витвору мистецтваfileinfotpl_deschProduct.description
{{Artwork}}dateдата створення оригінального витвору мистецтваfileinfotpl_datehCalendar vevent.dtstartmicroformat added by {{Date}} template
{{Artwork}}sourceджерело файлуfileinfotpl_src
{{Artwork}}artistтворець витвору мистецтваfileinfotpl_aut"hProduct.fn value"
{{Artwork}}authorавтор витвору мистецтваfileinfotpl_aut"hProduct.fn value"
{{Artwork}}permissionдозвіл/ліцензія файлу і витвору мистецтваfileinfotpl_perm
{{Artwork}}other versionsінші версії файлуfileinfotpl_ver
{{Artwork}}titleназва витвору мистецтваfileinfotpl_art_titlehProduct.fn
{{Artwork}}object typeтип витвору мистецтваfileinfotpl_art_object_type
{{Artwork}}mediumтехніка або носій витвору мистецтваfileinfotpl_art_medium
{{Artwork}}dimensionsрозміри витвору мистецтваfileinfotpl_art_dimensions
{{Artwork}}galleryінституція, де зберігається витвір мистецтваfileinfotpl_art_gallery
{{Artwork}}locationрозташування витвору мистецтва в межах інституціїfileinfotpl_art_locationhProduct.locality
{{Artwork}}accession numberномер доступу витвору мистецтваfileinfotpl_art_idhProduct.identifier
{{Artwork}}object historyісторія витвору мистецтваfileinfotpl_art_object_history
{{Artwork}}exhibition historyісторія виставок витвору мистецтваfileinfotpl_art_exhibition_history
{{Artwork}}credit lineрядок подяки правовласникамfileinfotpl_art_credit_line
{{Artwork}}inscriptionsнаписи на витворі мистецтваfileinfotpl_art_inscriptions
{{Artwork}}notesпримітки щодо витвору мистецтваfileinfotpl_art_notes
{{Artwork}}referencesпосилання, пов'язані з витвором мистецтваfileinfotpl_art_references
{{Book}}Authorавтор книгиfileinfotpl_author
{{Book}}Editorредактор книгиfileinfotpl_book_editor
{{Book}}Translatorперекладач книгиfileinfotpl_book_translator
{{Book}}Illustratorілюстратор книгиfileinfotpl_book_illustrator
{{Book}}Titleназва книгиfileinfotpl_book_title
{{Book}}Subtitleдодаткова назва книгиfileinfotpl_book_subtitle
{{Book}}Series titleназва серії книгиfileinfotpl_book_series-title
{{Book}}Authority fileбібліоінформаціяfileinfotpl_book_authority
{{Book}}Publisherвидавець книгиfileinfotpl_book_publisher
{{Book}}Printerдрукар книгиfileinfotpl_book_printer
{{Book}}Year of publicationдата або рік видання книгиfileinfotpl_date
{{Book}}Place of publicationмісце або місто видання книгиfileinfotpl_book_place-of-publication
{{Book}}Languageмова книгиfileinfotpl_book_language
{{Book}}Descriptionопис книгиfileinfotpl_desc
{{Creator}}NameІм'я творцяcreatorvCard.fn
{{Creator}}Alternative namesАльтернативні імена творцяfileinfotpl_creator_alt-name_valuevCard.nickname
{{Creator}}DescriptionНаціональність та професія творцяfileinfotpl_creator_desc_valuevCard.note
{{Creator}}Date of deathДата смерті творцяfileinfotpl_creator_deathdate_value
{{Creator}}Date of birthДата народження творцяfileinfotpl_creator_birthdate_valuevCard.bday
{{Creator}}Location of birth/deathМісце смерті творцяfileinfotpl_creator_deathloc_value
{{Creator}}Location of birthМісце народження творцяfileinfotpl_creator_birthloc_value
{{Creator}}Work periodПеріод роботи творцяfileinfotpl_creator_work-period_value
{{Creator}}Work locationМісце роботи творцяfileinfotpl_creator_work-location_valuev
{{Creator}}Imageпортрет або фото із зображенням творцяfileinfotpl_creator_image
{{Creator}}Authority fileБібліоінформація, пов'язана з творцемfileinfotpl_creator_authority_value


{{FileContentsByBot}}(різне)залежить, будь ласка, ознайомтесь із {{FileContentsByBot}}(various)hproduct-by-botвеликий набір даних і все ще розвивається, будь ласка, ознайомтесь із {{FileContentsByBot}}
{{Photograph}}titleназва фотографіїfileinfotpl_art_titlehProduct.fn
{{Photograph}}descriptionопис фотографіїfileinfotpl_deschProduct.description
{{Photograph}}original descriptionоригінальний архівний опис фотографіїfileinfotpl_deschProduct.description
{{Photograph}}dateдата створення оригінального витвору мистецтваfileinfotpl_datehCalendar vevent.dtstartmicroformat added by {{Date}} template
{{Photograph}}mediumтехніка або носій фотографіїfileinfotpl_art_medium
{{Photograph}}dimensionsрозміри фотографіїfileinfotpl_art_dimensions
{{Photograph}}artistтворець фотографіїfileinfotpl_aut"hProduct.fn value"
{{Photograph}}institutionінституція, де зберігається витвір мистецтваfileinfotpl_art_gallery
{{Photograph}}locationрозташування фотографії в межах інституціїfileinfotpl_art_locationhProduct.locality
{{Photograph}}sourceджерело файлуfileinfotpl_src
{{Photograph}}permissionдозвіл/ліцензія файлу і витвору мистецтваfileinfotpl_perm
{{Photograph}}other versionsінші версії файлуfileinfotpl_ver
{{Photograph}}accession numberномер доступу фотографіїhProduct.identifier

Альтернативний формат для CommonsMetadata

Оскільки формат table + id виявився надто складним для додавання до шаблонів, що мають форматування, відмінне від інформаційного шаблону на Вікісховищі, CommonsMetadata дозволяє використовувати альтернативний формат, подібний до шаблонів ліцензій: весь інформаційний шаблон має бути поміщений у клас fileinfotpl, а тег, що містить конкретну інформацію, повинен мати клас fileinfotpl_* (ті ж назви, що й угорі, але класи, не ідентифікатори).

Машиночитабельні дані, що встановлюються шаблонами ліцензій

Представлено в жовтні 2010 з використанням класів <span class="licensetpl_XXX">

licensetpl
Елемент, що визначає ліцензію. Охоплює весь код ліцензії, і це має бути ЄДИНА ліцензія, не мультиліцензія.
licensetpl_short
Коротка назва ліцензії: «Public domain», «CC-BY-SA-3.0», «CC-by-2.0-FR» тощо.
licensetpl_long
Повна назва ліцензії: «Public domain», «Creative Commons Attribution-Share Alike 3.0».
licensetpl_attr_req
Чи потрібна атрибуція. «true» або «false».
licensetpl_attr
Запитувана атрибуція: Вільний текст.
licensetpl_link_req
Чи вимагає ця ліцензія посилання на неї. «true» або «false».
licensetpl_link
Посилання на ліцензійний договір. «www.creativecommons.org/licenses/by-sa/XXX/YYY»
licensetpl_nonfree
«true», якщо це невільна ліцензія (не використовується на Вікісховищі, а лише у вікі, де діє ПДВ)

Декілька блоків licensetpl можуть бути охоплені блоком, що використовує клас licensetpl_wrapper.

Шаблони, що встановлюють цю інформацію

  • Templates setting licensetpl include:

{{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} і {{LGPL}}.

Машиночитабельні дані, що встановлюються шаблонами форматування

Шаблони форматування стилів, призначені забезпечити однакові стилі для різних сімейств неліцензійних шаблонів, містять машиночитабельні дані для визначення цих сімейств.

Шаблон Мета назва класу
{{Restriction-Layout}} використовується шаблонами про обмеження restrictiontemplate
{{FoP-Layout}} використовується шаблонами про свободу панорами foptemplate
{{Partnership-Layout}} використовується шаблонами про партнерства partnershiptemplate
{{Source-Layout}} використовується загальними шаблонами джерел sourcetemplate
{{Created with}} використовується шаблонами «Створено за допомогою ...» createdwithtemplate

Машиночитабельні дані, що встановлюються шаблонами про непов'язані з авторським правом обмеження

Шаблони, що стосуються непов'язаних з авторських правом юридичних обмежень містять ці класи для ідентифікації конкретних типів обмежень.

Шаблони Мета назва класу
{{Trademarked}} Зображення з торговими марками restriction-trademarked
{{Copydesign}} Дизайни з копірайтом restriction-design
{{Communist symbol}} Символи комунізму restriction-communist
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} Італійські культурні цінності restriction-ita-mibac
{{Australian Commonwealth reserve}} Австралійські резерви restriction-aus-reserve
{{Personality rights}} {{Romania personality rights}} Права особистості restriction-personality
{{2257}} Попередження про дію закону Child Protection and Obscenity Enforcement Act (США) restriction-2257
{{Costume}} Костюми restriction-costume
{{Fan art}} Фан-арт restriction-fan-art
{{Currency}} Валюта restriction-currency
{{IHL Symbol}} Символи, використання яких обмежено Міжнародним гуманітарним законом restriction-ihl
{{Nazi symbol}} Символи нацизму та фашизму restriction-nazi
{{Insignia}} Офіційні герби restriction-insignia

Машиночитабельні дані, що встановлюються специфічними шаблонами

Встановлюється більше машиночитабельних даних. Цей список неповний:

{{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
{{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>

Машиночитабельні дані, що встановлюються шаблонами розташування

{{Location}} і подібні шаблони додають машиночитабельні геодані в такому форматі: <span class="geo">12.34;24.68</span> (широта і довгота як числа з рухомою комою, відокремлені крапкою з комою). Координати використовують систему WGS84 (ту ж, що й GPS і більшість карт онлайн). Див. Вікісховище:Геокодування, щоб дізнатися більше.

Використання

MediaWiki API

MediaWiki API тепер служить обмеженій кількості метаданих. Розгляньте такий запит:

(Відкрийте в пісочниці API) — відкриває деякі корисні параметри, такі як Credit, Artist, LicenseUrl і Copyrighted та використовується, наприклад, Медіапереглядачем.

Скрипти, що використовують машиночитабельні дані

Зовнішні інструменти

Див. також

Визначення нових машиночитабельних даних

  • Там, де це можливо, охоплюйте дійсні дані, не лише якийсь заголовок поля. Цей останній метод історично використовується в наших шаблонах «Information», але в довготривалій перспективі його значно важче підтримувати.
  • Охоплюйте самі дані, а не те, яким чином вони форматуються.
  • Очікуйте, що форматування буде втрачено при конвертації даних. Візуальне оформлення не є частиною інформації.
  • Не охоплюйте по декілька одиниць інформації в межах одного поля. Є різниця між датою публікації і датою створення. Обидва ці значення є датами, але вони є різними «полями даних». Також CC-by-SA-4.0-3.0-2.5 не є назвою ліцензії (Licensename), це — три ліцензії з назвами CC-by-SA-##.
  • Переконайтесь, що значення даних має лише один елемент, або виводить відповідний елемент.
  • Don't wrap multiple units of information inside one field. There is a difference between a publication date and a creation date. Both are dates, but both are different 'data fields'. Also CC BY-SA-4.0-3.0-2.5 is not a license name, those would be 3 licenses with the name CC BY-SA-##.
  • Make sure that the data value has one unit, or outputs one consistent unit.

Проблеми

Є декілька речей, які зараз або НЕ розпізнаються, або розпізнаються погано. До них належать:

  • Derivative works
  • Works included in works. See also Category:FoP_templates
  • licenses derivates or works included in works are a mess.
  • Author vs. Copyright holder
  • usernames vs 'real names'
  • Catalogue IDs etc
  • VRTS permissions
  • Publication date vs creation date
Category:Commons help/uk
Category:Commons help/uk