С появлением модуля ELiS OJS возникла необходимость достать метаданные из OJS.
Известно, что у OJS есть OAI-PMH и в нем поддержка метаданных по dublin core и по MARCXML.
Сам протокол OAI-PMH в OJS нормально работает, но в процессе импорта с сайтов на платформе ELPUB и ряда других установок OJS выяснилось, что в метаданных по OAI-PMH может находиться мусор (то есть криво описывают в самом OJS) и метаданных только лишь по OAI-PMH недостаточно для импорта и надо парсить HTML-страницы сайта.
Содержание
Проблемы Dublin Core в OJS[править]
Посмотрим на запись для НТБ.
<oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"> <dc:title xml:lang="en-US">Technological and methodological aspects of using reference and search tools in maintaining the database of Dubna University faculty’s publications</dc:title> <dc:title xml:lang="ru-RU">Технологические и методические аспекты использования справочно-поискового аппарата для ведения базы публикаций сотрудников университета «Дубна»</dc:title> <dc:creator xml:lang="en-US">L. S. Timonina</dc:creator> <dc:creator xml:lang="ru-RU">Л. С. Тимонина</dc:creator> <dc:subject xml:lang="en-US"> электронный каталог</dc:subject> <dc:subject xml:lang="en-US"> MegaPro</dc:subject> <dc:subject xml:lang="en-US"> reference and information retrieval tools</dc:subject> <dc:subject xml:lang="en-US"> affiliation</dc:subject> <dc:subject xml:lang="en-US"> bibliographic entry</dc:subject> <dc:subject xml:lang="en-US"> electronic catalog</dc:subject> <dc:subject xml:lang="ru-RU"> электронный каталог</dc:subject> <dc:subject xml:lang="ru-RU"> АИБС «МегаПро»</dc:subject> <dc:subject xml:lang="ru-RU"> справочно-поисковый аппарат</dc:subject> <dc:subject xml:lang="ru-RU"> аффилиация</dc:subject> <dc:subject xml:lang="ru-RU"> библиографическая запись</dc:subject> <dc:subject xml:lang="ru-RU"> электронный каталог</dc:subject> <dc:description xml:lang="en-US">The author discusses the experience of building, maintaining and using the bibliographical database of science publications by the faculty of the state Dubna University. She analyzes in detail MegaPro ALIS retrieval functionality and describes different types of the system’s dictionaries and guides, their advantages and drawbacks in terms of entering data into bibliographic entry. The algorithm of using outer tables for reference when entering repeated subfields in one-click or entering data into several subfields of the bibliographic records. The example is given how hierarchical data of organization structure is used as an outer dictionary.Feasibility of using the directories of faculty authors and journals/other sources of information in publication databases is substantiated; example is given how to use them when entering several subfields of MARC21 fields 100, 700 and 773. The methodological solutions for maintaining directories of faculty authors and journals (and other information sources) are discussed.User and program interface for retrieving publications by author’s affliation, academic degree or title, institution, information source specific data are discussed as a result of building database of publications. The author emphasizes that the dictionaries may be used as supplementary information resources to support faculty publication activities and to integrate them into other university systems.</dc:description> <dc:description xml:lang="ru-RU">В статье освещён опыт создания, ведения и использования библиографической базы научных публикаций сотрудников государственного университета «Дубна». Подробно проанализирован справочно-поисковый аппарат АИБС «МегаПро», описаны различные типы словарей и справочников системы, их достоинства и недостатки при внесении данных в библиографическую запись. Приведены алгоритмы использования внешних справочных таблиц как справочников при занесении в «один клик» повторяемых подполей библиографической записи и при занесении данных в несколько подполей поля библиографической записи. Приведён пример использования иерархических данных о структуре организации в качестве внешнего справочника.Обоснована необходимость использования в базах данных публикаций справочников университета авторов и журналов/иных источников информации, определена структура справочников, приведён пример их использования при занесении отдельных подполей полей 100, 700 и 773 формата MARC21. Выработаны методические решения по ведению справочников авторов университета и журналов/иных источников информации.В качестве результата создания БД публикаций приведена разработка пользовательского и программного интерфейсов поиска публикаций с учётом таких данных, как аффилиация автора, научные степень и звание, место работы, специфические данные источника информации. Отмечена возможность использования разработанных справочников как дополнительных информационных ресурсов поддержки публикационной деятельности преподавателей и интеграции их с другими системами вуза.</dc:description> <dc:publisher xml:lang="ru-RU">Russian National Public Library for Science and Technology</dc:publisher> <dc:date>2020-10-29</dc:date> <dc:type>info:eu-repo/semantics/article</dc:type> <dc:type>info:eu-repo/semantics/publishedVersion</dc:type> <dc:format>application/pdf</dc:format> <dc:identifier>https://ntb.gpntb.ru/jour/article/view/653</dc:identifier> <dc:identifier>10.33186/1027-3689-2020-9-143-158</dc:identifier> <dc:source xml:lang="en-US">Scientific and Technical Libraries; № 9 (2020); 143-158</dc:source> <dc:source xml:lang="ru-RU">Научные и технические библиотеки; № 9 (2020); 143-158</dc:source> <dc:source>2686-8601</dc:source> <dc:source>1027-3689</dc:source> <dc:source>10.33186/1027-3689-2020-9</dc:source> <dc:language>rus</dc:language> <dc:relation>https://ntb.gpntb.ru/jour/article/view/653/573</dc:relation> <dc:relation>Автоматизированная интегрированная библиотечная система «МегаПро». Модуль «Каталогизация»: Документация / О-во с ограниченной ответственностью «Дата Экспресс»: электрон. текстовые дан. – Режим доступа: http://www.megaprosoft.ru/MegaPro/Data/Catalog.pdf (дата обращения: 20.02.2020).</dc:relation> <dc:relation>Альперин Б. Л. SCIACT – информационно-аналитическая система института катализа СО РАН для мониторинга и стимулирования научной деятельности / Б. Л. Альперин, А. А. Ведягин, И. В. Зибарева // Тр. ГПНТБ СО РАН. – 2015. – № 9. – С. 95–102. – Электрон. текстовые дан. – Режим доступа: https://www.elibrary.ru/download/elibrary_25021741_64384744.pdf (дата обращения: 20.02.2020).</dc:relation> <dc:relation>Баженов С. Р. Интеграция базы данных публикаций организации с индексами научного цитирования: реализация средствами САБ ИРБИС64 / С. Р. Баженов, М. В. Данилин, О. А. Рогозникова // Книга. Культура. Образование. Инновации. Материалы Междунар. проф. форума «Крым–2015» «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса». – 2015. – Электрон. текстовые дан. – Режим доступа: http://gpntb.ru/win/inter-events/crimea2015/disk/042.pdf (дата обращения: 20.02.2020).</dc:relation> <dc:relation>Власова С. А. Создание интегрированной базы данных публикаций сотрудников научной организации / С. А. Власова // Румянцевские чтения – 2019. Материалы Между- нар. науч.-практ. конф.: в 3 ч. – 2019. – С. 135–139. – Электрон. текстовые дан. – Режим доступа: https://www.elibrary.ru/download/elibrary_38492445_62316567.pdf (дата обращения: 20.02.2020).</dc:relation> <dc:relation>Грибов В. Т. Интеграция автоматизированных библиотечных систем с другими информационными сервисами и поставщиками ресурсов / В . Т . Грибов, С . В . Ефремов, Л. В. Левова // Книга. Культура. Образование. Инновации. Материалы Второго Междунар. проф. форума «Крым–2016». – 2016. – С. 409–415. – Электрон. текстовые дан. – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2016/disk/vtvo.pdf (дата обращения: 20.02.2020).</dc:relation> <dc:relation>Захарова С. С. Научные публикации: от картотеки трудов до библиографических профилей / С. С. Захарова, Ю. А. Гуреева // Библиосфера. – 2017. – № 2. – С. 85–89.</dc:relation> <dc:relation>Ковязина Е. В. Электронный архив научных публикаций: этапы развития / Е. В. Ковязина // Науч. и техн. б-ки. – 2014. – № 2. – С. 19–26. – Электрон. текстовые дан. – Режим доступа: https://www.elibrary.ru/download/elibrary_21190524_14506814.pdf (дата обращения: 20.02.2020).</dc:relation> <dc:rights xml:lang="en-US">Authors who publish with this journal agree to the following terms:Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).</dc:rights> <dc:rights xml:lang="ru-RU">Авторы, публикующие в данном журнале, соглашаются со следующим:Авторы сохраняют за собой авторские права на работу и предоставляют журналу право первой публикации работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.Авторы сохраняют право заключать отдельные контрактные договорённости, касающиеся не-эксклюзивного распространения версии работы в опубликованном здесь виде (например, размещение ее в институтском хранилище, публикацию в книге), со ссылкой на ее оригинальную публикацию в этом журнале.Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).</dc:rights> </oai_dc:dc>
Какие проблемы бросаются в глаза?
Ссылка на PDF[править]
1. Нет ссылки на PDF. Точнее она есть, но она не выделена как ссылка и более того, есть еще множество полей <dc:relation> в которых записан список литературы.
<dc:relation>https://ntb.gpntb.ru/jour/article/view/653/573</dc:relation> <dc:relation>Автоматизированная интегрированная библиотечная система «МегаПро». Модуль «Каталогизация»: Документация / О-во с ограниченной ответственностью «Дата Экспресс»: электрон. текстовые дан. – Режим доступа: http://www.megaprosoft.ru/MegaPro/Data/Catalog.pdf (дата обращения: 20.02.2020).</dc:relation>
В метаданных никак нельзя понять где ссылка на PDF, а где источник литературы. Вернее на самом деле ссылка на PDF всегда выше источников, но это все равно не правило и надо хардкодить разбор <dc:relation> на предмет гиперссылки в первой записи dc:relation (а лучше просто сходить на страницу по HTML и взять ссылку оттуда, что в ELiS OJS и делается.
Авторы[править]
2. Нет способа понять где какие имена авторов являются переводами. Вернее так, если ФИО автора (а это одна сущность) записано на двух языках, то они будут идти друг за другом, но все равно опираться на такое не надежно, а значит нельзя объединить русское и английское написание автора и создать всего одну сущность при импорте, а не две.
<dc:creator xml:lang="en-US">L. S. Timonina</dc:creator> <dc:creator xml:lang="ru-RU">Л. С. Тимонина</dc:creator>
Обращу внимание, что идея транслитерировать с английского на русский не сработает, так как в некоторых случаях русское ФИО может быть И.И. Иванов, а в латинице записано Ivan Ivanov.
Теги[править]
3. В тегах также нельзя понять какие являются переводом каких и могут некорректно стоять языки (у самого первого тега lang="en-US" ошибочно):
<dc:subject xml:lang="en-US"> электронный каталог</dc:subject> <dc:subject xml:lang="en-US"> MegaPro</dc:subject> <dc:subject xml:lang="en-US"> reference and information retrieval tools</dc:subject> <dc:subject xml:lang="en-US"> affiliation</dc:subject> <dc:subject xml:lang="en-US"> bibliographic entry</dc:subject> <dc:subject xml:lang="en-US"> electronic catalog</dc:subject> <dc:subject xml:lang="ru-RU"> электронный каталог</dc:subject> <dc:subject xml:lang="ru-RU"> АИБС «МегаПро»</dc:subject> <dc:subject xml:lang="ru-RU"> справочно-поисковый аппарат</dc:subject> <dc:subject xml:lang="ru-RU"> аффилиация</dc:subject> <dc:subject xml:lang="ru-RU"> библиографическая запись</dc:subject> <dc:subject xml:lang="ru-RU"> электронный каталог</dc:subject>
Также видно ненужный начальный пробел.
Ссылка на HTML-страницу статьи[править]
4. Ссылка на HTML-страницу статьи находится в поле identifier, а не в source. Но кроме ссылки на журнал в поле идентификатора находится и DOI, который не выделен как DOI никакими метаданными. Таким образом не зная о соглашении, что первый идентификатор ведет на HTML-страницу, а второй является DOI, извлечь ни первую ни вторую информацию только из метаданных нельзя. (ELiS OJS таки из первого идентификатора извлекает ссылку на веб-страницу и потом идет разбирать HTML.
<dc:identifier>https://ntb.gpntb.ru/jour/article/view/653</dc:identifier> <dc:identifier>10.33186/1027-3689-2020-9-143-158</dc:identifier>
Издатель[править]
Совершенно очевидно, что издатель записан в латинице, тогда как в метаданных указано, что на русском.
<dc:publisher xml:lang="ru-RU">Russian National Public Library for Science and Technology</dc:publisher>
Серия, том, выпуск[править]
Информация о серии, томе и выпуске явно не выделена, а записано кучей (без явного выделения серии, тома и выпуска) в <dc:source>, но также там в source и другая информация (ISSN и другие идентификаторы), таким образом надежно извлечь эти данные нельзя.
<dc:source xml:lang="en-US">Scientific and Technical Libraries; № 9 (2020); 143-158</dc:source> <dc:source xml:lang="ru-RU">Научные и технические библиотеки; № 9 (2020); 143-158</dc:source> <dc:source>2686-8601</dc:source> <dc:source>1027-3689</dc:source> <dc:source>10.33186/1027-3689-2020-9</dc:source>
Права[править]
В поле <dc:rights> нет ссылки на лицензию CC-BY, под которой распространяется журнал, вместо это человекочитаемый текст. Поэтому из метаданных нельзя извлечь лицензию.
Запись в MARCXML[править]
Пример MARCXML:
<record xmlns="http://www.loc.gov/MARC21/slim" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.loc.gov/MARC21/slim http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd"> <leader> cam 3u </leader> <controlfield tag="008">"210511 2021 eng "</controlfield> <datafield tag="042" ind1=" " ind2=" "> <subfield code="a">dc</subfield> </datafield> <datafield tag="245" ind1="0" ind2="0"> <subfield code="a">Тенденции развития современных библиотек и формирование стратегии библиотечно-информационного образования в Республике Казахстан</subfield> </datafield> <datafield tag="720" ind1=" " ind2=" "> <subfield code="a">Array, Array Array; Западно-Казахстанский университет им. Махамбета Утемисова</subfield> </datafield> <datafield tag="653" ind1=" " ind2=" "> <subfield code="a">библиотека; библиотечно-информационная деятельность; библиотечно-информационное образование; образовательная программа «Библиотечное дело»</subfield> </datafield> <datafield tag="520" ind1=" " ind2=" "> <subfield code="a"><p>Рассмотрены современные направления работы библиотек, на основании которых модернизируется библиотечно-информационное образование в Республике Казахстан. Государство ставит перед библиотеками серьёзные задачи: удовлетворение возрастающих информационных потребностей науки, образования, экономики и производственной сферы; развитие информационного общества. Важнейший фактор, повышающий эффективность деятельности библиотек, - кадровый потенциал отрасли. На Всеказахстанском съезде библиотекарей в 2018 г. была разработана концепция формирования человеческого капитала, которая предусматривает повышение требований к квалификации библиотекаря, расширение его профессиональных компетенций, привлечение в профессию молодых специалистов. Сегодня в высших учебных заведениях, готовящих библиотечные кадры, ведётся целенаправленная работа по повышению научного и творческого потенциала профессорско-преподавательского состава, привлечению студентов к проектной и творческой деятельности; развитию креативного мышления и навыков применения инновационных технологий в профессиональной деятельности. Совершенствуются учебный процесс и образовательные программы (по результатам взаимодействия с работодателями и выпускниками). Тенденциями модернизации библиотечного образования в Республике Казахстан являются также интеграция страны в единое информационное пространство; реализация основного содержания образовательных программ на трёх языках (в рамках образовательной политики).</p></subfield> </datafield> <datafield tag="260" ind1=" " ind2=" "> <subfield code="b">Russian National Public Library for Science and Technology</subfield> </datafield> <datafield tag="720" ind1=" " ind2=" "> <subfield code="a"></subfield> </datafield> <datafield tag="260" ind1=" " ind2=" "> <subfield code="c">2021-05-11 19:34:58</subfield> </datafield> <datafield tag="655" ind1=" " ind2="7"> <subfield code="a"></subfield> </datafield> <datafield tag="856" ind1=" " ind2=" "> <subfield code="q">application/pdf</subfield> </datafield> <datafield tag="856" ind1="4" ind2="0"> <subfield code="u">https://ntb.gpntb.ru/jour/article/view/746</subfield> </datafield> <datafield tag="786" ind1="0" ind2=" "> <subfield code="n">Научные и технические библиотеки; № 3 (2021)</subfield> </datafield> <datafield tag="546" ind1=" " ind2=" "> <subfield code="a">ru</subfield> </datafield> <datafield tag="787" ind1="0" ind2=" "> <subfield code="n"></subfield> </datafield> <datafield tag="500" ind1=" " ind2=" "> <subfield code="a"></subfield> </datafield> <datafield tag="500" ind1=" " ind2=" "> <subfield code="a"></subfield> </datafield> <datafield tag="500" ind1=" " ind2=" "> <subfield code="a"></subfield> </datafield> <datafield tag="540" ind1=" " ind2=" "> <subfield code="a">Авторы, публикующие в данном журнале, соглашаются со следующим:Авторы сохраняют за собой авторские права на работу и предоставляют журналу право первой публикации работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.Авторы сохраняют право заключать отдельные контрактные договорённости, касающиеся не-эксклюзивного распространения версии работы в опубликованном здесь виде (например, размещение ее в институтском хранилище, публикацию в книге), со ссылкой на ее оригинальную публикацию в этом журнале.Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).</subfield> </datafield> </record>
Видно, что переводы потеряны. Есть какие-то "Array" в 720 поле и много других недостатков.
HTML-страница[править]
В итоге ELiS работает так: по OAI-PMH находятся новые записи, из записей в Dublin Core извлекается URL страницы, она парсится и уже из HTML-страницы извлекаются знания о серии, томе, выпуске, страницах и т.д. Что-то может браться и из Dublin Core, но большую часть метаданных надежней извлечь именно с HTML.
Но и на веб-странице могут быть ошибки, например здесь указан диапазон страниц неверно.
<meta name="DC.Contributor.Sponsor" xml:lang="en" content=""/> <meta name="DC.Contributor.Sponsor" xml:lang="ru" content=""/> <meta name="DC.Creator.PersonalName" content="Тимонина Л.С."/> <meta name="DC.Date.created" scheme="ISO8601" content="2020-10-29"/> <meta name="DC.Date.dateSubmitted" scheme="ISO8601" content="2020-10-29"/> <meta name="DC.Date.issued" scheme="ISO8601" content="2020-10-30"/> <meta name="DC.Date.modified" scheme="ISO8601" content="2020-10-30"/> <meta name="DC.Description" xml:lang="en" content=" The author discusses the experience of building, maintaining and using the bibliographical database of science publications by the faculty of the state Dubna University. She analyzes in detail MegaPro ALIS retrieval functionality and describes different types of the system’s dictionaries and guides, their advantages and drawbacks in terms of entering data into bibliographic entry. The algorithm of using outer tables for reference when entering repeated subfields in one-click or entering data into several subfields of the bibliographic records. The example is given how hierarchical data of organization structure is used as an outer dictionary. Feasibility of using the directories of faculty authors and journals/other sources of information in publication databases is substantiated; example is given how to use them when entering several subfields of MARC21 fields 100, 700 and 773. The methodological solutions for maintaining directories of faculty authors and journals (and other information sources) are discussed. User and program interface for retrieving publications by author’s affliation, academic degree or title, institution, information source specific data are discussed as a result of building database of publications. The author emphasizes that the dictionaries may be used as supplementary information resources to support faculty publication activities and to integrate them into other university systems. "/> <meta name="DC.Description" xml:lang="ru" content=" В статье освещён опыт создания, ведения и использования библиографической базы научных публикаций сотрудников государственного университета «Дубна». Подробно проанализирован справочно-поисковый аппарат АИБС «МегаПро», описаны различные типы словарей и справочников системы, их достоинства и недостатки при внесении данных в библиографическую запись. Приведены алгоритмы использования внешних справочных таблиц как справочников при занесении в «один клик» повторяемых подполей библиографической записи и при занесении данных в несколько подполей поля библиографической записи. Приведён пример использования иерархических данных о структуре организации в качестве внешнего справочника. Обоснована необходимость использования в базах данных публикаций справочников университета авторов и журналов/иных источников информации, определена структура справочников, приведён пример их использования при занесении отдельных подполей полей 100, 700 и 773 формата MARC21. Выработаны методические решения по ведению справочников авторов университета и журналов/иных источников информации. В качестве результата создания БД публикаций приведена разработка пользовательского и программного интерфейсов поиска публикаций с учётом таких данных, как аффилиация автора, научные степень и звание, место работы, специфические данные источника информации. Отмечена возможность использования разработанных справочников как дополнительных информационных ресурсов поддержки публикационной деятельности преподавателей и интеграции их с другими системами вуза. "/> <meta name="DC.Format" scheme="IMT" content="application/pdf"/> <meta name="DC.Identifier" content="653"/> <meta name="DC.Identifier.pageNumber" content="143-158"/> <meta name="DC.Identifier.DOI" content="10.33186/1027-3689-2020-9-143-158"/> <meta name="dc.identifier" content="doi:10.33186/1027-3689-2020-9-143-158"/> <meta name="DC.Identifier.URI" content="https://ntb.gpntb.ru/jour/article/view/653"/> <meta name="DC.Language" scheme="ISO639-1" content="ru"/> <meta name="DC.Rights" content=" Авторы, публикующие в данном журнале, соглашаются со следующим: Авторы сохраняют за собой авторские права на работу и предоставляют журналу право первой публикации работы на условиях лицензии Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные контрактные договорённости, касающиеся не-эксклюзивного распространения версии работы в опубликованном здесь виде (например, размещение ее в институтском хранилище, публикацию в книге), со ссылкой на ее оригинальную публикацию в этом журнале. Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access ). "/> <meta name="DC.Source" content="Научные и технические библиотеки"/> <meta name="DC.Source.ISSN" content="2686-8601"/> <meta name="DC.Source.Issue" content="9"/> <meta name="DC.Source.URI" content="https://ntb.gpntb.ru/jour"/> <meta name="DC.Source.Volume" content="1"/> <meta name="DC.Subject" xml:lang="en" content="faculty publications"/> <meta name="DC.Subject" xml:lang="en" content="MegaPro"/> <meta name="DC.Subject" xml:lang="en" content="reference and information retrieval tools"/> <meta name="DC.Subject" xml:lang="en" content="affiliation"/> <meta name="DC.Subject" xml:lang="en" content="bibliographic entry"/> <meta name="DC.Subject" xml:lang="en" content="electronic catalog"/> <meta name="DC.Subject" xml:lang="ru" content="публикации сотрудников"/> <meta name="DC.Subject" xml:lang="ru" content="АИБС «МегаПро»"/> <meta name="DC.Subject" xml:lang="ru" content="справочно-поисковый аппарат"/> <meta name="DC.Subject" xml:lang="ru" content="аффилиация"/> <meta name="DC.Subject" xml:lang="ru" content="библиографическая запись"/> <meta name="DC.Subject" xml:lang="ru" content="электронный каталог"/> <meta name="DC.Title" content="Технологические и методические аспекты использования справочно-поискового аппарата для ведения базы публикаций сотрудников университета «Дубна»"/> <meta name="DC.Title.Alternative" xml:lang="en" content="Technological and methodological aspects of using reference and search tools in maintaining the database of Dubna University faculty’s publications"/> <meta name="DC.Type" content="Text.Serial.Journal"/> <meta name="DC.Type.articleType" content="АВТОМАТИЗИРОВАННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ"/> <meta name="gs_meta_revision" content="1.1" /> <meta name="citation_journal_title" content="Научные и технические библиотеки"/> <meta name="citation_issn" content="2686-8601"/> <meta name="citation_author" content="Л. С. Тимонина"/> <meta name="citation_author_institution" content="Государственный университет «Дубна»"/> <meta name="citation_title" content="Технологические и методические аспекты использования справочно-поискового аппарата для ведения базы публикаций сотрудников университета «Дубна»"/> <meta name="citation_date" content="2020/10/29"/> <meta name="citation_volume" content="1"/> <meta name="citation_issue" content="9"/> <meta name="citation_firstpage" content="143-158"/> <meta name="citation_doi" content="10.33186/1027-3689-2020-9-143-158"/> <meta name="citation_abstract_html_url" content="https://ntb.gpntb.ru/jour/article/view/653"/> <meta name="citation_language" content="ru"/> <meta name="citation_keywords" xml:lang="en" content="faculty publications"/> <meta name="citation_keywords" xml:lang="en" content="MegaPro"/> <meta name="citation_keywords" xml:lang="en" content="reference and information retrieval tools"/> <meta name="citation_keywords" xml:lang="en" content="affiliation"/> <meta name="citation_keywords" xml:lang="en" content="bibliographic entry"/> <meta name="citation_keywords" xml:lang="en" content="electronic catalog"/> <meta name="citation_keywords" xml:lang="ru" content="публикации сотрудников"/> <meta name="citation_keywords" xml:lang="ru" content="АИБС «МегаПро»"/> <meta name="citation_keywords" xml:lang="ru" content="справочно-поисковый аппарат"/> <meta name="citation_keywords" xml:lang="ru" content="аффилиация"/> <meta name="citation_keywords" xml:lang="ru" content="библиографическая запись"/> <meta name="citation_keywords" xml:lang="ru" content="электронный каталог"/> <meta name="citation_pdf_url" content="https://ntb.gpntb.ru/jour/article/download/653/573"/>
Выводы[править]
Увы, люди не идеальны и в метаданных даже у платных сервисов может быть мусор. Например у некоторых журналов НТБ volume проставлен в "0".
Если говорить про OJS, то метаданные в OAI-PMH не могут корректно описать журнальные статьи, в том числе в MARCXML.
Самые полные и точные метаданные на HTML-странице, но и там нельзя объединить переводы персон (понять, что Ivan Ivanov - это тот же человек, что и Иванов И.И.).
Поэтому не надо удивляться, что Google Scholar в итоге ходит в PDF и пытается достать метаданные из содержимого PDF.