home

Замечания к проекту национального стандарта электронной библиотеки ГОСТ Р 7.0.x - 2016

Ведущие отечественные библиотеки предложили проект ГОСТа "Электронные библиотеки. Основные виды. Структура. Технология формирования".

Скачать проект можно по адресу: http://www.rsl.ru/datadocs/doc_7667xo.pdf

gost-e-library-cover.png


Возражения и предложения по проекту[править]

Основные возражения - проект привязан к существующим федеральным электронным библиотекам. Он не универсален. Не подходит, например, сторонним интернет-библиотекам. Может не подходить и некоторым специальным библиотекам.


Определения[править]

Определение электронной библиотеки[править]

3.1 Электронная библиотека - информационная система, предназначенная для организации, хранения и использования электронных объектов, объединенных единой идеологией комплектования, структуризации и доступа, с едиными средствами навигации и поиска. 

Примечание: электронная библиотека классического типа - библиотечно-информационная система,  предполагающая наличие фонда, каталога, модулей регистрации пользователей и управления контентом, средств обеспечения сохранности и доступа.


Электронная библиотека классического типа[править]

Есть нарекания к определению "электронная библиотека классического типа". Желание выделить отдельный класс библиотек, соответствие которому будет рекомендоваться библиотечному сообществу, совершенно понятно. Но нельзя сказать, что есть классический тип электронных библиотек в том смысле, что классика является чем-то устоявшимся, а более-менее устоявшееся понимание электронных библиотек как раз не совпадает с определением проекта ГОСТа. Если "классический тип" соотносить с классическими библиотеками, то, возможно, лучше говорить об "электронных библиотеках классической структуры". Но я предлагаю использовать аналог термину reference library, т.е. "типовая электронная библиотека" и именно по отношению к этому термину и вводить расширенные требования, которые в текущем проекте приписаны электронной библиотеке. В то время как термин "электронная библиотека" оставить для более широкого класса эксплуатируемых систем, чтобы термин "электронная библиотека" соответствовал бытовому пониманию.

Вместо "типовой электронной библиотеки" можно рассмотреть и такие варианты: "референсная электронная библиотека", "модельная электронная библиотека", "каноническая электронная библиотека". Во всех случаях подразумевается, что есть некоторый подход к построению библиотек, описанный в ГОСТе и которому библиотека должна соответствовать по формальным признакам.

С таких позиций, чтобы смысл "электронная библиотека" был приближен к бытовому, я и продолжу анализ недостатков определения.


Требования единства к электронной библиотеке[править]

3.1 Электронная библиотека - ... объединенных единой идеологией комплектования, структуризации и доступа...

Требования ЕДИНСТВА идеологии комплектования, структуризации, доступа и навигации являются излишними.

Учитывая, что есть разные подходы к навигации по ЭБ, спорным является требование единой идеологии навигации.

Пусть есть библиотечный сервис, который позволяет делегировать подразделениям организации загрузку документов в отдельные подкаталоги. Разные подразделения создают в своих подкаталогах собственную иерархию (навигацию) согласно своим бизнес-процессам или бизнес-задачам. В этом случае каталог один (един), но идеология навигации меняется и жестко не администрируется т.к. подразделениям виднее какая именно система навигации лучше для них подходит. Такой подход на практике может применяться в корпоративных библиотеках или в институциональных репозитариях.

Не очень понятно, что понимается под единством доступа. Управление правами доступа на уровне документа не является редкостью. В ELiS (http://elibsystem.ru), например, правами доступа можно управлять даже на уровне страниц. Т.к. подразделения могут самостоятельно управлять своими подкаталогами, то и об единстве доступа говорить вряд ли возможно. Если единство доступа понимается согласно п. 4.4, то на практике могут применяться смешанные подходы, т.е. загружены и открытые и ограниченные и условно-ограниченные документы.


Навигация И поиск[править]

3.1 Электронная библиотека - ... с едиными средствами навигации и поиска. 

Является ли библиотекой то, что не содержит средств навигации? По определению - нет, ведь в определении стоит логическое "И" между навигацией и поиском. Т.е. НЭБ не является библиотекой т.к. в нем есть поиск, а из средств навигации, которыми можно воспользоваться не формируя поисковый запрос, есть только коллекции.

Обязана ли электронная библиотека иметь поиск? Если из библиотеки Максима Мошкова удалим поиск, будет ли http://lib.ru все еще библиотекой или уже нет? По проекту ГОСТа получается, что нет.


Альтернативное определение электронной библиотеки[править]

Переход от электронных документов в качестве основной хранимой единицы к электронным объектам мне представляется нецелесообразным.

Если несколько скорректировать определение, то получится:

Электронная библиотека - информационная система, предназначенная для хранения и предоставления доступа к электронным документам с использованием средств навигации или поиска.

Почему не "использования электронных объектов", а "предоставления доступа к электронным документам"? В начале почему не объектам: объект обязан быть идентифицируем и только, т.е. не обязан иметь метаданные, а идентифицировать можно по чему угодно, например, по внутреннему идентификатору в базе данных, по хеш-сумме или по пути до файла на файловой системе. Что может быть такой "библиотекой"? Ну, например, каталог ссылок. Если из Яндекс.Каталога (https://yaca.yandex.ru) убрать все метаданные о сайтах кроме гиперссылок, но оставить существующую схему навигации, то этот каталог подойдет под определение проекта ГОСТа. Но разве каталог гиперссылок является библиотекой?

Почему не "использования", а "предоставления доступа"? Потому что под использованием можно понимать что угодно. Вот Антиплагиат - это библиотека? Файлы в него загружаются, идентифицируются, упорядочиваются (для внутренних целей и по организациям) и используются (для поиска заимствований). Разве Антиплагиат - это электронная библиотека?

Почему исчезла "организация" из определения? Потому что организация связана с навигацией. Организация самим своим фактом выстраивает навигацию. А если есть навигация, то есть и некоторая организация.


Объект электронной библиотеки[править]

3.6 Объект электронной библиотеки – идентифицируемая единица хранения. Примечание: объектом электронной библиотеки может быть документ, гиперссылка.

В 4.3 говорится, что самостоятельные электронные библиотеки организованы в виде отдельного массива информационных объектов. В 3.6 дается определение не информационному объекту, а объекту электронной библиотеки. Возможно, в 4.3 речь идет об объектах электронной библиотеки. В самом определении 3.1 говорится об "электронных объектах", в то время как термин "электронный объект" не определен, а определен "объект электронной библиотеки".

Считаю, что абстракция гиперссылки (информационный/электронный объект) не являются основной сущностью хранения электронных библиотек. Библиотеки хранят документы. Обосную от противного.

Легко представить себе "библиотеку" в которой в качестве единиц хранения будут только гиперссылки. Каталогизированные, описанные, с метаданными, поиском и выполняющие все остальные требования проекта ГОСТа. Эта "электронная библиотека" называется в настоящее время электронным каталогом с заполненным полем "full text". Т.е. проект ГОСТа считает электронный каталог АБИС электронной библиотекой.

Проблема возникла из-за того, что электронный (информационный) объект сам может быть метаинформацией и, получается, электронная библиотека может не хранить электронные документы вообще, а хранить только метаданные.


Коллекция электронных документов[править]

3.8 Коллекция электронных документов – логическое объединение электронных объектов, предназначенное для реализации задач, определенных политикой электронной библиотеки. 

Коллекция электронных документов - это объединение электронных документов объектов!!!

Комментарии излишни. Но проблема появилась из-за попытки втиснуть на место электронного документа электронный объект.


Типология электронных библиотек[править]

По способу создания[править]

4.1 Электронные библиотеки по способу создания:
- Генерируемые – контент создается владельцами фонда электронной библиотеки;
- Агрегируемые – собираемые из цифрового контента;
- Смешанные – состоящие из генерируемого и агрегируемого контента.

Здесь правильна только одна строчка, про смешанные. Под генерацией понимается создание некоторого объекта. Генерируемая библиотека - это библиотека, автоматически сгенерированная, например, из директории с файлами на диске. На самом деле следует написать:

4.1 Электронные библиотеки по способу наполнения:
- Ручные – документы загружаются людьми;
- Автоматические – автоматически-собираемые из внешних источников;
- Смешанные – состоящие из ручного отбора и агрегированного или с предмодерацией автоматически-собранных документов.

Также, возможно, авторы хотели назвать пункт 4.1 Электронные библиотеки по способу создания электронных документов. В таком случае в 4.1 сами пункты менять не нужно.


По типу доступа[править]

4.4 Электронные библиотеки по типу доступа:
 открытый – предоставляемый кругу пользователей без специальных финансовых, юридических и технических условий. 
 ограниченный – требующий авторизации, регистрации или предоставляемый кругу пользователей, на условиях владельца электронной библиотеки, информационного посредника или лицензионных условий.
 условно-открытый – предоставляемый кругу пользователей как объект авторского и смежного права

Здесь смешали лицензирование контента с ограничениями доступа. Правильно разделить лицензирование и ограничения доступа. Если попытаться понять, какой контент не имеет юридических условий, то получается, что открытый - это в public domain (лицензия Creative Commons - это юридические требования) и без технических ограничений и бесплатно. Тогда это не открытый, а не защищенный авторским правом без технических ограничений.

Я бы предложил разбить этот пункт на несколько пунктов:

Библиотеки по финансовой политике:
 - платный;
 - бесплатный;
 - смешанный.
Библиотеки по типам доступа:
- открытый - нет технических условий;
- условно-открытый - требуется выполнение технических требований или действий для получения доступа;
- закрытый - доступ для ограниченной группы пользователей, устанавливаемый администрацией библиотеки;
- смешанный.
Библиотеки по лицензионным ограничениям документов:
- неограниченные - на документы не распространяется авторское право (public domain);
- открытые - согласно ст. 1286.1 ГК РФ;
- ограниченные - на документы распространяется авторское право и они не являются открытыми;
- смешанные.
Библиотеки по целям деятельности:
- коммерческие;
- некоммерческие.

Указание типа библиотек по лицензионным ограничением отличается от разделения по финансовой политике тем, что указываются лицензионные ограничения, а не стоимостные. При этом особо выделяются открытые лицензии (включая Creative Commons) согласно текущему пониманию Закона.

Также я добавил эти деления исходя из ценности этих знаний для пользователя. Пользователь хочет знать, затребуют ли с него денег за документы, будут ли показывать рекламу, какими правами на использование документов библиотеки обладает, потребуется ли регистрация. Именно поэтому коммерческие/некоммерческие библиотеки выделены отдельно, хотя такое определение фактически входит в определение организации-владельца и могло бы и не выделяться как характеристика электронной библиотеки.


Библиотеки по технической открытости[править]

Также предлагаю добавить пункт про интегрируемость с внешними библиотеками

Библиотеки по технической открытости:
- Безусловно-открытые - предоставляющие бесплатный неограниченный доступ к своему функционалу по открытым международным протоколам без лицензионных ограничений;
- Ограниченно-открытые - предоставляющие бесплатный доступ к своему функционалу по открытым протоколам с лицензионными ограничениями;
- Условно-открытые - предоставляющие бесплатный доступ к своему функционалу по собственным протоколам;
- Открытые - безусловно-открытые, ограниченно-открытые или условно-открытые;
- Закрытые - предоставляющие платный или частично-платный доступ к своему функционалу;
- Обособленные - не предоставляющие доступа к своему функционалу по какому-либо протоколу;

Различие ограниченно-открытых от безусловно-открытых в лицензионных ограничениях. Например, создатели библиотеки могут затребовать не использовать API в коммерческих целях.


Библиотеки по мобильной доступности[править]

В связи с развитием мобильных устройств, предлагаю выделить эту функциональность отдельно.

Библиотеки по мобильной доступности: 
- Адаптированная для планшетов - сайт имеет версию (или адаптирует основную версию) для работы на планшетах.
- Адаптированная - сайт имеет версию (или адаптирует основную версию) для работы на планшетах и смартфонах.
- Доступная - адаптированная библиотека, имеющая мобильные приложения хотя бы под две актуальные мобильные платформы (платформа актуальна, если новые устройства с ее поддержкой находятся в свободной продаже).
- Мобильная - библиотека имеет мобильное приложение, но не сайт.
- Неоптимизированная - сайт не имеет оптимизации для просмотра на мобильных устройствах. 
- Недоступная - библиотека не работает на мобильных устройствах.

Вопрос актуальности платформы можно обсуждать дополнительно, например, платформа актуальна, если на рынке представлено не менее 5% работающих с ее поддержкой устройств.


Структура электронной библиотеки[править]

Структура библиотеки списана с федерального подхода и может сильно отличаться от других решений.

В п. 5.4 фонд электронной библиотеки разделяется на фонд пользовательских копий и страховых копий. В этом разделении реализована конкретная архитектура создания резервной копии.

В ГОСТе неявно предполагается, что есть электронная библиотека доступная всем и есть отдельное хранилище, в котором хранятся оригиналы на случай выхода библиотеки из строя. Но это не единственный способ осуществления резервирования документов. Возможно делать резервные копии электронной библиотеки целиком в виде снапшотов виртуальных машин или создавать географически-распределенные кластеры с полностью продублированными электронными документами и метаданными (базами данных).

Также, по видимому, предполагается, что в архиве может быть мастер-копия, а пользовательская копия - уменьшенная копия. Во многих случаях такой подход может не использоваться, например, в ELiS пользовательская копия не создается, а уменьшенные страницы генерируются на лету из мастер-копии. Резервное копирование может делаться разными путями и рекомендуемый - делать снапшот виртуальных машин. Вряд-ли копию виртуальной машины можно назвать страховым фондом и, поэтому, ELiS и многие другие электронные библиотеки не попадают под ОБЯЗАТЕЛЬНУЮ структуру согласно проекта ГОСТа. НЭБ в текущем виде, на сколько мне известно, тоже не проходит через требования 5.4 к структуре фонда.


Состав электронной библиотеки[править]

Документы, представляющие контент[править]

В 6.2 указывается, что ссылки на внешние ресурсы тоже являются документом. Это указание следует исключить.

Комментарии тоже могут быть контентом. В целом, если не использовать понятие контента как документ + часть метаданных, то можно не определять понятие контента.


Содержание контента[править]

В 6.3 указывается, что контент содержит первичные документы и описательные метаданные.

Обычно под контентом понимается полезная/содержательная часть информации. Для страницы сайта, например, контентом будет статья и встроенные и относящиеся к статье рисунки, а меню или рекламные баннеры не будут. При этом отдельный рисунок из статьи или абзац тоже являются контентом. Т.е. любая часть контента тоже является контентом.

В применении к книгам, если вы загрузите EPUB с рисунками и текстом и веб-плеер будет отображать документ, то и абзац и рисунки - все это контент как в целом, так и по-отдельности.

В определении же 6.3 контентом называется то, что скорее следует называть документом, т.е. документ целиком + описательные метаданные. Но документ не разделим на части и в этом месте определение контента противоречит общепринятому пониманию.


Технология электронной библиотеки[править]

В 8.5 по сохранности электронных документов из пункта

- предотвращение утраты данных и изменения (искажения) контента при каждом принципиальном обновлении программного обеспечения; 

следует исключить уточнение про обновление ПО. Исключение связано с тем, что потери данных могут возникнуть не сразу, а спустя месяцы и годы работы по вине редковстречающейся ошибки.

Также в 8.5 можно добавить пункт

- консистентность данных

При этом хочу отметить, что проект ГОСТа обеспокоен сохранностью только электронных документов, в то время как создание электронной библиотеки требует существенных усилий. Поэтому целесообразно говорить о задаче целостности и сохранности всей электронной библиотеки, особенно выделяя сохранность электронных документов собственной генерации.


Архитектура электронной библиотеки[править]

В 10.3 указывается, что архитектура электронной библиотеки может быть централизованной, распределенной и комбинированной. При этом распределенная архитектура:

– источники данных, хранилища электронных объектов и метаданных распределены территориально и не являются составными частями электронной библиотеки

Если метаданные и документы распределены территориально и не являются составными частями библиотеки, то библиотека никак не может их обрабатывать самостоятельно. Такая система, по сути, является распределенным поиском, а не библиотекой. Чтобы предоставить возможность навигации надо как минимум проиндексировать метаданные, т.е. собрать метаданные вместе в рамках электронной библиотеки.

Возможно в п. 10.3 идет речь не об архитектуре библиотеки, а об типе фонда (распределенный фонд, централизованный, комбинированный). Замечу также, что в проекте ни разу не встречается упоминание федеративной или корпоративной электронных библиотек.

Заключение[править]

К сожалению, цели проекта ГОСТа сформулированны недостаточно четко. Если есть задача написать единые и жесткие требования к электронным библиотекам для библиотекарей - это один вопрос. При этом системы типа DSpace не получат права называться электронной библиотекой. Увы. Если есть задача стандартизовать АБИС в качестве электронной библиотеки - это другой вопрос.

Я же считаю, что следует разработать стандарт, в котором:

  • будет описана электронная библиотека в самом общем виде, который не назовет АБИС электронной библиотекой, а DSpace назовет;
  • будет описана каноническая электронная библиотека, на которую смогут равняться библиотеки всех уровней.

В таком случае, проект стандарта требуется существенно перерабатывать.

Надеюсь, что мои замечания и предложения в этом процессе будут полезны.