Ведущие отечественные библиотеки предложили проект ГОСТа "Электронные библиотеки. Основные виды. Структура. Технология формирования".
Скачать проект можно по адресу: http://www.rsl.ru/datadocs/doc_7667xo.pdf
Содержание
Возражения и предложения по проекту[править]
Основные возражения - проект привязан к существующим федеральным электронным библиотекам. Он не универсален. Не подходит, например, сторонним интернет-библиотекам. Может не подходить и некоторым специальным библиотекам.
Определения[править]
Определение электронной библиотеки[править]
3.1 Электронная библиотека - информационная система, предназначенная для организации, хранения и использования электронных объектов, объединенных единой идеологией комплектования, структуризации и доступа, с едиными средствами навигации и поиска. Примечание: электронная библиотека классического типа - библиотечно-информационная система, предполагающая наличие фонда, каталога, модулей регистрации пользователей и управления контентом, средств обеспечения сохранности и доступа.
Электронная библиотека классического типа[править]
Есть нарекания к определению "электронная библиотека классического типа". Желание выделить отдельный класс библиотек, соответствие которому будет рекомендоваться библиотечному сообществу, совершенно понятно. Но нельзя сказать, что есть классический тип электронных библиотек в том смысле, что классика является чем-то устоявшимся, а более-менее устоявшееся понимание электронных библиотек как раз не совпадает с определением проекта ГОСТа. Если "классический тип" соотносить с классическими библиотеками, то, возможно, лучше говорить об "электронных библиотеках классической структуры". Но я предлагаю использовать аналог термину reference library, т.е. "типовая электронная библиотека" и именно по отношению к этому термину и вводить расширенные требования, которые в текущем проекте приписаны электронной библиотеке. В то время как термин "электронная библиотека" оставить для более широкого класса эксплуатируемых систем, чтобы термин "электронная библиотека" соответствовал бытовому пониманию.
Вместо "типовой электронной библиотеки" можно рассмотреть и такие варианты: "референсная электронная библиотека", "модельная электронная библиотека", "каноническая электронная библиотека". Во всех случаях подразумевается, что есть некоторый подход к построению библиотек, описанный в ГОСТе и которому библиотека должна соответствовать по формальным признакам.
С таких позиций, чтобы смысл "электронная библиотека" был приближен к бытовому, я и продолжу анализ недостатков определения.
Требования единства к электронной библиотеке[править]
3.1 Электронная библиотека - ... объединенных единой идеологией комплектования, структуризации и доступа...
Требования ЕДИНСТВА идеологии комплектования, структуризации, доступа и навигации являются излишними.
Учитывая, что есть разные подходы к навигации по ЭБ, спорным является требование единой идеологии навигации.
Пусть есть библиотечный сервис, который позволяет делегировать подразделениям организации загрузку документов в отдельные подкаталоги. Разные подразделения создают в своих подкаталогах собственную иерархию (навигацию) согласно своим бизнес-процессам или бизнес-задачам. В этом случае каталог один (един), но идеология навигации меняется и жестко не администрируется т.к. подразделениям виднее какая именно система навигации лучше для них подходит. Такой подход на практике может применяться в корпоративных библиотеках или в институциональных репозитариях.
Не очень понятно, что понимается под единством доступа. Управление правами доступа на уровне документа не является редкостью. В ELiS (http://elibsystem.ru), например, правами доступа можно управлять даже на уровне страниц. Т.к. подразделения могут самостоятельно управлять своими подкаталогами, то и об единстве доступа говорить вряд ли возможно. Если единство доступа понимается согласно п. 4.4, то на практике могут применяться смешанные подходы, т.е. загружены и открытые и ограниченные и условно-ограниченные документы.
Навигация И поиск[править]
3.1 Электронная библиотека - ... с едиными средствами навигации и поиска.
Является ли библиотекой то, что не содержит средств навигации? По определению - нет, ведь в определении стоит логическое "И" между навигацией и поиском. Т.е. НЭБ не является библиотекой т.к. в нем есть поиск, а из средств навигации, которыми можно воспользоваться не формируя поисковый запрос, есть только коллекции.
Обязана ли электронная библиотека иметь поиск? Если из библиотеки Максима Мошкова удалим поиск, будет ли http://lib.ru все еще библиотекой или уже нет? По проекту ГОСТа получается, что нет.
Альтернативное определение электронной библиотеки[править]
Переход от электронных документов в качестве основной хранимой единицы к электронным объектам мне представляется нецелесообразным.
Если несколько скорректировать определение, то получится:
Электронная библиотека - информационная система, предназначенная для хранения и предоставления доступа к электронным документам с использованием средств навигации или поиска.
Почему не "использования электронных объектов", а "предоставления доступа к электронным документам"? В начале почему не объектам: объект обязан быть идентифицируем и только, т.е. не обязан иметь метаданные, а идентифицировать можно по чему угодно, например, по внутреннему идентификатору в базе данных, по хеш-сумме или по пути до файла на файловой системе. Что может быть такой "библиотекой"? Ну, например, каталог ссылок. Если из Яндекс.Каталога (https://yaca.yandex.ru) убрать все метаданные о сайтах кроме гиперссылок, но оставить существующую схему навигации, то этот каталог подойдет под определение проекта ГОСТа. Но разве каталог гиперссылок является библиотекой?
Почему не "использования", а "предоставления доступа"? Потому что под использованием можно понимать что угодно. Вот Антиплагиат - это библиотека? Файлы в него загружаются, идентифицируются, упорядочиваются (для внутренних целей и по организациям) и используются (для поиска заимствований). Разве Антиплагиат - это электронная библиотека?
Почему исчезла "организация" из определения? Потому что организация связана с навигацией. Организация самим своим фактом выстраивает навигацию. А если есть навигация, то есть и некоторая организация.
Объект электронной библиотеки[править]
3.6 Объект электронной библиотеки – идентифицируемая единица хранения. Примечание: объектом электронной библиотеки может быть документ, гиперссылка.
В 4.3 говорится, что самостоятельные электронные библиотеки организованы в виде отдельного массива информационных объектов. В 3.6 дается определение не информационному объекту, а объекту электронной библиотеки. Возможно, в 4.3 речь идет об объектах электронной библиотеки. В самом определении 3.1 говорится об "электронных объектах", в то время как термин "электронный объект" не определен, а определен "объект электронной библиотеки".
Считаю, что абстракция гиперссылки (информационный/электронный объект) не являются основной сущностью хранения электронных библиотек. Библиотеки хранят документы. Обосную от противного.
Легко представить себе "библиотеку" в которой в качестве единиц хранения будут только гиперссылки. Каталогизированные, описанные, с метаданными, поиском и выполняющие все остальные требования проекта ГОСТа. Эта "электронная библиотека" называется в настоящее время электронным каталогом с заполненным полем "full text". Т.е. проект ГОСТа считает электронный каталог АБИС электронной библиотекой.
Проблема возникла из-за того, что электронный (информационный) объект сам может быть метаинформацией и, получается, электронная библиотека может не хранить электронные документы вообще, а хранить только метаданные.
Коллекция электронных документов[править]
3.8 Коллекция электронных документов – логическое объединение электронных объектов, предназначенное для реализации задач, определенных политикой электронной библиотеки.
Коллекция электронных документов - это объединение электронных документов объектов!!!
Комментарии излишни. Но проблема появилась из-за попытки втиснуть на место электронного документа электронный объект.
Типология электронных библиотек[править]
По способу создания[править]
4.1 Электронные библиотеки по способу создания: - Генерируемые – контент создается владельцами фонда электронной библиотеки; - Агрегируемые – собираемые из цифрового контента; - Смешанные – состоящие из генерируемого и агрегируемого контента.
Здесь правильна только одна строчка, про смешанные. Под генерацией понимается создание некоторого объекта. Генерируемая библиотека - это библиотека, автоматически сгенерированная, например, из директории с файлами на диске. На самом деле следует написать:
4.1 Электронные библиотеки по способу наполнения: - Ручные – документы загружаются людьми; - Автоматические – автоматически-собираемые из внешних источников; - Смешанные – состоящие из ручного отбора и агрегированного или с предмодерацией автоматически-собранных документов.
Также, возможно, авторы хотели назвать пункт 4.1 Электронные библиотеки по способу создания электронных документов. В таком случае в 4.1 сами пункты менять не нужно.
По типу доступа[править]
4.4 Электронные библиотеки по типу доступа: открытый – предоставляемый кругу пользователей без специальных финансовых, юридических и технических условий. ограниченный – требующий авторизации, регистрации или предоставляемый кругу пользователей, на условиях владельца электронной библиотеки, информационного посредника или лицензионных условий. условно-открытый – предоставляемый кругу пользователей как объект авторского и смежного права
Здесь смешали лицензирование контента с ограничениями доступа. Правильно разделить лицензирование и ограничения доступа. Если попытаться понять, какой контент не имеет юридических условий, то получается, что открытый - это в public domain (лицензия Creative Commons - это юридические требования) и без технических ограничений и бесплатно. Тогда это не открытый, а не защищенный авторским правом без технических ограничений.
Я бы предложил разбить этот пункт на несколько пунктов:
Библиотеки по финансовой политике: - платный; - бесплатный; - смешанный.
Библиотеки по типам доступа: - открытый - нет технических условий; - условно-открытый - требуется выполнение технических требований или действий для получения доступа; - закрытый - доступ для ограниченной группы пользователей, устанавливаемый администрацией библиотеки; - смешанный.
Библиотеки по лицензионным ограничениям документов: - неограниченные - на документы не распространяется авторское право (public domain); - открытые - согласно ст. 1286.1 ГК РФ; - ограниченные - на документы распространяется авторское право и они не являются открытыми; - смешанные.
Библиотеки по целям деятельности: - коммерческие; - некоммерческие.
Указание типа библиотек по лицензионным ограничением отличается от разделения по финансовой политике тем, что указываются лицензионные ограничения, а не стоимостные. При этом особо выделяются открытые лицензии (включая Creative Commons) согласно текущему пониманию Закона.
Также я добавил эти деления исходя из ценности этих знаний для пользователя. Пользователь хочет знать, затребуют ли с него денег за документы, будут ли показывать рекламу, какими правами на использование документов библиотеки обладает, потребуется ли регистрация. Именно поэтому коммерческие/некоммерческие библиотеки выделены отдельно, хотя такое определение фактически входит в определение организации-владельца и могло бы и не выделяться как характеристика электронной библиотеки.
Библиотеки по технической открытости[править]
Также предлагаю добавить пункт про интегрируемость с внешними библиотеками
Библиотеки по технической открытости: - Безусловно-открытые - предоставляющие бесплатный неограниченный доступ к своему функционалу по открытым международным протоколам без лицензионных ограничений; - Ограниченно-открытые - предоставляющие бесплатный доступ к своему функционалу по открытым протоколам с лицензионными ограничениями; - Условно-открытые - предоставляющие бесплатный доступ к своему функционалу по собственным протоколам; - Открытые - безусловно-открытые, ограниченно-открытые или условно-открытые; - Закрытые - предоставляющие платный или частично-платный доступ к своему функционалу; - Обособленные - не предоставляющие доступа к своему функционалу по какому-либо протоколу;
Различие ограниченно-открытых от безусловно-открытых в лицензионных ограничениях. Например, создатели библиотеки могут затребовать не использовать API в коммерческих целях.
Библиотеки по мобильной доступности[править]
В связи с развитием мобильных устройств, предлагаю выделить эту функциональность отдельно.
Библиотеки по мобильной доступности: - Адаптированная для планшетов - сайт имеет версию (или адаптирует основную версию) для работы на планшетах. - Адаптированная - сайт имеет версию (или адаптирует основную версию) для работы на планшетах и смартфонах. - Доступная - адаптированная библиотека, имеющая мобильные приложения хотя бы под две актуальные мобильные платформы (платформа актуальна, если новые устройства с ее поддержкой находятся в свободной продаже). - Мобильная - библиотека имеет мобильное приложение, но не сайт. - Неоптимизированная - сайт не имеет оптимизации для просмотра на мобильных устройствах. - Недоступная - библиотека не работает на мобильных устройствах.
Вопрос актуальности платформы можно обсуждать дополнительно, например, платформа актуальна, если на рынке представлено не менее 5% работающих с ее поддержкой устройств.
Структура электронной библиотеки[править]
Структура библиотеки списана с федерального подхода и может сильно отличаться от других решений.
В п. 5.4 фонд электронной библиотеки разделяется на фонд пользовательских копий и страховых копий. В этом разделении реализована конкретная архитектура создания резервной копии.
В ГОСТе неявно предполагается, что есть электронная библиотека доступная всем и есть отдельное хранилище, в котором хранятся оригиналы на случай выхода библиотеки из строя. Но это не единственный способ осуществления резервирования документов. Возможно делать резервные копии электронной библиотеки целиком в виде снапшотов виртуальных машин или создавать географически-распределенные кластеры с полностью продублированными электронными документами и метаданными (базами данных).
Также, по видимому, предполагается, что в архиве может быть мастер-копия, а пользовательская копия - уменьшенная копия. Во многих случаях такой подход может не использоваться, например, в ELiS пользовательская копия не создается, а уменьшенные страницы генерируются на лету из мастер-копии. Резервное копирование может делаться разными путями и рекомендуемый - делать снапшот виртуальных машин. Вряд-ли копию виртуальной машины можно назвать страховым фондом и, поэтому, ELiS и многие другие электронные библиотеки не попадают под ОБЯЗАТЕЛЬНУЮ структуру согласно проекта ГОСТа. НЭБ в текущем виде, на сколько мне известно, тоже не проходит через требования 5.4 к структуре фонда.
Состав электронной библиотеки[править]
Документы, представляющие контент[править]
В 6.2 указывается, что ссылки на внешние ресурсы тоже являются документом. Это указание следует исключить.
Комментарии тоже могут быть контентом. В целом, если не использовать понятие контента как документ + часть метаданных, то можно не определять понятие контента.
Содержание контента[править]
В 6.3 указывается, что контент содержит первичные документы и описательные метаданные.
Обычно под контентом понимается полезная/содержательная часть информации. Для страницы сайта, например, контентом будет статья и встроенные и относящиеся к статье рисунки, а меню или рекламные баннеры не будут. При этом отдельный рисунок из статьи или абзац тоже являются контентом. Т.е. любая часть контента тоже является контентом.
В применении к книгам, если вы загрузите EPUB с рисунками и текстом и веб-плеер будет отображать документ, то и абзац и рисунки - все это контент как в целом, так и по-отдельности.
В определении же 6.3 контентом называется то, что скорее следует называть документом, т.е. документ целиком + описательные метаданные. Но документ не разделим на части и в этом месте определение контента противоречит общепринятому пониманию.
Технология электронной библиотеки[править]
В 8.5 по сохранности электронных документов из пункта
- предотвращение утраты данных и изменения (искажения) контента при каждом принципиальном обновлении программного обеспечения;
следует исключить уточнение про обновление ПО. Исключение связано с тем, что потери данных могут возникнуть не сразу, а спустя месяцы и годы работы по вине редковстречающейся ошибки.
Также в 8.5 можно добавить пункт
- консистентность данных
При этом хочу отметить, что проект ГОСТа обеспокоен сохранностью только электронных документов, в то время как создание электронной библиотеки требует существенных усилий. Поэтому целесообразно говорить о задаче целостности и сохранности всей электронной библиотеки, особенно выделяя сохранность электронных документов собственной генерации.
Архитектура электронной библиотеки[править]
В 10.3 указывается, что архитектура электронной библиотеки может быть централизованной, распределенной и комбинированной. При этом распределенная архитектура:
– источники данных, хранилища электронных объектов и метаданных распределены территориально и не являются составными частями электронной библиотеки
Если метаданные и документы распределены территориально и не являются составными частями библиотеки, то библиотека никак не может их обрабатывать самостоятельно. Такая система, по сути, является распределенным поиском, а не библиотекой. Чтобы предоставить возможность навигации надо как минимум проиндексировать метаданные, т.е. собрать метаданные вместе в рамках электронной библиотеки.
Возможно в п. 10.3 идет речь не об архитектуре библиотеки, а об типе фонда (распределенный фонд, централизованный, комбинированный). Замечу также, что в проекте ни разу не встречается упоминание федеративной или корпоративной электронных библиотек.
Заключение[править]
К сожалению, цели проекта ГОСТа сформулированны недостаточно четко. Если есть задача написать единые и жесткие требования к электронным библиотекам для библиотекарей - это один вопрос. При этом системы типа DSpace не получат права называться электронной библиотекой. Увы. Если есть задача стандартизовать АБИС в качестве электронной библиотеки - это другой вопрос.
Я же считаю, что следует разработать стандарт, в котором:
- будет описана электронная библиотека в самом общем виде, который не назовет АБИС электронной библиотекой, а DSpace назовет;
- будет описана каноническая электронная библиотека, на которую смогут равняться библиотеки всех уровней.
В таком случае, проект стандарта требуется существенно перерабатывать.
Надеюсь, что мои замечания и предложения в этом процессе будут полезны.