home

Ответ на статью Эдуарда Сукиасяна "Какая электронная библиотека нам нужна?"

В "Научных и технических библиотеках" №10/2016 вышла статья Эдуарда Рубеновича Сукиасяна про электронные библиотеки http://www.gpntb.ru/ntb/ntb/2016/10/NTB10_2016_%D0%905_2.pdf.

Со своей стороны готов подискутировать с автором по обсуждаемой теме, являясь представителем критикуемой стороны создателей электронных библиотек (ЭБ).

Номера страниц[править]

Выбираем (если есть, из чего выбрать), нажимаем, получаем… текст на экране. Номеров страниц нет. 
... 

Если говорить про оцифрованные книги, то обычно номер страницы там ставит издательство и проблем возникнуть не должно.

Если рассматривать ситуацию, когда сборник разбивается на статьи и эти статьи размещаются в ЭБ в виде отдельных файлов, то разумно каждой такой отдельной статье присвоить глобально-уникальный идентификатор DOI или какой-то другой. Задача этого идентификатора - вести на конкретную статью (перенаправлять), при этом он может помочь распространять метаданные.

Крайне желательно, чтобы идентификатор присваивался при выпуске статьи, это позволит DOI указать прямо в статье и облегчить поиск оригинала при неконтролируемом распространении в интернете.

ЭБ, на которую ведет этот глобальный идентификатор - особенная. Именно на нее придет научная общественность. Так как новые научные статьи уже практически не распространяются в печатном виде, а обмен происходит в интернете - номер страницы в сборнике вместо DOI или аналога является рудиментом эпохи распространения знаний на бумаге.

Если такой подход не соответствует правилам описания - меняйте правила. Приводите их в соответствие цифровой эпохе.

Есть еще формат EPUB и его конкуренты-аналоги. В этом формате номера страницы нет совсем (хотя внутри XHTML-страницы есть, но производители ПО это скрывают т.к. разбиение на страницы не обязано что-то означать и может делаться по технологическим или административным причинам).

В формате EPUB видимый текст является частью XHTML. XHTML позволяет делать семантическое описание со всеми вытекающими из этого возможностями повышения релевантности полнотекстового поиска и автоматизированного извлечения знаний. Стандарт EPUB CFI позволяет не просто ссылаться на начало какой-то страницы, а ссылаться на любой абзац или даже любое слово в тексте или на мультимедийный объект (картинку, видео). Важно, что со стороны издателя не надо расставлять каких-либо специальных меток (в отличии от PDF).

Иными словами, в EPUB есть гораздо более мощный инструмент, чем навигация с помощью указания номера страницы. Если мировая библиография этот момент прохлопала, то с ее стороны требовать от EPUB откатиться в возможностях до номера страницы не совсем уместно.

Правда не стоит относиться к возможности использования EPUB CFI слишком оптимистично. ПО не очень хочет отображать ссылку на EPUB CFI к произвольному фрагменту, а использование EPUB CFI не является общепринятым. Да и наличие EPUB CFI не решает всех проблем создания ссылок на цифровой контент. Проблемы остаются, их много и кому-то надо будет ими заняться. Но в любом случае, остановить технический прогресс невозможно и судьба номера физической страницы уже предрешена. Ссылка на страницу целиком будет частным случаем ссылки на конкретный фрагмент произведения.

Количество произведений[править]

Необходимо понять: количество оцифрованных «произведений» – не самый важный показатель для любой электронной библиотеки

Мои метрики совершенно однозначно фиксируют зависимость популярности библиотеки от числа новых произведений. Особенно эта зависимость заметна, когда произведений в библиотеке мало и увеличение числа документов в два раза приводит к двукратному росту популярности.

Если владельцы библиотеки хотят роста аудитории - в библиотеку необходимо добавлять актуальные издания на постоянной основе. Прекращается добавление изданий - прекращается рост аудитории, который скоро сменится спадом из-за потери уже загруженными изданиями актуальности.

Конечно, я допускаю возможность работы библиотек, для которых посещаемость не является основным критерием успешности. Но к публичным библиотекам это, обычно, не относится. Если у тебя нет полезной информации, значит читатели найдут ее в другом месте, а ты им, налогоплательщикам, не особо и нужен.

К сожалению, большинство ЭБ вузов и региональных библиотек ориентированы на что угодно, но только не на успешность среди читателей.

Навигация по электронной библиотеке[править]

Если не касаться НЭБа и федеральных библиотек, то ЭБ организаций не успели накопить большого количества цифрового контента. Самостоятельная оцифровка дает 1000 изданий в год на одного занятого сотрудника. Т.е. даже сильная библиотека не может себе позволить оцифровать более 3-5 тыс. изданий в год самостоятельно.

Поэтому на начальном этапе создания и наполнения электронной библиотеки, ББК в электронной библиотеке просто не нужен. Что не отменяет необходимости описывать издания (как оцифрованные, так и поставленные извне) по всем правилам. И когда этих изданий станет много, можно будет в библиотеку добавить (включить отображение) ББК или что-то другое.

В каком-то смысле спираль истории вернулась в состояние, когда каждая малая ЭБ создает собственную систему навигации ни с кем и ни с чем не совместимую. По мере роста такая система станет все более запутанной. Бороться с этим преждевременно. Надо дать малым ЭБ накопить контент, а вот расставлять правильно индексы ББК можно и нужно уже сейчас.

Непосредственно само описание можно вести не в ЭБ, а в АБИС и просто добавить в ЭБ способ синхронизации или ссылку на карточку электронного документа в АБИС. Можно рассмотреть и альтернативные варианты связи АБИС с ЭБ.

Однако хочу подчеркнуть, я являюсь противником создания ЭБ на базе АБИС в виде некоторого модуля, хотя федеральные библиотеки, скорее, придерживаются обратной позиции, что ЭБ - это часть АБИС.

Итак: малым библиотекам допустимо использовать собственные системы навигации при условии, что индексы ББК или другой выбранной системы проставляются. Но иерархическая навигация в любом случае должна быть. Иерархической навигации может не быть в очень больших библиотеках по той причине, что большая часть контента не классифицирована и поиск может дать неожиданный результат (книга по той или иной науке есть, но она не нашлась из-за усечения). В больших библиотеках можно пользоваться фасетами в качестве альтернативы или дополнения иерархической навигации.

Что касается причин, почему поступающий в ЭБ изначально цифровой контент часто не описан, то виной тому не только ЭБ, а чаще сами библиотекари, которые просто не хотят делать описания. Проверить этот тезис достаточно просто: если бы виновны были ЭБ, которые не содержат необходимых инструментов описания, то все равно полное описание было бы в АБИС, поскольку нахождение документа в ЭБ не освобождает библиотекаря от ответственности описания в АБИС.

Я не хочу полностью оправдывать ЭБ и разделяю часть ответственности со своей стороны, ЭБ действительно могут не иметь удобных механизмов описания или заставлять одно и тоже делать дважды: один раз описывать в ЭБ и второй в АБИС. Но этот вопрос можно решить технически, если будет интерес всех заинтересованных сторон.

Также хочу отметить, что НЭБ является "сборной солянкой" документов и никогда не сможет решить всех проблем с описанием т.к. в основании НЭБ лежит некачественное описание в библиотеках - источниках произведений для НЭБ. Как много раз подчеркивали создатели, НЭБ - это библиотека распределенная, в самом НЭБ нет никаких документов. Все документы хранятся в библиотеках, а НЭБ лишь проксирует страницы книг через единый для всех библиотек сайт. Хотеть от НЭБа большего чем он делает сейчас - да, нужно. Но идеальный продукт на неидеальном фундаменте не построить.

Права на документы[править]

В России, да и в мире, нет стандарта на описание лицензии. Есть Creative Commons, но сам этот факт не решает всех проблем т.к. знание о лицензии необходимо еще не потерять при переносе из одной системы в другую, а сама ЭБ должна не только хранить ссылку на текст лицензии, но и знать: права доступа, разрешено ли скачивание, объем копирования/цитирования, число конкурентных лицензий, подсети с разрешенным доступом, цену покупки, текст договора в соответствии с которым лицензия выдана, срок действия, права на выдачу статистики, право на комментирование... И хорошо-бы заверить лицензию цифровой подписью. Т.е. должен быть достаточно гибкий стандарт описания лицензий и всех прав, проистекающих из них. Сейчас объективно перенести лицензию из одной системы в другую в общем случае невозможно и вина здесь всей отрасли, а не только ЭБ.

Но если библиотека из книжного оригинала сделала электронную копию (проще говоря – оцифровала книгу) и выставила её в свободное пользование, не получив разрешения автора, – закон нарушен. Мне непонятно, почему. Купив книгу в магазине, я могу делать с ней всё, что угодно: отсканировать, хранить в своём домашнем компьютере. Почему при чтении печатного текста закон об авторском праве не нарушается?

Законодательство об авторском праве запрещает распространение, а не потребление. В исключительно личных целях вы можете потреблять в цифровом виде любую книгу и не важно, с пиратского ресурса вы ее получили или нет. Пиратом, т.е. нарушителем, вы станете тогда, когда начнете без согласия правообладателя это произведение распространять. Есть некоторые исключения из этого правила, но для книг в ЭБ работает именно такой принцип.

Основа библиотечного фонда[править]

Не уверен, что самой ценной частью фондов электронных библиотек должна быть та литература, которая издаётся сегодня. Ведь именно о ней идёт речь в статьях большинства авторов, связывающих формирование фондов электронных библиотек с проблемами преодоления ограничений авторского права. Современная литература нужна учёным-естественникам, а также тем, кто работает над проблемами «пограничного слоя», отделяющего знание от незнания. В этой среде хорошо налажены коммуникации между учёными и научными школами, они обмениваются первоисточниками с помощью электронной доставки документов.

Почти половина всех издаваемых наименований произведений в России выходят тиражом менее 500 экз. Деньги на тираже в 500 экз. сделать сложно. Видимо, существенная часть этого контента является некоммерческой и может попасть в ЭБ совершенно бесплатно. Почему публичные ЭБ распространяют в основном оцифрованный контент в общественном достоянии? Наверное надо об этом спросить тех, кто считает авторское право непреодолимым препятствием на пути наполнения ЭБ востребованным контентом.

Вот литературоведам и историкам в широком смысле слова, изучающим историю науки и техники, культуры и искусства, архитектуры, действительно нужна электронная библиотека. Ведь многих изданий (начиная с книг, изданных в XVIII в.) в фондах библиотек просто нет.

Оцифровать все - проблематично с точки зрения ресурсов, а вот потерять контент изначально созданный в электронном виде и не требующий трудозатрат на оцифровку - очень даже легко. В библиотеках регионов, вузов и других организаций не особо заботятся о "вечном хранении" документов (которые в бумажной форме часто и не существуют), мы каждый день безвозвратно теряем цифровой контент (книги, брошюры, презентации, видео). Научные статьи из цифровых сборников оказываются на официальных сайтах, сайтах факультетов, в eLIBRARY.RU с КиберЛенинкой... да где угодно, только не в ЭБ вуза или региона! Но ни одна компания не "работает вечно". Рано или поздно КиберЛенинка с eLIBRARY.RU перестанут существовать из-за финансовых трудностей и есть опасения, что сохранение контента в момент ликвидации не будет для них приоритетным, а сайты факультетов и вузов в принципе не берут на себя ответственность за сохранение контента и, при запуске нового сайта, старый контент может быть потерян просто потому, что владельцы сайта не готовы тратить ресурсы на его перенос.

Заключение[править]

Электронным библиотекам надо активизироваться в направлении современного и актуального контента. Руководители библиотек несут прямую ответственность за потерю цифрового контента в результате своего бездействия, но эта потеря не осуждается профессиональным сообществом. В тоже время библиотеки продолжают вкладывать миллионы в оцифровку книг, которые потом не читают и искренне полагают, что так и нужно делать. Считаю, что к оцифровке следует подходить разумно в плане ресурсов, приоритетов и отдачи.

Библиотеки, выбравшие в качестве основного приоритета своей ЭБ оцифрованные издания, выбывают из технологической гонки с современными контентными сервисами, теряют значимость в глазах общества и предрешают свой закат в цифровой эпохе. Ну а ликвидация библиотек или преобразование в информационно-культурные центры приведет к тому, что и свою историческую миссию они тоже провалят.