Сколько стоит оцифровка всех книг страны

Пользователи ждут от библиотек "оцифровки всего". Библиотеки говорят - денег на оцифровку нет. Типовая областная библиотека в год оцифровывает около 1 тыс. книг.

А и правда, сколько стоит все оцифровать?

Начнем с оцифровки хотя бы всего того, что издается сейчас, а затем пересчитаем на все ранее изданное.

В год производится по данным Российской книжной палаты около 100 тыс. книг и брошюр. Типовая книга ну пусть 300 страниц.

bookchamber_stat_2016.png

Не будем ставить задачу точного подсчета стоимости, важно понять примерную сумму, поэтому некоторые моменты упростим (например, стоимость принято считать в оцифрованных страницах, а не книгах).

Персонал[править]

Современные библиотеки оцифровывают очень медленно (1000 книг в год). Многие зачем-то выполняют ручной разворот книг, обрезку и цветокоррекцию в Photoshop. Все это в принципе можно решить покупкой специального ПО. При отлаженном процессе и качественных сканерах с ПО, на оцифровку одной книги заложим 1 час.

Один человек за рабочую смену оцифрует 8 книг, а за год 2 тыс. Для оцифровки 100 тыс. книг и брошюр выходящих за год нам потребуется штат 50 человек.

50 человек при средней зарплате 40 тыс. руб. или около 60 тыс. руб с налогами. Содержание помещения обычно составляте около 30% от зараплаты, а всего 80 тыс. руб. на человека в месяц, или 1 млн. на ставку в год.

50 ставок - 50 млн. руб. в год с налогами и помещением. Руководитель, системный администратор и разработчик еще + 5 млн. руб.

Итого: 55 млн. руб.

Если вывести оцифровку в удаленные от Москвы города, стоимость можно снизить до 1.5 раз.

Оборудование[править]

Нам нужны сканеры, серверы с хранилищем и резервные копии.

Сервера[править]

Одна книга занимает где-то 0.5 ГБ. Но т.к. для резервной копии книги нужно еще столько-же, то 1 ГБ.

Всего на 100 тыс. книг надо 100 ТБ в год.

Пусть на один сервер помещается 8 дисков по 6 ТБ. С учетом создания RAID6, свободное место будет 6 дисков х 6 ТБ = 36 ТБ.

server.jpg

Соответственно, каждый год надо добавлять в стойки по три сервера. Эти же сервера будут отдавать и обрабатывать контент. На стоимость одного сервера заложим 1 млн. руб.

Каждый год надо добавлять серверов на 3 млн. руб. Также потребуются затраты на амортизацию существующих серверов 10-15% от их стоимости, т.е. сервера стоят 3.5 млн. в год.

Еще потребуется стойка с питанием. В цоде уровня TIER-3 на это уйдет до 120 тыс. за сервер в год. Но с учетом того, что у нас будет часть серверов содержать за прошлые года, заложим 1.5 млн. в год.

Расходы на серверное оборудование для хранения всего в одном экземпляре с резервной копией: 5 млн. в год с постепенным нарастанием стоимости из-за роста числа серверов, работу которых надо поддерживать.

В реальности повышение отказоустойчивости потребует создание еще одного ЦОДа в другом городе (или за городом), что увеличит стоимость проекта в два раза до 10 млн. руб.

На сервера потребуется установка ПО. В целом ПО обычно обходится в стоимость оборудования, т.е. еще 6 млн. руб.

Сканеры[править]

Сканеры имеет смысл рассматривать автоматические (10-15 млн.) и полуавтоматические (0.5-1 млн.). Автоматические сами перелистывают страницы. В полуавтоматических страницы перелистывает оператор, а остальное автоматически.

scaner.jpg

На полуавтомате скорость сканирования будет ниже в 2-3 раза и существенно выше утомление оператора. Однако с учётом того, что сканеров надо 50 шт., покупка автоматических экономически нецелесообразна.

Итого, надо разово 50 млн. руб и при амортизации 5 лет (на самом деле срок службы сканеров мне не известен), 10 млн. руб. в год на амортизацию полуавтоматических планетарных сканеров.

Развитие[править]

Систему время от времени надо будет развивать. На участие в конференциях, доработку ПО, научные исследования заложим еще 4 млн. руб.

Итого, затраты[править]

Статья Траты, в год
Персонал 55 млн.
Сервера с системой хранения 16 млн.
Сканеры в первый год 50 млн., 10 млн. каждый следующий
Развитие 4 млн.

Итого: в первый год 135 млн. и 85 млн. в каждый последующий.

В случае, если оцифровка будет в Москве, зарплату надо будет поднять до средней по городу (60 тыс. руб.), что приведет к увеличению стоимости проекта на 15 млн. в год.

В Москве затраты в первый год 150 млн. и по 100 млн. в последующие года.

Если потребуется вести оцифровку вглубь, то можно исходить из того, что оцифровать потребуется до 6 млн. книг. Если будет поставлена задача оцифровки в течении 5 лет (срока службы сканеров), число привлеченных людей надо будет увеличить в 12 раз с таким же возрастанием затрат: в первый год 150 млн. * 12 = 1.8 млрд. и в последующие 4 год еще 4. 8 млрд. т.к. (100 млн. * 12 = 1.2 млрд) * 4 года = 4.8 млрд.

На оцифровку прошлого за 5 лет потребуется 6.6 млрд. руб. Но с учетом того, что за это время надо еще на 0.5 млрд. провести оцифровку новых книг, общая стоимость составит 7.2 млрд. руб.

Общие затраты: 7.2 млрд. руб в течении 5 лет в сегодняшних ценах.

Много это или мало?

  • Весь оборот печатной отрасли оценивается в 70 млрд. в год.
  • Всего на публичные библиотеки государство каждый год тратит около 50-55 млрд. руб.
  • Бюджет Российской государственной библиотеки 1.7 млрд. руб (т.е. четверть от нужной суммы).

7.2 млрд. в течении 5 лет - цифра не маленькая, но посильная для государства.

Комментарии

Я вообще много вещей не учел. Например, оценка А.И. Вислым в 8 млн. книг которые надо отсканировать подозрительно походит на число записей РГБ. Но понятно же, что нет смысла сканировать очередное переиздание. Т.е. оценка в целом по числу книг завышена.

Однако в статистике РКП есть не только книги и брошюры. Т.е. ежегодная нагрузка в плане наименований для оцифровки скорее занижена. К счастью газеты полностью не придется оцифровывать т.к. они идут потоком по обязательному экземпляру, но оценка по оцифровке сегодняшних книг видимо занижена.

Также не совсем корректно считать нагрузку по числу книг. Надо учитывать страницы и считать сколько стоит ввод книги.

Оценка проекта по персоналу (50 операторов, 1 администратор, 1 программист и 1 руководитель) занижена. Очевидно, потребуется еще персонал как на выборку и доставку книг, так и на проверку качества оцифровки.

На размещение сотрудников приведена некая цифра, на самом деле скорее всего внутри существующих библиотек помещения может не оказаться и придется арендовать цех, соответственно надо наладить подвоз книг и первичный ремонт цеха.

Ну и т.п. можно ещё долго раскапывать.

Дальше жизнь устроена так, что надо не только оцифровать, но и влить это все в народ. А это проверка прав и т.п. вещи. В общем, еще целый большой кусок по представлению массива оцифрованного не противоречащим Закону способам + ПО для этого и взаимодействия с заинтересованными структурами.