Довольно часто доводится слышать фантазии вузов, что можно наворотить поверх логов электронных библиотек рекомендательные системы и тогда заживем! Ну или по крайней мере увеличим количество выдач и повысим уровень удовлетворенности студента.
Для проверки этой гипотезы были просмотрены логи на установке ELiS в ПГНИУ https://elis.psu.ru за последние три года.
Содержание
Характеристика ЭБ[править]
В библиотеке 4171 PDF открытого и ограниченного доступа. Аккаунты к библиотеке доступны в системе управления вузом и генерируются сразу при зачислении в вуз. К ресурсам ограниченного доступа из сети вуза доступ без авторизации, а из интернета по логину.
Даты по которым собрана статистика: с 29.11.2018 по 29.11.2021 (3 года).
Большая часть ресурсов посещается анонимными пользователями. С 29.11.2020 по 29.11.2021 (за 1 год) книги в PDF открыты в плеерах 419 тыс. раз.
Методика[править]
Код JS фиксирует все открытия плеера и записывает их в базу, в логи включено количество просмотренных страниц и длительность сессии.
Затем количество сессий (одна сессия - один сеанс работы с документом в плеере) подсчитывается для каждого пользователя и выводится топ пользователей, наиболее часто открывающих документы.
Затем проверяется по каждому пользователю какие он книги открывал и сколько книг он читал часто (20+ раз).
Результаты[править]
За 3 года больше 100 сессий всего лишь у 25 человек, из которых 1 преподаватель и 24 студента. "Самый читающий" студент открыл за 3 года книги 840 раз.
У большинство посетителей наблюдается один из двух шаблонов:
1) много открытых книг по несколько страниц за сессию;
2) 3-5 книг с большим количеством сессий (30-60) и с большим количеством просмотренных страниц. Т.е. за 3 года самые "читающие" открывают в библиотеке и пользуются регулярно всего-лишь 3-5 книгами.
3) смешанный из 1 и 2, когда 3-5 книг с числом открытий более 20 и еще 10-20 с числом открытий 1-2.
Большинство книг, которые выбранные пользователи читают, относятся к гуманитарной тематике. Естественные науки по многу читают реже.
Это пример истории чтения "самого читающего студента", где dataCount - число просмотренных страниц:
Еще пример читателя:
И еще пример:
Выводы[править]
В вузах даже "самые читающие" студенты, в аутентифицированном виде читают учебники в ЭБ вуза мало. Хотя реальное чтение учебников выше (так как многие в открытом доступе), тем не менее можно сделать вывод, что читают не слишком много.
Обычно есть 3-5 действительно хорошо читаемых учебника, остальные разово открываются и всё.
Раз общее количество прочитанных книг аутентифицированными пользователями мало, персонализированную рекомендательную систему строить смысла нет.
Преподаватели не относятся к "самым читающим" пользователям ЭБ.