home

Почему рекомендательные системы для электронных библиотек вузов бесполезны

Довольно часто доводится слышать фантазии вузов, что можно наворотить поверх логов электронных библиотек рекомендательные системы и тогда заживем! Ну или по крайней мере увеличим количество выдач и повысим уровень удовлетворенности студента.

Для проверки этой гипотезы были просмотрены логи на установке ELiS в ПГНИУ https://elis.psu.ru за последние три года.

Характеристика ЭБ[править]

В библиотеке 4171 PDF открытого и ограниченного доступа. Аккаунты к библиотеке доступны в системе управления вузом и генерируются сразу при зачислении в вуз. К ресурсам ограниченного доступа из сети вуза доступ без авторизации, а из интернета по логину.

Даты по которым собрана статистика: с 29.11.2018 по 29.11.2021 (3 года).

Большая часть ресурсов посещается анонимными пользователями. С 29.11.2020 по 29.11.2021 (за 1 год) книги в PDF открыты в плеерах 419 тыс. раз.

Методика[править]

Код JS фиксирует все открытия плеера и записывает их в базу, в логи включено количество просмотренных страниц и длительность сессии.

Затем количество сессий (одна сессия - один сеанс работы с документом в плеере) подсчитывается для каждого пользователя и выводится топ пользователей, наиболее часто открывающих документы.

Затем проверяется по каждому пользователю какие он книги открывал и сколько книг он читал часто (20+ раз).

Результаты[править]

За 3 года больше 100 сессий всего лишь у 25 человек, из которых 1 преподаватель и 24 студента. "Самый читающий" студент открыл за 3 года книги 840 раз.

most_popular_reading_3year.jpg

У большинство посетителей наблюдается один из двух шаблонов:

1) много открытых книг по несколько страниц за сессию;

2) 3-5 книг с большим количеством сессий (30-60) и с большим количеством просмотренных страниц. Т.е. за 3 года самые "читающие" открывают в библиотеке и пользуются регулярно всего-лишь 3-5 книгами.

3) смешанный из 1 и 2, когда 3-5 книг с числом открытий более 20 и еще 10-20 с числом открытий 1-2.

Большинство книг, которые выбранные пользователи читают, относятся к гуманитарной тематике. Естественные науки по многу читают реже.

Это пример истории чтения "самого читающего студента", где dataCount - число просмотренных страниц:

most-popular-reader.jpg

Еще пример читателя:

student_history2.png

И еще пример:

student_history3.png

Выводы[править]

В вузах даже "самые читающие" студенты, в аутентифицированном виде читают учебники в ЭБ вуза мало. Хотя реальное чтение учебников выше (так как многие в открытом доступе), тем не менее можно сделать вывод, что читают не слишком много.

Обычно есть 3-5 действительно хорошо читаемых учебника, остальные разово открываются и всё.

Раз общее количество прочитанных книг аутентифицированными пользователями мало, персонализированную рекомендательную систему строить смысла нет.

Преподаватели не относятся к "самым читающим" пользователям ЭБ.