Труды КНЦ (Технические науки вып. 7/2023(14))

Введение Количественная оценка степени популярности публикаций является одной из типичных вспомогательных задач, возникающих при мониторинге онлайновых медиа с той или иной прикладной целью [1]. Несмотря на то, что практически все онлайновые медиа используют в качестве атрибутов сообщений те или иные счетчики пользовательской реакции, в прикладных задачах понятие популярности, как правило, трактуется более широко и используется для более глубокого анализа поведения аудитории, чем простые отметки «нравится/не нравится» или иные индикаторы пользовательской реакции, т. е. мы исходим их того, что реакция аудитории не тождественна популярности сообщения. Это заставляет искать более изощренные способы оценки популярности публикаций в онлайновых социальных медиа, использующие как непосредственно индикаторы пользовательской реакции, так и различные метаданные сообщений (время публикации, авторство, размер аудитории и т. п.). В настоящей работе на экспериментальных данных, полученных в результате мониторинга нескольких региональных онлайн-сообществ в сети «ВКонтакте», проведен сравнительный анализ возможностей использования различных индикаторов реакции аудитории в качестве основы для расчета порядкового показателя популярности контента, применимого для ранжирования сообщений по степени их популярности. О существующих подходах к оценке популярности контента Единое понимание популярности в существующих работах по данной тематике отсутствует, что делает формальное ее определение нетривиальной задачей [2]. В целом определение популярности публикации опирается на имеющиеся в распоряжении индикаторы, характеризующие реакцию аудитории. К таким индикаторам в большинстве онлайновых социальных сетей относятся количество просмотров, лайков (отметок «нравится»), комментариев и репостов (пересылок сообщения целиком в другие онлайн-сообщества). Исследования в этой области показывают, что популярность публикации может быть выражена разными способами, кроме того, она может меняться со временем в зависимости от различных неформализованных факторов [3]. Задачу также усложняет и то, что популярность идентичного контента может быть различной в разных социальных сетях или даже в разных группах одной сети. Кроме количественных индикаторов реакции аудитории на публикацию, при расчете оценки популярности могут использоваться различные модификаторы, например, астрономическое время публикации сообщения или объем аудитории онлайн-сообщества, в котором опубликовано сообщение. Важным обстоятельством является также то, осуществляется ли оценка популярности сообщений в пределах одного сообщества или же нескольких. В последнем случае, очевидно, оценки в абсолютных величинах не подходят, поскольку количественные значения индикаторов популярности, при прочих равных, прямо зависят от объема аудитории онлайн-сообщества. Наряду с указанными выше «базовыми» индикаторами, для оценки популярности прибегают к использованию и других параметров публикаций. В работе [4], например, эта оценка осуществляется с учетом гомофильности аудитории и популярности автора. В исследовании [5] предлагается использовать различия в поведении и интересах аудитории. Еще один подход к определению популярности контента основан на анализе его распространения в социальных сетях. Существующие способы оценки популярности можно разделить на три категории, каждая из которых применяется в соответствующих видах прикладных задач анализа контента онлайновых медиа [6]: 1) номинальные оценки; 2) количественные оценки; 3) порядковые оценки. В случае номинальных оценок требуется отнести элемент контента (сообщение) к одной из заданных категорий. Как правило, рассматривается двухклассовая идентификация, в результате которой сообщение относится к релевантым или не релевантным. При количественных оценках тем или иным способом оценивается величина популярности. Наконец, при порядковых оценках требуется ранжировать сообщения по степени их популярности. В данной работе рассматривается последний случай. Труды Кольского научного центра РАН. Серия: Технические науки. 2023. Т. 14, № 7. С. 35-42. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2023. Vol. 14, No. 7. P. 35-42. © Шишаев М. Г., Диковицкий В. В., 2023 36

RkJQdWJsaXNoZXIy MTUzNzYz