Труды КНЦ (Технические науки вып. 7/2023(14))

Вид функции f зависит от используемой интерпретации понятия популярности публикации, которая, в свою очередь, определяется прикладной задачей, в контексте которой нам необходимо оценить популярность. Областью значений функции, в зависимости от вида оценки — количественная, номинальная или порядковая, является либо числовое значение, либо одно из заданных номинальных значений, либо отношение порядка на множестве сообщений. В данной работе рассматривается задача порядковой оценки популярности, т. е. решающее значение имеет не величина признака как таковая, а порядок объектов, отсортированных по этому признаку. Исходя из чего, способы расчета значений признаков объектов, дающие в результате идентичный порядок сортировки объектов, являются эквивалентными. Для проверки этого утверждения в отношении используемых нами данных были проведены отдельные расчеты показателя популярности, основанные на количестве лайков, репостов и комментариев, после чего объекты (сообщения) были отсортированы и оценена степень сходства получившихся трех последовательностей. Схожесть последовательностей оценивалась как среднее относительное смещение позиции объекта в двух последовательностях: S = Рі(Хі)-Р2(Хі)^ /jv где N — количество объектов; p 1(x i), p 2(x t) — позиция объекта xi в 1-й и 2-й последовательностях соответственно. Размер исходного датасета составил 100 тыс. образцов. При сравнении рассматривались только образцы с ненулевыми значениями соответствующих меток. Было сформировано 6 различных последовательностей: Plc , Pcl , Plr , Prl , Pcr , Prc . Нижний индекс в данном случае означает следующее: Plc, — последовательность, отсортированная по убыванию l, в которой образцы имеют ненулевое количество лайков и комментариев. Аналогичным образом интерпретируются обозначения остальных последовательностей, т. е. выполняются следующие наборы условий: (о е Pic: l ik e s ( o ) ф 0 Л c o m m e n ts ( o ) ф 0 | V 0 j, 0 y е Ptc: lik e s ( o i) > l i k e s ( o j ) ,V i < j ’ ( о е Pci: l ik e s ( o ) ф 0 Л c o m m e n ts ( o ) ф 0 \ v o i oj е Pct: c o m m e n ts ( o t) > c om m e n ts ( o j) , Vi < j ’ ( o е Pir : l ik e s ( o ) ф 0 Л r e р o s t s ( o ) ф 0 \v o i,o j е Pir: lik e s (o i) > l i k e s ( o j ) ,V i < j ’ ( o е Pn : l ik e s ( o ) ф 0 Л r e р o s t s ( o ) ф 0 \Voi,oj е Pr t : r e p o s t s ( o i ) > r e p o s t s (o j), Vi < j ’ f o е Pcr: c om m e n ts ( o ) ф 0 Л r e p o s t s ( o ) ф 0 [Voi oj е Pc r : c om m e n ts ( o i) > c o m m e n ts ( o j) ,V i < j ’ ( o е Prc : r e p o s t s ( o ) ф 0 Л c om m e n ts ( o ) ф 0 [Voi oj е Prc : r e p o s t s ( o t) > r e p o s t s ( o j ) ,V i < j ’ где likes(o), reposts(o), comments(o) — количество лайков, репостов и комментариев образца o соответственно; oi — i-й элемент последовательности. Последовательности сравнивались попарно. Итоги сравнения и размер соответствующих последовательностей приведены в табл. 1. Труды Кольского научного центра РАН. Серия: Технические науки. 2023. Т. 14, № 7. С. 35-42. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2023. Vol. 14, No. 7. P. 35-42. © Шишаев М. Г., Диковицкий В. В., 2023 39

RkJQdWJsaXNoZXIy MTUzNzYz