?

Log in

No account? Create an account
Разбираю гуманитарные вопросы на винтики, функции, алгоритмы. Оживляю технологии
Совмещаю гуманитарный и технический пласты знаний в единое мировоззрение
Рассуждая о социальных сетях: активность в группах (1) 
31st-Aug-2016 11:55 pm
Активность пользователей в группе в соц. сетях
Предположим есть некое сообщество в социальной сети. Сообщество достаточно большое, чтобы вручную перебирать его членов было затруднительно. А хочется узнать некоторые параметры. Например, приблизительно выявить ядро и активную часть аудитории, подвязанную смыслом.

Основное взаимодействие в группах ведется вокруг сообщений в лентах. Коммуникационная модель в соц. сетях загнана в рамки измеримости. Это проявляется в возможности отреагировать на сообщение ленты. Зачем отправляется то или иное сообщение абстрактно бесполезно. А вот целей реакции может быть много: выразить отношение, поделиться мнением, повлиять на других, распространить интересную информацию.
Замеряя реакцию на сообщения от имени группы, можно оценить как ядро, так и активную аудиторию, которая сознательно или нет считает поддержку материала группы важной.

Проще всего измерить эмоциональную оценку сообщения - условные лайки (в разных сетях называются по разному).
Менее однозначны комментарии и репосты. Они могут нести позитивную, негативную или любую иную оценку сообщения. И, по хорошему, необходимо примерно оценивать связанность с сообщением (в случае комментариев) и проводить символьный анализ. Или применять более примитивные методы вычленения позитивной реакции. Впрочем, для данного маленького рассуждения это избыточно.

Допустим мы подсчитали количество реакций для каждого пользователя группы. Это не сложно сделать с помощью машины.
Простым методом разделение найденного множества пользователей, проявивших какую-либо реакцию, будет упорядочении их по активности реакции и поиск странных скачков на графике (в машинном виде - в последовательности).
В среднем, количество лайков, репостов и комментариев возрастает с ростом активности пользователя. Но они растут не синхронно. Потому однозначно упорядочить можно только по одному параметру и это будет не самая взвешенная шкала. Или ввести некие допущения и посчитать усредненное значение, скажем "активность". Пусть по X у нас будут считать люди 1 на шкале = 1 пользователю, а по Y - значения характеристик пользователей.
Yactivity = (K1 * Ylike + K2 * Ycomment + K3 * Yrepost) / (3 * K4)
Тогда эта усредняющая характеристика будет возрастать. Значит, можно выстроить последовательность относительно нее.
Построив график (см. вводную картинку - как раз для посредственного размера группы), увидим один мощный перегиб кривой. Дополнительно скажу, что подобная картина наблюдается в разных сообществах.

Для оценки момента перехода от одного вида графика к другому можно использовать касательную. И вычислить угол наклона, при котором в среднем наблюдаются резкие изменения количества членов (перешедших барьер). Однако в нашей схеме шаг по x = 1, тогда угол наклона касательной сведется к арктангенсу от Y1 - Y0 или к разнице между двумя значениями "активности" = 1. Ясно, что такая характеристика не является универсальной. Хотя оценка по углу перехода некоторого множества сообществ дает интересный результат.

Угол наклона касательной к графику активности

При наклоне в 45 градусов, т.е. при Y1 - Y0 = 1 наблюдается резкое падение "преодолевших барьер" пользователей. Что само по себе странно и требует дополнительно изучения, сопоставления с практикой.

Касательная является частным случаем секущей. Секущая проводится через 2 точки и потому устойчивее показывает тренд. Минус ее будет заключаться в отбрасывании некоторой части потенциально активной аудитории, попавшей между двумя точками секущей.

Какие еще подходы к разбиению множества пользователей по активности можете предложить?
Краем уха слышал, краем глаза видел, что биржевые "игроки" используют всяческие функции оценки кривых и трендов их изменения. Быть может, спекулянтский инструментарий может быть применен в данном случае?

This page was loaded Jan 22nd 2018, 10:30 pm GMT.