МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Дмитрий Владимирович ЛАНДЭЛекция 6“Математические моделиинформационных потоков”
Моделирование информационныхпотоковОбщий характер временной зависимости числа тематических публикаций в сети определяется закономерностями, которые целиком допускают построение математических моделей. Модель, аналогичная модели Бартона-Кеблера, учитывает статическую и динамическую составляющие от общих объемов сообщений по заданной тематике с учетом старения информации:v(T) = 1 – ae-T – be-2T.Организации-генераторы новостной информации в производят поток информации, в среднем постоянный по количеству сообщений. Изменяются во времени лишь объемы сообщений, которые соответствуют той или другой теме. Таким образом, рост количества публикаций по одной теме сопровождается уменьшением публикаций по другим темам: где ni(t) – количество публикаций в единицу времени, а M – общее количество всех возможных тем.
Линейная модель В некоторых случаях динамика тематических информационных потоков реализуется линейно, то есть количество сообщений в момент времени t можно представить формулой:y(t) = y(t0) + v(t - t0), где y(t) – количество сообщений на время t, v – середняя скорость увеличения (уменьшения) интенсивности тематического информационного потока во времени. Содержательная составляющая информационного потока может быть оценена как флюктуация информационного потока – изменение стандартного отклонения (t):В случае поведения стандартного отклонения (t) t, то чем большее значение , тем выше корреляция между текущими и предыдущими сообщениями. В этих случаях характеризует степень связи между случайными событиями и принимает значение от ½ до 1.
Примеры, для которых линейная модель адекватна Динамика количества откликов на запрос «семантическ*» Динамика появления документов в информационном потоке, содержащих слово «масон»
Экспоненциальная модель В некоторых случаях процесс увеличения (роста) актуальности или старения информации описывается экспоненциальной зависимостью, которую можно аппроксимировать такой формулой:N(t) = N(t0)e(t - to) , где - среднее относительное изменение интенсивности информационного потока. Относительное изменение интенсивности в определенный момент времени исчисляется по формуле:(ti)=(N(ti) – N(ti-1))/N(ti-1). Изменение флюктуаций величины (ti) относительно среднего значения может быть оценена по формуле:Если (t) изменяется как корень квадратный из времени, то можно говорить о процессе с независимыми приращениями. В случае наличия значительной доли зависимых сообщений справедливо: (t) t, причем < 1. Значение >> ½, говорит о наличии долгосрочной памяти системы.
Пример, для которого экспоненциальная модель адекватна Посуточный график появления сообщений, содержащих термин «блог» Помесячный график в полулогарифмической шкале появления сообщений, содержащих термин «блог»
Логистическая модель Логистическую модель можно рассматривать как обобщение экспоненциальной модели Мальтуса, которая, предусматривает пропорциональность скорости роста функции ее значения в каждый момент времени: где k – некоторый коэффициент.В случае логистической модели идея заключается в том, чтобы сделать коэффициент в уравнении Мальтуса функцией времени. Наиболее распространенным есть использования константы, которая в явном виде ограничивает рост решения. В нашем случае с этой целью используем емкость N. Тогда правая часть соответствующего выражения представляется в виде:где k – коэффициент Мальтуса, а r – коэффициент, который описывает отрицательные для данной системы процессы, связанные с внутренними факторами.
Логистическая модель: примеры Динамика объемов публикаций в Интернет по тематике болезни и отхода от деятельности известного политического деятеля Динамика объемов публикаций в Интернет с упоминанием фамилии сенсационно избранного мэра большого города (до выборов и после)
Логистическая модель: детализация На формальном уровне сопоставим с темой два параметра: продолжительность (характерное “время жизни”) λ и интенсивность D. Продолжительность - промежуток времени, в течение которого тема имеет выраженную актуальность. Интенсивность - величина, которая характеризует порожденное соответствующей темой количество публикаций, усредненное по промежутку λ. Вклад интенсивности D определяется следующим образом:Соответственно, рассматриваются две временные области: 0 < t ≤ λ с D > 0 и t > λ с D = 0, для которых решениями являются функции u(t) и v(t). Полное решение получается путем “сшивки” на границе в точке λ:
Логистическая модель: уравнения После нормирования параметров пороговой величины N, уравнение для первой области имеет вид:Решение этого уравнения: Уравнение для второй области имеет вид:Решение второго уравнения:
Логистическая модель: обобщенный график информационного потока
Спасибо за внимание! Ландэ Д.В[email protected]://poiskbook.kiev.uaМЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Киев, Украина