Исследование методов и реализация алгоритма моделирования распространения информации в социальных сетях

Виды социальных медиа. Критерии эффективности продвижения аккаунта в социальных сетях. Программная реализация алгоритма моделирования распространения информации в социальной сети "Twitter". Разработка клиентского приложения. Апробация интерфейса системы.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 08.02.2016
Размер файла 5,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Российской Федерации

Волжский политехнический институт (филиал)

федерального государственного бюджетного образовательного

учреждения высшего образования

«Волгоградский государственный технический университет»

(ВПИ (филиал) ВолгГТУ)

Факультет «ВЕЧЕРНИЙ»

Кафедра «Информатика и технология программирования»

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

к бакалаврской работе на тему

Исследование методов и реализация алгоритма моделирования распространения информации в социальных сетях

Автор работы Айналимов Батырбек Орынгалиевич

Обозначение ________ВРБ-34675695-09.03.01-11.1-15________

Группа __________ВИЗ-475___________

Направление ___09.03.01-Информатика и вычислительная техника

Руководитель работы ______02 ноября 2015 г. Н.Н. Короткова

Консультанты по разделам:

Моделирование программных систем 02 ноября 2015 г. Л.А. Макушкина

Нормоконтролер 02 ноября 2015 г. Е.Е. Слободкина

г. Волжский, 2016

Задание на бакалаврскую работу

Студент __Айналимов Батырбек Орынгалиевич_____________

Код кафедры __ВИТ_______ Группа ____ВИЗ-475_________

Тема Исследование методов и реализация алгоритма моделирования распространения информации в социальных сетях____ утверждена приказом по ВПИ (филиал) ВолгГТУ от ____09 октября 2015___ № _356-ст_

Срок предъявления готовой работы _01 февраля 2016 г._

Исходные данные для выполнения работы

1. Громаковский А.: Работа с облачными системами удаленного доступа. - СПб.: Питер, 2011

2. Михеева Е.В.: Информационные технологии в профессиональной деятельности. - М.: Академия, 2011

3. Негус Кристофер: Ubuntu и Debian Linux для продвинутых. - СПб.: Питер, 2011

Исполнитель работы __02 ноября 2015 г. Б.О.Айналимов_______

Руководитель работы_02 ноября 2015 г. Н.Н.Короткова______

Консультанты по разделам:

Моделирование программных систем 02 ноября 2015 г. Л.А. Макушкина

Аннотация

Работа содержит 143 страницы, 1 таблицу, 30 иллюстраций, 21 использованный литературный источник. Работа выполнена на кафедре «Информатика и технология программирования».

Ключевые слова: алгоритм моделирования распространения информации в социальных сетях, маркетинговые агентства, облачная операционная система Corezoid, сервис Twitter.

Целью бакалаврской работы является планирование и автоматизация проведения кампании по продвижению рекламного проекта социальных Twitter-медиа в социальных сетях на основе моделирования алгоритма распространения информации.

В рамках данной работы рассмотрено понятие социальных сетей; определены критерии эффективности продвижения аккаунта в социальных сетях; охарактеризованы особенности продвижения проектов в социальных сетях; разработан алгоритм автоматизированного эффективного распространения информации в сети Twitter. Произведена разработка программного комплекса, включающего клиентское и серверное решение, которые позволяют автоматизируют публикацию списка статусов (сообщений) по алгоритму отложенного постинга с анализом количества «лайков» предыдущих постов. Выполнена оценка качества программного обеспечения.

Основные результаты научных разработок, выполненных автором по теме бакалаврской работы, представлены на российских конференциях: РАЕ "Студенческий форум .2016", "Научный прорыв - 2016".

Введение

Актуальность. Социальные сети становятся всё более популярной площадкой для продвижения, для организации мероприятий и многого другого. По данным исследовательской организации IDC Global Technology and Industry 50% бюджета, выделенного на продвижение в социальных медиа, западные маркетологи тратят на работу в социальных сетях [1]. Сегодня SMM пользуется большой популярностью не только среди малого и среднего бизнеса, но и применяется крупнейшими мировыми брендами, которые используют её для установления обратной связи с потребителями.

Использование социальных сетей в бизнесе дало толчок к развитию Интернет-коммуникаций. Как элемент маркетинговой стратегии сети имеют широкие возможности для продвижения чего-либо без существенных денежных затрат, поэтому они широко используются некоммерческими организациями. Сети позволяют формировать контент, развивать личное общение с целевой аудиторией, взаимодействовать с отдельными представителями целевой аудитории, изучать их интересы, проводить акции и просто информировать.

В данной бакаларвской работе продвижение в социальных сетях исследуется на примере проекта.

В качестве объекта бакаларвского проекта рассматриваются социальные сети как инструмент интернет-коммуникаций. Предметом является продвижение проекта в социальных сетях. Апробация была произведена в рамках конференции «Cisco Connect - 2015», где были представлены результаты разработки программного продукта для маркетингового агентства. По результатам конференции, были внесены доработки и произведена повторная апробация в рамках «VK Challenge - 2015», где участники смогли протестировать продукт, а автор оценить возможности многопоточной работы системы при нагрузке более 1000 запросов в минуту.

Решению различных теоретических и практических проблем построения ИС в технических системах посвятили свои работы ведущие ученые и специалисты Бэкус Дж., Вирт Н., Вьеннер Я. И., Гийока М. Ф., Кирсанов О. Ф., Найер М. О., Чарльз Э.

Целью выпускной квалификационной работы является планирование и проведение кампании по продвижению рекламного проекта социальных Twitter-медиа, а также продвижение в собственной социальной сети Writer-ru.ru с моделированием алгоритма расспространения информации в социальных сетях.

Для достижения поставленной цели были решены следующие исследовательские задачи:

· Рассмотреть понятие функционирования социальных сетей.

· Определить критерии эффективности продвижения аккаунта в социальных сетях.

· Разработать методы продвижения проектов в социальных сетях.

· Составить план по автоматизации продвижения услуг в социальных сетях.

· Провести кампанию по продвижению услуг в Twitter.

· Проанализировать эффективность проведенной кампании по продвижению услуг в Twitter.

· Разработать собственную социальную сеть для моделирования алгоритма распространенния информации социальных сетях.

Методы исследования.

Для решения поставленных задач в работе использовались методы математической статистики, решения динамических задач распределения потоков информации, объектно-ориентированной модели проектирования.

Научная новизна. Научная новизна положений, выносимых на защиту, заключается в следующем:

· Выполнено построение сигналов для каждого токена (последовательности символов) с использованием информации о частоте его появления в корпусе в различные моменты времени.

· Осуществлено применение вейвлетного анализа к полученным сигналам.

· Произведено удаление незначительных токенов с использованием автокорреляции сигналов.

· Выполняется построение матрицы кросс-корреляции сигналов токенов.

· Осуществляется поиск событий как наборов токенов (инструментов авторизации) путём кластеризации (разделения на кластеры) полученной матрицы.

· Выполняется поиск сообщений, описывающих каждое событие, с помощью метода мульти-документного реферирования по документам, содержащим токены из каждого набора.

· Программный продукт не требует данных о пользователях и доступа к внешним базам знаний.

· Реализована возможность инкрементальной обработки при поступлении новых сообщений по разработанному алгоритму.

Основные положения, выносимые на защиту:

· Проанализированы существующие методы и реализации алгоритма моделирования распространения информации в социальных сетях для оптимизации рекламных кампаний.

· Проанализировано математическое описание алгоритма моделирования распространения информации в социальных сетях.

· Разработана алгоритмическая модель в системе Corezoid как инструмент проектирования бизнес-процессов для обработки запросов от медийных компаний.

· Разработан интерфейс системы как экран взаимодействия с пользователем.

Практическая значимость работы. В основу бакалаврской работы положены научные результаты, полученные лично автором при непосредственной разработке прикладных информационных систем и технологий для маркетингового агентства России:

· База данных «Коррелирующих субъектов в информационных потоках», разработанная при партнерском сотрудничестве с ООО «ВАН», г. Москва.

· Оптимизация жадного алгоритма под динамическое потоковое распределение для улучшения качества обработки запросов с минимальной потерей пакетов в эскалационных вершинах, разработанная при поддержке и партнерском сотрудничестве с центром НКТ.

· База данных «Математических зависимостей действий пользователей в медийной среде постинг-сервиса Twitter».

В первой главе произведен обзор существующих методов и реализации алгоритма моделирования распространения информации в социальных сетях.

Во второй главе приведено описание методологии проектирования ИС как формального процесса, дано математическое описание реализации алгоритма моделирования распространения информации в социальных сетях.

В третьей главе приведена программная реализация алгоритма моделирования распространения информации в социальной сети «Twitter».

В четвертой главе описана апробация простроенной модели работы системы распространения информации.

1 Обзор существующих методов и алгоритмов моделирования распространения информации в социальных сетях

1.1 Социальные сети как инструмент маркетингового агентства для распространения информации

Мир технологий развивается непрерывно и динамично. С каждым годом появляются новые концепции и их реализации, а существующие расширяют свои функциональные характеристики и возможности. Не нова и цель этой спирали прогресса - сделать условия жизни человека как можно комфортнее и продуктивными. Одной из причин такого бурного роста является широкое распространение Internet и значительное увеличение скорости передачи данных. Как отмечают в Google, до 2008 года был «Интернет людей», теперь наступил «Интернет вещей», так как устройств, подключенных к сети стало больше чем жителей планеты. Благодаря этому взаимодействие их с человеком стало возможно вынести на совершенно другой уровень.

С начала своего основания и приобретения популярности социальные сети заняли видное место в повседневной жизни человека. Ведь они обеспечивают связь между людьми, независимо от их местонахождения. Также с введением таких новых функций как распространение музыки, видео, фото и документов, социальные сети окончательно закрепились в пятерке самых посещаемых страниц в сети Интернет. Однако наряду с рядом положительных результатов функционирования социальных сетей можно выделить и отрицательные. В частности, они все больше влияют на язык и сознание пользователей.

Однако, все это лишь вершина айсберга, а основной информационное воздействие, осуществляющих сети, все же остается незамеченным пользователем «темной водой» внешней веселости и ненавязчивости сообщений картинок и демотиваторов.

Анализируя социальные сети в контексте информационных войн, следует уделить внимание психологическим явлениям, которые делают сети такими привлекательными для осуществления информационно-психологического воздействия на пользователей. В частности, целесообразно выделить следующие: явление «Спираль молчания» (по Э. Ноэль-Нойман) стадный инстинкт в социальных сетях; доверие всему опубликованном в сети; присутствие лидеров мнений; стремление к самореализации или замены реальности. Таким образом, модель коммуникации немецкой исследовательницы Е. Ноэль-Нойман [4].

Ее гипотеза заключается в том, что масс-медиа могут манипулировать общественным мнением за счет предоставления слова представителям меньшинства и замалчивания мыслей большинства. Подобное происходит и в социальных сетях, когда авторами сообщений выступают именно представители меньшинства, однако пользователи, которые не хотят оставаться в стороне, начинают поддерживать, возможно даже неприемлемую для них мнение. Связанным с вышеупомянутой моделью является явление «стадного инстинкта», которое непосредственно объясняет в некоторой степени «спираль молчания».

Сам принцип стадного инстинкта заключается в том, что человек по своей природе - существо коллективное, групповая. И один из механизмов выживания в группе состоит в том, чтобы в большинстве случаев вести себя так же, как и все, а также перенимать опыт других [6]. «Стадный инстинкт» непосредственно проявляется в том, что человек, видя большое количество отзывов под сообщением в сети - комментариев и ругательств - предоставляет такому сообщению большее значение и сама присоединяется к большинству, а в случае малого количества отзывов преимущественно оставляет сообщения без достаточного внимания.

Подобное происходит и с деятельностью групп: человек с большим удовольствием присоединится к группе, аудитория которой составляет несколько десятков тысяч, чем в маленькой группе с несколькими десятками участников. Интересным остается явление полного доверия всей информации, которая публикуется в сети. Пользователь обычно не проверяет полученную информацию и принимает ее за достоверную, только на основании того, что она публикуется солидной группой со значительной аудиторией. В этом аспекте следует отметить и явление возникновения «лидеров мнений», которые могут быть представлены, как отдельная независимая личность или группа, или страница в социальной сети.

Именно им пользователь доверяет беспрекословно, даже иногда считая их наиболее достоверным источником в определенных вопросах, упуская то, что они могут и не быть специалистами в данной сфере. С помощью таких «лидеров мнений» государство или корпорация может обеспечивать расположение пользователя к ним или же убеждать пользователей в собственных идеях, навязывая им свое видение конкретных важных событий, явлений в различных сферах функционирования государства и общества [5].

Отметим и то, что важным остается стремление пользователя самореализоваться в сети, примерить на себя какую-то другую роль или же свободно произносить свои мысли, прикрываясь анонимностью, которую предоставляет сеть. В то же время виртуальность жизнедеятельности человека усиливается за счет ощущение того, что виртуальная реальность менее агрессивной к человеку и в значительной степени подконтрольна ей.

Также стремление человека к виртуализации своей жизни часто обусловлено желанием сделать свою жизнь более яркой, содержащим интересные события и сильные эмоциональные чувства [1]. Все вышеперечисленное приводит к тому, что количество пользователей социальных сетей растет с каждым годом. Обращаясь к конкретным цифрам, отметим, что аудитория социальной сети «Facebook» составляет более одного миллиарда пользователей, «Twitter», «Vk.com» и «Google+» - более 200 000 000, «LinkedIn» и «Odnoklassniki.ru» - более 100 миллионов [9].

Анализируя основные методы, используемые в социальных сетях, стоит упомянуть мнению Г. Почепцова, который отмечает, что сегодня информационные войны, прежде всего, ведутся с помощью интеллектуального инструментария, а социальные сети является непосредственным средой для их использования.

Инструментарий социальных сетей дает возможность быстро распространять информацию об определенном событии, не дожидаясь ее освещение в традиционных СМИ. Сегодня скорость имеет решающее значение. Наибольшее распространение и популярность получает первая опубликованная история, независимо от носителя. В то же время стоит отметить, что социальные сети являются идеальным орудием не только для оказания влияния, но и для сбора необходимой информации. Ведь, сам того не подозревая, пользователь социальной сети становится абсолютно незащищенным перед вторжением в его личную жизнь.

Например, ученые Кембриджского университета обнаружили, что даже то, как пользователь ставит «лайки» в Facebook, может многое рассказать о нем, потому что современные компьютерные программы позволяют получить всю информацию из социальных сетей и проанализировать ее [2]. Итак, можно сделать вывод, что социальные сети могут стать действительно хорошим подспорьем для организаторов цветных революций.

Сегодня социальные сети быстро приобретают популярность. Ежегодно количество пользователей увеличивается. Охватывая значительную и разностороннюю аудиторию, социальные сети превращаются в инструментарий ведения информационных войн и оказания влияния на общественность. Также следует отметить определенных положительных последствиях функционирования сетей в государственной сфере.

Прежде всего, социальные сети могут существенно повысить эффективность механизмов общественной самоорганизации - то есть способствовать возникновению «гражданского общества». Новые формы коммуникации государства и общества создают предпосылки развития институтов и организаций гражданского общества, которые обеспечивают наращивание социального капитала всех участников определенной коммуникации.

В то же время нельзя не отметить негативные моменты влияния социальных сетей на сознание человека. Пользователь компьютера подвержен аддикции, то есть зависимости от социальных сетей и Интернета в целом, ведь при использовании сети он находится в измененном состоянии сознания - своеобразном психологическом трансе, в котором реальность приобретает нечетких рис и сливается с виртуальностью. А это способствует бессознательном усвоению всего, что дает нам сеть - новостей, сообщений, фотографий, видео. И пользуясь определенными методами, можно легко убедить обычного пользователя в чем попало, независимо от его социального статуса или местонахождения.

1.2 Обзор существующих программных продуктов для распространения информации в социальных сетях

Сравнение начнем с сервиса, который позволяет публиковать записи в Facebook, Twitter, LinkedIn, App.net и Google+ одновременно. Buffer -- не только автопостер, но и аналитическая система, которая изучает социальные медиа. Каждую запись можно опубликовать в назначенное время или использовать функцию Buffer (Share Next), как показано на рисунке 1 -- система сама разместит сообщение в наиболее выгодное время, когда пост увидит максимальное количество людей.

Рисунок 1 - Интерфейс Buffer

Удобство интерфейса: понятный и простой.

Работает с: Facebook, Twitter, Google+ и LinkedIn.

Цена: бесплатен для частного использования до двух аккаунтов, далее от 4000 рублей в месяц.

Поддержка: нет русского интерфейса.

Рисунок 2 - Интерфейс Hootsuite

Полноценное приложение для работы с Twitter, «ВКонтакте», Facebook, Google+, LinkedIn, Foursquare и WordPress в браузере или на мобильных устройствах. Через «Хутсвит» (именно так правильно читается название сервиса) доступно не только чтение лент социальных сетей, но и публикация контента. В Pro-версии на рисунок 2 есть массовый загрузчик сообщений, с помощью которого SMM-менеджер может работать с несколькими постами одновременно [11].

Удобство интерфейса: для профессионалов. Нужно разбираться: нагруженный и сложный.

Работает с: Facebook, Twitter, Google+, LinkedIn, Instagram, Tumblr, YouTube.

Цена: бесплатно до 3-х социальных сетей, далее от 720 рублей в месяц.

Поддержка: быстрая обработка сообщений, но русского интерфейса нет.

Hootsuite - большой сложный enterprise-софт (для больших компаний, с большими отделами поддержки активности в социальных сетях). Он сделан для задачи гораздо шире, чем просто публикация, поэтому непростой в использовании неподготовленным пользователем.

Рисунок 3 - Интерфейс Buzzlike

Через Buzzlike (рисунок 3) публикуются записи во «ВКонтакте», Facebook и «Одноклассниках». Посты всех сообществ выстраиваются во временной ленте в порядке очереди. В сервисе есть шаблоны, как текстовые, так и с прикреплением медиафайлов.

Удобство интерфейса: очень сложный. Сервис предлагает мало услуг, однако для старта постинга необходимо осуществить целый ряд технических настроек вручную.

Работает с: Facebook, Twitter, Google+, LinkedIn, Instagram, Tumblr, YouTube.

Цена: бесплатно до 2-х социальных сетей, далее от 3000 рублей в месяц.

Поддержка: быстрая обработка сообщений, но русского интерфейса в центре обработки сообщений нет.

Рисунок 4 - Интерфейс Time2Post

Помимо работы с «ВКонтакте», Facebook, Twitter и LinkedIn, Time2Post умеет публиковать сообщения из RSS-потока, а также накладывать водяной знак на изображения. Есть и массовый загрузчик изображений, который показан на рисунок 4. Все посты можно распланировать по времени или перемешать в случайном порядке.

Удобство интерфейса: сложный и нелогичный интерфейс со множеством опций. В центре помощи на сайте не хватает информации.

Работает с: «ВКонтакте», Facebook, Twitter и LinkedIn.

Цена: бесплатно.

Поддержка: долгая обработка сообщений, множество ошибок.

Типичная ошибка сервиса - автоматическое прекращение постинга по причине сбоя в авторизации.

Рисунок 5 - Интерфейс SmmBox

SmmBox (рисунок 5) существует в виде расширения для браузера, через которое менеджер может публиковать записи с любых сайтов напрямую во «ВКонтакте». Сервис автоматически определяет весь доступный для постинга контент, а также позволяет добавить водяной знак, таймер или запланировать сообщение на нужное время. SmmBox работает и внутри «ВКонтакте» -- в ленте у каждой записи появляется кнопка «Забрать», через которую контент сразу доступен для публикации в любом сообществе [12].

Удобство интерфейса: для профессионалов. Нужно разбираться: нагруженный и сложный.

Работает с: Facebook, ВКонтакте, Одноклассники.

Цена: от 399 рублей в месяц.

Поддержка: оперативная обработка сообщений, есть русский интерфейс.

1.3 Анализ алгоритмов распространения информации в социальных сетях

Социальные медиа, выстраивают сообщество и определенное взаимодействие вокруг определенного вида контента (текста, видео, фото). Например: блоги, форумы, социальные сети, Википедия.

Социальная сеть онлайн средой, объединяющей людей по интересам. Сюда приходят, чтобы обсуждать и комментировать различные темы и события. Одним словом, социальная сеть - это целый новый мир бесплатных средств распространения информации, строится в Интернете усилиями индивидуальных пользователей и компаний. Коммуникации через традиционные СМИ, во-первых, полностью подконтрольные издателям, а во-вторых, имеют преимущественно нисходящую направленность. Публикации готовятся профессиональными журналистами на основе изучения фактических материалов, затем их редактируют и только потом допускают к распространению.

В социальных медиа, например, в блогах, любой зарегистрированный пользователь имеет право голоса и может участвовать в многопоточных дискуссиях по принципу: «все со всеми», каждый участник высказывает свое мнение и делится информацией. И все это общедоступно в режиме онлайн. Блогеров часто называют «гражданскими журналистами»

Социальная сеть представляет собой социальную структуру (математически - граф), состоящий из группы узлов, которыми являются социальные объекты (люди или организации), и связей между ними (социальных взаимоотношений)», не дает нам возможности для четкой и конкретной деятельности, так как оперирует очень абстрактными и субъективными понятиями (человек, взаимоотношения).

Виды социальных медиа

Социальные медиа могут принимать различные формы, в том числе Интернет-форумы, блоги, микроблоги, вики, подкасты, фотографии или картинки, видео, рейтинги и социальные закладки. Каплан и Хенлин созданы схемы классификации для различных социальных типов СМИ в своей статье Бизнес Горизонты [3] опубликованной в 2010 году. По словам Каплана и Хенлин существует шесть различных типов социальных медиа: совместные проекты, блоги и микроблоги, содержание общины, сайты социальных сетей, виртуальных игровых мирах, и виртуальные социальные миры. Технологии включают в себя: блоги, обмен изображениями, стены-сообщений, электронную почту, мгновенные сообщения, обмен музыкальными файлами, краудсорсинг, и Voice over IP. Многие из этих социальных услуг, могут быть интегрированы с помощью социальных платформ сети.

Классифицируем по направлению деятельности:

1) Коммуникации

* Блоги: Blogger, ExpressionEngine, LiveJournal, Open Diary, TypePad, Vox, WordPress, Xanga

* микроблоггинга: FMyLife, Foursquare, Jaiku, Plurk, Posterous, Tumblr, Twitter, Qaiku, Google Buzz, Identi.ca Nasza-Klasa.pl

* Социальные сети ASmallWorld, Bebo, Cyworld, Diaspora, Facebook, Hi5, Hyves, LinkedIn, MySpace, Ning, Orkut, Plaxo, Tagged, XING, IRC, Yammer

* Событийные коммуникации: Eventful, The Hotlist, Meetup.com, Upcoming

* Агрегаторы информации: Netvibes, Twine (website)

* геосоциального сервисы: Foursquare, Geoloqi, Gowalla, Facebook places, The Hotlist, Google Latitude

2) Совместная работа

* Вики: PBworks, Wetpaint, Wikia, Wikimedia, Wikispaces

* Социальные закладки: [5] CiteULike, Delicious, Diigo, Google Reader, StumbleUpon, folkd

* Новости (пользователи сами ищут информацию и загружают ее на сайт социальных новостей, где подписчики имеют возможность обсуждать ее содержание): Digg, NowPublic, Reddit, Newsvine

* Навигация: Trapster, Waze

* Системы управления контентом: Wordpress, Drupal, Plone

* Управление документами и средства редактирования: Google Docs, Syncplicity, Docs.com, Dropbox.com

3) Мультимедиа

* Распространение фото и произведений искусства: deviantArt, Flickr, Photobucket, Picasa, SmugMug, Zooomr

* Распространение видеоsevenload, Viddler, Vimeo, YouTube, Dailymotion, Metacafe, Nico Nico Douga, Openfilm

* Кастинг (трансляции): Justin.tv, Livestream, OpenCU, Skype, Stickam, Ustream, blip.tv, oovoo, Youtube

* Музыка: Last.fm, The Hype Machine.

* Распространение презентаций: scribd, SlideShare

4) Обзоры

* Обзор продуктов: epinions.com, MouthShut.com

* Бизнес обзоры: Customer Lobby, Yelp, Inc.

* Сообщество «Вопросы и ответы»: Askville, EHow, Stack Exchange, WikiAnswers, Yahoo! Answers, Quora, ask.com, answers mail.ru.

5) Виртуальные миры

* Active Worlds, Forterra Systems, Second Life.

Методика исследования

Социальные медиа включают в себя программную и аппаратную составляющие, которые, однако, не могут существовать без пользователей, потому что сами пользователи занимаются наполнением Интернет-сервисов. Таким образом пользователи делают с Интернет-сервиса социальных медиа.

Изучение социальных медиа с точки зрения направления деятельности в социальных медиа, дальнейшего развития, тенденций сводится к изучению пользователей. Наиболее достоверную информацию о пользователе можно получить от него самого, с помощью личного опроса и благодаря информации, которую он добровольно разместил о себе.

Прежде чем приступать к анализу статистических данных, сначала необходимо дать описание процесса подготовки эмпирических данных к непосредственному анализу. Выбор математического метода анализа данных тесно связан со шкалами соответствующих признаков.

Теперь перейдем к рассмотрению непосредственно к переменным опыта. Для оценки проводится только частотной анализ. Переменные, относится к номинальной шкалы часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частных выборках проводятся одинаковые статистические тесты, результаты которых потом сравниваются одним с другом.

Если проводить анализ собрав данные, что пользователи добровольно разместили в социальных медиа, то все такие пользователи попадут в выборку. Величина выборки будет достаточно большой, чтобы уменьшить статистическую погрешность и быть репрезентативной генеральной совокупности, то есть всем пользователям Интернета.

Среда исследования

Наиболее популярными из социальных медиа на данный момент являются социальные сети, они очень широко распространены среди пользователей социальных медиа и вообще самыми известными социальными медиа. Количество людей, пользующихся определенными социальными сетями во всем мире зипоставима с размерами большой густонаселенной страны. Количество самих социальных сетей тоже достаточно большая, они разнообразны по направлению и довольно существенно отличаются в зависимости от страны, где проживает пользователь.

Наиболее распространенными являются социальные сети без четкой направленности по интересам (в отличие от, социальных сетей читателей книг, меломанов, фотографов и т.д. - то есть таких сетей, где люди группируются по преобладающим интересом). Примерами таких социальных сетей является Facebook, Vkontakte, Twitter. Их существует великое множество, однако, только эти достигли глобальных масштабов и доминируют среди других. Следует также учитывать то, что один человек может быть пользователем нескольких социальных сетей одновременно.

Пользователям «Twitter» доступен характерный для многих социальных сетей набор возможностей: создавать профиль с информацией о себе, использовать и распространять контент, гибко управлять приватностью, взаимодействовать с другими пользователями, а также через механизм групп и встреч, отслеживать через ленту новостей активность друзей и сообществ. Интерфейс «Twitter» доступен более чем на 200 языках.

«Twitter» предлагает сторонним ресурсам использовать специально разработанные приложения для глубокой интеграции с социальной сетью.

Также важно определить тот факт, что социальная сеть, в которой будет размещено приложение, предоставляет широкую возможность распространения приложения, используя присущие социальным медиа механизмы.

Разместим приложение в социальной сети «Twitter». Встроенные функции этой социальной сети не уступают по качеству другим. Есть возможность взаимодействовать с информацией пользователей с помощью «Twitter API». Именно благодаря хорошему API существуют возможности для получения информации о любом пользователя, такой, что он разместил добровольно и не скрывает. Эта лазейка и является решающим фактором при выборе среды для анализа.

Социальные медиа и социальные сети в частности используют так называемый «эффект вирусности»: полезная и интересная информация распространяется среди пользователей благодаря им же. То есть один пользователь передает информацию другим, те передают ее дальше, другим пользователям. Такое распространение информации происходит благодаря штатным инструментам социальных медиа: комментированием и функциями «Мне нравится» («Like») и «Рассказать друзьям» («Share»). Также для распространения информации используются группы и публичные страницы, обеспечивают постоянный доступ к ней.

Приложение создается с целью получения полезной информации от пользователей, однако пользователям он может не показаться полезным или интересным именно для них. Это может отразиться на распространении приложения (если он не интересен пользователю, то вряд расскажет о нем другим), поэтому в приложении предусмотрена функциональность, которая должна заинтересовать пользователя, привлечь его внимание и побудить распространять приложение дальше. Это та часть приложения, обрабатывает данные пользователя, доступны с его аккаунта в социальной сети и показывает ему в интересном виде.

Именно обработку всех запросов пользователей осуществляет центр обработки данных, который должен обеспечить единый информационный ресурс с гарантированными уровнями достоверности, доступности и безопасности данных. На каждом таком сервере может находиться от одной до нескольких десятков виртуальных машин, которые способны обрабатывать и удовлетворять соответствующими компонентами или приложениями запросы на предоставление сервиса. Однако "неустойчивая" структура центра обработки данных (ЦОД), в результате миграции является виртуальных машин, вносить задержки при обслуживании запросов на предоставление сервиса [13].

Для уменьшения времени обслуживания (обработки) запросов, поступающих на обслуживание в центре обработки данных, с учетом топологической структуры такого центра, в работе предлагается использовать алгоритм поиска пути по критерию минимального времени прохождения, основа которого - способ расчета оптимального пути передачи на основе данных о распространении информации и изменения в топологии сети. Этот алгоритм позволяет учитывать не только загруженность каждого канала, но и суммарную задержку на интерфейсах, что ускорит поиск оптимального маршрута.

При изменении структуры сети. Это, в свою очередь, приведет к уменьшению времени обслуживания запросов пользователей с динамично переменной структуры ЦОД.

При исследовании алгоритмов решения задачи условного постинга в социальных сетях, был выявлен ряд алгоритмов и моделей, которые можно успешно применять при моделировании распространения информации в социальных сетях. Апробация была произведена в рамках конференции «Cisco Connect - 2015», где были представлены результаты разработки программного продукта для маркетингового агентства. По результатам конференции, были внесены доработки и произведена повторная апробация в рамках «VK Challenge - 2015», где участники смогли протестировать продукт, а автор оценить возможности многопоточной работы системы при нагрузке более 1000 запросов в минуту.

Таблица 1 - Сравнительный анализ методов и алгоритмов

Метод

Тип алгоритма

Сложность

Плюсы

Минусы

Полный перебор

Точный

O(n!)

Простота реализации;

Точное решение

Входные данные не велики; временная сложность

Жадный алгоритм

Приближенный

O(n*log(n))

Высокая скорость; может работать с большими значениями n; простота реализации

Решение неточное

Генетический алгоритм

Приближенный

-

Высокая скорость; может работать с большими значениями n; независимость от вида исходных данных

Не гарантирует нахождение оптимального решения

Метод динамического программирования

Точный

O(w*n)

Независимость от вида исходных данных; точное решение

Большой объём вычислительной работы

Существует ряд методов, позволяющих находить решение задачи об отложенном постинге. При выборе алгоритма решения приходится выбирать между точными алгоритмами, которые не применимы для стеков большой размерности, и приближенными, которые работают быстро, но не обеспечивают оптимального решения задачи. Если перебирать всевозможные подмножества данного набора из n предметов, то получится решение сложности не менее чем O(2n). В настоящее время неизвестен (и, скорее всего, вообще не существует) алгоритм решения этой задачи, сложность которого является многочленом от n.

Выводы по первой главе. Постановка задач исследования

При исследовании алгоритмов решения задачи условного постинга в социальных сетях, был выявлен ряд алгоритмов и моделей, которые можно успешно применять при моделировании распространения информации в социальных сетях.

Целью выпускной квалификационной работы является планирование и проведение кампании по продвижению рекламного проекта социальных Twitter-медиа, а также продвижение в собственной социальной сети Writer-ru.ru с моделированием алгоритма расспространения информации в социальных сетях.

Для достижения поставленной цели были решены следующие исследовательские задачи:

· Рассмотреть понятие функционарования социальных сетей.

· Определить критерии эффективности продвижения аккаунта в социальных сетях.

· Разработать методы продвижения проектов в социальных сетях.

· Составить план по автоматизации продвижения услуг в социальных сетях.

· Провести кампанию по продвижению услуг в Twitter.

· Проанализировать эффективность проведенной кампании по продвижению услуг в Twitter.

· Разработать собственную социальную сеть для моделирования алгоритма распространенния информации социальных сетях.

При определении самых влиятельных агентов в сети, их ценности, было выявлено оптимальное решение, которое определяет влиятельных агентов в социальной сети, ценность которых определяется ожидаемой прибылью при медиапланировании.

Стремительное развитие инфокоммуникационных сетей с cloud-технологии открывает множество возможностей для пользователей. Пользователям «облака» предоставляются необходимые сервисы удаленно с помощью технологии виртуализации. Однако важным аспектом в предоставлении cloud-услуг является скорость предоставления этих сервисов, наличие свободных каналов для их предоставления, чтобы удовлетворить потребности пользователей.

социальный информация алгоритм интерфейс

2. Математическое описание реализации алгоритма моделирования распространения информации в социальных сетях

2.1 Обзор алгоритма распространения информации в социальных сетях

Пусть сервис является объектом для предоставления услуги клиентам cloud сети, основной характеристикой которого является продолжительность обработки запроса tобр. Рассмотрим атомарный сервис ? сервис, реализованный одной программой, установленной на одной виртуальной машине. Если установлено несколько атомарных сервисов на одной физической машине, производительность таких сервисов уменьшается, поскольку доступ сервисов к ресурсам физической машины происходит по методу временного разделения. Поэтому в случае увеличения количества сервисов на одной РМ, рост интенсивности поступления запросов на РМ и увеличения интенсивности поступления запросов на каждый сервис увеличивается продолжительность обслуживания запросов каждым сервисом. В случае уменьшение производительности сервиса система управления переносит этот сервис на другую VM или РМ.

Логическая топология не меняется, но данные проходят по другим физическим каналам. В таком случае общее время передачи сервиса от пользователя к ЦОД и в обратном направлении рассчитываться так:

(2.1)

где: n ? количество запросов;

tкоммут. ? время прохождения запроса через систему коммутации;

tп.к.з. ? время поиска каналов, по которым будет осуществляться передача;

tобр. ? время обработки запроса, который является суммой времен обработки запроса сервисом, который состоит из k атомарных сервисов:

(2.2)

Поскольку оптимальный путь передачи изменяется, то это приводит к увеличению времени поиска каналов, по которым будет осуществляться передача - tп.к.з., что, в свою очередь, приведет к увеличению общего времени передачи (рисунок 6).

Время поиска маршрута, мкс

Рисунок 6 - Зависимость времени передачи сервису данных от временни поиска канала, по которому производиться передача

Для решения этой проблемы используют алгоритм поиска пути по критериям минимального времени прохождения. В основу этого алгоритма положен способ расчета оптимального пути передачи на основе данных о распространении информации и изменения в топологии сети. Эти данные образуют единую комбинированную метрику маршрута, которая обнаруживает компромисс между выбором оптимального маршрута и свойствами трафика, поскольку вероятность одновременного существование потоков с максимальным сервисом на маршрутах с общей линией низкая. Оптимальным путь состоит в том, что обеспечивается лучший показатель общей метрики, а потенциальный объем доступных ресурсов намного больше необходимого.

Метрика этого алгоритма представляется в виде:

(2.3)

где: Кn ? коэффициенты, которые задает администратор для корректировки композитной метрики;

minC ? минимальное значение пропускной способности на пути следования оптимального маршрута, по которому будут направляться данные;

L ? загруженность каждого звена в сети;

D ? суммарная задержка на интерфейсах;

R ? надежность пути.

Эта композитная метрика не передается между маршрутизаторами. Метрика вычисляется локально на маршрутизаторе и существует только на нем. Далее маршрутизатор передает только измененные параметры и сохраняет всех своих соседей в таблице, позволяет быстро находить альтернативные маршруты в случае отключения основных. Если соответствующий маршрут не найден, маршрутизатор опрашивает соседей о наличии альтернативных маршрутов.

Предположим, что некоторый интерфейс на выходе, при передаче информации от физического сервера А к виртуальной машине, имеет значение задержки t, до порогового значения задержки Т, то есть t <T. Виртуальная машина с целым программным комплексом в результате воздействия различных факторов мигрирует на физический сервер В. Алгоритм поиска пути по критерию минимального времени прохождения, передавая запрос на предоставление сервиса, анализирует, что такого логического оптимального маршрута уже не существует, поскольку на выходе из интерфейса, в случае передачи по "старому" маршруту, значение задержки t превышает пороговое значение Т (рисунок 7).

Суммарная задержка на интерфейсах, мс

Рисунок 7 - Зависимость времени поиска оптимального маршрута от суммарной задержки на интерфейсах

Назначением этой задачи является построение оптимального, с точки зрения прибыли, плана работы сервиса медиапланирования и предоставления компании прогнозов плана выполнения медиапланирования на будущие периоды.

Дано:

· Количество разновидностей медиапланирования - n;

· Количество видов имеющихся ресурсов - m;

· Значение ценовых коэффициентов на единицу медиапланирования j-го вида - ,;

· Запасы ресурсов i-го вида - bi, ;

· Матрица затрат ресурсов на медиапланирование - А, в какой aij- затраты i-го вида ресурса на j-й вид медиапланирования;

· Значение ценовых коэффициентов параметрической составляющей ЦФ для каждого го вида медиапланирования - ,.

Переменные:

· - количество медиапланирования.

В матричном виде математическая постановка задачи будет иметь следующий вид.

Целевая функция - максимизировать прибыль от продажи услуг медиапланирования:

(2.4)

Ограничения:

(2.5)

(2.6)

. (2.7)

Данная задача является задачей параметрического программирования с параметром в целевой функции.

Назначением задачи является определение коэффициентов параметрической составляющей задачи, то есть значений вектора.

Для определения коэффициентов, параметрических составляющих задачи (2.4) - (2.7) необходимо применить один из методов оценки неизвестных величин. К таким методам оценки относятся: метод наименьших квадратов (МНК), взвешенный метод наименьших квадратов, метод - оценок и метод наименьших модулей (МНМ) [1]. При разработке комплекса задач для определения вектора применялся МНМ, в нем минимизируется следующая функция (суммарное отклонение):

, (2.8)

где - неизвестные параметры;

- функция, параметры которой мы оцениваем;

- результаты -го наблюдения .

Задача (2.4) - (2.7) является классической задачей линейного параметрического программирования (ЗЛП) [7], а задача (2.8) может быть сведена к ЗЛП, поэтому решать их будем, используя алгоритмы разработаны для данного класса задач.

Общим методом решения задач данного класса является симплекс-метод. Симплекс-метод - метод решения задачи линейного программирования, в котором осуществляется направлен движение по допустимым базисным решениям к нахождению оптимального решения; симплекс-метод также называют методом постепенного улучшения плана. Метод был разработан американским математиком Джорджем Данцигом в 1947 году.

В основе метода параметрического программирования для ЗПУ с параметром в целевой функции лежат процедуры прямого симплекс-метода с некоторой модификацией, следовательно, для задачи (2.4) - (2.7) будем применять процедуры алгоритма именно этого метода.

Относительно задачи (2.8), то она сводится к задаче линейного программирования, позволит решить ее симплекс-методом.

Основной математической задачей, которую решает данный комплекс, является задача параметрического программирования с параметром в целевой функции. Параметрическое программирование - это метод определения того, как меняется решение задачи с изменением всех компонент вектора коэффициентов ЦФ.

Пусть при задача имеет оптимальное решение . Без потери общности предположим, что в оптимальном решения небазисные переменные имеют номера 1,…,. Запишем преобразованную задачу, соответствующую оптимальному развязку ()

(2.9)

где

(2.10)

Здесь коэффициенты составляющей исчисленные на основе базиса, оптимального относительно ЦФ при , так что компоненты вектора необязательно неотъемлемые. Поскольку решение оптимальный относительно , то

(2.11)

При параметрическая составляющая не играет никакой роли. При увеличении от нуля происходит поворот вектора нормали ЦФ , при достижении определенного значения это может привести к изменению оптимума.

Продолжим анализ задачи. При увеличении от нуля общая ЦФ приобретает значение

. (2.12)

Решение остается оптимальным до тех пор, пока выполняются условия:

. (2.13)

Обобщим описанный выше метод в виде пошагового алгоритма:

Шаг 0. Найти решение начальной ЗЛП при .

Шаг 1. Если для всех ( - множество индексов небазисных переменных), текущий решение остается оптимальным при всех сколь угодно больших , Стоп. Иначе найти

и соответствующее .

Шаг 2. Если , то мы определили все решения в заранее заданном диапазоне изменения параметра , Стоп.

Шаг 3. Если для всех ( - множество индексов базисных переменных), то при изменении базиса ЦФ становится неограниченным (если в столбце, соответствующей переменной , все коэффициент не положительные, то при всех ЦФ неограниченное сверху), Стоп.

Иначе найти переменную, которую выводим из базиса, с помощью выражения

.

Пусть минимум соответствует индексу .

Шаг 4. Выполнить операцию замещения: ввести в базис переменную , вывести из базиса переменную .

Шаг 5. Перейти на Шаг 1.

2.2 Анализ базовых требований к информационной системе для эффективной работы алгоритма

Поскольку сценарии использования интерфейсов социальных сетей не предполагают автоматического сбора данных множества пользователей с целью построения социального графа, то возникает ряд проблем:

1. Приватность данных - зачастую доступ к данным пользователей разрешён только для зарегистрированных и авторизованных участников сети, что требует поддержки эмуляции пользовательской сессии с помощью специальных учётных записей (аккаунтов).

2. Слабая структурированность данных - во многих случаях программные интерфейсы (API) социальных сетей имеют ограниченный функционал, что требует поддержки получения с помощью пользовательского веб-интерфейса статических копий HTML-страниц, корректной обработки их динамической части (включая исполнение асинхронных запросов к серверу социальной сети), извлечения нужных данных с помощью алгоритма и/или шаблона и построения их структурированного представления, удобного для дальнейшей автоматической обработки.

3. Ограничения доступа и блокировки - с целью предотвращения несанкционированного автоматического сбора данных и ограничения нагрузки на инфраструктуру сервиса социальной сети владельцы сервисов зачастую вводят явные или скрытые ограничения на допустимое количество запросов от одного пользовательского 441 аккаунта и/или IP-адреса в единицу времени, что требует учёта количества посылаемых запросов, а также поддержки динамической ротации используемых для сбора данных пользовательских аккаунтов и IP-адресов.

4. Размерность данных обуславливает необходимость в параллельном методе сбора данных, а также в методах получения репрезентативной выборки пользователей социальной сети (сэмплирование). В связи с постоянной необходимостью получения больших наборов данных из социальных сетей, был разработан фреймворк для сбора данных из различных интернет-сервисов.

Разработанный инструмент поддерживает скачивание данных из социальных сетей Facebook, Twitter, Hunch. Реализовано несколько способов получения репрезентативных выборок пользователей социальных сетей: сэмплирование методом обхода в ширину (breadth-first search, BFS) [1], по Метрополису- Гастингсу (Metropolis-Hastings Random Walk, MHRW) [3] и методом «лесного пожара» (Forest Fire, FF) [2].

Реализован механизм автоматического выбора учетной записи социальной сети для каждого запроса, а также поддержка прокси-соединений. Это обеспечивает устойчивость к блокировкам по IP - адресам и учетным записям. Кроме того, фреймворк поддерживает многопоточное скачивание. Одной из ключевых особенностей разработанного фреймворка является возможность быстро реализовать новые сценарии скачивания и методы сэмплинга.

Для оценки производительности фреймворка были проведены эксперименты, в которых скачивались профили пользователей социальных сетей Twitter, Facebook и Hunch. Были достигнуты следующие показатели:

· Facebook: более 500 профилей в час (один поток);

· Twitter: более 3000 профилей в час (один поток);

· Hunch: более 100 профилей в час (один поток).

Генерация случайных социальных графов. Несмотря на наличие средств для сбора данных из социальных сетей и большого количества доступных наборов данных, актуальной является задача создания моделей случайных социальных графов и инструментов для генерации случайных графов с заданным набором свойств. Для достоверного тестирования методов анализа социальных данных они должны быть применены к множеству наборов данных с различными свойствами.

К примеру, методы поиска сообществ пользователей в социальном графе могут показывать существенно различные результаты в зависимости от 442 размера исходного графа, средней степени вершины, коэффициента кластеризации и других структурных свойств. Сбор необходимых для достоверного тестирования реальных данных затруднён не только вследствие временных затрат на скачивание и обработку больших массивов слабоструктурированной информации, но и в силу сложности управления процессом сбора с целью получения набора данных с конкретным набором свойств. Размер графа, 106 вершин Размер графа, 103 вершин.

Результаты тестирования времени генерации случайных графов с заданной структурой сообществ. Вверху: на кластерах Amazon EC2 с различным количеством рабочих узлов типа m1.large: зелёная линия - 2 узла, жёлтая линия - 4 узла, красная линия - 8 узлов, синяя линия - 16 узлов.

Внизу: на одном компьютере. 443 Были разработаны модель и оригинальный метод для генерации случайных графов, обладающих основными свойствами социальных сетей (распределение степеней, диаметр, коэффициент кластеризации и т.д.) и заданной структурой сообществ пользователей. Для каждого пользователя осуществляется генерация атрибутов профиля, социальных связей, сообществ и текстовых сообщений.


Подобные документы

  • Понятие социальной сети, определение основных целей и задач ее создания, распространенность и значение в современном обществе. Модели влияния в социальных сетях. Выбор средств проектирования и программная реализация, разработка и реализация интерфейса.

    дипломная работа [1,5 M], добавлен 11.09.2012

  • Обучение нейронных сетей как мощного метода моделирования, позволяющего воспроизводить сложные зависимости. Реализация алгоритма обратного распространения ошибки на примере аппроксимации функции. Анализ алгоритма обратного распространения ошибки.

    реферат [654,2 K], добавлен 09.06.2014

  • Использование социальных сетей и медиа компаниями. Программа исследования факторов подписки на официальные аккаунты брендов в Twitter и Instagram. Применение мобильного Интернета целевыми группами российских потребителей. Тестируемые гипотезы и модель.

    дипломная работа [2,9 M], добавлен 30.12.2015

  • Основные положения теории защиты информации. Сущность основных методов и средств защиты информации в сетях. Общая характеристика деятельности и корпоративной сети предприятия "Вестел", анализ его методик защиты информации в телекоммуникационных сетях.

    дипломная работа [1,1 M], добавлен 30.08.2010

  • Постановка задачи для машинного моделирования, определение параметров и переменных. Алгоритмизация модели и её машинная реализация. Реализация алгоритма моделирования на общесистемном языке программирования. Описание диалога с пользователем, интерфейс.

    курсовая работа [703,1 K], добавлен 14.01.2013

  • Исследование симметричных алгоритмов блочного шифрования. Минусы и плюсы алгоритма IDEA. Разработка программы аутентификации пользователя и сообщений на основе алгоритма IDEA. Выбор языка программирования. Тестирование и реализация программного средства.

    курсовая работа [314,2 K], добавлен 27.01.2015

  • Симметричные криптосистемы; алгоритмы шифрования и дешифрования данных, их применение в компьютерной технике в системах защиты конфиденциальной и коммерческой информации. Основные режимы работы алгоритма DES, разработка программной реализации ключа.

    курсовая работа [129,6 K], добавлен 17.02.2011

  • Обзор рынка мобильных приложений, социальных сетей, аналогов. Обзор инструментов разработки: Android Studio, Microsoft visual С# 2012, PostgreeSQL, API Открытых данных Вологодской области, API Социальных сетей. Программный код, разработка интерфейса.

    дипломная работа [2,6 M], добавлен 10.07.2017

  • Актуальный статус социальных сетей: их понятие и внутренняя структура, история становления и развития, целевая аудитория, классификация и разновидности, позиция организаций. Анализ деятельности музыкальной группы "Perpetum Mobile" в социальных сетях.

    курсовая работа [1,6 M], добавлен 17.06.2013

  • AnyLogic как инструмент компьютерного моделирования нового поколения. Процесс разработки моделей и реализация имитационных моделей для распространения эпидемического заболевания. Разработка систем обратной связи (диаграммы потоков и накопителей).

    контрольная работа [1,8 M], добавлен 21.07.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.