Математические методы количественной оценки характеристик полезности You Tube канала

Характеристика развития You Tube каналов и партнерских сетей. Частные партнерские сети: преимущества, особенности функционирования. Построение рекомендаций для помощи принятия управленческого решения менеджерам партнерской сети. Монетизация You Tube.

Рубрика Экономико-математическое моделирование
Вид дипломная работа
Язык русский
Дата добавления 19.06.2017
Размер файла 374,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение

высшего образования

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ

ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ»

Факультет прикладной математики и информатики

Кафедра прикладной математики и экономико-математических методов

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА

На тему «Математические методы количественной оценки характеристик полезности YouTube канала»

Введение

Данная работа посвящена исследованию особенностей работы и взаимодействия YouTube каналов с частными партнерскими сетями.

Актуальность исследования заключается в том, что на текущий момент не существует сервисов, методов или моделей прогнозирования роста аудитории YouTube каналов, поскольку значительная часть данных необходимых для проведения подобной работы является закрытой и может быть получена только с согласия владельца YouTube канала, либо требует длительных наблюдений.

Не проводилось исследований доказывающих при помощи математических методов влияния качественных характеристик YouTube канала, на его полезность, которая выражается в объеме его аудитории. Следует отметить, что и сам перечень этих характеристик не выделен и не обоснован. На данный момент существуют сервисы, использующие лишь два параметра - это время работы канала и число подписчиков канала.

Цель выпускной квалификационной работы состоит в выявлении списка качественных характеристик YouTube каналов, относящихся к конкретным категориям, для оценки их вклада в общую полезность деятельности каналов, которая заключается в потенциальном росте аудитории каналов. А также в создании алгоритма позволяющего на основе математических методов оценивать перспективность YouTube каналов при принятии управленческого решения о подключении конкретных каналов к партнерской сети. Поскольку на текущий момент, из-за отсутствия инструментов менеджеры вынуждены полагаться исключительно на свой опыт.

Объектом исследования выступит взаимодействие частных партнерских сетей с владельцами YouTube каналов.

Предметом исследования является инструмент оценки роста аудитории YouTube каналов различных категорий.

Практическая значимость работы заключается в применении созданного инструмента оценки роста аудитории конкретной партнерской сетью для принятия решения.

В задачи исследования входит:

1. Ознакомление с соответствующей литературой и существующими методами решения.

2. Выбор метода исследования.

3. Составление списка качественных характеристик YouTube канала.

4. Оценка вклада выявленных характеристик в общую полезность деятельности канала.

5. Составление рекомендаций для принятия управленческого решения о подключении канала к партнерской сети;

1. Метод совместного анализа для оценки полезности качественных характеристик youtube каналов

1.1 Характеристика развития YouTube каналов и партнерских сетей

1.1.1 История сервиса YouTube

История YouTube началась более десяти лет назад. В 2005 году был запущен домен Youtube.com. На сегодняшний день YouTube является самым популярным сервисом видиохостинга. Создателями этого феномена современного интернета стали Chad Harley (Чад Хёрли) Steve Chen (Стив Чен) Jawed Karim (Джавед Карим). Ранее они являлись сотрудниками и разработчиками не менее известного проекта - PayPal.

С самого начала был только домен и идея работы нового сервиса. Для привлечения пользователей необходимо было придумать удачный маркетинговый ход. Поэтому появилась лотерея, в которой каждый день одному случайному посетителю сайта дарили iPod.

Как и ожидалось, все возрастающая активность вокруг молодого проекта привлекла внимание инвесторов. Крупнейшим партнером YouTube стал фонд Sequia Capital. В период с ноября 2005 по апрель 2006 он инвестировал в проект около 11,5 миллионов долларов.

Популярность YouTube росла с геометрической прогрессией, и уже к июлю 2006 сайт добился 65000 загруженных видео и 100 миллионов просмотров в день. Такая популярность объясняется тем, что в существующем медийном пространстве YouTube стал культурным и социальным феноменом. Если раньше основным источником видеотрансляции было телевидение, то с появлением видеохостинга генерировать и просматривать контент может каждый индивидуум, причем не ограниченное количество раз. Этот подход произвел революцию в сфере медиа и стал отправной точкой в создании абсолютно нового подхода к трансляции контента в широкие массы.

В октябре 2006 года, Google начинает процесс приобретения сервиса. Цена сделки составила 1.65 миллиардов долларов, причем часть из этих денег была выплачена акциями, которые со временем сделали основателей сайта весьма состоятельными людьми. В ноябре того же года сервис полностью перешел под контроль корпорации Google.

Таким образом, можно выделить следующие ключевые даты на начальном этапе становления видиохостинга YouTube:

1. 14-го февраля 2005г. - активирован домен YouTube.

2. 23-го апреля 2005г. - на сервисе появился первый ролик длительностью 15 секунд. Это Джавед Карим снял видео, где некто Яков Лапитски стоит на фоне клетки со слонами.

3. Май 2005г. - начало периода бета-тестирования.

4. Ноябрь 2005г. - публичное открытие сервиса.

5. Октябрь 2006 - выкуп компанией Google.

1.1.2 Монетизация YouTube

Предполагается, что YouTube никак не монетизировался до выкупа Google, и осуществлял свою деятельность исключительно на инвестиции, полученные от фонда Sequia Capital и других инвесторов.

Уже в 2005 году вопрос монетизации интернет-пространства стоял достаточно остро. Мало кто понимал, сколько нужно платить за рекламу в интернете. Компания Google решила вопрос достаточно простым образом, создав единую платформу монетизации всех своих сервисов, в том числе поисковика. AdSense и AdWords стали одним из первых масштабных проектов интеграции рекламы во все сервисы Google.

Google автоматически размещает наиболее подходящую данному пользователю рекламу на сайте-партнере, подключенному к программе AdSense. Такой тип размещения рекламы получил название контекстная реклама. AdSense был запущен в 2003 году, а начале 2011 года доля доходов программы AdSense составляла 28% от общих доходов Google или 2.43 миллиарда долларов США. Начисление средств, происходит за счет переходов по рекламным ссылкам (кликов) и количества просмотренных рекламных роликов (например, в начале ролика на YouTube). Тем не менее, в случае просмотра рекламы перед видео начисление происходит только в том случае, если ролик был досмотрен до конца.

1.1.3 Частные партнерские сети: преимущества, особенности функционирования

Почему вообще появились частные партнерские сети?

Во многом из-за недостатков системы AdSense.

Google AdSense перечисляет деньги раз в месяц, но только при накоплении минимум ста долларов на счете. И накопить эти сто долларов достаточно сложно, особенно для небольших сайтов или youtube-каналов, ввиду достаточно скромных заработков партнеров за показ рекламы.

Достаточно быстро, появились частные партнерские сети, задача которых состояла, как и у Google AdSense, выступать посредником между рекламодателями и площадками для размещения рекламы.

Основное их преимущество для авторов YouTube каналов заключается в низком пороге вхождения. По сути, любой начинающий канал, собрав немного подписчиков и просмотров не нарушая правил сервиса, может подключиться к любой действующей партнерской сети и начать получать некоторый доход за свою деятельность.

Подключение к партнерской сети дает следующие преимущества:

1. Высокий заработок и прямая монетизация. Крупные компании предлагают партнерам размещать прямую рекламу на своих каналах, это дает больший заработок, чем обычная программа AdSense

2. Планирование стратегии. В штате партнерских сетей работают опытные и сертифицированные специалисты, которые анализируют каналы и предлагают планы развития. Другие опытные партнеры и профессионалы YouTube проводят мастер-классы и обучающие вебинары.

3. Удобные платежи и система выплат. Партнерские сети работают со всеми основными платежными системами, или находят индивидуальный подход к каждому партнеру.

4. Техническая поддержка. Каждый партнер имеет право обратиться за помощью в решении любой проблемы связанной с его каналом.

5. Оптимизация канала и SEO-продвижение. Партнерские сети располагают наборами инструментов, которые доступны всем партнерам, для оптимизации, продвижения и управления контентом.

6. Защита авторских прав и борьба с пиратством. Партнерские сети работают напрямую с YouTube, помогают разобраться с системой Content ID, избавиться от ложных претензий в нарушении чужих авторских прав, монетизировать каждый просмотр видео партнера на чужом канале или удалить его оттуда.

7. Коллаборация с другими каналами. Помощь во взаимном продвижении канала-партнера при помощи других каналов, подключенных к этой сети, для привлечения аудитории.

8. Участие в мероприятиях. Партнеры имеют права на получение помощи в посещении различных тематических мероприятиях.

9. Студии для записи видео и аудио. Партнеры имеют право воспользоваться студиями в различных городах, для создания своего контента.

10. Перевод, дубляж и субтитры. Партнерам предлагаются услуги в переводе своих видео-роликов на другие языки.

11. Реферальная программа. Партнерам дается возможность подключать другие каналы к партнерской сети и получать с этого доход.

Несмотря на то, что партнерская сеть забирает себе часть дохода с канала, в качестве платы за предоставляемые услуги, в большинстве случаев наблюдается рост дохода партнеров при подключении к сети вместо работы с AdSense.

Однако предоставление этих услуг, в особенности технической поддержки, организации мероприятий, помощи в продвижении канала требует затрат людских ресурсов, а партнерская сеть не может одобрять все заявки на подключение, если среди них окажутся не эффективные каналы. Поскольку такие каналы не окупают затраты этих ресурсов.

Так же существует ограничение со стороны компании Google, которое заключается в правилах функционирования партнерской сети, например, жалоба на нарушение авторских прав т.н. «страйк», придет не только на канал, но и в адрес партнерской сети, к которой этот канал подключен. И если сеть накопит критическое количество таких жалоб, и не сможет своевременно их разрешать компания Google в одностороннем порядке имеет право закрыть эту партнерскую сеть.

Эти два ограничения являются существенными при принятии решения о подключении.

Понятно, что автору видео и партнерской сети хотелось бы знать долю коммерческих просмотров на канале в будущем, однако в количественном выражении выручка всегда будет увеличиваться, с ростом числа подписчиков и соответственно просмотров.

Проблема заключается в трудностях принятия решения о подключении канала к партнерской сети и ответа на вопрос - «будет ли расти аудитория этого канала, как следствие будет ли расти выручка партнерской сети?» менеджерам хотелось бы иметь критерии оценки, позволяющие сделать более конкретные выводы. Исследование направленно на создание инструмента для прогнозирования роста аудитории канала для принятия решения его подключения к партнерской сети.

Цель данного исследования формулируется как: выявление списка качественных характеристик YouTube канала, работающего в конкретной категории, для оценки их вклада в общую полезность деятельности канала, как выражение потенциального роста аудитории этого канала.

Задачи исследования:

1. Ознакомление с соответствующей литературой и уже существующими методами решения подобной проблемы;

2. Выбор метода исследования;

3. Составление списка качественных характеристик YouTube канала;

4. Оценка вклада выявленных характеристик в общую полезность деятельности канала.

5. Составление списка рекомендаций для помощи принятия управленческого решения о подключении канала к партнерской сети;

На данный момент решение о подключении к партнерской сети принимается исключительно на основании личного опыта менеджера по подключению, а также с использованием минимальных требований для подключения к партнерской сети, определенных этой партнерской сетью и правилами работы AdSense.

Эти ограничения следующие:

1. Общее количество просмотров на роликах должно быть не менее 10000.

2. Общее количество просмотров на роликах, опубликованных за последние 30 дней, должно быть не менее 3000.

3. Количество подписчиков канала должно быть не менее 500.

4. Не менее 5-7 роликов на канале

5. Канал существует более одного месяца

6. Канал имеет положительную репутацию на YouTube (отсутствие нарушений правил сообщества YouTube).

7. Видео на канале должно быть авторским и не нарушать авторских прав других лиц. Это касается как видео - так и аудио материалов.

8. Владелец канала должен быть старше 14 лет (выплаты возможны для лиц старше 18 лет, в случае если партнер не достиг возраста 18 лет, соглашение оформляется на родителей или опекунов).

Очевидно, что данные критерии оценки не позволяют оценивать перспективность этого канала, иначе говоря, не понятно, сколько денег он принесет в будущем - поскольку партнерской сети важно понимание перспектив роста аудитории, ведь с ростом аудитории будет расти и доля коммерческих просмотров, а значит и выручка партнерской сети.

Конечно, можно запросить более подробную статистику от автора, например, о количестве подписчиков, просмотров и их росте за период времени, получить временной ряд и попытаться построить простейшие прогнозные модели.

Однако, подобные действия ввиду не самого удобного способа сбора подобной информации, ее предоставления в начальном виде, а также последующая формализация этой информации и создание неких программных алгоритмов являются достаточно трудоемкой задачей.

Таким образом, объектом исследования, выступит взаимодействие партнерских сетей с владельцами каналов, а предметом исследования будет инструмент оценки роста (перспективности) аудитории YouTube каналов различных категорий.

1.2. Описание метода совместного анализа

1.2.1 Обоснование выбора метода

Методом получения ответа на вопрос о предполагаемом росте аудитории канала могла быть регрессионная модель. Однако реализация подобного метода связана с большим количеством трудностей.

Первая и самая главная проблема связана с получением данных для построения временных рядов. Поскольку вся статистическая информация предоставляемая сервисом YouTube Analytics является закрытой, то есть доступной только владельцу канала, то эти данные (в том числе количество подписчиков) значение которых должно было стать зависимой переменной в предполагаемой модели, можно получить только с личного согласия владельца канала.

Данные Analytics предоставляются в динамическом виде, то есть существует возможность узнать конкретное значение интересуемого параметра в любой момент времени с момента создания канала. Но крайне неудобный формат предоставления этих данных, а также закрытый доступ к информации затрудняет возможность перевода показателей во временные ряды.

И даже те данные, которые могут находиться в открытом доступе (например, количество просмотров) доступны только на текущий момент, что вызвало бы необходимость длительных наблюдений для получения информации и невозможность углубится в прошлое. Это является еще одним препятствием для построения регрессионной модели.

С сокрытием данных, со стороны владельца канала, связано множество трудностей, поскольку автор может ограничить доступ, практически ко всему, например, к комментариям, или оценкам нравится, не нравится, помимо числа подписчиков. Тем самым, возможность частично или полностью скрывать информацию о канале и видеозаписях затрудняет сбор данных.

Так же встал вопрос об определении предикторов, т.е. независимых переменных. Какие именно характеристики могут влиять на предполагаемый рост, стагнацию или убывание аудитории канала, а также численное выражение этих характеристик в формате временного ряда. Перевод иных характеристик (например, количество положительных или отрицательных комментариев) имеющих субъективный характер во все те же временные ряды выглядит трудоемкой задачей. То есть если мы имеем ситуацию, когда комментирующий прямо пишет - «это видео мне понравилось» или «это видео мне не понравилось» оценить характер данного замечания не составляет труда. Однако часто можно встретить ситуацию, когда наполнение комментария может быть неверно истолковано исследователем. Это прямо повлияет на точность проводимого анализа. Другими словами, неявное выражение предпочтений пользователем, оставившим комментарий, должно быть проигнорировано для составления потенциальной оценки.

Однако, существуют сервисы способные работать с данными находящимися в открытом доступе.

Первый такой сервис называется «SocialBlade».

Этот сервис работает по принципу «трекера». Поскольку сервис не запрашивает никаких данных и не требует авторизации Google аккаунта, для работы с API YouTube Analytics, то данные собираются следующим образом: после первого обращения, любым пользователем, к конкретному каналу, сервис начинает собирать данные о канале. Сервис снимает текущие значения количества подписчиков, просмотров видео и загруженных видео, то есть работает с открытыми данными, однако, как уже было сказано, эти данные могут быть и не доступны для общего пользования. Так же на основании внутренних алгоритмов делается вывод о предполагаемых доходах этого канала. Как именно делается вывод о доходах, не раскрывается, однако можно предположить, что существуют некоторые средние константы, на которые умножается число просмотров, всех за время существования канала или за период, обычно это месяц. После первого обращения канал появляется в базе данных сервиса, и записывает данные о канале каждый день, по сути, проделывая формальное наблюдение.

Так же сервис предоставляет услугу построения прогнозных значений о росте числа подписчиков, так же, не раскрывая работу внутренних алгоритмов и методов построения этих прогнозов. Однако на основании представленных данных о сборе информации можно сделать предположение, что из собранных данных, о числе подписчиков, выстраивается временной ряд, а прогнозные значения строятся методом линейного тренда.

Это лишь предположения о работе сервиса, построенное с учетом явной линейности предоставляемых прогнозных значений.

Однако этот сервис не является решением проблемы, поскольку ему присущи все вышеизложенные недостатки:

1. Данные о канале начинают собираться, только с момента первого обращения к этому каналу при помощи данного сервиса.

2. Явная простота и линейность вычислений прогнозных значений, которые, скорее всего, не будут соответствовать действительности, поскольку динамика роста аудитории YouTube канала далеко не всегда подчиняется линейным законам.

Второй сервис называется «vidIQ».

Этот сервис работает с внутренними данными канала, требуя авторизации Google аккаунта, и работает с API YouTube Analytics. Однако результат обработки этих данных доступны только владельцу канала, но у этого сервиса существует приложения для веб-браузера Google Chrome, которое показывает дополнительную информацию о канале, на его веб-странице, или конкретном видео. Скорее всего, менеджера партнерской сети будет интересовать всего несколько разделов этой информации, а именно:

1. Средний прирост количества подписчиков в день.

2. Просмотры и подписчики за последний месяц. По мимо абсолютных значений, приводятся и относительные показатели.

3. Среднее количество просмотров в день.

Проанализировав данные предоставляемые двумя сервисами с личным опытом, возможно, менеджер сможет сделать какие-то выводы, однако этой информации недостаточно для принятия аргументированного решения о подключении канала.

1.2.2 Процедура совместного анализа

Процедура совместного (conjoint) анализа позволяет получить количественную оценку качественных характеристик того или иного объекта.

Важно то, что респонденту предлагается оценить с точки зрения бытовых и личных предпочтений некий объект, состоящий из независимых между собой характеристик.

Оценивается именно отношение респондентов к качественным характеристикам объекта и на основании этого принимается решение о выпуске конечного продукта, обладающего именно такими качествами, которые более значимы для конечного потребителя.

Совместный анализ - это особая форма представления, сбора и анализа данных, как правило, используемая в маркетинговых исследованиях.

Каждый продукт, товар или услуга, обладает некоторым количеством составных характеристик. Процедура совместного анализа предполагает выявление наиболее важных и значимых характеристик для потребителя, а также относительную привлекательность для конечного потребителя продукта, обладающего разными наборами этих характеристик.

При помощи этой процедуры определяется значимая для потребителей конфигурация из этих параметров продукта - товара или услуги, из уже существующих в производстве моделей или предполагаемых новых видов продукции.

Важность метода для этой работы, заключается в оценке значимости вклада характеристик в деятельность YouTube канала, поскольку целью работы является именно выявление значимости каждой отдельной характеристики для дальнейшей оценки менеджером партнерской сети в момент принятия решения о подключении его к партнерской сети.

Проведение совместного анализа состоит из нескольких пунктов:

1. Определить перечень составных характеристик и их уровни. Необходимо понять какие характеристики объекта нуждаются в изучении, и определить уровни этих характеристик, какие градации они могут принимать;

2. Подготовить информацию для опроса. В совместном анализе выводы строятся именно на обработке данных опроса потенциальных пользователей. Опрос будет состоять из «карточек», иначе говоря, объектов, обладающих выявленными характеристиками, представляющими важность. Поскольку число сочетаний из возможных вариантов может быть слишком велико для восприятия опрашиваемыми, так же необходимо составить ортогональный план опроса;

3. Проведение опроса, в котором респонденты ранжируют предложенные каналы исходя из личных предпочтений;

4. Обработка результатов опроса.

5. Подведение итогов исследования и формулировка выводов.

1.2.3. Математическое представление метода

С точки зрения математики процедура оценки полезности в рамках совместного анализа выглядит следующим образом.

Модель объекта, в данном случае YouTube канала, задана в виде набора характеристик и их значений. Они и их значения нумеруются как - число характеристик и {1,2, … k} - множество характеристик;

Nj - количество значений характеристик с номером j, j=1,..k; {1,2,… Nj} - ряд значений характеристики с номером j, j=1,..k. Величину

называют длинной общего ряда значений характеристик.

Подобный способ нумерации позволяет записывать профиль объекта как набор значений (l1, l2,…,lk), где lj ? {1,2,…, Nj}, j=1,…,k.

Это дает возможность сформировать список объектов, которые различаются значениями характеристик. Этот список включает в себя все возможные варианты, называется полным набором профилей. Если к модели добавить новую характеристику, число вариантов объекта возрастет во столько раз, сколько значений может принимать эта характеристика. Если модель объекта содержит k характеристик, а характеристика j может принимать Nj различных значений j = 1,…k, то полный набор профилей включает K профилей, где

Если профилей много, то респондентам трудно оценивать полезность каждого предложенного им варианта, и вместо полного набора, используют сокращенный набор профилей, иначе называемый ортогональным планом объема K* < K.

Набор профилей, в любом удобном виде, предлагается респондентам для оценивания, структура данных «на входе» модели совместного анализа, т.е оценки полезности профилей, полученных от респондентов показаны в таблице 1.

Таблица 1. Структура результатов опроса (оценки полезности профилей).

Респондент

Варианты объекта

1

2

3

K*

1

U11

U12

U13

U1K*

2

U21

U22

U23

U2K*

n

Un1

Un1

Un1

UnK*

Где n - количество опрошенных,

K* - ортогональный(сокращенный) план профилей,

Uil - полезность конкретного объекта с номером l для респондента i. Величину полезности Uil определяет респондент.

Затем, на основе этих оценок, производится оценка полезности рядов значений характеристик - частных полезностей. Декомпозиция полезности объекта на полезность значений характеристик производится отдельно, как для каждого респондента, так и для всей совокупности опрошенных. Для этого используется модель вида:

где U(l1,l2,…,lk) - полезность товара, со значением характеристик l1,l2,..,lk, lj?{1,2,…,Nj}, j = 1,…,k;

- полезность значения lk атрибута с номером k, k = 1,…,k; (?)

f - функциональная зависимость, между полезностью товара и полезностью значений характеристики.

Рассматривается простая аддитивная модель:

где b(0) - константа.

Результат оценивания модели (1) состоит в том, что для респондента с номером i, i = 1,…n, определяются ряды полезности значений каждого из атрибутов и константу:

полезности значений 1, …, N1 атрибута 1;

полезности значений 1, …, N2 атрибута 2;

полезности значений 1, …, Nk атрибута k;

- константа.

Для совокупности респондентов в целом, определяют аналогичные величины, без индекса i.

Для оценки величин полезности характеристик объекта, по величинам полезности объекта, с точки зрения респондента с номером i, i = 1,…n; строится еще одна система описания вариантов объекта. Для каждой характеристики j для которой предполагается дискретная функция полезности, вводятся Nj -1 переменных , x1(j), x2(j), …, xNj-1(j), которым для каждого профиля приписывают значения по следующим правилам:

1. Если атрибут j принимает значение lj и в ряду возможных значений указанного атрибута значение lj не является последним, значение новой переменной с верхним индексом j и нижним индексом lj полагают равным единице, а значения всех остальных новых переменных с верхним индексом j полагают равными нулю: если s = lj, если s ? lj; s = 1, …,Nj - 1;

2. Если атрибут j принимает последнее возможное значение в ряду, т. е, значение lj=Nj, все новые переменные с верхним индексом j принимают значение (-1): s = 1, …, Nj - 1

Для каждой характеристики с линейной функцией полезности, в новой системе описания вводится одна переменная, значения которой совпадают со значением характеристики из описываемого профиля, так же в эту систему описания объекта вводится константа x(0) = 1.

Для i-го респондента строится и оценивается регрессионная модель вида:

Уравнения строятся для всех вариантов объекта (D - число характеристик с дискретной моделью полезности). Параметры модели (величины ,,…, ,) оцениваются на основе метода наименьших квадратов, с применением либо специализированного программного обеспечения, либо иных программ с возможностями статистических вычислений. Полезность значений характеристики j с дискретной функцией полезности для i-го респондента, находят по правилу:

(здесь s = 1, …,Nj; j = 1, …, D; i = 1, …, n).

Полезность значений атрибута j с линейной функцией полезности, для респондента с номером i находят по правилу:

(здесь j = D + 1, …, k; i = 1,…n, а x - значение характеристики).

Структура данных «на выходе» модели совместного анализа показана в таблице 2.

Таблица 2. Структура оцененной модели полезности.

Респондент

Атрибут 1

Атрибут 2

Атрибут k

Константа

1

N1

1

N2

1

Nk

1

n

Все

Здесь n - количество респондентов, k - количество характеристик, Nj - количество значений характеристики с номером j. В i-ой строке указаны величины:

- полезность значения s атрибута j для респондента i, i = 1, …, n; s = 1, …, Nj; j = 1, …, k; - константа модели для респондента с номером i, i = 1,…,n.

В маргинальной строке таблицы те же величины указаны без индексов i и характеризуют совокупность опрошенных респондентов в целом.

Поскольку модель (1) является регрессионной, то таблица 2, полученная на основе таблицы 1, исходные оценки можно переоценить. А именно объекту с номером l, характеристики которого имеют значения l1,l2,…, lk, lj ? {1,2,…,Nj}, j = 1,…,k, и респонденту с номером i, i = 1,…,n, ставится в соответствие новая величина вычисляемая на основе (1):

Величина называется предсказанной полезностью объекта l для респондента i, l=1,…,K; i = 1,…,n. Кроме указанных величин, модель (1) позволяет оценить величину

которая называется предсказанной полезностью товара l для всей совокупности опрошенных, l = 1,…,K. На основе (5) и (6) формируется таблица 3, аналогичная таблице 1.

Таблица 3. Представление предсказанных значений полезности.

Варианты объектов

Респондент

1

2

3

K

1

2

N

Все

Абсолютным вкладом характеристики j в полезность объекта называют величину Cj:

Для того чтобы вычислить значение Cj, j = 1,…,k, нужно рассмотреть ряд полезности значений характеристики j и вычислить разность его максимального и минимального элементов.

Совместным вкладом в полезность объекта называют величину C:

Относительным вкладом (важностью) характеристики j в полезность объекта называют величину RCj:

Для того, чтобы доказать, достаточно взять пару объектов L и M, которые отличаются только значением первой характеристики. Значения характеристик объекта L записываются как: (L, l2,…,lk), где Значения характеристик объекта M записываются как: (M, l2,…,lk), где Тогда в силу (1) полезность объектов L и M отличается настолько, насколько отличаются полезности соответствующих значений первой характеристики:

Предположим, что объект M по первой характеристике является максимально полезным, а объект L - минимально. Тогда полезность объектов L и М отличается на величину

которая совпадает с величиной C1. Таким образом, величина C1 показывает, насколько можно изменить полезность всего объекта, меняя только первую характеристику, без изменения остальных.

Справедливо, что для любой величины Cj определенной формулой (7), изменение j-ой характеристики, покажет насколько можно изменить полезность всего объекта, меняя только одну характеристику.

Далее рассмотрим пару объектов, один из которых по всем характеристикам имеет наиболее полезные значения, а другой наименее. В соответствии с (1) разность полезности двух объектов:

Таким образом, величина C, определяемая формулой (8), показывает, насколько можно изменить полезность объекта, меняя значение всех его характеристик. Использование относительных величин RCj, j = 1,…,k, придает сравнению атрибутов большую наглядность.

2. Количественные оценки характеристик полезности youtube каналов

2.1 Формирование информационной базы исследования

Процедура совместного анализа накладывает некоторые ограничения на исходную информацию, поэтому было необходимо собрать и структурировать данные о принадлежности к конкретной категории каналов, подключенных к конкретной партнерской сети. Были получены данные, обо всех подключенных к этой сети каналах, за последний год от момента запроса данных.

В первичном виде данные выглядели как Google Таблица, в которой содержалась информация об имени владельца канала, дате подключения, кодовом значении принадлежности канала к конкретной категории, числе подписчиков и URL ссылка на канал с прямым идентификатором.

Эти данные были перенесены в более удобное средство просмотра и редактирования информации - таблицу Microsoft Excel.

Затем был применен инструмент «фильтр», для разделения данных по кодовым обозначениям категорий, (Приложение Б) чтобы потом перевести все данные о каналах, принадлежащих к одной категории, в отдельные листы таблицы Excel, для проведения дальнейшей выборки. Так же количество каналов в каждой категории было посчитано и их распределение было приведено в гистограмме (Рис.2.1).

Охватить все категории в данном исследовании не представилось возможным, поскольку всего категорий было 16 это:

1. «Pets/Animals» - 24 канала;

2. «How to/Style» - 433 канала;

3. «Film/Animation» - 194 канала;

4. «Autos/Vehicles» -167 каналов;

5. «Sports» - 104 канала;

6. «Entertainment» - 902 канала;

7. «Travel/Events» - 56 каналов;

8. «Non-profit/Activism» - 65 каналов;

9. «Education» - 121 канал;

10. «News/Politics» - 36 каналов;

11. «Science/Technology» - 107 каналов;

12. «Music» - 163 канала;

13. «People/Blogs» - 898 каналов;

14. «Gaming» - 2225 каналов;

15. «WarGame» - 69 каналов;

16. Без категории - 395 каналов;

Наиболее часто встречающейся категорией оказалась «Gaming» - игровая тематика - 2225 подключенных каналов, то именно эта категория была выбрана первой для проведения анализа.

Две другие категории: «Film/Animation» и «How to/Style» были выбраны как наиболее структурированные и максимально отвечающие первичным требованиям процедуры совместного анализа. Однако тоже достаточно объемные - 194 и 433 подключенных канала, на момент запроса данных. Дело в том, что обычно метод совместного анализа применяется для конкретных, уже описанных объектов или явлений, чьи характеристики материальны, и давно известны, что не вызывает никаких трудностей в плане описания объекта исследования. Другие категории, например, «Entertainment» и «People\Blogs» слишком похожи друг на друга в плане наполнения. И тот контент, который производят авторы, не поддается классификации и выявлению хоть каких-то характеристик для анализа. Всего за последний год партнерская сеть подключила 5958 каналов.

Менее весомые категории не рассматривались.

Следующим критерием отбора было число подписчиков конкретного канала. Выбирались достаточно крупные - по нескольку десятков тысяч подписчиков, поскольку этот результат, достигнутый менее чем за год, может считаться весомым, по сравнению с теми каналами, которые собрали небольшую аудиторию, в несколько сотен, или даже тысяч человек.

Рис. 2.1. Круговая диаграмма распределения подключенных за последний год каналов по категориям.

2.2 Обоснование набора характеристик YouTube каналов по категориям

Каналы в каждой выделенной категории изначально имели два параметра - время работы внутри партнерской сети и число подписчиков.

Была выдвинута гипотеза - что число подписчиков зависит от времени работы внутри партнерской сети. Что в частном случае является правдой, аудитория активных каналов в любом случае будет расти со временем, однако довольно сложно оценить темпы этого роста. Этот прирост номинальный и связан исключительно с активностью конкретного канала.

Однако есть два очень важных фактора - интенсивность роста и предельная аудитория. Они связаны между собой и означают следующее: любой YouTube канал обладает какой-то предельной (условно) аудиторией, то есть на этот канал может подписаться не более определенного количества человек, и эта цифра зависит исключительно от качества производимого этим каналом контента. Аудитория каналов будет расти интенсивно, только до момента прохождения этой предельной точки, после чего прирост подписчиков сильно замедляется.

Для проверки этой гипотезы была построена парная регрессия, где зависимой переменной было число подписчиков, а предиктором время функционирования этого канала внутри партнерской сети.

Для всех трех исследуемых категорий коэффициент детерминации составил менее 0,1 - в категории «Gaming» он равен 0,03. В категории «How to/style» он равен 0,01. В категории «Film/Animation» он равен 0.08. (Рис 2.2, 2.3, 2.4)

Рис. 2.2. Поле зависимости числа подписчиков от времени нахождения в партнерской сети категории «Gaming».

Рис. 2.3. Поле зависимости числа подписчиков от времени нахождения в партнерской сети категории «How to/Style».

Рис. 2.4. Поле зависимости числа подписчиков от времени нахождения в партнерской сети категории «Film/Animation».

Крайне низкое значение коэффициента детерминации означает, что гипотеза не верна, следовательно, время не оказывает существенного влияния на прирост аудитории, и не может выступать гарантом роста выручки. Следует учитывать, что время работы внутри сети не равно общему времени работы канала, и достаточно часто к сети подключаются довольно крупные (в своем сегменте) каналы и здесь следует учитывать факторы интенсивности роста и предельной аудитории. Так же это подтверждает необходимость выявления дополнительных составных характеристик.

Затем была проведена аналитическая группировка внутри категорий:

Таблица 2.1. Аналитическая группировка каналов категории «Gaming»

Среднее время работы

Число каналов в группе

Среднее число подписчиков в группе

75

10

127689

197

10

101755

256

10

72946

290

9

156695

320

10

197135

351

10

171325

383

9

143997

Таблица 2.2. Аналитическая группировка каналов категории «Film/Animation»

Среднее время работы

Число каналов в группе

Среднее число подписчиков в группе

56

7

41944

94

7

30337

152

7

51757

235

7

62513

290

7

555533

334

7

103798

Таблица 2.3. Аналитическая группировка каналов категории «How to/Style»

Среднее время работы

Число каналов в группе

Среднее число подписчиков в группе

40

6

105428

206

5

144291

307

5

82354

357

6

82482

Результаты группировки отмечены на рисунках 2.2, 2.3, 2.4 красными точками (ряд2).

2.3 Первый этап совместного анализа. Выявление составных характеристик YouTube каналов

Для выявления списка качественных характеристик была собранна группа экспертов - сотрудников партнерской сети и владельцев YouTube каналов.

Экспертной группе были предложены каналы из трех выделенных категорий - «Gaming», «How to/Style» и «Film/Animation» для оценки и выявления составных характеристик. Список каналов, участвовавших в эксперименте есть в приложении.

Для первой категории, игровой направленности, экспертами были выделены следующие составные характеристики:

Жанр - первичная характеристика, игры, как и любое произведение искусства, имеют свои жанровые направления. От этого зависит предельное значение аудитории. В конкретную игру, на всей планете может играть ограниченное количество человек, это является верхней границей значения числа подписчиков. Маловероятно, что канал, ориентированный на конкретную игру, или игровой жанр, соберет аудиторию большую, чем все люди, которые интересуются конкретной игрой или игровым жанром, чего, в общем-то, и не происходит, но можно рассчитывать на процентный охват от общего числа игроков, поэтому эта характеристика является, безусловно, важной и определяющей потенциальный успех деятельности YouTube канала.

Каналы, участвующие в выборке, делают контент в следующих направлениях - mobile, multi, sandbox, shooter.

Смысловая нагрузка - тип контента который создает автор канала. Это может быть канал, посвященный прямым трансляциям игрового процесса, или киберспортивных состязаний. Обучающие ролики, рассказывающие как играть в конкретную игру, чтобы достигнуть определенных результатов. Или развлекательный монтаж, когда автор создает какую-то нарезку смешных или интересных моментов из игры. Обзор конкретной игры, или просто публикация игрового процесса со своими комментариями.

Манера повествования - это совокупность некоторых факторов, как голос и интонации автора, его харизма, способность развлечь зрителя шутками или, наоборот, освещать события в серьезном формате. Так же автор может никак не появляться в кадре, используя иные способы передачи настроения. Соответственно значения этой характеристики будут следующими - агрессивная (серьезная), дружеская (забавная) или нейтральная.

В категории «Film/Animation» первой характеристикой эксперты выделили направленность на аудиторию. По сути, все каналы делятся на три большие группы - направленные на детей, подростков, и для любых возрастных групп. Они достаточно легко отличимые, даже в названии, например, детских каналов, пишут слово «Kids» для облегчения поиска. Каналы для подростков хорошо видно по наполнению, конечно, такими каналами могут заинтересоваться люди и более старшего возраста, однако основная их аудитория -- это подростки. Каналы, направленные на любую аудиторию, просто не имеют явно выраженных признаков направленности на детскую или подростковую аудиторию.

Так же идет деление по типу предлагаемого контента, но тут эксперты поделили все достаточно просто, это либо анимация, мультфильмы и так далее, либо живая съемка и фильмы.

И средняя длительность роликов, их эксперты поделили на длинные и короткие. Короткие -- это ролики до 7-9 минут в среднем, длинные соответственно, от 10 минут и больше.

В категории «How to/Style» в первую очередь свое внимание эксперты обратили на характеристику направления деятельности этого канала. Их три - посвященных внешнему виду, искусству рисования, а также рукоделию.

Так же стоит отметить, что закадровый голос присутствует далеко не на всех каналах, некоторые каналы, например, посвященные рисованию, предпочитают просто ставить какую-то фоновую музыку, как и каналы, посвященные рукоделию, которые просто демонстрируют процесс создания той или иной вещи, однако и здесь могут быть вариации. Поэтому эту характеристику эксперты рекомендовали отметить как её наличие или отсутствие.

Еще на таких каналах присутствуют отдельные рубрики, посвященные конкретным вещам. Например, каналы, занимающиеся внешним видом, могут предложить ролики, посвященные либо только одежде, либо только макияжу, либо тому и другому вместе. Обычно канал работает в одном направлении, двух или сразу нескольких.

Результаты работы экспертной группы приведены в таблицах:

Таблица 2.4. Выявленные экспертами факторы для категории «Gaming»

Название характеристики

Значения характеристики

Код для значения характеристики

Жанр

Mobile

1

Multi

2

Sandbox

3

Shooter

4

Смысловая нагрузка

Прямые трансляции

1

Обучение

2

Развлекательный монтаж

3

обзоры

4

Запись геймпеля

5

Манера повествования

Агрессивная (серьезная)

1

Дружеская (забавная)

2

Нейтральная

3

Таблица 2.5. Выявленные экспертами факторы для категории «Film/Animation»

Название характеристики

Значения характеристики

Код для значения характеристики

Расчетная аудитория

Для всех

1

Дети

2

Подростки

3

Тип контента

Фильм

1

Анимация

2

Длительность роликов (в среднем)

Длинные

1

Короткие

2

Таблица 2.6. Выявленные экспертами факторы для категории «How to/Style»

Название характеристики

Значения характеристики

Код для значения характеристики

Направление

Appearance

1

Art

2

Handmade

3

Закадровый голос

Есть

1

Нет

2

Рубрики

одна

1

две

2

много

3

2.4 Оценка вклада выявленных характеристик в общую полезность деятельности канала

2.4.1 Второй этап совместного анализа. Подготовка и проведение опроса

Поскольку предстоит обработка большого объема данных, то сам эксперимент и построение модели будет производиться в пакете SPSS.

Опрашиваемым будет предложено несколько вариантов YouTube каналов, из которых они будут выбирать наиболее понравившиеся, этот вариант будет удаляться, и так пока не останется самый последний, наиболее не понравившийся респонденту вариант. В пакете SPSS любой вариант YouTube канала будет называться карточкой или комплектацией этого канала.

Необходимо определится с кодировками, то есть с теми кодами, которые будут использоваться вместо текстового описания уровней характеристик (таблицы 2.4, 2.5, 2.6).

Желаемый набор профилей с математической точки зрения называется ортогональным планом эксперимента, однако здесь стоит сделать пояснение.

Поскольку в этом исследовании процедура совместного анализа будет использоваться уже для существующих объектов - YouTube каналов, в связи с этим, конечный, ортогональный план будет состоять из уже существующих каналов, обладающих уникальными характеристиками, без полного повторения. Не существует возможности оценить ортогональное сочетание всех характеристик, поскольку каналов, которые бы обладали ими, в своей категории, в природе, и в выборке не существует. И поскольку исследование направленно не на создание оптимального, с точки зрения потребителя, конечного продукта, но оценке его составляющих, подобная модернизация составления ортогонального плана является вынужденной мерой. Конечно, выборка состоит из релевантных каналов, чье число подписчиков превосходит несколько десятков тысяч. С точки зрения менеджеров партнерской сети, нет смысла оценивать маленькие каналы, каким бы уникальным набором характеристик они не обладали. Однако значимость каждой в отдельности имеет вес, который оправдывается числом подписчиков. В выборку попали каналы, подключенные за последний год, и это является хорошим показателем - меньше чем за год собрать несколько десятков тысяч подписчиков.

Составление ортогонального плана в пакете SPSS выглядит следующим образом. На верхней панели кнопка «Данные» - далее «Ортогональный план» - «Генерировать». В открывшемся окне необходимо указать имя фактора (характеристики) и его метку, пробелы в названиях характеристики запрещены, однако это правило не распространяется на название метки. После заполнения этих двух полей, слева необходимо нажать кнопку «Добавить». Выделение имени фактора в рабочем поле, активирует кнопку «Задать значения», нажатие этой кнопки дает возможность задать значения и коды факторов. В первом столбце задаются коды значений факторов, во втором метки, т.е. текстовые описания. Кнопка «продолжить» чтобы окончательно определить фактор.

Эту процедуру необходимо проделать для всех факторов выбранной категории. Для категории «Gaming» должны быть определены характеристики - жанр, смысловая нагрузка и манера повествования, со всеми возможными значениями этих характеристик. Далее необходимо сохранить файл с данными. Для этого в нижней части окна ставится галочка рядом с «Создать новый», это активирует кнопку «файл», и сохранить файл с данными исследования в любую удобную директорию. Поскольку категорий для исследования выбрано три, эту процедуру от добавления характеристик и их уровней, до сохранения файла, необходимо провести для каждой категории отдельно, получив три файла с данными для дальнейшей работы.

Процедура совместного анализа предполагает создание карточек, или макетов предполагаемого объекта, но поскольку оценивается уже существующие каналы, это действие отпадает, и в качестве макетов опрашиваемым для оценки будут предложены уже существующие каналы, обладающие тем или иным набором определенных характеристик. В качестве карточек в опросном листе будут выступать ссылки на эти YouTube каналы.

Всего в опросе в категории «Film/animation» и «How to/Style» будет участвовать по двенадцать и восемь уникальных каналов соответственно, которые были отобраны из всех подключенных к партнерской сети за последний год. В категории «Gaming» таких каналов будет двадцать четыре.

Опросный лист создавался в сервисе Google Forms. Сверху необходимо заполнить строку с названием опросного листа, а также описание, с инструкциями к требованию заполнения опроса. Левое поле, подписанное как «ссылки на каналы» - это вопросы формы, в данном случае эти поля заполнялись ссылками на каналы, которые были сокращены, для удобства просмотра формы. Слева выбирается метод внесения ответов в опрос. В данном случае для получения ранжированных результатов, необходимо выбрать метод «сетка (множественный выбор)» и сделать столько столбцов с ответами, сколько каналов участвует в каждом опросе, для форм «Film/animation» их двенадцать, для категории «How to/style» их восемь, для категории «Games» их двадцать четыре. Сами столбцы помечаются числом, которое указывает, какой канал респондент считает наиболее привлекательным, а какой наименее, где, например, в категории «How to/style» - «1» - самый понравившийся канал и «8» - самый непонравившийся. Так же необходимо включить требования обязательного заполнения всех строк внизу формы, и в выпадающем меню в виде троеточия поставить галочку, напротив «по одному ответу на столбец» чтобы исключить повторы в ранжировании. Таким образом, достигается соответствие опросного листа, требованиям совместного анализа. Так же внизу формы был создан дополнительный вопрос, о возрасте респондента.

Опрос проводился не по совсем традиционной схеме, в которой респондентам предлагается оценить набор объектов, или их муляжей (рисунков), с точки зрения привлекательности, после чего выбранный респондентом объект удалялся, с отметкой о выборе и опрашиваемый повторял процедуру, до тех пор, пока не кончались варианты объектов.

В данном случае в качестве карточек объектов выступали прямые ссылки на каналы, которые респонденты и оценивали с точки зрения личной привлекательности, но карточки не удалялись, как это делается в традиционном опросе, поскольку инструмент Google Form не дает такой возможности, поэтому респондентам необходимо было самим расставить очередность выбора.

Однако данные опроса в конечном виде переносятся в Google таблицу и имеют удобный вид, где в строках находятся значения результата выбора о постановке того или иного канала, на конкретное место с точки зрения привлекательности, отдельно взятого респондента.

2.4.2 Третий этап совместного анализа. Обработка результатов опроса

В первую очередь данные переносятся из Google Таблиц в более удобный, для просмотра и редактирования файл Microsoft Excel. В категории «Film/animation» было получено 310 ответов, в категории «How to/style» 330 ответов, в категории «Gaming» 340 ответов. В опросе участвовали лица обоего пола от 16 до 42 лет. Не все данные годятся для обработки, например, некоторые формы, были заполнены по восходящему порядку, иные через строчку, такие закономерности должны быть удалены из выборки. После удаления испорченных форм ответов осталось 329 результатов в категории «Gaming», 319 результат в категории «how to/style» и 237 результатов в категории «Film/animation».

Эти данные переносятся в новый файл SPSS, где в первом столбце содержится информация об опрашиваемом, в данном случае лишь номер респондента, а все остальные нумеруются по порядку представленных в опросе карточек YouTube каналов и содержат результаты опроса.

Если рассмотреть первую строчку файла с результатами опроса категории «Film/animation», можно увидеть, что первый опрошенный поставил первый канал на 11 место, второй на третье, третий на седьмое и так далее.

Пятый и основной этап заключается в выполнении процедуры совместного анализа в пакете SPSS. Для этого в SPSS существует собственный язык программирования и встроенный редактор и компилятор.

Для вызова этого средства необходимо нажать кнопку «Файл» на верхней панели, далее меню «Создать» и выбрать «Редактор синтаксиса». Откроется окно редактора синтаксиса, в котором пишется код исполняемой программы, для обработки данных. Стандартная программа для обработки данных выглядит следующим образом:


Подобные документы

  • Математический аппарат для моделирования динамических дискретных систем. Направление развития теории сетей Петри. Построение сети, в которой каждой позиции инцидентно не более одной ингибиторной дуги. Появление и устранение отказов оборудования.

    реферат [116,2 K], добавлен 21.01.2015

  • Построение схемы сети. Расчет интенсивностей входных потоков для каждой СМО. Проверка стационарности сети. Модель сети на языке моделирования GPSS. Сравнение расчетных и экспериментальных данных по критерию Стьюдента. Проверка адекватности модели.

    контрольная работа [94,6 K], добавлен 28.07.2013

  • Методики решения аналитической задачи оценки функционирования жилищно-коммунального хозяйства региона. Математическая модель, метод и алгоритм решения задачи планирования вывоза бытовых отходов на заводы по их переработке. Ввод дополнительной информации.

    автореферат [755,5 K], добавлен 23.03.2009

  • Моделирование экономических систем: основные понятия и определения. Математические модели и методы их расчета. Некоторые сведения из математики. Примеры задач линейного программирования. Методы решения задач линейного программирования.

    лекция [124,5 K], добавлен 15.06.2004

  • Моделирование экономических процессов методами планирования и управления. Построение сетевой модели. Оптимизация сетевого графика при помощи табличного редактора Microsoft Excel и среды программирования Visual Basic. Методы принятия оптимальных решений.

    курсовая работа [217,2 K], добавлен 22.11.2013

  • Задача и методы решения экстремальных задач, которые характеризуются линейными зависимостями между переменными и линейным критерием. Построение экономико-математической задачи и ее решение с помощью пакета WinQSB, графический анализ чувствительности.

    курсовая работа [259,4 K], добавлен 16.09.2010

  • Математические методы прогнозирования инновационных процессов в экономике, применяемых для построения интегральных моделей в экономической сфере. Метод стратегических сетей, разработанный М. Джексоном, М. Конигом, основанный на современной теории графов

    статья [712,4 K], добавлен 07.08.2017

  • Нахождение начального опорного плана методом минимальной стоимости, оптимизация его методом потенциалов. Решение задачи о назначениях с заданной матрицей затрат. Построение набора дуг, соединяющих все вершины сети и имеющих минимальную протяженность.

    контрольная работа [341,0 K], добавлен 24.04.2012

  • Изучение на практике современных методов управления и организации производства, совершенствование применения этих методов. Описание ориентированной сети, рассчет показателей сети для принятия управленческих решений. Проблема выбора и оценка поставщика.

    курсовая работа [137,6 K], добавлен 21.08.2010

  • Основы математического моделирования экономических процессов. Общая характеристика графического и симплексного методов решения прямой и двойственной задач линейного программирования. Особенности формулирования и методика решения транспортной задачи.

    курсовая работа [313,2 K], добавлен 12.11.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.