Состояние рынка Big Data в маркетинге в России и прогноз его развития с учетом фактора технологий защиты персональных данных

Технологии защиты персональных данных и их применение. Юридический аспект защиты персональных данных в России. Описание результатов опроса среди рядовых российских пользователей. Прогноз развития технологий в связи с аспектом защиты персональных данных.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 03.07.2017
Размер файла 149,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

· Безработный

30. Укажите ваш уровень дохода

· Средств с трудом хватает на продукты питания

· На питание средств хватает, но покупка предметов одежды вызывает трудности

· Средств хватает на покупку одежды, но для покупки бытовой техники свободных средств нет

· Заработка хватает на покупку техники, но не на крупные покупки (автомобиль, квартира)

· Я могу позволить себе любые покупки

31. Укажите ваш уровень образования

· Общее образование

· Среднее специальное

· Неоконченное высшее

· Высшее

Приложение 2

Интервью №1

ФИО: Боровиков И. Г.

Должность: Основатель и генеральный директор компании Mindbox

Интервью:

Давайте начнем с первого вопроса. Вы работаете с большим количеством различных компаний, в связи с чем как бы в могли охарактеризовать рынок больших данных в России на данный момент? Является ли он отстающим от западного рынка или находится на схожем уровне?

Давайте начнем с определения - что такое рынок больших данных?

В моем понимании это объем технологий, которые используются российскими компаниями, как компаниями самими, их отделами, так и компаниями-подрядчиками.

Мы говорим о рынке купли-продажи самих данных или технологиях?

Скорее технологиях

Рынка нет, он только формируется. Есть хайп, есть очень много пиара на этот счет, пиар очень развит, а вот сами технологии пока не очень.

Что по-вашему на данный момент развито больше всего? Чего не хватает, а что используется чаще всего?

Я вижу сейчас три момента, где они применяются. Первое - это скоринговые модели, которые строят операторы сотовой связи и продают в банки и страховые, достаточно большая история. Вторая история - это использование больших данных в маркетинге, причем в двух моментах. Первое - это различные предиктивные модели, предсказывающие интерес, поведение или покупательскую способность потребителя. Частный случай - товарная рекомендация, более-менее известная штука в ритейле, она достаточно быстро развивается, технологии персонализации сайтов. Вторая история - это использование больших данных для программатика, направление контекстной и медийной рекламы, т.е. обезличенные по сути данные. Ну и третья история - это то, что делают «большие дядьки» по типу Yandex, Google и Facebook, которые персонализируют свои сервисы под людей с помощью больших данных. Все это - что-то такое плюс-минус живое.

Тогда еще дополнительный вопрос - какую задачу в большей степени решают большие данные в бизнес-процессах и крупных, и средних компаний сейчас? Все-таки это маркетинговая активность или оптимизация бизнес-процессов внутренних каких-то, например, оптимизация сервисов?

Моя работа - это маркетинг, еще со скорингом мы сталкивались. По сути, только там я эффект от больших данных и наблюдаю.

Спасибо! На ваш взгляд, с какими главными трудностями, по-вашему, сталкивается российский бизнес в работе с большими данными. Многими исследованиями выводятся такие проблемы, как нехватка кадров, недостаток данных или нехватка знаний о технологиях, или недоверие бизнеса к технологиям. Что на ваш взгляд можно выделить как одни из главных трудностей?

Я думаю, что низкая квалификация людей, нехватка кадров. И на уровне топ-менеджмента, и на уровне маркетологов. Вы знаете, в 99% компаний бухгалтерский учет нормально не налажен, они не знают, сколько зарабатывают, сколько теряют, какие большие данные?

Я видел большой список клиентов у вашей компании. Можно ли считать это ответом на вопрос есть ли недоверие к технологиям? Как я вижу, много компаний так или иначе обращаются к вам за определенными решениями на базе больших данных, на базе анализа данных. Или все равно недоверие в определенной степени есть и приходится убеждать в необходимости этого?

Смотрите, ни одна компания к нам не обращалась и не платила денег за анализ данных. Все хотят, но никто не готов за это платить. Когда компания обращается и говорит «а проанализируйте мне пожалуйста данные», обычно это переводится как «у меня жуткие проблемы с бизнесом, не знаю что делать, спасите пожалуйста». Данные здесь не причем. Как они реально используются - из 200 клиентов, которые у нас сейчас есть, например, те же самые товарные рекомендации и эффект от них в деньгах умеют считать одна или две компании. Среди всех маркетологов, которых я встречал, может быть 5 знают, что такое контрольная группа. Собственно, компании, которые к нам приходят, приходят не для того, чтобы купить технологию, а для того, чтобы они осознали, что у них есть проблема с бизнесом, после чего они просят от нас решения. Чаще всего это превращается в рекламную рассылку - слали 3 раза в месяц, стали слать 5 раз в месяц, стало хуже, непонятно что нужно делать и т.д. Мы условно делаем какие-то совершенно базовые вещи, рассказываем, что спам - это плохо, что нужно делать хотя бы базовые сегментации по жизненному циклу. Вот такие большие данные. Да, конечно, выставляем товарные рекомендации, которые строятся на довольно сложных местами моделях. Но это как приходите вы к папуасу и даете ему пулемет. И ему все равно, что это за пулемет - он не видит разницы, не способен оценить, к сожалению.

Последний вопрос по этой теме. Все, что вы говорите, условная неграмотность в этом вопросе, непонимание - это применимо и к крупным компаниям тоже? Или это средние компании все же?

К любым компаниям абсолютно. Компаний, которые умеют нормально что-то мерять в России, ну их 5. Если говорить про розницу, то ритейл и e-commerce. Ну может в 2 раза ошибся, может, 10.

Спасибо, следующий вопрос. Так как у меня основная часть работы - это защита персональных данных, считаете ли вы защиту персональных данных в Интернете сейчас проблемой, и сталкивались ли вы с проблемами в работе в этом аспекте? Много задач по анализу данных у вас нет, не приходит с этим запрос, но в целом бывали ли случаи, когда темы защиты персональных данных вставала остро?

Смотрите… Довольно широкая тема. Считаю ли я что, в интернете защита персональных данных адекватна? Да, считаю, что все достаточно, все хорошо. Вопрос второй - сталкивались ли мы с какими-нибудь трудностями при защите персональных данных. Да в принципе нет - вполне себе рутинная процедура, вполне исполнимая. Нужно этим заниматься и все - мы заявились как оператор, сделали внутри упражнения по классификации СПДН, выработали позицию относительно необходимого уровня защиты, ТЗ. Это процесс, да, работа, но она, наверное, даже была полезна. Видел ли я какие-то проблемы в этом аспекте, да, но проблемы носили не технический характер, а скорее организационно-правовой. У нас к сожалению очень низкая квалификация людей, которые занимаются проверкой и низкая классификация судов, с этим большая проблема. Как это выглядело на практике - есть у нас, например, понятие конклюентного действия. Человек поставил галочку на сайте - предполагается, что он согласился. Для нас с вами, как для Интернет людей - это очевидная и понятная мера, что человек согласился получать какую-то информацию, дал разрешение на обработку персональных данных. Объяснить то же самое бабушке 65 лет, сидящей в каком-нибудь Новосибирском Роскомнадзоре - это почти невозможно. «У вас нет акта ввода этого человека на сайт, он не подписан синей печатью» - и там можно сколько угодно говорить про Интернет, это не работает вообще. То есть у нас была совершенно парадоксальная ситуация, у нас один из заказчиков, крупная табачная компания. Бегают девочки всякие по торговым центрам. Это западная компания, они довольно параноидально и серьезно относятся к соблюдению законодательства, они реально собирают бумажные анкеты с подписями людей, которые дают согласие. Они хранят их сами, много на это денег тратят. Приходят из моего любимого новосибирского ФАС или Роскомнадзор письма о том, что какой-то человек пожаловался, что он не давал согласие на рекламные рассылки, а ему смс поступила. Как обычно в духе наших доблестных органов, бумажка приходит датированная задним числом - она приходит, когда уже сроки нарушены, электронного вида никакого нет. Взяли юриста, наняли его, он поехал туда разбираться. Приехал, привез бумажную анкету с личной подписью этого человека. Бабушка из Роскомнадзора на это смотрит и спрашивает: «А где копия паспорта этого человека, чтобы я убедилась, что это действительно он, а не кто-нибудь еще». Смех в том, что даже копия паспорта нашлась. Притащили копию паспорта, а бабушка говорит «где у вас копия договора с оператором сотовой связи, что это именно его телефон». Вот и всё, вся история с персональными данными примерно на этом заканчивается. Даже если ты параноидально пытаешься что-то исполнять, здравого смысла и осознания у органов которые этим занимаются критически мало.

Еще один дополнительный вопрос. Законодательство в сфере защиты персональных данных - считаете ли вы его достаточно проработанным и отвечающим всем особенностям работы с большими данными сейчас?

Тут история какая. С точки зрения персональных данных законодательство плюс-минус нормальное. С точки зрения больших данных его нет вообще - нет определения в законе, что такое персональные данные, что можно, а что нельзя собирать и как это обрабатывать. Есть много противоречивых сигналов из государственных органов, что это такое. Например, на рекламном рынке есть под понятием большие данные обычно подразумевается хранение cookies и связанной с ними информации. И вот, например, из того же Роскомнадзора и иных организаций идут сигналы по типу «это персональные данные, это нет, можно, нельзя», а какой-то формальной позиции государства по этому поводу нет. Наверное, это будет отрегулировано, да, это точно нужно регулировать, но это какая-то отдельная категория, которую необходимо отделить от персональных данных.

Спасибо большое. И последний вопрос - можете ли вы поделиться своим мнением относительно перспектив развития Big Data в России? Есть определенная статистика, что в России Big Data развивается быстро, но какое у вас мнение - положительная ли динамика?

Рост рынка технологий - я думаю да, он будет взрывообразный. Тем более, насколько я могу судить, государство осознало, что эти технологии могут влиять и на выборы и серьезно этим занялось.

Как вы думаете, возможные изменения в отношении самих пользователей к защите своих данных - могут ли они стать угрозой развитию Big Data?

Ну угрозой развития Big Data - нет, а неким регулирующим фактором - наверное, да. Вспомните, например, американские антикуки, что-нибудь в этом духе будет, наверное, да.

Приложение 3

Интервью №2

ФИО: Кочетков Е.

Должность: Директор по аналитике в банке Открытие

Интервью:

Добрый день. Давайте начнем с первого вопроса - как вы видите, какой сейчас рынок больших данных, находится ли он на достаточном уровне развития или сильно уступает зарубежному?

Ну, я думаю, что в России он сейчас активно развивается. Прежде всего это IT-компании, Яндекс, Mail.ru. Далее идут наши телеком-операторы, такие как АФК системы, Мегафон, Ростелеком. Вообще в принципе разработчики сейчас активно ищут data-специалистов. Развитие идет, но, скорее всего, на Западе с этим лучше. Простой пример - у них уже подобные предметы и программы включаются в вузовские программы. Помимо этого, у них уже есть результаты, у них это работает. Родилась сама концепция распределенных вычислений в США. Big Data - это хайповый термин, за ним очень много кроется. Это скорее собирательное понятие. Так вот, началось это с Google еще в 2004, они свою распределенную систему сделали, потом это подхватили Apache, сделали Hadoop, а потом уже на open-source движках развивают. Сейчас уже много разработчиков появилось, которые предлагают продукты свои, Cloudera, Terradata. На западе это развито больше, но преимущественно в США. В Европе рынок нельзя сказать, что наполнен, но там тенденция к развитию гораздо выше - у них созданы все условия, общий уровень образования повыше, квалификация людей. Но нужно смотреть страны. Есть такие страны, как Германия, где нехватка программистов. А поскольку нужные люди находятся на стыке профессий - на Западе это развивать проще. У нас шаги сделаны - вакансий стало больше, заработные платы в этой области привлекательные. Я думаю, что сейчас это тоже здесь пойдет потихонечку.

Как вы видите, какую задачу в большей степени сейчас решает анализ больших данных, данных в целом, в бизнес-процессах крупных и средних российских компаний. На первом месте оптимизация бизнес-процессов или маркетинговые задачи?

Я считаю, что скорее вовлечение клиентов, но одно с другим связано. Ты не можешь быстро получать информацию о клиентах и предлагать им сию минуту то, что им нужно, не имея соответствующей структуры. А это уже подразумевает некую оптимизацию. Но, к сожалению, у нас не все компании на достойном уровне развития аналитических систем и инфраструктуры в целом. Data-инженеры, люди, которые ответственны за поддержание и администрирование всех этих систем, необходимых для анализа больших данных, их на рынке не хватает, на рынке есть голод определенный. Хорошие специалисты кочуют туда-сюда, либо сидят в приличных компаниях. Отдельно я бы упомянул стартапы, они хорошо развиваются. Есть много интересных проектов, например, «Точка» или «Seven Seconds». Стартапы развиваются активно. Другое дело, что там тенденция такая наметилась, что стартапы активно скупают банки, как раз для того, чтобы больше знать о клиентах, больше предлагать продуктов. Отдельно еще, наверное, всякие социальные сети - они одни из лидеров на рынке. Плюс рекомендательные системы - очень интересная вещь, мы их видим каждый день. Достаточно на новостные агрегаторы зайти - тут же выпадают рекомендуемые новости. Поэтому нельзя сказать, что это только маркетинг, я думаю, что это неразрывно идет. Но маркетинг, наверное, больше, потому что естественно все заинтересованы в том, чтобы уже сейчас клиенту показать, показать какие мы data-driven организации, что мы впереди планеты всей. На мой взгляд зачастую это немножечко завышено и это немножечко идет с опережением того, что есть в плане инфраструктуры.

Следующий вопрос, который хотелось бы задать, связан с вашим мнением о главных трудностях, с которыми сталкивается российский бизнес в работе с большими данными. Вы уже немного коснулись этой темы, но может вы сможете выделить какие-то ключевые трудности?

Ну я бы выделил 4 отдельных ветви. Первая ветвь - это недостаток внутренней инфраструктуры, неорганизованность данных, разрозненность источников. В книге «Аналитика 2.0» хорошо написано - все хотят сразу, руководители хотят скорее все сделать, видят хайп, но для того, чтобы выйти на уровень предиктивной аналитики, нужно сначала прийти к хорошей аналитике первичного уровня, иначе это может печально обернуться. Для начала нужно поднять базовую инфраструктуру. Второе - это конечно же кадровый голод. Банально есть нехватка специалистов, жизнь в России не самая легкая, все хотят больше денег и лучше условия. Третье - это как раз проблемы внешние, непонимание клиента, что он хочет в плане больших данных или предоставление не тех данных, не в том формате. В том числе желание увидеть результат сразу, а в больших данных не так. Может быть три месяца надо ждать, а может год-два, чтобы затраты окупились. Четвертая - это законодательные вопросы. Никаких ограничений там серьезных нет, но тот же закон о защиты персональных данных, на мой взгляд, это первый шаг, чтобы ограничить их использование для какого-то круга лиц. Или, например, запрет на использование определенных сайтов - конечно, все это мешает. Статистику это мешает собирать - например, LinkedIn заблокировали. А это отличный источник для исследователей. В каких-то отраслях эта тенденция наметилась, и это конечно не критично, но чуть-чуть мешает.

Следующий мой вопрос связан с защитой персональных данных. Считаете ли вы это в целом проблемой для Big Data, и, если вы можете поделиться, сталкивались ли вы с проблемами в работе в этом аспекте?

Прямо так не сталкивался, непосредственно мне персональные данные не поступают, поступает банковская тайна. Но, конечно же, какие-то препятствия есть, хотя хороший специалист всегда данные обезличит. И совершенно не обязательно знать, что это тот-то, живет там-то и родился тогда-то, чтобы построить статистику - достаточно знать, чего он хочет. Но кому-то это может не понравиться. Сфотографировали человека, он может подать в суд - сейчас по закону о защите персональных данных за это полагается ответственность, штраф или даже до уголовной. Поэтому конечно кому-то это, наверное, создает проблему. Но в России все часто довольно таки обходится, все же законы делаются так, чтобы можно было найти в них лазейку. Не думаю, что это сейчас как-то критично, рано об этом говорить. Но может специалисты по защите информации другого мнения, я таковым все-таки не являюсь.

Если все-таки произойдет определенный сдвиг в сознании у людей, может ли это стать угрозой для развития больших данных или там столько различных путей, что это не станет угрозой?

Мне кажется, что в обозримом будущем это вряд ли станет угрозой. Конечно, сознание людей меняется. Я в сетях сам не публикую ничего, во-первых, времени нет, во-вторых, зачем, чтобы все данные собирались. Доля таких людей, кто также думает, как-то пытается ограничить использование осмысленно - очень маленькая. В Интернете все пишут, что попало, никто не задумывается о последствиях. Рядовые пользователи, особенно если это люди далекие от IT, больших данных, они не задумываются. У нас доля людей с высшим образованием не такая большая, если мы говорим про Россию. На Западе ситуация примерно такая же - людям нужно просто пользоваться сервисами и знать, что все безопасно. Им зачастую все равно, что о них кто-то что-то собирает. Но с другой стороны у них судебная система развита, и если кого-то что-то не устроит, это может создать проблемы. Но таких случаев я особо не знаю.

А если мы рассмотрим ситуацию - операторы данных собирают большие объемы данных. Происходит бартер - вы используете сервисы, а мы используем данные для оптимизации сервисов, делаем более релевантные коммерческие предложения. Но вот бывает, что данные воруют, таких случаев немало. Если человек заключает пакт с компанией, можно ли быть уверенным в безопасности?

Хакерские атаки - это проблема, но они были и до больших данных. Воровали и деньги с кошельков, карточек. Если ты хочешь пользоваться сервисом, ты ставишь галочку. Не все читают, но если ты хочешь пользоваться им, ты хочешь быть, безусловно, уверен в безопасности, и компании делают много. С другой стороны, капитализация Google и прочих во многом обязана тому, что они владеют информацией. Почему стартапы так быстро растут в цене? Казалось бы, ничего в них нет, все то же самое, но капитализация растет - потому что они собирают какие-то уникальные данные. И возможно они их куда-то сливают, умалчивают об этом. Тут довольно сложно узнать правду, но опять же простой пример. В США АНБ собирают сотни миллионов разговоров, смс и так далее, но вроде как это никому сильно не мешало. Я думаю, что тут все настолько схвачено у компаний крупных, что к ним не придерешься особо. Там хорошие юристы, и я думаю, что они немало времени уделяют этому вопросу.

Приложение 4

Интервью №3

ФИО: Вязовская О.

Должность: Руководитель отдела онлайн-маркетинга в Ozon

Интервью:

Ольга, добрый день. Для начала, не могли бы вы рассказать, чем вы занимаетесь в компании, чтобы я смог немного подстроиться под диалог?

Я руковожу онлайн-маркетингом в Ozon, непосредственно отвечаю за закупку внешнего траффика, как на десктопе, так и на мобайле. И все это происходит на основе данных, поэтому при нашей закупке используют математические модели и внутренние данные. Ну и внешние закупаемые данные.

Первый вопрос, несколько вводный - на ваш взгляд, как бы вы охарактеризовали рынок больших данных в России, рынок данных, аналитики в целом? По уровню развитию сильно ли он уступает зарубежному, или он находится уже на довольно высоком уровне?

Зарубежному он безусловно уступает, потому что за рубежом, если говорить о больших данных, то весь e-commerce совершенно спокойно делится своими данными. У нас это все закрыто, каждый имеет свою DMP систему или что-то похожее и, соответственно, обогащает это все внутри. Данные каждого интернет-магазина - это самое большое сокровище. За рубежом так не считают, потому что там самое основное - это не сами данные, а умение с ними работать. Поэтому в этом мы, конечно, сильно отстаем. Сейчас нельзя прийти на некую биржу и купить пользователей, которые совершают покупки в определенных магазинах. Хотя первые попытки уже есть - те же самые компании по типу Segmento, которые продают данные о покупках, по транзакциям определенного банка, в частности, Сбербанка. Есть компании, которые договариваются с некоторыми Интернет-магазинами, ходят и продают конкретные данные этого магазина. И возможность для брендов таргетироваться по покупкам на их же товары или товары конкурентов. Но таких случаев я знаю очень мало, на самом деле, только E-аптека совместно с Аудиторисом сделали такой проект, больше такого особо нет. Сейчас только сами Интернет-магазины обладают вот этой информацией, которой они естественно не хотят делиться.

Я правильно понимаю, что ваша компания и другие опираются по большей части на свои данные?

Да, безусловно, при этом еще закупая внешние данные у провайдеров больших данных, Mail.ru, Yandex, но опять же - это данные не по покупкам, а демография, поведенческие факторы. А данные о покупках - только у самих интернет-магазинов, но и, естественно, у банков.

Давайте тогда следующий вопрос. Как вы считаете, какую задачу в большей степени сейчас решает анализ больших данных, аналитика в бизнес-процессах крупных и средних рос компаний? Что на первом месте - оптимизация бизнес-процессов или внешняя маркетинговая активность, создание более релевантного коммерческого предложения?

Первична, с точки зрения бизнеса, конечно оптимизация маркетинговых затрат. Внутренняя работа с данными она хороша, она, безусловно, нужна, но от того, как вы работаете с данными, ваши затраты не сильно сужаются или увеличиваются, потому что, условно, это бесплатные для вас источники, ваши внутренние данные. А если говорить о внешней коммуникации, то это прямые ваши маркетинговые затраты, а, соответственно, любая компания стремится к оптимальному использованию маркетинговых затрат и оптимизации. Поэтому вот такой фокус №1, почему сейчас programmatic и аналогичные системы, даже RTB, которые предлагает таргетирование элементарно по соцдему пользуются таким спросом, потому что в некоторых отраслях это помогает сократить издержки.

С какими главными трудностями сейчас сталкивается бизнес в работе с большими данными? Например, нехватка кадров, недостаток данных, слаборазвитая инфраструктура, недоверие бизнеса - что бы вы могли выделить?

Самая главная проблема на данный момент - это проблема мэтчинга этих данных. Сейчас данных много, но сами по себе данные не имеют никакого смысла, их нужно для чего-то использовать. Если мы, например, используем данные для маркетинговых коммуникаций, и мы хотим понять, какое оптимальное количество раз мы должны повзаимодействовать с пользователем, показать креатив, например, чтобы это было оптимально с точки зрения наших затрат и с точки зрения дохода от данного пользователя - мы показываем этот креатив на разных площадках и на разных источниках трафика. Так вот для того, чтобы с разных источников трафика все это собрать в единое - это достаточно большая проблема. Например, тот же самый Facebook не отдает свои данные извне, даже сертифицированным DMP системам. Facebook идет как отдельный источник, и один и тот же юзер, который есть в Яндексе и есть в Facebook, мы его видим, как два разных юзера, просто потому что мы не можем их смэтчить из-за невозможности передачи данных с Facebook. Я вижу самую большую проблему именно в аналитике, в том, что мы не можем корректно посчитать все те затраты, которые несем на пользователя - мы просто их не мэтчим.

А, допустим, вопрос доверия к технологиям, их понимания - как вы можете оценить? Сейчас бизнес готов к применению этих технологий?

По поводу доверия. Здесь важный момент следующий - была такая история на рынке, достаточно недавно, про продажу данных. Есть черные биржи данных, где можно купить данные, например, с плагинов, данные, которые собираются пикселем недобросовестных компаний, которые продали это вне. Конечно, есть большое недоверие к этим компаниям, которые сегодня появились, завтра закрылись, пикселем собрали данные и заработали на этом денег. Есть большие игроки на рынке, которые имеют свое имя и международный опыт, в принципе, постепенно, наверное, там доверие к ним начинает проявляться. Как пример, Weborama - международный игрок, достаточно крупные ребята. Но лично я с большим недоверием отношусь к компаниям предоставляют свою DMP платформу и одновременно являются продавцами данных. Такие компании тоже есть - странно, как два бизнеса в одной компании существуют, притом, что вроде они должны друг другу противоречить.

Вторая весомая часть моей работы связана с защитой персональных данных - так как большие данные основываются на данных о пользователях, считаете ли вы защиту персональных данных пользователей в Интернете проблемой в целом и сталкивались ли вы с какими-то проблемами в работе в этом аспекте?

Ну, конечно же, защита данных - это очень популярный на данный момент вопрос, много споров, по поводу того, что считать персональными данными. Сейчас, например, e-mail не является персональными данными, а телефон уже является персональными данными. Сейчас мэтчинг происходит по cookies, user-id, там вообще все это обезличено. Мы лично не знаем, кто это, Маша Иванова или еще кто-то. Мы знаем просто набор параметров об определенном пользователе. Сталкивалась ли я с этим? Да, сталкивалась, при мэтчинге, например. При мэтчинге с теми же самыми сотовыми операторами идет мэтчинг по телефону - и там, конечно же, большой вопрос, можно или нельзя выгружать эти телефоны и использовать их, передавать третьим лицам. Это действительно проблема. А самый точный мэтчинг, если вы мэтчите e-mail и телефон. А если третий параметр - это идеал, а так хотя бы 2 параметра. Получается если телефон отбрасываем - то мэтчинг данных только на 50% получается, а 50% теряется. Ну, конечно, это проблема.

Вы можете сказать, что большая часть данных - обезличена, правильно?

Все данные, с которыми мы работаем, обезличены. Не большая, а все. Если говорить про те же самые номера телефонов, мы не видим сами номера. Мы видим только в зашифрованном виде все это, закодированном.

Отдельная тема, связанная с защитой - это законодательство. Считаете ли вы его достаточно проработанным в России на данный момент и отвечает ли оно всем особенностям работы с большими данными?

Ну, там на самом деле много спорных моментов, опять же, по поводу e-mail много споров было, считать или не считать его персональными данными. Но сказать так, что законодательство кому-либо из провайдеров, которые продают данные, мешало бы - наверное нет. В принципе все и так в закодированном виде используют эти данные, мэтчат их в закодированном виде, обезличивают. Здесь ничего не нарушается, нет никаких проблем. Единственное что, опять же повторюсь, с сотовыми операторами - единственные ребята, у которых могут возникнуть такие проблемы. У e-commerce, если говорить в целом об отрасли, такого нет, у нас все в электронном виде, у нас все основано на e-mail, как основном идентификаторе. Тут не возникает никаких проблем.

Как вы видите перспективы развития технологий больших данных в России? Они сейчас, как я это вижу по статистике, действительно развиваются хорошо, семимильными шагами. Как это видите вы, работая в этой сфере?

Здесь опять же я немного повторюсь, что сам по себе сбор данных для всех уже давно понятен, в сыром виде на рынке они есть. Здесь вопрос больше в работе с ними, как мы будем их дальше использовать. Сейчас есть разные технологии, которые позволяют, скажем так, все с большей вероятностью угадывать предпочтения пользователя, угадывать то, что он захочет, на основе данных, его поведенческих характеристик, прошлого поведения и т.д. Facebook сейчас обладает классной моделью под названием «динамический ремаркетинговый look alike». Facebook определяет, какой товар будет интересен пользователю, который никогда не посещал ваш сайт или магазин, на основании того, что он ищет похожего пользователя у вас и что выбирает ваш пользователь. Плюс на основании тех действий, которые он совершает в Facebook - лайкает кошечек, смотрит на одежду и что-то еще. Технология Facebook сама подбирает те товары, которые потенциально могут быть интересны этому человеку. Это реально будущее, предугадывание того, что может быть интересно человеку. С точки зрения еще сбора данных появляются новые технологии, например, та же самая технология нейросетей, распознавания лиц, технологии сбора информации о возрасте, росте, скорости ходьбы - всего, чего угодно. Это уже не будущее, это уже настоящее, это то, что есть сейчас. Сейчас можно определять более точно некоторые моменты, т.е. собирать более точный параметр нежели было раньше. Это уже не просто девушка 25 лет, любящая красные платья, а это девушка 25 лет с серыми глазами, красными губами, с проблемами с кожей - это прямо уже более детализированные факторы, которые можно собрать. Раньше такое собрать было достаточно тяжело без вот этих новых технологий с нейросетями. Например, те же самые производители телефонов, разных гаджетов продают данные о том, на каком этаже человек находится, сколько он весит, его рост, какая у него скорость шага, что он делает, бежит, едет на машине, как он передвигается - в общем, очень много факторов дополнительных, которые раньше бы мы не собрали.

Очень интересный пример с Facebook, спасибо большое! Но вот объем данных нарастает, растет количество методов сбора - это все обезличенные в вашем понимании данные?

Конечно, это в любом случае обезличенные данные. Когда вы делаете закупку этих данных, вы говорите, что мне нужны все девушки 25 лет с серыми глазами, красными губами, фиолетовыми волосами - вам подбирают в обезличенном варианте этих людей. Выставляют по локации «Москву», и вам говорят, что таких 1000 людей в Москве - и вы можете купить их через биржу. У вас нет прямого контакта с этими людьми, вы покупаете через какую-то систему.

Покупаете систему, а потом показываете именно этим конкретным лицам рекламу?

Через биржу вы таргетируете ваш креатив, любую вашу коммуникацию на данных пользователей. Вы никогда не сможете выгрузить их данные из биржи, вы сможете только купить саму коммуникацию.

Если, допустим, будут какие-то структурные изменения в отношении к защите своих данных у пользователей - могут ли они стать определенной угрозой развитию больших данных. Или объем технологий настолько велик, что даже какой-то процент, который откажется от передачи данных, ничего не изменит и все равно развитие будет продолжаться?

Во-первых, где эти люди откажутся? Тот же Facebook, Вконтакте, Яндекс, Google - это все разные площадки. И отказавшись на одной площадке не значит, что этот же самый человек откажется на другой площадке. Нужно применить усилия, а люди по натуре своей ленивые. В каждом источнике, на каждом сайте куда они заходят отказываться практически невозможно. В любом случае даже если введут такое ограничение, что на каждом ресурсе будет установлена предупредительная надпись, что «о вас собирают данные, вы можете отказаться или согласиться» - каждый раз пользователь не будет от этого отказываться. Все равно будут некие дыры, через которые можно собрать данные о пользователе. Даже введение такого пункта законодательства ничего не изменит. И, если даже будет введение этого на уровне браузера, предположим, что при входе в браузер будет сразу push-уведомление о том, что о вас собирают данные, если не хотите, чтобы они собирались, поставьте запрет. Все равно это тоже не может быть угрозой, потому что пользователи чистят cookies, обновляют программы, происходит динамика - каждый раз вся эта информация обновляется, пользователь в определенный момент все равно забудет, что надо запретить сбор о себе информации. В общем, я думаю, что это вообще не проблема, если это, конечно, на глобальном уровне вообще не запретят. Если не скажут, что нельзя собирать данные, то это не будет проблемой. Размещено на Allbest.ru


Подобные документы

  • Основы безопасности персональных данных. Классификация угроз информационной безопасности персональных данных, характеристика их источников. Базы персональных данных. Контроль и управление доступом. Разработка мер защиты персональных данных в банке.

    дипломная работа [3,2 M], добавлен 23.03.2018

  • Законодательные основы защиты персональных данных. Классификация угроз информационной безопасности. База персональных данных. Устройство и угрозы ЛВС предприятия. Основные программные и аппаратные средства защиты ПЭВМ. Базовая политика безопасности.

    дипломная работа [2,5 M], добавлен 10.06.2011

  • Описание основных технических решений по оснащению информационной системы персональных данных, расположенной в помещении компьютерного класса. Подсистема антивирусной защиты. Мероприятия по подготовке к вводу в действие средств защиты информации.

    курсовая работа [63,4 K], добавлен 30.09.2013

  • Актуальность защиты информации и персональных данных. Постановка задачи на проектирование. Базовая модель угроз персональных данных, обрабатываемых в информационных системах. Алгоритм и блок-схема работы программы, реализующей метод LSB в BMP-файлах.

    курсовая работа [449,5 K], добавлен 17.12.2015

  • Анализ структуры распределенной информационной системы и обрабатываемых в ней персональных данных. Выбор основных мер и средств для обеспечения безопасности персональных данных от актуальных угроз. Определение затрат на создание и поддержку проекта.

    дипломная работа [5,3 M], добавлен 01.07.2011

  • Характеристика комплекса задач и обоснование необходимости совершенствования системы обеспечения информационной безопасности и защиты информации на предприятии. Разработка проекта применения СУБД, информационной безопасности и защиты персональных данных.

    дипломная работа [2,6 M], добавлен 17.11.2012

  • Система контроля и управления доступом на предприятии. Анализ обрабатываемой информации и классификация ИСПДн. Разработка модели угроз безопасности персональных данных при их обработке в информационной системе персональных данных СКУД ОАО "ММЗ".

    дипломная работа [84,7 K], добавлен 11.04.2012

  • Правовое регулирование защиты персональных данных. Общий принцип построения соответствующей системы. Разработка основных положений по охране личных документов. Подбор требований по обеспечению безопасности персональных данных в информационных системах.

    дипломная работа [1,3 M], добавлен 01.07.2011

  • Анализ сетевой инфраструктуры, специфика среды исполнения и принципов хранения данных. Обзор частных моделей угроз персональных данных при их обработке с использованием внутрикорпоративных облачных сервисов. Разработка способов защиты их от повреждения.

    курсовая работа [41,7 K], добавлен 24.10.2013

  • Предпосылки создания системы безопасности персональных данных. Угрозы информационной безопасности. Источники несанкционированного доступа в ИСПДн. Устройство информационных систем персональных данных. Средства защиты информации. Политика безопасности.

    курсовая работа [319,1 K], добавлен 07.10.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.