Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента
Необходимость ввода гибкой классификации пользователей на основе их поведения при работе с тематическими ресурсами. Параметризация классов пользователей, интеллектуальный алгоритм фильтрации контента. Параметры для принятия экспертной системой решения.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 15.11.2013 |
Размер файла | 16,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента
Егоров Е.Ю.,
Сибирский федеральный университет, г. Железногорск, Россия
Современный интернет концентрирует множество всевозможных ресурсов и привлекает огромную аудиторию. Однако качество публикуемой информации имеют крайне низкое качество. Особенно остро данная проблема стоит при динамическом формировании и обсуждении конвента (например, ветки форумов). Зачастую, в соответствующих разделах тематических информационных ресурсов аудиторию можно разделить на тех, кто конструктивно ведёт диалог (находится в тематике ресурса), и тех, кто вносит дискомфорт в обсуждение профильного сообщества. В связи с тем, что администратор не может справиться с большим количеством поступающей информации, рационально ввести в возможности ядра ресурса интеллектуальную функцию классификации пользователей, которая бы разделяла их по интересам и по характеру влияния на качество тематического ресурса.
Применение классических методов пользовательского рейтинга не представляется эффективным. В работах Сухинина Д.И. [1] была сделана попытка комплексно проанализировать поведение пользователя при работе с тематическими ресурсами. Исходя из этого, можно говорить о необходимости ввода гибкой классификации пользователей. Это обусловлено в первую очередь тем, что в обсуждение темы может включиться не только разделяющий мнение авторов материала, но и имеющий противоположную точку зрения (как профессиональную, так и популистско-обывательскую). Очевидно, что в различных ситуациях ядру тематического ресурса необходимо будет вести себя по разносу. Введём классы пользователей:
Гость - не авторизованный пользователь, классифицировать которого система не имеет возможности и его права максимально ограничены.
Новичёк - недавно зарегистрированный пользователь ресурса, имеющего малую стаитсикуработы с материалом сайта и обладающего ограниченными возможностями.
Случайный пользователь -зарегистрированный в системе пользователь, проявивший активность на начальном этапе знакомства с ресурсом и потом потерявший к нему интерес.
Исследователь - это такой пользователь, который сохраняет свою активность в обращении к материалам ресурса и формировании контента в определённых информационных секторах тематического ресурса.
Спамер - активный пользователь, интенсивно рассылающий сообщения не по тематике ветки форума.
Эксперт-критик - пользователь, активно критикующий собеседников ветки форума, опираясь на здравый смысл и адекватные аргументы (без перехода на личности и без попыток унижения собеседника).
Провокатор - активный пользователь, провоцирующий своими сообщениями отдельную группу участников ветки форума обсуждения на резко негативную оценку.
Завсегдатай - активный пользователь, разделяющий идеологию тематического ресурса и обладающий дополнительными правами.
Агрессивный обыватель (вредитель) - активный пользователь, противостоящий идеологии тематического ресурса при опоре на популистско-обывательскую позицию.
Эксперт-единомышленник - активный пользователь, обладающий знаниями и опытом по тематике ресурса и разделяющий его идеологию.
Переходы между ролями осуществляются в процессе уточнения профиля пользователя системой, сопровождая их эволюцией прав от начальной конфигурации (нейтральной для новичка) в положительную или отрицательную стороны. В таблице представлена начальная параметрическая модель, характеризующая отдельные классы пользователей.
Таблица. Параметризация классов пользователей
Группа |
Мнение пользователей -100%|+100% |
Кол-во публикаций |
Кол-во проведённого времени |
|
Гость |
- |
- |
- |
|
Новичок |
0 |
0-10 |
Больше 2 дней |
|
Случайный пользователь |
Положительно |
0 |
Больше 5 дней |
|
Исследователь |
Положительно |
0-1 |
Больше 7 дней |
|
Спамер |
Меньше (-5% ) - (-10%) |
0 |
Больше 7 дней |
|
Эксперт-критик |
Больше 5-10% |
0-5 |
Больше 1 месяца |
|
Завсегдатай |
Больше 25% |
Больше 5 |
Больше 2 месяцев |
|
Эксперт-единомышленник |
Больше 75% |
Больше 10 |
Более полугода |
|
Провокатор |
Меньше (-10% ) - (-25%) |
Не учитывается |
Не учитывается |
|
Вредитель |
Меньше -50% |
0 |
Меньше 10 часов |
Тогда можно говорить о системе, которой необходимо принимать решения не только на базе однозначных показателей из таблицы, но и после анализа их поведения. В этой ситуации необходимо реализовать интеллектуальный алгоритм фильтрации контента, учитывая следующие допущения:
- часть координирующих поведение сообщества сигналов поступает от модераторов или экспертов-единомышленников;
- мнения провокаторов, вредителей, спамеров и новичков игнорируются при определении рейтинга обсуждаемого материала или других пользователей; интеллектуальная фильтрация контент пользователь
- идеология тематического ресурса ориентирована на качество контента и объективность его оценки.
Тогда параметрами для принятия интеллектуальным фильтром (экспертной системой) решения будут следующие:
- консолидированное мнение «полезных» пользователей о конкретном члене тематического сообщества относительно отдельной в ветке форума;
- обобщённая статистика посещаемости ресурса (временной, частотный, деятельностный аспекты);
- объём публикованного материала (документы, статьи, презентации) и его качество (оценка премодерации);
- оценка семантического «вектора» высказываний, относительно идеологии тематического ресурса (включая семантический анализ высказываний на форуме).
Предложенная группировка и параметризация пользователей позволит повысить качество фильтрации нежелательного контента. Она способствует выработке соответствующих мер ядром тематического ресурса по явному (предупредления, ограничение прав, блокировака) или косвенному [2] противодействию злонамеренным попыткам формирования неадекватного контента как в рамках форума, так и всего ресурса.
Литература
1. Сухинин Д.И., Углев В.А. Проблематика самоорганизации профильных интернет сообществ // Измерение, контроль, информатизация: Материалы IX Международной конференции. - Барнаул: АлтГТУ, 2008. - С. 233-236.
2. Стюгин М.А., Беда И.А. Алгоритм построения защищённых от информационных исследования систем // Системный анализ и информационные технологии: Материалы V Международной конференции. В 2 т. Т.2 С. 419-423.
Размещено на Allbest.ru
Подобные документы
Функции выполнения отраслевых порталов и ключевые соображения планирования структуры и контента сайтов. Отраслевые порталы в Интернет-маркетинге. Создание документов на сайте SharePoint Online. Организация поиска контента и доступа пользователей к нему.
курсовая работа [44,0 K], добавлен 23.02.2015Разработка предложений по внедрению биометрической аутентификации пользователей линейной вычислительной сети. Сущность и характеристика статических и динамических методов аутентификации пользователей. Методы устранения угроз, параметры службы защиты.
курсовая работа [347,3 K], добавлен 25.04.2014Методы проектирования систем автоматического управления: экспериментальный и аналитический. Моделирование замкнутой системы управления. Системы в динамике: слежение, стабилизация, алгоритм фильтрации. Математические модели систем, воздействий, реакция.
контрольная работа [522,9 K], добавлен 05.08.2010Развитие русскоязычного Интернета: гендерные и возрастные аспекты. Социально-психологические аспекты общения пользователей Интернет. Причины обращения к Интернету. Критерии Интернет-зависимости. Мотивация пользователей Интернет.
научная работа [21,8 K], добавлен 14.05.2007Разработка средствами языка PHP и Фреймворка Yii системы регистрации и аутентификации пользователей на сайте. Проектирование приложения с помощью языка UML, построение диаграммы прецедентов. База данных приложения. Страница регистрации пользователей.
отчет по практике [1,1 M], добавлен 15.09.2014Рассмотрение и анализ моделей и алгоритмов семантического поиска в мультиагентной системе поддержки пользователей. Ознакомление с интерфейсом чата с ботом. Изучение и характеристика экспериментальных оценок релевантности и пертинентности запросов.
дипломная работа [3,0 M], добавлен 13.10.2017Построение структурных схем - графических представлений алгоритмов цифровой фильтрации. Возможные варианты синтеза структур на примере рекурсивных фильтров. Построение разностного уравнения таких фильтров с записью системной функции в общем виде.
презентация [123,3 K], добавлен 19.08.2013Понятие и содержание коммуникативной компетентности. Информационные технологии, информационное общество, интернет. Социальные сети: определение, классификации, функции. Различия активных и неактивных пользователей по основным коммуникативным умениям.
дипломная работа [466,1 K], добавлен 11.08.2014Изучение ведущих технологий шифрования и обмена данными. Выбор и разработка архитектуры сетевой технологии управления ключами пользователей. Разработка логической модели базы данных, основных форм и интерфейсов, основных алгоритмов обработки информации.
курсовая работа [586,6 K], добавлен 18.12.2011Признание Интернета основным информационным ресурсом при переходе к информационному обществу. Проблемы ограничения числа пользователей современного Интернет и необходимость его модернизации. Создание и масштабирование локальных сетей нового поколения.
статья [30,0 K], добавлен 04.12.2009