Применение метода анализа данных - деревья решений
Разработка и принятие правильного решения как задачи работы управленческого персонала организации. Деревья решений - один из методов автоматического анализа данных, преимущества их использования и область применения. Построение деревьев классификации.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 08.09.2011 |
Размер файла | 91,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
ФАКУЛЬТЕТ ЭКОНОМИКИ И МЕНЕДЖМЕНТА
Кафедра экономической кибернетики
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
по дисциплине:
"Математические методы принятия решений"
Симферополь, 2010
Содержание
- Теоретическая часть
- Преимущества использования деревьев решений
- Области применения деревьев решений
- Задание
- Литература
Теоретическая часть
Своевременная разработка и принятие правильного решения - главные задачи работы управленческого персонала любой организации. Непродуманное решение может дорого стоить компании. На практике результат одного решения заставляет нас принимать следующее решение и т.д. Когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода предыдущего решения или исходов испытаний, то применяют схему, называемую деревом решений.
Деревья решений - один из методов автоматического анализа данных, основные идеи которого восходят к работам П. Ховленда (Р. Hoveland) и Е. Ханта (Е. Hunt) конца 50-х годов XX в. Их итогом явилась основополагающая монография, давшая импульс развитию этого направления.
Построение деревьев классификации - один из наиболее важных приемов, используемых при проведении "добычи данных и разведывательного анализа" (Data Mining), реализуемый как совокупность методов аналитической обработки больших массивов информации с целью выявить в них значимые закономерности и/или систематические связи между предикторными переменными, которые затем можно применить к новым совокупностям измерений.
Дерево решений представляет из себя некий графический инструмент, который помогает производить действия, такие, как: описание возможных стратегий игрока, описание неопределенных исходов (неизвестные стратегии второй стороны) и их вероятностей, вычисление EMV по стратегиям первого игрока, выбор стратегии с максимальным значением EMV. Как правило, применение этого графического средства предполагает использование следующих соглашений:
1) деревья решений состоят из вершин (круги, квадраты и треугольники) и ветвей (линии);
2) вершины соответствуют определенным моментам времени. Вершины-решения (квадраты) соответствуют моментам времени, когда ЛПР (лицо принимающее решение) принимает решение. Вершины-вероятности (круги) соответствуют моментам времени, когда разрешается одна из неопределенностей. Оконечные вершины (треугольники) соответствуют окончанию задачи, когда все решения приняты, все неопределенности разрешились и все платежи произошли;
3) развитие ситуации во времени происходит согласно данной графической схеме слева направо;
4) ветви, идущие из вершин-решений, соответствуют различным возможным решениям. Ветви, идущие из вершин-вероятностей, соответствуют различным возможным вариантам разрешения неопределенности и не являются объектом чьего-либо управления;
5) вероятности соответствуют ветвям, исходящим из вершин вероятностей. Эти вероятности являются условными вероятностями при условии свершения события, соответствующего вершине, из которой они исходят. Поэтому сумма вероятностей по всем ветвям, исходящим из одной вершины, равна 1;
6) каждой оконечной вершине соответствуют два числовых значения.
Первое - это вероятность прихода в данную оконечную вершину и второе - значение платежа, соответствующее данному сценарию развития событий.
Преимущества использования деревьев решений
Рассмотрев основные проблемы, возникающие при построении деревьев, было бы несправедливо не упомянуть об их достоинствах:
· быстрый процесс обучения;
· генерация правил в областях, где эксперту трудно формализовать свои знания;
· извлечение правил на естественном языке;
· интуитивно понятная классификационная модель;
· высокая точность прогноза, сопоставимая с другими методами (статистика, нейронные сети);
· построение непараметрических моделей.
В силу этих и многих других причин, методология деревьев решений является важным инструментом в работе каждого специалиста, занимающегося анализом данных, вне зависимости от того практик он или теоретик.
Области применения деревьев решений
Деревья решений являются прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных (data mining).
В состав многих пакетов, предназначенных для интеллектуального анализа данных, уже включены методы построения деревьев решений. В областях, где высока цена ошибки, они послужат отличным подспорьем аналитика или руководителя
· Деревья решений успешно применяются для решения практических задач в следующих областях:
· Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.
· Промышленность. Контроль за качеством продукции (выявление дефектов), испытания без разрушений (например проверка качества сварки) и т.д.
· Медицина. Диагностика различных заболеваний.
· Молекулярная биология. Анализ строения аминокислот.
дерево решение классификация управленческий
Это далеко не полный список областей где можно использовать деревья решений. Не исследованы еще многие потенциальные области применения.
На сегодняшний день существует значительное число алгоритмов, реализующих построение деревьев решений, из которых наибольшее распространение и популярность получили следующие:
· CART (Classification and Regression Tree), разработанный Л. Брейманом с соавторами [Breiman et al., 1984], представляет собой алгоритм построения бинарного дерева решений - дихотомической классификационной модели; каждый узел дерева при разбиении имеет только двух потомков; как видно из его названия, алгоритм решает задачи как классификации, так и регрессии;
· C4.5 - алгоритм построения дерева решений с неограниченным количеством потомков у узла, разработанный Р. Куинленом [Quinlan, 1993]; не умеет работать с непрерывным целевым полем, поэтому решает только задачи классификации;
· QUEST (Quick, Unbiased, Efficient Statistical Trees) - программа, разработанная В. Ло и И. Ши [Loh, Shih, 1997], в которой используются улучшенные варианты метода рекурсивного квадратичного дискриминантного анализа, позволяющие реализовать многомерное ветвление по линейным комбинациям порядковых предикторов; содержит ряд новых средств для повышения надежности и эффективности индуцируемых деревьев классификации.
Задание
Компания решает вопрос о предоставлении нового продукта на общенациональный рынок. Неопределенность заключается в том, как отреагирует рынок на новый продукт. Рассматривается вопрос об апробации нового продукта первоначально на некотором региональном рынке. Таким образом, первоначальное решение, которое необходимо принять компании - это проводить ли первоначальный маркетинг продукта на региональном уровне.
Компания предполагает, что выход на региональный уровень потребует затрат на 3 млн. грн., а выход на общенациональный рынок потребует вложения 90 млн. грн. Если не проводить первоначальных пробных продаж на региональном уровне, то решение о выходе на общенациональный рынок можно принять незамедлительно.
Компания рассматривает результаты продаж как успешные, средние или отрицательные в зависимости от объемов продаж. Для регионального уровня этим градациям соответствуют объемы в 200, 100 и 30 тыс. экземпляров, а для общенационального 6000, 3000 и 900 тыс. экземпляров соответственно. Исходя из данных по результатам региональных тестирований аналогичных видов продукции компания оценивает вероятности указанных трех исходов как 0,2, 0,5 и 0,3. Кроме того, исследуя данные о соотношении результатов региональных продаж с последующими продажами на общенациональном рынке, компания сумела оценить следующие условные вероятности (табл.).
Вариант №2 |
Условные вероятности продаж на общенациональном рынке |
|||||
успешные |
средние |
отрицательные |
||||
Вероятности продаж на региональном рынке |
0,2 |
успешные |
0,6 |
0,2 |
0,2 |
|
0,5 |
средние |
0,7 |
0,2 |
0,1 |
||
0,3 |
отрицательные |
0,1 |
0,2 |
0,7 |
Кроме этого известно, что каждая продажа приносит прибыль в 18 грн. как при продаже на региональном рынке, так и на общенациональном.
Задача состоит в принятии обоснованной стратегии выхода (или невыхода) на рынок с новой товарной позицией.
Решение
Построим дерево решений для данной задачи (рис.1)
Приведем расчет характеристик дерева решений:
0,2 * 0,6 + 0,5 * 0,7 + 0,3 * 0,1 = 0,5
0,2 * 0,2 + 0,5 * 0,2 + 0,3 * 0,2 = 0,2
0,2 * 0,2 + 0,5 * 0,1 + 0,3 * 0,7 = 0,3
6 000 * 18 = 108 000
3 000 * 18 = 54 000
900 * 18 = 16 200
108 000 - 90 000 = 18 000
54 000 - 90 000 = - 72 000
16 200 - 90 000 = - 73 800
0,5 * 108000 + 0,2 * 54000 + 0,3 * 16200 - 90000 = - 20340
200 * 18 = 3 600
100 * 18 = 1 800
30 * 18 = 540
0,6 * 10800 + 0,2 * 54000 + 0,2 * 16200 - 90000 + 3600 - 3000 = - 68880
3 600 - 3 000 = 600
108 000 - 90 000 + 3 600 - 3 000 = 18 600
54 000 - 90 000 + 3 600 - 3 000 = - 35 400
16 200 - 90 000 + 3 600 - 3 000 = - 73 200
0,6 * 0,2 = 0,12
0,2 * 0,2 =0,04
0,2 * 0,2 = 0,04
0,7 * 10800 + 0,2 * 54000 + 0,1 * 16200 - 90000 + 1800 - 3000 = - 71220
1800 - 3 000 = - 1200
108 000 - 90 000 + 1 800 - 3 000 = 16 800
54 000 - 90 000 + 1 800 - 3 000 = - 37 200
16 200 - 90 000 + 1 800 - 3 000 = - 75 000
0,1 * 10800 + 0,2 * 54000 + 0,7 * 16200 - 90000 + 540 - 3000 = - 69240
540 - 3 000 = - 2 460
108 000 - 90 000 + 540 - 3 000 = 15 540
54 000 - 90 000 + 540-3 000 = - 38 460
16 200 - 90 000 + 540-3 000 = - 76 260.
Размещено на Allbest.ru
Таким образом, анализируя дерево решений, можно сформулировать оптимальную стратегию компании, а именно: предприятию не следует проводить региональную компанию и разворачивать продажи на общенациональном уровне.
Литература
1. К. Шеннон. Работы по теории информации и кибернетике. М. Иностранная литература, 1963
2. С.А. Айвазян, В. С Мхитарян Прикладная статистика и основы эконометрики, М. Юнити, 1998
Размещено на Allbest.ru
Подобные документы
Описание основных положений нечеткой логики: функций принадлежности, лингвистические переменные, база правил нечетких высказываний. Деревья решений и типы решаемых задач. Степень принадлежности примеров к атрибутам. Механизмы анализа нечеткой информации.
контрольная работа [1,4 M], добавлен 30.01.2015Изучение методов моделирования и анализа панельных данных. Построение ABC-XYZ классификации среди данных широкой номенклатуры по товарным запасам торгового предприятия. Виды исходных данных и построение на их основе модели регрессии по панельным данным.
курсовая работа [363,2 K], добавлен 23.02.2015Повышение обоснованности принимаемого решения, анализ вариантов как цель системного анализа, его применение на примере обустройства детской комнаты. Построение дерева целей, расчет коэффициентов относительной важности. Деревья мероприятий, сетевой график.
курсовая работа [114,5 K], добавлен 12.05.2012Математическая модель задачи принятия решения в условиях риска. Нахождение оптимального решения по паре критериев. Построение реализационной структуры задачи принятия решения. Ориентация на математическое ожидание, среднеквадратичное отклонение.
курсовая работа [79,0 K], добавлен 16.09.2013Классификационные принципы методов прогнозирования: фактографические, комбинированные и экспертные. Разработка приёмов статистического наблюдения и анализа данных. Практическое применение методов прогнозирования на примере метода наименьших квадратов.
курсовая работа [77,5 K], добавлен 21.07.2013Разработка и исследование эконометрических методов с учетом специфики экономических данных и в соответствии с потребностями экономической науки и практики. Применение эконометрических методов и моделей для статистического анализа экономических данных.
реферат [43,1 K], добавлен 10.01.2009Дисперсионный анализ - исследование причин отклонений фактических затрат от нормативных. Схемы организации исходных данных с двумя и более факторами. Формулы расчета межгрупповой и внутригрупповой дисперсии. Задачи двухфакторного дисперсионного анализа.
курсовая работа [1,0 M], добавлен 16.01.2013Задачи оптимизации сложных систем и подходы к их решению. Программная реализация анализа сравнительной эффективности метода изменяющихся вероятностей и генетического алгоритма с бинарным представлением решений. Метод решения задачи символьной регрессии.
диссертация [7,0 M], добавлен 02.06.2011Построение модели планирования производства. Использование инструментального средства "Поиск решения" для решения задачи линейного программирования. Решение оптимальной задачи, с использованием методов математического анализа и возможностей MathCad.
лабораторная работа [517,1 K], добавлен 05.02.2014Построение графического дерева решений по установленному критерию оптимальности. Анализ узлов дерева решений с точки зрения доступности информации. Определение вектора приоритетов альтернатив, используя метод анализа иерархий и матрицы парных сравнений.
контрольная работа [106,4 K], добавлен 09.07.2014