Вероятностно-статистический анализ продаж автомобилей BMW
Генеральная, выборочная совокупность. Методологические основы вероятностно-статистического анализа. Функции MathCad, предназначенные для решения задач математической статистики. Решение задач, в MS Excel, с помощью формул и используя меню "Анализ данных".
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 20.01.2014 |
Размер файла | 401,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Оглавление
Введение
1. Методологические основы вероятностно-статистического анализа
1.1 Основные понятия математической статистики
1.2 Основные функции MathCad, предназначенные для решения задач математической статистики
1.3 Способы решения задач математической статистики в MS Excel с помощью встроенных формул и используя меню «Анализ данных»
2. Практическое решение задач математической статистики на ЭВМ
2.1 MathCad
2.2 MS Excel
Заключение
Литература
Введение
Автомобили BMW - это надежные средства передвижения, получившие большую популярность по всему миру. Российские автолюбители остаются довольными качеством и количество продаж автомобилей BMW на российском рынке увеличивается с каждым годом. На основании данных продажи автомобилей BMW можно провести анализ, используя формулы математической статистики и разные программы.
MathCad - это популярная система компьютерной математики, предназначенная для автоматизации решения массовых математических задач в самых различных отраслях науки, техники и образования.
Теория вероятностей и математическая статистика - очень важный раздел современной математики, занимающийся реальными событиями со случайными факторами.
Как бы ни было совершенны расчеты, измерения, испытания и технологические процессы, они не могут предусмотреть заранее влияния на них многочисленных случайных факторов. Эффект их воздействия приводит так или иначе к разным результатам, иногда весьма существенным. Необходимо уметь определять в цифрах точность и надежность результата инженерной деятельности, делаемых на основании ограниченного статистического материала. Для этого нужно иметь практические навыки в решении задач математической статистики. Решение этих задач «вручную», даже с использованием калькуляторов, очень трудоемкий процесс, требующий знания специальных алгоритмов вычислений. Именно поэтому раньше при изучении математической статистики тратилось значительное время на освоение специальных способов вычисления сумм, на использование расчетных таблиц и методов контроля каждого шага вычисления. Появление и быстрое развитие вычислительной техники увеличили масштабы и ускорили темпы внедрения статистических методов анализа данных в практическую и научно-исследовательскую деятельность.
Цель курсовой работы - систематизация, накопленной и закрепление знаний о понятиях математической статистики, умение их применять при практических вычислениях на ЭВМ.
Задачи работы:
изучить основные понятия математической статистики;
провести первичную обработку статистических данных и вычислить характеристики выборки среде MahtCad и MS Excel.
Актуальность. Развитие программного обеспечения привело к созданию большого количества прикладных пакетов по статистике. Но большинство специалистов, столкнувшись с трудностями при их освоении, предпочитают использовать доступный и достаточно простой для проведения стандартных статистических методов табличный процессор Excel. Именно поэтому выпускники вузов должны уметь пользоваться Excel при решении статистических задач.
1. Методологические основы вероятностно-статистического анализа
1.1 Основные понятия математической статистики
совокупность мathсad математический статистика
Различают генеральную и выборочную совокупности.
Генеральной совокупностью называют совокупность всех мысленно возможных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины.
Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность - это все население определенного региона.
Выборочной совокупностью называется часть отобранных объектов из генеральной совокупности. Объемом совокупности называют число объектов этой совокупности.
Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, а перечень вариант и соответствующие им частот или относительных частот - статистическим рядом.
Если исследуется некоторый непрерывный признак, то вариационный ряд может состоять из очень большого количества чисел. В этом случае удобнее использовать интервальный статистический ряд.
Ступенчатая фигура, состоящая из прямоугольников, основания которых - частичные интервалы, длиною h, высоты равны отношению частоты к длине интервала, называется гистограммой частот.
Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для каждого значения x относительную частоту события X<x. Таким образом,
,
где - число вариант, меньших x, n - объем выборки.
Свойства F*(x):
0
- неубывающая функия.
Если х1 - наименьшая варианта, то при хх1; если хк - наибольшая варианта, то при х > хк.
Выборочным средним называется среднее арифметическое значений случайной величины, принимаемых в выборке.
Другими характеристиками вариационного ряда являются:
- мода - варианта, имеющая наибольшую частоту.
- медиана - варианта, которая делит вариационный ряд на две части, равные по числу вариант.
Выборочным коэффициентом асимметрии называется число, определяемое формулой
.
Выборочный коэффициент асимметрии служит для характеристики асимметрии полигона вариационного ряда. Если полигон ассиметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем другая.
Выборочным эксцессом или коэффициентом крутизны называется число , определяемое формулой
.
Выборочный эксцесс служит для сравнения на «крутость» выборочного распределения. Если выборочному распределению соответствует отрицательный эксцесс, то соответствующий полигон имеет более пологую вершину по сравнению с нормальной кривой. В случае положительного эксцесса полигон более крутой по сравнению с нормальной кривой.
Пусть изучается некоторая с.в. Х. С этой целью над с.в. Х производится ряд независимых опытов (наблюдений). В каждом из этих опытов величина Х принимает то или иное значение. Пусть она приняла раз значение, раз -значение, …, раз - значение . При этом = - объем выборки. Значения , …называются вариантами с.в.Х.
Вся совокупность значений с.в. Х представляет собой первичный статистический материал, который подлежит дальнейшей обработке, прежде всего -упорядочению. Операция расположения значений случайной величины (признака) по не убыванию называется ранжированием статистических данных.
Полученная таким образом последовательность , …значений с.в. Х (где ) называется вариационным рядом.
Числа , показывающие, сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки -частостями или относительными частотами (), т.е.
, где .
Перечень вариантов и соответствующих им частот или частостей называется статистическим распределением выборки или статистическим рядом. Записывается статистическое распределение в виде таблицы. Первая строка содержит варианты, а вторая - их частоты (или частости).
1.2 Основные функции MathCad, предназначенные для решения задач математической статистики
Познакомимся с основными функциями Mathcad, предназначенными для решения задач математической статистики, а также с методами ввода данных для последующей статистической обработки.
Ввод и вывод файлов данных.
При решении практических задач статистического анализа данных чаще всего приходится иметь дело с большими объемами исходной информации. Зачастую такие данные представляют собой заранее введенные в файл аппаратными средствами экспериментальные данные, подготовленные специальными приложениями и сохраненные в файле таблицы чисел. Ниже будет рассказано о том, как в Mathcad можно генерировать последовательности случайных чисел. Такие последовательности позволяют имитировать результаты реальных измерений той или иной случайной величины. При многократном использовании больших массивов данных их удобно хранить в файлах на диске.
Mathcad предоставляет пользователю специальные функции ввода данных из файла на диске и вывода данных в файл, т.е. функции доступа к файлам - READ, WRITE, APPEND, READPRN, WRITEPRN, APPENDPRN. Подробное описание этих функций и правила работы с ними можно найти в литературе по пакету, во встроенном в систему справочнике, в руководстве пользователя.
Познакомимся подробнее с функциями READ(file) и WRITE(file), предназначенными соответственно для чтения и записи числового значения. Файл данных для Mathcad - это файл чисел, записанных в формате ASCII, разделенных пробелом, запятой или символом концах строки. Числа могут быть целыми или с плавающей запятой, записанными с десятичной точкой или в экспоненциальной форме. При обращении к файлу Mathcad по умолчанию обращается в ту папку (каталог, директорию), из которой загружался рабочий документ или в которую документ последний раз загружался. Однако можно работать с файлами из любых папок, указывая полное имя файла.
Функция READ(file) считывает значение из файла и присваивает его переменной. Поскольку чаще всего читаются массивы чисел, обращение к функции записывается следующим образом: Xi:= READ(fiie).
Функция WRITE(file) записывает в файл на диске числовое значение
переменной. Поскольку, как правило, записываются массивы чисел, то чаще всего она указывается следующим образом: WRITE(file):= хi. Если файла с указанным именем не существует, то он будет создан; если такой файл есть, то при записи предыдущая информация будет потеряна.
Функции вычисления выборочных характеристик.
Первичная обработка данных состоит обычно в отыскании максимального x max и минимального x min значений выборки, а также в построении вариационного ряда - массива выборочных значений занумерованных (записанных) в порядке возрастания. Для выполнения этих вычислений в Mathcad предназначены соответственно функции max(A), min(A) и sort(A).
Кроме того, Mathcad имеет шесть функций, вычисляющих точечные оценки параметров распределения случайной величины. В последующих разделах главы даны все необходимые определения и описаны методы получения оценок. Здесь приведем только определения функций и правила обращения к ним. Следующие четыре функции вычисляют числовые характеристики выборки, cодержащейся в массиве А размерности т х п.
Функция mean(A) вычисляет значение выборочного среднего.
Функция var(A) вычисляет смещенную точечную оценку дисперсии называемую выборочной дисперсией.
Функция stdev(A) определяет среднеквадратичное отклонение.
Функция median(A) вычисляет медиану - величину, меньше и больше которой в выборке содержится одинаковое количество элементов.
Еще две функции предназначены для вычисления числовых харак-. теристик двумерного случайного вектора, выборочные значения двух компонент которого расположены соответственно в массивах А и В размерности т х n. Функция cvаr(A,B) вычисляет значение выборочной ковариации.
Построение эмпирических распределений.
Наиболее наглядной формой графического представления выборок является гистограмма. В Mathcad для построения гистограмм предназначена функция hist(?,A). Для того чтобы построить гистограмму, нужно сначала сгруппировать выборочные данные, записанные в массиве A, и сохранить граничные точки интервалов группировки в векторе ?, размерность которого равна числу интервалов. Результат вычислений функции hist(?,A) - вектор, каждый элемент которого равен количеству выборочных значений, попадающих в соответствующий интервал группировки.
Размерность вектора hist(?,A) совпадает с размерностью вектора ? и равна числу интервалов группировки. Если д 1,…,д m -длины интервалов группировки, a x1,…,xm их середины и hj =nj /n относительные частотыпопадания наблюдений в J-Й интервал группировки, то можно построить изображение ступенчатой функции f(x) = hj /дj в виде столбчатой диаграммы, которая называется гистограммой.
Используя функцию hist(?,A), можно построить полигон частот - ломаную линию, соединяющую точки с абсциссами, равными серединам интервалов группировки, и ординатами, равными соответствующим частотам.
Моделирование выборок из стандартных распределений.
Mahtcad обладает богатой библиотекой встроенных функций, предназначенных для генерирования выборок из генеральных совокупностей с наиболее распространенными стандартными распределениями. Например, для генерации нормального распределения предназначена функция rnorm(k,µ,у), значением которой является вектор, содержащий k выборочных значений нормально распределенной случайной величины с математическим ожиданием Mо=µ и дисперсией Dо=у2. Ниже приведен список функций Mathcad, генерирующих выборки:
* Бета-распределение: rbeta(k,s1,s2).
* Биномиальное распределение: rbinom(k,n,p).
* Распределение Коши: rcauchy(k,l,s)
* ч2- распределение: rchisq(k,d)
* Экспоненциальное распределение: rexp(k,r).
* Распределение Фишера (F-распределение): rF(k,m,n).
* Гамма-распределение: rgamma(k,s).
* Геометрическое распределение: rgeom(k,p).
* Логнормальное распределение: rlnorm(k,µ,у).
* Логистическое распределение: rlogis(k,l,s).
* Отрицательное биномиальное распределение: rnbinom(k,n,p).
* Нормальное распределение: rnorm (k,µ,у).
* Распределение Пуассона: rpois(k,л).
* Распределение Стьюдента: rt(k,d).
* Равномерное распределение: runif(k,a,b)
* Распределение Вейбулла: rweibull(k,s).
1.3 Способы решения задач математической статистики в MS Excel с помощью встроенных формул и используя меню «Анализ данных»
Математические функции.
СЧЕТЕСЛИ - количество непустых ячеек в указанном диапазоне, удовлетворяющем заданному критерию. Позволяет рассчитать количество ячеек внутри указанного интервала, которые удовлетворяют заданному критерию. СЧЕТЕСЛИ(интервал, критерий). где интервал - интервал, в котором подсчитывается количество ячеек; критерий - критерий в форме числа, выражения или текста, который определяет, какие ячейки необходимо подсчитывать. Например, критерий может быть выражен следующим образом: 25, «25», >25, «дома». Пример. Пусть ячейки В3:И6 содержат 32, 54, 76, 86 соответственно: СЧЕТЕСЛИ (В3:В6;”>55?) равняется 2. ЧИСЛОКОМБ - количество комбинаций для заданного числа объектов. Рассчитывает количество комбинаций для заданного числа объектов. Функция ЧИСЛОКОМБ может использоваться для определения числа всех возможных сочетаний объектов. Пример. Необходимо сформировать группу из четырех человек, при условии, что имеется десять кандидатов. Тогда общее число различных групп составит: ЧИСЛОКОМБ(10;4) равняется 210. СУММЕСЛИ - сумма ячеек, определенных по заданному критерию. Позволяет просуммировать ячейки, определенные заданным критерием. СУММЕСЛИ(интервал;критерий; сумм_интервал) где интервал - интервал вычисляемых ячеек; критерий - критерий в форме числа, выражения или текста, который определяет, какая ячейка суммируется с другими. Например, критерий может быть выражен как 25, «25», >25, «дома»; сумм_интервал - ячейки для суммирования. Эти ячейки суммируются в том случае, если соответствующие им ячейки в аргументе интервал удовлетворяют критерию. Если аргумент сумм_интервал опущен, то суммируются ячейки в аргументе интервал. Пример. Пусть ячейки А2:А6 содержат величины стоимости для пяти объектов: 100000 руб., 200000 руб., 300000 руб., 400000 руб., 500000 руб. соответственно. Пусть ячейки С1:С4 содержат величины комиссионных при продаже объектов: 9000 руб., 15000 руб., 22000 руб., 29000 руб., 36000 руб. СУММЕСЛИ(А2:А6;”>210000?;С1:С4) равняется 66000 руб.
Статистические функции.
КОРЕЛЛ - связь между двумя множествами данных. Данная функция позволяет рассчитать коэффициент корреляции между двумя интервалами ячеек. Коэффициент корреляции обычно используется для определения взаимосвязи между двумя свойствами объекта. КОРЕЛЛ (массив1;массив2) где массив1 - первый интервал ячеек; массив2 - второй интервал ячеек. Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки с нулевыми значениями учитываются. Функция КОРЕЛЛ выдает значение ошибки #Н/Д в том случае, если массив1 и массив2 имеют различное количество данных и значение ошибки #ДЕЛ/0! в том случае, если массив1 или массив2 пуст, или, если отклонение их значений равно нулю. Пример. КОРЕЛЛ({3;2;4;5;6};{9,7,12,15,17} равняется 0,997054. МАКС - максимальное значение из списка чисел. Позволяет рассчитать наибольшую величину из набора числовых значений. МАКС(число1;число2;…) где число1, число2,… - до 30 чисел, среди которых ищется максимальное значение. Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают ошибку. Если аргумент является массивом или ссылкой, то в нем учитываются только числа. Пустые ячейки, логические значения или текст в массиве или ссылке игнорируются. Если логические значения или текст не должны игнорироваться, следует использовать функцию МАКСА. Пример. Определить максимальное значение, если ячейки А1:А5 содержат числа 12,5,6,29 и 3. МАКС(А1:А5) равняется 29. МАКСА (А1:А5;40) равняется 40. Если аргументы не содержат чисел, то функция МАКС выдает 0 (ноль). СРЗНАЧ - среднее арифметическое. Позволяет рассчитать среднее (арифметическое) двух чисел. СРЗНАЧ (число1;число2;…) где число1, число2,… - до 30 аргументов, для которых вычисляется среднее арифметическое. Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются. Вычисляя средние значения ячеек, следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если не установлен флажок Нулевые Значения на панели Вид в диалоговом окне Параметры. Пустые ячейки не учитываются, но нулевые ячейки учитываются. Чтобы открыть диалоговое окно Параметры, надо выбрать команду Параметры в меню Сервис. Пример: Пусть ячейки А1:А5 имеют имя Баллы и содержат числа 10, 7, 9, 27 и 2, тогда СРЗНАЧ(А1:А5) равняется 11 СРЗНАЧ(Баллы) равняется 11 СРЗНАЧ(А1:А5;5) равняется 10 СРЗНАЧ(А1:А5 равняется СУММ(А1:А5)/СЧЕТ(А1:А5) и равняется 11. МОДА - наиболее часто встречающееся значение. Функция позволяет рассчитать наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. МОДА(число1;число2;…) где число1, число2,… - до 30 аргументов, среди которых вычисляется наиболее часто встречающееся значение. Можно использовать массив или ссылку на массив вместо аргументов, разделяемых точкой с запятой. Аргументы должны быть числами, именами, массивами или ссылками, которые содержат числа. Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако, ячейки, которые содержат нулевые значения, учитываются. Функция МОДА выдает значение ошибки #Н/Д! в том случае, если множество данных содержит не однотипные данные. Пример. МОДА({5;6;4;4;3;2;4}) равняется 4.
Выборка и анализ данных в Excel.
В Excel имеется набор инструментов для анализа данных, называемый пакет анализа, который может быть использован для решения статистических или экономических задач. Для использования одного из этих инструментов необходимо указать входные данные и выбрать параметры. Анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, и результаты будут представлены в выходном диапазоне. Некоторые инструменты позволяют представить результаты анализа в графическом виде. Статистический пакет анализа данных. Для его установки в меню Сервис выбирается команда Надстройки и далее в списке Пакет анализа. Для использования инструментов анализа, анализируемые данные следует представить в виде строк или столбцов. Совокупность ячеек, содержащих эти данные, называется входным диапазоном. В меню Сервис выбирается команда Анализ данных. В списке Инструменты анализа выбирается необходимая строка. Далее вводятся входной и выходной диапазоны. Корреляционный анализ. Используется для количественной оценки взаимосвязи двух наборов данных, представленных в безразмерном виде. Корреляционный анализ дает возможность установить: ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (корреляция близка к нулю). Для вычисления коэффициента корреляции между двумя наборами данных используется статистическая функция КОРЕЛ. Ковариационный анализ. Ковариация является мерой связи между двумя диапазонами данных. Используется для вычисления среднего произведения отклонений точек данных относительно средних.
Ковариационный анализ дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная ковариация), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная ковариация), или данные двух диапазонов никак не связаны (ковариация близка к нулю). Вычисления ковариации для отдельной пары данных производятся с помощью статистической функции КОВАР. Экспоненциальное сглаживание. Предназначается для предсказания значения на основе прогноза для предыдущего периода, скорректированного с учетом погрешностей в этом прогнозе. Использует константу сглаживания, по величине которой определяет, насколько сильно влияют погрешности на прогнозы в предыдущем прогнозе. Скользящее среднее. Используется для расчета значений в периоде прогнозирования на основе среднего значения переменной для указанного числа предшествующих периодов. Скользящее среднее, в отличие от простого среднего для всей выборки, содержит сведения о тенденциях изменения данных. Процедура может использоваться для прогноза сбыта, инвентаризации и других процессов. Генерация случайных чисел. Используется для заполнения диапазона случайными числами, извлеченными из одного или нескольких распределений. С помощью данной процедуры можно моделировать объекты, имеющие случайную природу, по известному распределению вероятностей. Например, можно использовать нормальное распределение для моделирования совокупности данных по арифметическим ошибкам в бухгалтерском учете. Чтобы в результате выполнения вычислений вернуть равномерно распределенное случайное число, большее или равное 0 и меньшее 1, используется функция СЛЧИС(). Чтобы вернуть случайное число, лежащее между произвольными заданными значениями, используется функция СЛУЧМЕЖДУ(). Ранг и персентиль. Используется для вывода таблицы, содержащей порядковый и процентный ранги для каждого значения в наборе данных. Данная процедура может быть применена для анализа относительного взаимораспределения данных в наборе. Регрессия. Линейный регрессионный анализ заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных. Например, на объем реализации влияют несколько факторов, включая цену, выпуск и сезонность. Регрессия пропорционально распределяет меру реализации по этим трем факторам на основе данных функционирования организации. Результаты регрессии впоследствии могут быть использованы для предсказания объема реализации. Выборка. Создает выборку из генеральной совокупности, рассматривая входной диапазон как генеральную совокупность. Если совокупность слишком велика для обработки или построения диаграммы, можно использовать представительную выборку. Кроме того, если предполагается периодичность входных данных, то можно создать выборку, содержащую значения только из отдельной части цикла. Например, если входной диапазон содержит данные для квартальных продаж, создание выборки с периодом 4 разместит в выходном диапазоне значения продаж из одного и того же квартала.
2. Практическое решение задач математической статистики на ЭВМ
В качестве данных (выборки) взяли значения количества продаж автомобилей BMW в 50 автосалонах Российской Федерации.
Провели исследование выборки в MathCad и MS Excel.
2.1 MathCad
Ввод исходных данных
ORIGIN:= 1
A:=
Первичная обработка выборки:
Xmin:= min (A) Xmax:= max(A) R:= Xmax - Xmin
Xmin = 45 Xmax = 80 R = 35
Вариационный ряд
А1:=
X:= stack (,
1 |
||
1 |
45 |
|
2 |
50 |
|
3 |
50 |
|
4 |
50 |
|
5 |
50 |
|
6 |
50 |
|
7 |
50 |
|
8 |
50 |
|
9 |
50 |
|
10 |
50 |
|
11 |
52 |
|
12 |
52 |
|
13 |
52 |
|
14 |
52 |
|
15 |
55 |
|
16 |
55 |
|
17 |
55 |
|
18 |
… |
|
1 |
||
1 |
72 |
|
2 |
72 |
|
3 |
65 |
|
4 |
68 |
|
5 |
50 |
|
6 |
75 |
|
7 |
65 |
|
8 |
60 |
|
9 |
50 |
|
10 |
65 |
|
11 |
58 |
|
12 |
75 |
|
13 |
52 |
|
14 |
55 |
|
15 |
65 |
|
16 |
45 |
|
17 |
52 |
|
18 |
… |
X:= sort(X)
Построение статистического ряда распределения
1 |
||
1 |
1 |
|
2 |
9 |
|
3 |
4 |
|
4 |
4 |
|
5 |
1 |
|
6 |
5 |
|
7 |
13 |
|
8 |
1 |
|
9 |
1 |
|
10 |
3 |
|
11 |
6 |
|
12 |
2 |
Int:= f:= hist (int, X) f = (частоты)
fl:= (относительные частоты)
Построение полигона частот и относительных частот
Рис. 1
Построение эмпирической функции распределения
k:= 1 .. 12
(накопленные частоты)
Рис. 2
График эмпирической функции распределения
Вычисление числовых характеристик выборки:
xв:= mean(X) xв = 61,8 выборочная средняя
Ме:= median(X) Ме = 65 медиана
Мо:= mode(X) Mo = 65 мода
Dв:= var(X) Dв = 8,788 выборочная дисперсия в:= в = 9,374 выборочное ср. кв. откл.
s2:= (Stdev(X) s2 = 8,967 исправ. выборочная дисперсия
s:= Stedev(X) s = 94,696 исправ. выборочное сред. квад. отк.
As:= skew As = 0.141 выборочный коэф. ассиметрии
Ek:= kurt Ek = -1.066 выборочный эксцесс
Вычисление интервальных оценок
95% доверительный интервал для математического ожидания при неизвестной дисперсии:
t:= qt t = 2.009
xl:= xв - t xl =591.101
xp:= xв + t xp = 644.899
l:= (xl xp) l = (591.101 644.899)
95% доверительный интервал для дисперсии:
20:= qchisq, 49) 20 = 31.555
21:= qchisq, 49) 21= 70.222
l = 6.257
u:= u = 1.392
II:= (1 u) II = (6.257 1.392 )
2.2. MS Excel
Исходные данные: Количество продаж автомобилей BMW(шт.)
65 |
50 |
60 |
65 |
75 |
50 |
68 |
65 |
72 |
72 |
|
55 |
65 |
50 |
52 |
45 |
65 |
55 |
52 |
75 |
58 |
|
55 |
65 |
65 |
75 |
50 |
65 |
60 |
65 |
60 |
50 |
|
52 |
55 |
50 |
50 |
65 |
75 |
52 |
80 |
65 |
60 |
|
65 |
75 |
65 |
50 |
60 |
80 |
72 |
70 |
50 |
75 |
n= |
50 |
|
max= |
80 |
|
min= |
45 |
|
R= |
35 |
статистическое распределение частот и относительных частот
Вариант а |
Частота ni |
Относительная |
Накопленная |
|
45 50 52 55 58 60 65 68 70 72 75 80 |
1 9 4 4 1 5 13 1 1 3 6 2 |
0,02 0,18 0,08 0,08 0,02 0,1 0,26 0,02 0,02 0,06 0,12 0,04 |
0,02 0,2 0,28 0,36 0,38 0,48 0,74 0,76 0,78 0,84 0,96 1 |
50 1 Числовые характеристики выборки:
выборочная средняя хв= 61,8,
выборочная дисперсия Dв= 8788,
исправленная выборочная дисперсия s2= 8967,35,
среднее квадратическое отклонение = 9,374,
исправленное среднее кв. отклонение s= 9,469,
мода Мо= 65 медиана Ме= 65,
интервальная оценка для математического ожидания:
доверительный уровень: 0,95,
доверительный интервал: 26,912,
нижняя граница: 59,108 t= 2,00958,
верхняя граница: 64,491,
интервальная оценка для дисперсии:
доверительный уровень: 0,95
Рис. 3
= 31,554
= 70,2224
нижняя граница: 6257,26
верхняя граница: 13924,9
Рис. 4
Рис. 5
Результаты описательной статистики: |
|
Среднее 618 Стандартная ошибка 13,39205 Медиана 650 Мода 650 Стандартное отклонение 94,69608 Дисперсия выборки 8967,347 Эксцесс -1,06632 Ассиметричность 0,140713 Интервал 350 Минимум 450 Максимум 800 Сумма 30900 Счет 50 Наибольший(1) 800 Наименьший(1) 450 Уровень надежности(95,0%) 26,91233 |
Заключение
В данной курсовой работе рассмотрены основные понятия математической статистики и проведено исследование выборки 50 значений количества продаж автомобилей BMW.
Расчеты основных характеристик проводились в среде MathCad и MS Excel.
По результатам исследования получены следующие значения:
- размах варьирования количества продаж автомобилей BMW равен 35 шт.;
- среднее количество проданных автомобилей BMW в Российской Федерации составляет 61,8 шт.;
- разброс количества продаж автомобилей BMW вокруг средней стоимости составляет 9,4 шт.;
- коэффициент вариации равен 15,17%, отсюда следует, что рассматриваемая совокупность однородная;
- с надежностью 0,95 интервал (покрывает математическое ожидание количества продаж автомобилей BMW;
- с надежностью 0,95 интервал покрывает дисперсию количества продаж автомобилей BMW.
Литература
1. Плис А.И. Статистические вычисления в среде Excel. Библиотека пользователя. - СПб.: Питер, 2011.-608с.
2. Справочник по математике для экономистов / Под редакцией В.И. Ермакова. - Москва.: Высшая школа, 2007. -486с.
3. Дьяконов В.П. Справочник по MATHCAD. - М.: СК Пресс. 2011. - 396 с.
4. Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высш. Ш., 2009. - 479с.
Размещено на Allbest.ru
Подобные документы
Построение математической модели и решение задачи математического программирования в средах MathCad и MS Excel. Решение систем с произвольными векторами свободных коэффициентов. Определение вектора невязки. Минимизация и максимизация целевой функции.
отчет по практике [323,5 K], добавлен 01.10.2013Примеры решения задач линейного программирования в Mathcad и Excel. Нахождение минимума функции f(x1, x2) при помощи метода деформируемого многогранника. Построение многофакторного уравнения регрессии для решения экономико-статистической задачи.
курсовая работа [1,3 M], добавлен 17.12.2011Программный пакет Microsoft Office и табличный процессор Excel. Задачи и основные функции в Microsoft Excel. Формулы в Microsoft Excel. Общие сведения об алгоритмах. Метод половинного деления. Понятие оптимизационных задач и оптимизационных моделей.
курсовая работа [333,4 K], добавлен 17.03.2008- Использование электронных таблиц MS EXCEL для решения экономических задач. Финансовый анализ в Excel
Использование электронных таблиц MS EXCEL для расчета затрат на вспомогательные материалы, прибыли, построение диаграмм. Подведение динамических итогов с применением сводных таблиц. Регрессионный анализ данных. Проведение финансового анализа в Excel.
контрольная работа [607,9 K], добавлен 29.03.2010 Группировка предприятий по стоимости основных фондов, построение гистограммы распределения, определение моды графическим и аналитическими способами. Оценка объемов продаж товара методами математической статистики. Задача на экономические индексы.
задача [1,7 M], добавлен 03.02.2010Основы понятия регрессионного анализа и математического моделирования. Численное решение краевых задач математической физики методом конечных разностей. Решение стандартных и оптимизационных задач, систем линейных уравнений. Метод конечных элементов.
реферат [227,1 K], добавлен 18.04.2015Применение методов и формул математической статистики при выполнении расчета показателей эффективности производства, организации рабочего процесса, оценке перспектив и разработке планов развития определенных отраслей промышленности. Расчет добычи угля.
контрольная работа [497,9 K], добавлен 05.11.2009Построение математической и электронной модели в MS Excel. Распределение средств по различным источникам для получения максимальной прибыли от рекламы. Смысл данных отчета по устойчивости. Условия составления оптимального плана распределения средств.
контрольная работа [47,7 K], добавлен 01.03.2011Статистический анализ по выборке. Проведение регрессионного анализа исходных данных и выбор аналитической формы записи производственной функции. Выполнение экономического анализа в выбранной регрессионной модели на основе коэффициентов эластичности.
курсовая работа [2,2 M], добавлен 22.07.2015Основы составления, решения и анализа экономико-математических задач. Состояние, решение, анализ экономико-математических задач по моделированию структуры посевов кормовых культур при заданных объемах животноводческой продукции. Методические рекомендации.
методичка [55,1 K], добавлен 12.01.2009