Зависимость потребления бензина от количества автомобилей
Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 28.06.2009 |
Размер файла | 593,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
15
Кафедра высшей математики
Курсовая работа
по теории вероятностей и математической статистике
на тему:
« Зависимость потребления бензина от количества автомобилей »
Дубна, 2003
Оглавление
ВВЕДЕНИЕ
ПОСТАНОВКА ЗАДАЧИ
ДИАГРАММА РАССЕИВАНИЯ
ПОСТРОЕНИЕ ПРЯМОЙ Y=AX+B, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI)В СРЕДНЕМ КВАДРАТИЧНОМ
ПОСТРОЕНИЕ КРИВОЙ Y=PX2+QX+R, НАИМЕНЕЕ ОТКЛОНЯЮЩЕЙСЯ ОТ ТОЧЕК (XI;YI) В СРЕДНЕМ КВАДРАТИЧНОМ
АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ И ВЫВОД О ЗАВИСИМОСТИ XI И YI
ВЫВОД
СПИСОК ЛИТЕРАТУРЫ
Введение
В данной работе исследуется зависимость потребления бензина в городе от количества автомобилей с помощью методов математической статистики.
Бензин - смесь легких углеводородов с tкип 30-205 °C; прозрачная жидкость, плотность 0,70-0,78 г/см3. Получают главным образом перегонкой или крекингом нефти. Топливо для карбюраторных авто- и авиадвигателей; экстрагент и растворитель для жиров, смол, каучуков.
Автомобиль - транспортная безрельсовая машина главным образом на колесном ходу, приводимая в движение собственным двигателем (внутреннего сгорания, электрическим или паровым). Различают автомобили пассажирские (легковые и автобусы), грузовые, специальные (пожарные, санитарные и др.) и гоночные. Скорость легковых автомобилей до 300 км/ч, гоночных до 1020 км/ч (1993), грузоподъемность грузовых автомобилей до 180 т.
Обычно в любой области науки при изучении двух величин проводятся эксперименты, и задача состоит в том, чтобы на основании экспериментальных точек выявить функциональную зависимость.
Если мы рассматриваем слабо формализованные системы, которые трудно поддаются однозначным и точным описаниям, связь между величинами X и Y изначально корреляционная. Это связано, что Y зависит не только от X, но и от других параметров.
В этом случае, задача состоит в том, чтобы приближённо свести корреляционную связь к функциональной с помощью подбора такой функции, которая максимально возможным способом была бы близка к экспериментальным точкам. Такая функция называется функцией регрессии.
Обычно вид самой функции угадывается, но она зависит от некоторых параметров. Задача статистического и корреляционного анализа состоит в нахождении этих параметров. Для этого и используется метод наименьших квадратов.
Постановка задачи
Даны выборки
- количество автомобилей, - потребление бензина.
Задача состоит в изучении характера зависимости
1. Изобразить точки () на плоскости (на миллиметровой бумаге и в виде точечного графика на компьютере)
2. Методом наименьших квадратов определить числа такие, что прямая наименее уклоняется от точек () в среднем квадратичном.
3. Методом наименьших квадратов определить числа такие, что парабола наименее уклоняется от точек () в среднем квадратичном.
4. Сравнить между собой результаты пунктов 2. и 3.
5. С помощью сравнения статистик
где объем выборки, ответить на вопросы:
1) Подтвердилась ли гипотеза о том, что зависимость между и близка к линейной ?
2) Подтвердилась ли гипотеза о том, что зависимость между и
близка к квадратичной?
3) Какая из двух кривых - прямая или парабола - меньше отклоняется от точек выборки () ?
Диаграмма рассеивания
Даны выборки и , которые можно интерпретировать следующим образом: -- потребление бензина, -- количество автомобилей. Задача состоит в изучении характера зависимости между и . Исходные выборки представлены в таблице:
X |
Y |
X |
Y |
X |
Y |
X |
Y |
|
8,64558 |
116,76 |
22,2483 |
112,8 |
35,3723 |
113,328 |
48,6586 |
125,396 |
|
9,30954 |
115,72 |
22,38 |
114,03 |
35,8685 |
119,397 |
49,2468 |
126,783 |
|
9,54538 |
109,996 |
22,743 |
114,952 |
36,0494 |
124,624 |
49,0515 |
125,652 |
|
9,91695 |
126,634 |
23,0127 |
117,027 |
36,5302 |
118,734 |
49,7645 |
119,88 |
|
10,3459 |
112,28 |
23,9216 |
110,664 |
36,7256 |
126,531 |
50,6983 |
129,604 |
|
11,1794 |
115,564 |
24,7213 |
120,474 |
37,2568 |
125,601 |
50,4538 |
125,877 |
|
12,0403 |
116,048 |
25,2151 |
120,749 |
38,6184 |
121,974 |
51,7368 |
124,935 |
|
12,4383 |
114,524 |
25,5633 |
125,365 |
38,669 |
123,196 |
52,3859 |
121,572 |
|
12,8887 |
114,716 |
26,5224 |
117,494 |
39,2617 |
119,925 |
52,932 |
127,416 |
|
13,3673 |
107,328 |
26,654 |
112,982 |
40,1783 |
122,293 |
53,1557 |
123,507 |
|
13,5643 |
114,422 |
26,7975 |
112,34 |
40,239 |
120,465 |
54,0261 |
128,29 |
|
14,4435 |
118,925 |
27,6272 |
127,172 |
41,1804 |
122,419 |
54,4972 |
136,727 |
|
14,4909 |
123,297 |
28,2653 |
121,229 |
40,8874 |
127,014 |
54,3892 |
125,732 |
|
15,3408 |
119,606 |
28,6799 |
119,246 |
42,0704 |
133,402 |
55,475 |
124,107 |
|
15,5866 |
116,443 |
28,9424 |
113,728 |
42,7372 |
136,142 |
55,7691 |
128,79 |
|
16,9966 |
119,384 |
29,8652 |
124,189 |
42,8423 |
123,36 |
55,912 |
139,417 |
|
17,4323 |
116,428 |
30,2303 |
131,775 |
43,6994 |
128,363 |
56,6281 |
127,151 |
|
17,2341 |
123,058 |
30,6092 |
113,164 |
44,4041 |
118,225 |
57,6097 |
130,697 |
|
17,7988 |
116,349 |
31,6162 |
122,517 |
45,0372 |
126,604 |
57,3441 |
142,839 |
|
18,5831 |
116,665 |
32,1788 |
117,256 |
45,1258 |
127,831 |
58,699 |
134,079 |
|
19,4722 |
118,844 |
32,7243 |
114,794 |
45,4427 |
122,39 |
59,0407 |
130,316 |
|
19,8208 |
123,205 |
32,7933 |
130,624 |
46,3461 |
129,182 |
59,3109 |
129,148 |
|
20,6594 |
109,789 |
33,1236 |
133,529 |
46,5863 |
127,344 |
59,8175 |
135,398 |
|
20,8651 |
118,634 |
34,0453 |
123,582 |
47,3429 |
124,694 |
60,3217 |
131,061 |
|
21,0348 |
110,347 |
34,9061 |
135,169 |
47,7225 |
117,103 |
61,2562 |
126,388 |
Изобразим эти точки в виде точечного графика с соответствующими координатами (, ); для этого надо найти размах выборки по X и Y и выбрать соответствующий масштаб. Сначала находим и , затем размах выборки по X, которая вычисляется по формуле и в результате равна 52,61062. Аналогично и , а размах выборки поY получим равный 35,511. Глядя на размах выборок по X и по Y, выбираем масштаб диаграммы рассеивания и строим её.
рис.1. Диаграмма рассеивания
По формуле где
можно найти коэффициент корреляции:
Он не равен нулю, следовательно, зависимость между X и Y существует.
Построение прямой y=ax+b, наименее отклоняющейся от точек (Xi;Yi)в среднем квадратичном
Для построения прямой y = ax + b, наименее отклоняющейся от точек в среднем квадратичном, необходимо методом наименьших квадратов определить числа a, b такие, что функция двух переменных принимает минимальное значение. Данная функция имеет вид:
.
Зная, что необходимым условием минимума функции является равенство нулю ее первых частных производных, имеем следующую систему для нахождения значений :
,
Данная система может быть представлена в виде:
,
где
В результате получим что:
Докажем теперь, что в точке функция имеет минимум. Достаточным условием существования экстремума функции двух переменных является следующее неравенство:
.
Для доказательства введем следующие обозначения:
Составим дискриминант . Тогда, если , то функция имеет в точке экстремум, а именно минимум при А>0 (или С>0). Из системы видно, что эти условия выполняются: = , С=200>0.
То есть точка действительно является точкой минимума.
Следовательно, функция при данных значениях имеет следующий график:
рис.2. График уравнения линейной регрессии
Построение кривой y=px2+qx+r, наименее отклоняющейся от точек (Xi;Yi) в среднем квадратичном
Для построения кривой , наименее отклоняющейся от точек в среднем квадратичном, необходимо методом наименьших квадратов определить числа , и такие, что функция трех переменных принимает минимальное значение. Данная функция имеет вид:
Аналогично нахождению значений для прямой составляем систему трех линейных уравнений, которая является необходимым условием минимума функции:
Данная система является системой линейных однородных уравнений. Решая эту систему методом Крамера и зная, что:
составляем определители, состоящие из коэффициентов при и столбца свободных членов.
Значения находим делением соответствующих определителей.
= = =
Докажем теперь, что в точке функция имеет минимум. Достаточным условием существования минимума функции трех переменных является следующее неравенство:
d.
Получаем следующее уравнение:
Воспользуемся критерием Сильвестра, т.е. найдем миноры 1-ого, 2-ого и 3-ого порядков и докажем, что они положительные.
==
Найдем миноры первого, второго и третьего порядков для этого определителя:
Так как все миноры положительны, то по критерию Сильвестра d, и функция имеет минимум в точке .
Таким образом, парабола имеет следующий график:
рис.3. График уравнения параболической регрессии
Анализ полученных результатов и вывод о зависимости Xi и Yi
рис.4. Сравнение линейной и параболической регрессий
Для сравнения полученных результатов построения кривых и определим значения статистик:
Поскольку и , можно говорить о том, что зависимость между и близка и к линейной, и к квадратичной. При этом парабола меньше отклоняется от точек и , чем прямая
Вывод
Зависимость потребления бензина от количества автомобилей близка к линейной и к квадратичной. Однако видно, что разница между значениями статистик небольшая. Следовательно, с практической точки зрения удобнее приближать точки выборки и к прямой . Выявление зависимости между потреблением бензина и количеством автомобилей пригодится для понимания ситуации, которая складывается у нас на дорогах и влияет на природу, поскольку потребление бензина всегда сопровождается вредными выбросами.
Список литературы
1. Гмурман В.Е. Теория вероятностей и математическая статистика. -- М.: Высшая школа 1998.
2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике -- М.: Высшая школа 1998.
3. Ивашев-Мусатов О. С. Теория вероятностей и математическая статистика -- М.: Наука 1979.
4. Мазный Г.Л., Прогулова Т.Б. Методическое пособие к курсовому проектированию по ВМ и информатике. -- Дубна: Кафедра ВМ и САУ, 1996.
Подобные документы
Функции эритроцитов в организме человека, учет изменения их количества в связи с возрастом в рамках теории вероятностей и математической статистики. Обработка исходных данных, построение диаграммы рассеивания, гистограммы признаков; проверка гипотез.
курсовая работа [1,6 M], добавлен 18.02.2012Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.
курсовая работа [613,3 K], добавлен 24.10.2012Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.
курсовая работа [511,8 K], добавлен 08.12.2013Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.
курсовая работа [862,4 K], добавлен 06.05.2009Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.
курсовая работа [988,5 K], добавлен 19.01.2011Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.
курсовая работа [304,0 K], добавлен 02.03.2017