Анализ динамических рядов и построение уравнения множественной регрессии
Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | украинский |
Дата добавления | 24.09.2014 |
Размер файла | 92,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
Санкт-Петербургский государственный горный университет
КУРСОВАЯ РАБОТА
по дисциплине Статистика
Тема работы: Анализ динамических рядов и построение уравнения множественной регрессии
ВЫПОЛНИЛ:
студент гр. БА-09-2 ____________ /Колодяжная Е.В./
ПРОВЕРИЛ:
Доктор техн. наук, профессор ___________ /Скобелина В.П./
Санкт-Петербург
2011
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
Санкт-Петербургский государственный горный университет
УТВЕРЖДАЮ
Заведующий кафедрой
_______ /Пашкевич Н. В./
" __" _______ 2011 г.
Кафедра экономики, учета и аудита
КУРСОВАЯ РАБОТА
По дисциплине: Статистика
ЗАДАНИЕ
Студенту группы БА-09-2 Колодяжной Е.В.
(шифр группы) (Ф.И.О.)
1. Тема курсовой работы: Анализ динамических рядов и построение уравнения множественной регрессии
2. Исходные данные к курсовой работе: В процессе написания курсовой работы было использовано 2 литературных источника.
3. Содержание пояснительной записки: Курсовая работа включает решение комплексной статистической задачи построения уравнения множественной регрессии на конкретном информационном материале.
4. Перечень графического материала: В качестве графического материала в курсовой работе представлено: 8 таблиц.
5. Срок сдачи законченного проекта: 15 декабря 2011 г.
Руководитель проекта профессор ________________ / Скобелина В.П./
Дата выдачи задания: .
Аннотация
Целью курсовой работы является закрепление теоретических знаний, полученных при изучении курса «Общая Статистика». Работа включает решение комплексной статистической задачи построения уравнения множественной регрессии на конкретном информационном материале. Выполнение работы сопряжено с использованием знаний, теоретических обобщений и навыков практического их применения по высшей математике, общей теории статистики, элементам математической статистики, а также теоретическим основам отраслевой экономики.
The summary
The object of course work is fastening of theoretical knowledge received at study the course «Statistics». The course work includes the decision of complex statistical problem by building equation of plural regression on specific information material. Performing of the work connects with using theoretical knowledge and skills of their practical using for mathematics, statistics, mathematical statistics and also theoretical bases of branch economy.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. Качественный анализ таблицы исходных динамических рядов
1.1 Исходные данные
1.2 Анализ исходных динамических рядов признака-функции и признака-фактора
1.3 Теоретические сведения о динамических рядах и их показателях
1.4 Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами
2. Расчет показателей вариации динамических рядов
2.1 Исследование исходных динамических рядов на непрерывность
2.2 Характеристика динамики признака-функции и признаков-факторов
2.3 Представительность признаков
3. Расчет показателей вариации динамических рядов
3.1 Теоретическая справка о показателях вариации
3.2 Расчет показателей вариации динамических рядов
4. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции
4.1 Теоретическая справка о парной корреляции
4.2 Исследование коэффициентов парной корреляции
5. Построение уравнение многофакторной корреляционной связи
5.1 Теоретическая справка о множественной регрессии
5.2 Построение уравнения множественной регрессии
Заключение
Список литературы
Приложение
Введение
Данная курсовая работа нацелена на решение комплексной статистической задачи, конечным итогом которой выступает уравнение множественной регрессии, построенное на конкретном информационном материале. Выполнение работы связано с использованием знаний по базовым теоретическим дисциплинам: высшей математике, общей теории статистики и теоретическим основам отраслевой экономики.
Курсовая работа имеет комплексный характер, следовательно, ее выполнение включает следующие этапы:
· проведение качественного анализа таблицы исходных данных динамических рядов;
· расчет показателей вариации динамических рядов и их оценка;
· проведение ранжирования признаков;
· количественное измерение тесноты связи между динамикой признака-функции и определенного числа признаков-факторов методом парной корреляции;
· построение уравнения многофакторной корреляционной связи признака-функции с наиболее значимыми признаками-факторами.
Каждый из перечисленных этапов решения данной задачи имеет свои конкретные вопросы, методы и способы их решения. Практически все работы выполняются при помощи специальной компьютерной программы «ELVIS».
1. Качественный анализ таблицы исходных динамических рядов
1.1 Исходные данные
Исходная информация представлена таблицей, содержащей данные о плановых объемах механического колонкового бурения, дифференцированные по полезным ископаемым региона, полученные за 20 лет, при относительно постоянных внешних факторах для изучаемой совокупности (признака) за исследуемый период (таблица 1):
Таблица 1
Исходные данные
(метры)
1.2 Анализ исходных динамических рядов признака-функции и признака-фактора
Для того чтобы можно было сделать качественный анализ, нужно, чтобы исходная таблица отвечала следующим условиям:
· информация, находящаяся в таблице, должна быть однородной, то есть относиться к одному объекту изучения;
· данные таблицы должны быть сопоставимы;
· исходная информация представлена в единых измерениях.
Проведем проверку соответствия таблицы исходных данных (таблица 1) заданным параметрам. Однородность данной таблицы заключается в том, что все показатели таблицы относятся к одной территории, исходная информация представлена в едином измерении- метрах.
Особое место нужно уделить вопросу сопоставимости данных. Проблема сопоставимости данных важна для рядов динамики, потому что они охватывают значительные периоды времени, за которые могли произойти изменения, приводящие к несопоставимости статистических данных. Анализировать ряды динамики нельзя, если приводятся несопоставимые данные. В нашем случае геологоразведочные работы проводятся в одних и тех же территориальных границах, условия работы (рельеф, климатический пояс и т.д.) также постоянны, для механического колонкового бурения характерна достаточно устойчивая производственно-технологическая структура. То есть мы имеем динамические ряды с сопоставимыми уровнями.
В подлежащем таблицы исходного статистического материала находится динамический ряд обобщающего показателя (признак-функция) объема бурения (у), величина которого в любом году изучаемого периода (уровень признака-функции) зависит от уровня признака-фактора, показанного в сказуемом таблицы. Признаки-факторы содержат информацию об объемах бурения (у), на цветные металлы (х1), на черные металлы (х2), на неметаллы (х3) и из них на химическое сырье (х4). Таким образом, мы видим, что факториальные признаки формируют как внешнюю (объемы бурения всего, в том числе на цветные металлы, на черные металлы, на неметаллы), так и внутреннюю сводку (неметаллы, из них на химическое сырье).
Существование внешней и внутренней сводок подтверждают существование следующего неравенства:
(1.2.1)
Подставляя исходные данные получаем следующее неравенство:
1208800793000
что подтверждает качественность информации, так как внутренняя сводка не должна превышать содержащую ее внешнюю.
1.3 Теоретические сведения о динамических рядах и их показателях
Из числа вариационных рядов выделяется особая их группа динамических рядов, уровни которых регистрируются моментами времени, а цифровые значения признака (признаков) жестко привязаны к временному вектору, т.е. у таких рядов постоянно увеличивается временной параметр, а значение признака (признаков) не подчинены какой-то определенной закономерности.
В силу этой особенности динамические ряды различаются по временному фактору:
· моментные динамические ряды, в которых регистрируются регулярно повторяющиеся моменты времени (декада, месяц, год);
· периодические ряды, уровни которых разделяются периодами времени (специализированными или стандартными);
· смешанные ряды, когда смешиваются моментные и временные уровни динамических рядов.
Временную особенность этих рядов можно проследить и в характеристике основных показателей динамических рядов. При этом следует помнить, что динамический ряд, как вариационный, имеет характеристики вариационного ряда (уровни, частоты и т.д.)
Специальные характеристики динамического ряда включают в себя:
· абсолютный прирост признака на данный момент времени по отношению к значению признака за постоянный момент (период) или переменный - соответственно базисные или цепные абсолютные приросты:
· относительный прирост, когда абсолютная разность относится к соответствующей базе постоянной или цепной:
· темп роста: цепной и базисный:
· темп прироста
Между базисными и цепными темпами роста существует взаимосвязь двоякого рода:
если, начиная со второго, каждый последующий базисный темп разделить на предыдущий, получим цепной темп замыкающего уровня
если перемножить несколько соседних (начиная с крайнего) значений цепных темпов роста, то получим базисный темп крайнего уровня
Кроме этих характеристик существует целая группа показателей - связок. К числу этих показателей относятся два наиболее распространенных стандартных показателя:
· квота абсолютного прироста признака на 1% его прироста равна частному от деления абсолютного прироста на темп роста
где ti- темп прироста. Показатель темпа прироста дает относительную оценку значения абсолютного прироста по сравнению с первоначальным уровнем
· квота относительного изменения признака:
Несмотря на то, что второй показатель, считается более надежным его можно использовать только для расчетов по моментным рядам, а все остальные показатели можно считать для всех видов рядов. Однако, темпы роста (главным образом, цепные) у смежных рядов нужно уточнить. Рассмотренные показатели (кроме квот) - это уровневые показатели; для динамических рядов определяются и обобщающие показатели:
· итоговое базисное абсолютное отклонение признака от начальной базы:
· среднегодовой абсолютный прирост - это отношение полного абсолютного базисного прироста к числу моментов (периодов) динамических рядов
где n- число цепных абсолютных приростов в изучаемом периоде.
· среднегодовой темп роста:
где, ti - цепной темп роста, а n - число членов ряда.
Эта формула применима для замкнутых динамических рядов.
1.4 Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами
динамический ряд корреляция вариация
По характеру связи таблицы исходной информации делятся на три вида:
· балансовые, когда уровни признака-функции формируются из уровней признаков-факторов;
· аналитические, когда уровни признака-функции и уровни отдельных признаков-факторов связаны аналитически;
· комбинационные, когда уровни признака-функции связаны аналитически с несколькими признаками-факторами.
Балансовая связь между признаком-функцией и признаками-факторами в исходной таблице может быть полной, представительной и частичной.
В данном случае по характеру связи таблица исходной информации является балансовой, т.к. уровни признака-функции формируются из уровней признаков-факторов. Имеет место представительная балансовая связь, т.к. выполняется выражение:
,
где, i - индекс признака-фактора, i=1,2,…,n; m - число изучаемых признаков-факторов, mn, yt и xt - ежегодные уровни признака-функции и признака-фактора соответственно.
В нашем случае:
y- функциональный признак - объем бурения равен 3512600 метров
x1, x2, x3, x4-факториальные признаки, где x4 является внутренней сводкой x3
x1 - цветные металлы, 1519500 метров;
x2 - черные металлы, 346700 метров;
x3 - неметаллы, 1208800 метров;
x4 - химическое сырье, 793000 метров;
В нашем случае получили неравенство , которое удовлетворяет условиям формулы (1.4.17).
Таким образом, можно сделать вывод, что исходная информация качественная, следовательно, динамические ряды, ее формирующие, можно рассматривать как операционное поле последующего анализа.
Воспользуемся программой «ELVIS», исходная таблица может быть заменена матрицей:
Таблица 2
Исходные данные
--N------Y----------X1---------X2---------X3---------X4---
1. 15500.0 7100.0 1450.0 5250.0 3700.0
2. 15670.0 7150.0 1480.0 5510.0 3530.0
3. 16010.0 7230.0 1520.0 5670.0 3690.0
4. 16200.0 7280.0 1580.0 5710.0 3730.0
5. 16800.0 7410.0 1610.0 5480.0 4300.0
6. 16850.0 7450.0 1630.0 5620.0 4170.0
7. 17170.0 7520.0 1670.0 5310.0 4670.0
8. 17400.0 7800.0 1820.0 5750.0 4030.0
9. 17750.0 7820.0 1740.0 5810.0 4380.0
10. 17900.0 7860.0 1800.0 5990.0 4250.0
11. 18000.0 7510.0 1760.0 5730.0 4590.0
12. 17850.0 7730.0 1790.0 5870.0 4460.0
13. 17930.0 7750.0 1810.0 5980.0 4270.0
14. 18100.0 7820.0 1840.0 6330.0 4110.0
15. 18170.0 7710.0 1700.0 6940.0 3720.0
16. 18600.0 7770.0 1870.0 6280.0 2990.0
17. 18730.0 7810.0 1900.0 6540.0 3480.0
18. 19100.0 7800.0 1930.0 7010.0 3690.0
19. 18840.0 7730.0 1900.0 7130.0 3730.0
20. 18690.0 7700.0 1870.0 6970.0 3810.0
2. Расчет показателей вариации динамических рядов
После того, как мы ввели все исходные данные в программу, она посчитала нам показатели динамических рядов для всех признаков:
Таблица 3
Показатели по 1-му признаку :
Признак Абсолютные Темпы Темпы Цепные темпы
N1 разности роста прироста роста
15500.0 ------ 1.000 .000 -----
15670.0 170.0 1.011 .011 1.011
16010.0 340.0 1.033 .033 1.022
16200.0 190.0 1.045 .045 1.012
16800.0 600.0 1.084 .084 1.037
16850.0 50.0 1.087 .087 1.003
17170.0 320.0 1.108 .108 1.019
17400.0 230.0 1.123 .123 1.013
17750.0 350.0 1.145 .145 1.020
17900.0 150.0 1.155 .155 1.008
18000.0 100.0 1.161 .161 1.006
17850.0 -150.0 1.152 .152 .992
17930.0 80.0 1.157 .157 1.004
18100.0 170.0 1.168 .168 1.009
18170.0 70.0 1.172 .172 1.004
18600.0 430.0 1.200 .200 1.024
18730.0 130.0 1.208 .208 1.007
19100.0 370.0 1.232 .232 1.020
18840.0 -260.0 1.215 .215 .986
18690.0 -150.0 1.206 .206 .992
Таблица 4
Показатели по 2-му признаку :
Признак Абсолютные Темпы Темпы Цепные темпы
N2 разности роста прироста роста
7100.0 ------ 1.000 .000 -----
7150.0 50.0 1.007 .007 1.007
7230.0 80.0 1.018 .018 1.011
7280.0 50.0 1.025 .025 1.007
7410.0 130.0 1.044 .044 1.018
7450.0 40.0 1.049 .049 1.005
7520.0 70.0 1.059 .059 1.009
7800.0 280.0 1.099 .099 1.037
7820.0 20.0 1.101 .101 1.003
7860.0 40.0 1.107 .107 1.005
7510.0 -350.0 1.058 .058 .955
7730.0 220.0 1.089 .089 1.029
7750.0 20.0 1.092 .092 1.003
7820.0 70.0 1.101 .101 1.009
7710.0 -110.0 1.086 .086 .986
7770.0 60.0 1.094 .094 1.008
7810.0 40.0 1.100 .100 1.005
7800.0 -10.0 1.099 .099 .999
7730.0 -70.0 1.089 .089 .991
7700.0 -30.0 1.085 .085 .996
Таблица 5
Показатели по 3-му признаку :
Признак Абсолютные Темпы Темпы Цепные темпы
N3 разности роста прироста роста
1450.0 ------ 1.000 .000 -----
1480.0 30.0 1.021 .021 1.021
1520.0 40.0 1.048 .048 1.027
1580.0 60.0 1.090 .090 1.039
1610.0 30.0 1.110 .110 1.019
1630.0 20.0 1.124 .124 1.012
1670.0 40.0 1.152 .152 1.025
1820.0 150.0 1.255 .255 1.090
1740.0 -80.0 1.200 .200 .956
1800.0 60.0 1.241 .241 1.034
1760.0 -40.0 1.214 .214 .978
1790.0 30.0 1.234 .234 1.017
1810.0 20.0 1.248 .248 1.011
1840.0 30.0 1.269 .269 1.017
1700.0 -140.0 1.172 .172 .924
1870.0 170.0 1.290 .290 1.100
1900.0 30.0 1.310 .310 1.016
1930.0 30.0 1.331 .331 1.016
1900.0 -30.0 1.310 .310 .984
1870.0 -30.0 1.290 .290 .984
Таблица 6
Показатели по 4-му признаку :
Признак Абсолютные Темпы Темпы Цепные темпы
N4 разности роста прироста роста
Признак Абсолютные Темпы Темпы Цепные темпы
N4 разности роста прироста роста
5250.0 ------ 1.000 .000 -----
5510.0 260.0 1.050 .050 1.050
5670.0 160.0 1.080 .080 1.029
5710.0 40.0 1.088 .088 1.007
5480.0 -230.0 1.044 .044 .960
5620.0 140.0 1.070 .070 1.026
5310.0 -310.0 1.011 .011 .945
5750.0 440.0 1.095 .095 1.083
5810.0 60.0 1.107 .107 1.010
5990.0 180.0 1.141 .141 1.031
5730.0 -260.0 1.091 .091 .957
5870.0 140.0 1.118 .118 1.024
5980.0 110.0 1.139 .139 1.019
6330.0 350.0 1.206 .206 1.059
6940.0 610.0 1.322 .322 1.096
6280.0 -660.0 1.196 .196 .905
6540.0 260.0 1.246 .246 1.041
7010.0 470.0 1.335 .335 1.072
7130.0 120.0 1.358 .358 1.017
6970.0 -160.0 1.328 .328 .978
Таблица 7
Показатели по 5-му признаку:
Признак Абсолютные Темпы Темпы Цепные темпы
N5 разности роста прироста роста
3700.0 ------ 1.000 .000 -----
3530.0 -170.0 .954 -.046 .954
3690.0 160.0 .997 -.003 1.045
3730.0 40.0 1.008 .008 1.011
4300.0 570.0 1.162 .162 1.153
4170.0 -130.0 1.127 .127 .970
4670.0 500.0 1.262 .262 1.120
4030.0 -640.0 1.089 .089 .863
4380.0 350.0 1.184 .184 1.087
4250.0 -130.0 1.149 .149 .970
4590.0 340.0 1.241 .241 1.080
4460.0 -130.0 1.205 .205 .972
4270.0 -190.0 1.154 .154 .957
4110.0 -160.0 1.111 .111 .963
3720.0 -390.0 1.005 .005 .905
2990.0 -730.0 .808 -.192 .804
3480.0 490.0 .941 -.059 1.164
3690.0 210.0 .997 -.003 1.060
3730.0 40.0 1.008 .008 1.011
3810.0 80.0 1.030 .030 1.021
Как уже было упомянуто выше, исходная информация качественная, и поэтому на ее основе можно проводить анализ.
2.1 Исследование исходных динамических рядов на непрерывность
Статистический анализ выполняется для непрерывных динамических рядов. Непрерывность ряда является необходимым условием комплексного анализа динамических рядов. Поэтому до начала анализа необходимо исходные динамические ряды проверить на непрерывность. Для этого рассчитываются ряды цепных темпов роста в пределах каждого динамического ряда (в нашем случае это сделала компьютерная программа).
Ряд считается непрерывным, если значения цепных темпов роста (ti) удовлетворяют следующим условиям: (2.1.18) для количественных признаков и (2.1.19) для качественных признаков.
Так как у нас в исходных данных даны количественные признаки, то мы применяем формулу 2.1.18. Как видно из приведенных выше показателей значения цепных темпов роста для всех признаков удовлетворяют условию (2.1.18), следовательно, эти ряды непрерывны, поэтому можно проводить анализ.
2.2 Характеристика динамики признака-функции и признаков-факторов
Динамика может быть растущей или убывающей, а характер - спокойный, пульсивный, равномерный. Кроме того, выделяются зоны интенсивной динамики (растущей или убывающей).
Направленность динамики ряда определяется двояко: визуально и расчетным способом. Визуальное определение предполагает сопоставление крайних (последнего и начального) уровней ряда. Второй способ сопряжен с расчетом среднегодовых темпов роста () в пределах изучаемого периода. При растущей динамике >1, при убывающей <1.
Программа определила направленность динамических рядов:
Определение направленности динамических рядов :
По крайним уровням ряда :
Направленность 1-го признака растущая.
Направленность 2-го признака растущая.
Направленность 3-го признака растущая.
Направленность 4-го признака растущая.
Направленность 5-го признака растущая.
По цепным темпам роста :
Средний цепной темп роста по 1-му признаку равен 1.0099
Динамика растущая.
Средний цепной темп роста по 2-му признаку равен 1.0043
Динамика растущая.
Средний цепной темп роста по 3-му признаку равен 1.0135
Динамика растущая.
Средний цепной темп роста по 4-му признаку равен 1.0150
Динамика растущая.
Средний цепной темп роста по 5-му признаку равен 1.0015
Динамика растущая.
Для выявления характера динамики составляется таблица абсолютных разностей, каждый уровень которой равен разности двух соседних уровней исходных рядов признака-фукнции и признаков-факторов. В пределах каждого из столбцов этой таблицы следует выделить точки «перегиба» признака. Последние регистрируют возрастание соседних абсолютных разностей более, чем в 2 раза, или изменение знака абсолютных разностей на обратный.
Программа посчитала абсолютные разности (таблица 8):
Таблица 8
Таблица абсолютных разностей с указанием точек перегиба.
(единица под числом - перегиб, ноль - его отсутствие.)
--N------Y----------X1---------X2---------X3---------X4---
1. 170.0 50.0 30.0 260.0 -170.0
1 1 0 1 1
2. 340.0 80.0 40.0 160.0 160.0
1 1 1 1 1
3. 190.0 50.0 60.0 40.0 40.0
1 1 1 1 1
4. 600.0 130.0 30.0 -230.0 570.0
1 1 1 1 1
5. 50.0 40.0 20.0 140.0 -130.0
1 1 1 1 1
6. 320.0 70.0 40.0 -310.0 500.0
0 1 1 1 1
7. 230.0 280.0 150.0 440.0 -640.0
1 1 1 1 1
8. 350.0 20.0 -80.0 60.0 350.0
1 1 1 1 1
9. 150.0 40.0 60.0 180.0 -130.0
1 1 1 1 1
10. 100.0 -350.0 -40.0 -260.0 340.0
1 1 1 1 1
11. -150.0 220.0 30.0 140.0 -130.0
1 1 1 0 0
12. 80.0 20.0 20.0 110.0 -190.0
1 1 1 1 0
13. 170.0 70.0 30.0 350.0 -160.0
1 1 1 1 1
14. 70.0 -110.0 -140.0 610.0 -390.0
1 1 1 1 1
15. 430.0 60.0 170.0 -660.0 -730.0
1 1 1 1 1
16. 130.0 40.0 30.0 260.0 490.0
1 1 0 1 1
17. 370.0 -10.0 30.0 470.0 210.0
1 1 1 1 1
18. -260.0 -70.0 -30.0 120.0 40.0
1 1 0 1 1
19. -150.0 -30.0 -30.0 -160.0 80.0
По таблице абсолютных разностей необходимо рассчитать число точек «перегиба» по столбцам и их долю в объеме каждого исходного ряда (20 уровней). Кроме того, необходимо указать количество совпадений точек «перегиба» для каждого из признаков-факторов с признаком-функцией, определить долю этих совпадений в общем числе точек «перегиба» у признака-функции. Если доля точек «перегиба» превышает 50% объема ряда, то это указывает на пульсивный характер динамики. В остальных случаях имеет место спокойная или равномерная (реже) динамика. Последняя характеризуется относительно устойчивыми значениями абсолютных разностей. Спокойной динамике соответствуют следующие значения среднегодовых темпов прироста (): 1-3% для количественных признаков и 0,5-1,5% для качественных.
По данным таблицы программа определила точки перегиба, и количество совпадений этих точек:
Количество перегибов и их доля :
В 1-м столбце число перегибов равно : 17
Доля перегибов в этом столбце равна : 85.0%
Динамика пульсивна.
В 2-м столбце число перегибов равно : 18
Доля перегибов в этом столбце равна : 90.0%
Динамика пульсивна.
В 3-м столбце число перегибов равно : 15
Доля перегибов в этом столбце равна : 75.0%
Динамика пульсивна.
В 4-м столбце число перегибов равно : 17
Доля перегибов в этом столбце равна : 85.0%
Динамика пульсивна.
В 5-м столбце число перегибов равно : 16
Доля перегибов в этом столбце равна : 80.0%
Динамика пульсивна.
Количество совпадений и их доля :
Количество совпадений в 1-м и 2-м столбцах равно 17
Доля совпадений в этих столбцах равна : 100.0%
Количество совпадений в 1-м и 3-м столбцах равно 14
Доля совпадений в этих столбцах равна : 82.4%
Количество совпадений в 1-м и 4-м столбцах равно 16
Доля совпадений в этих столбцах равна : 94.1%
Количество совпадений в 1-м и 5-м столбцах равно 15
Доля совпадений в этих столбцах равна : 88.2%
При пульсивной динамике важно установить жесткость динамики признака-функции и каждого из признаков-факторов. Только при наличии жесткой связи можно говорить о надежности информационного поля. Важно отметить, что все признаки-факторы имеют жесткую связь с признаком-функцией, т.к. процент совпадения точек перегиба признаков-факторов и признака-функции велик.
Программа определила жесткость динамической связи для всех признаков:
Оценка жесткости динамической связи :
1-й признак-фактор имеет жесткую динамическую
связь с признаком-функцией.
2-й признак-фактор имеет жесткую динамическую
связь с признаком-функцией.
3-й признак-фактор имеет жесткую динамическую
связь с признаком-функцией.
4-й признак-фактор имеет жесткую динамическую
связь с признаком-функцией.
В пределах нашего поля важно выявить еще один момент: сонаправленность рядов признаков-факторов с признаком-функцией. Это условие переводит информационное поле в поле регрессии.
Мы видим, что динамика признака-функции и динамики признаков-факторов растущие, это свидетельствует о сонаправленности признака-функции с признаками факторами.
Кроме того, программа посчитала нам средние цепные темпы роста по всем признакам:
По цепным темпам роста :
Средний цепной темп роста по 1-му признаку равен 1.0099
Динамика растущая.
Средний цепной темп роста по 2-му признаку равен 1.0043
Динамика растущая.
Средний цепной темп роста по 3-му признаку равен 1.0135
Динамика растущая.
Средний цепной темп роста по 4-му признаку равен 1.0150
Динамика растущая.
Средний цепной темп роста по 5-му признаку равен 1.0015
Динамика растущая.
Все их значения превышают единицу, что также говорит нам о сонаправленности признака-функции с признаками-факторами.
Можем сделать вывод о том, что наше поле является полем регрессии.
2.3 Представительность признаков
Динамические ряды очерчивают нам поле регрессии, следовательно, статистические данные подвержены анализу. Этапы анализа, предшествующие этому моменту, ограничивались сопоставлением каждого признака в отдельности. Остальные этапы анализа выполняются в границах поля регрессии, т.е. для тех динамических рядов, которые это поле образуют.
Системный анализ включает в себя:
· Ранжирование признаков-факторов по представительности (по объему признака);
· Расчет оценочного показателя вариации и ранжирование признаков-факторов по нему;
· Проведение анализа парной корреляции;
· Построение уравнения множественной регрессии.
В зависимости от характера связи между подлежащим и сказуемым таблицы исходной информации по-разному определяется представительность (значимость) признаков-факторов по их влиянию на динамику признака-функции. При балансовой связи признаки-факторы, сонаправленные с признаком-функцией, ранжируются по их представительности, исходя из удельного веса их средней функции.
Рассчитаем соответствующие относительные величины.
Удельный вес признака Х1 в Y составляет 43,26%;
Х2 в Y составляет 9,87%;
Х3 в Y составляет 34,41%;
X4 в Y составляет 22,58%.
Таким образом, если произвести ранжирование признаков по представительности, получим:
Х1 - 43,26%;
Х3 - 34,41%;
Х4 -22,58%;
Х2 - 9,87%.
3. Расчет показателей вариации динамических рядов
Вторым критерием отбора признаков для построения уравнения множественной регрессии является вариация. Поэтому необходимо проверить признаки на вариабельность.
3.1 Теоретическая справка о показателях вариации
Вариация - отклонение индивидуальных значений признака в вариационном ряду от принятой базы - линии тренда, плановый уровень (нормативный), средние.
В экономической статистике за базу оценки вариации принимается средняя - модуль средней или устойчивая средняя.
Изучение вариации признаков в экономической статистике подчинено двум основным целям:
· оценка вариабельности (устойчивости) признака;
· оценка однородности совокупности по изучаемому признаку.
Вариацией называется наличие различий в индивидуальных значениях признака у единиц совокупности.
Показатели вариации оценивают изменение признака в ряду распределения. Базой для расчета этих показателей выступает статистическая средняя (обобщающая (типическая) характеристика явления по одному количественному признаку), рассчитывающаяся как среднее арифметическое.
В экономической статистике применяются следующие показатели вариации:
1.среднее линейное отклонение - показатель измерения вариации в достаточно однородных совокупностях, поэтому его использование весьма ограничено.
Если под знаком суммы будет стоять не абсолютная величина разности между индивидуальным значением признака и средней, а ее квадрат, то будет иметь место другой показатель, который называется средний квадрат отклонения или дисперсия
2.средний квадрат отклонения (дисперсия) - показатель, нивелирующий незначительные колебания в значениях признака, тем самым, исключая анализ сторонних влияний на признак, поэтому часто используется для оценки вариации.
Если извлечь корень из дисперсии, то получим среднее квадратическое отклонение.
3.Среднее квадратичное отклонение регистрирует интервал колебания признака.
где xi - значение признака i-той группы; - среднее значение признака в исследуемой совокупности; n - число единиц совокупности; fi - число единиц i-той группы (частота или частость).
4.Коэффициент вариации от среднего линейного отклонения - относительная величина, использующаяся для оценки вариации и обеспечивающая высокую эффективность анализа.
5.Коэффициент вариации от среднего квадратичного отклонения
Каждый из приведенных выше показателей имеет свою специфику использования.
Среднее линейное отклонение редко используется в статистике для анализа, так как этот показатель ограничен в своем применении, может использоваться только в однородных совокупностях (отклонение от смежного уровня не более 15-20%).
Дисперсия очень широко применяется при анализе вариации. Этот показатель не учитывает мелкие колебания признака, то есть учитывает влияние лишь постоянных факторов. Дисперсия служит также для оценки устойчивости изучаемой совокупности.
Среднее квадратическое отклонение является наиболее часто применяемым показателем для оценки вариации, так как оно регистрирует интервал колебания признака.
Из всех приведенных показателей самыми надежными являются коэффициенты вариации, так как они являются относительными величинами, то есть отражают качество изучаемых процессов.
3.2 Расчет показателей вариации динамических рядов
Для каждого признака программа посчитала показатели вариации.
Показатели вариации для 1-го признака :
Минимальное значение .155000E+05
Максимальное значение .191000E+05
Размах вариации .360000E+04
Среднее по признаку .175630E+05
Среднее линейное отклонение .890400E+03
Дисперсия .111472E+07
Ср-квадратическое отклонение .105580E+04
Козффициент вариации .506975E+01
Лин.коэффициент вариации .601152E+01
Коэффициент осцилляции .204976E+02
Показатели вариации для 2-го признака :
Минимальное значение .710000E+04
Максимальное значение .786000E+04
Размах вариации .760000E+03
Среднее по признаку .759750E+04
Среднее линейное отклонение .213000E+03
Дисперсия .580288E+05
Ср-квадратическое отклонение .240892E+03
Козффициент вариации .280355E+01
Лин.коэффициент вариации .317067E+01
Коэффициент осцилляции .100033E+02
Показатели вариации для 3-го признака :
Минимальное значение .145000E+04
Максимальное значение .193000E+04
Размах вариации .480000E+03
Среднее по признаку .173350E+04
Среднее линейное отклонение .122800E+03
Дисперсия .204628E+05
Ср-квадратическое отклонение .143048E+03
Козффициент вариации .708393E+01
Лин.коэффициент вариации .825198E+01
Коэффициент осцилляции .276896E+02
Показатели вариации для 4-го признака :
Минимальное значение .525000E+04
Максимальное значение .713000E+04
Размах вариации .188000E+04
Среднее по признаку .604400E+04
Среднее линейное отклонение .489200E+03
Дисперсия .331854E+06
Ср-квадратическое отклонение .576068E+03
Козффициент вариации .809398E+01
Лин.коэффициент вариации .953123E+01
Коэффициент осцилляции .311052E+02
Показатели вариации для 5-го признака :
Минимальное значение .299000E+04
Максимальное значение .467000E+04
Размах вариации .168000E+04
Среднее по признаку .396500E+04
Среднее линейное отклонение .358000E+03
Дисперсия .172485E+06
Ср-квадратическое отклонение .415313E+03
Козффициент вариации .902900E+01
Лин.коэффициент вариации .104745E+02
Коэффициент осцилляции .423707E+02
Для системного анализа в рамках поля регрессии критериальными показателями регрессии принимается (для количественных признаков) линейный коэффициент вариации.
Как видно из вышеперечисленных показателей вариации, которые рассчитала для нас программа, наиболее устойчивым является признак Х1. Значение линейного коэффициента вариации равно 6,01%. Самым вариабельным является Х4, значение коэффициента линейной вариации которого равно 10,47%. Таким образом, если выполнить ранжирование признаков по вариабельности от самого устойчивого к самому вариабельному (неустойчивому), то получим:
Х1-6,01 %
Х2-8,25 %
Х3-9,53 %
Х4-10,47 %
4. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции
Этот анализ выполняется для всех видов связи (кроме полной балансовой связи) между признаком-функцией и признаками-факторами. Данный анализ и является третьим критерием отбора признаков для построения уравнения множественной регрессии.
Количественное измерение тесноты связи осуществляется последовательно для каждого из признаков-факторов по мере уменьшения их значимости (представительности).
4.1 Теоретическая справка о парной корреляции
Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и от поставленных задач. Связи между признаками и явлениями ввиду их большого разнообразия классифицируют по ряду оснований.
По характеру зависимости признаков различают:
· Функциональную (полную) связь;
· Корреляционную (неполную) связь.
Корреляционная связь - важнейший частный случай статистической связи, состоящий в том, что это связь, при которой определенному значению факторного признака соответствует лишь среднее значение результативного признака, т.е. что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение признака у; в то время как в каждом отдельном случае значение признака у (с различными вероятностями) может принимать множество различных значений.
Связь между двумя признаками (результативным и факторным или двумя факторными) называется парной корреляцией.
Зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков - это частная корреляция.
Зависимость же результативного и двух или более факторных признаков, включенных в исследование, называется множественной корреляцией.
Регрессия в теории вероятностей и математической статистике, зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости у = f(х), когда каждому значению независимой переменной х соответствует одно определённое значение величины у, при регрессионной связи одному и тому же значению х могут соответствовать в зависимости от случая различные значения величины у.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Теснота связи количественно выражается величиной коэффициентов корреляции.
Регрессивный анализ заключается в определении аналитического выражения связи, в котором изменение результативного признака обуславливается влиянием одного или нескольких факторных признаков, а множество всех прочих факторов применяется за постоянные (или усредненные) величины.
Корреляционно-регрессивный анализ включает в себя измерение тесноты и направления связи, а также установление аналитического выражения (формы) связи.
Теснота парной линейной корреляционной связи, как и любой другой показатель, может быть измерена корреляционным отношением . Кроме того, при линейной корреляционной форме уравнения применяется другой показатель тесноты связи - коэффициент корреляции :
(4.1.25)
Обычно считают связь сильной, если r0,7; средней тесноты, при 0,5r0,7; слабой, при r < 0.5.
Коэффициент парной корреляции характеризует наличие линейной связи между двумя переменными.
Корреляционное поле и корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость выборочных точек получают корреляционное поле. По характеру расположения точек поля можно составить предварительное мнение о форме зависимости случайных величин (например, о том, что одна величина в среднем возрастает или убывает при возрастании другой). Для численной обработки результаты обычно группируют и представляют в форме корреляционной таблицы.
Коэффициент корреляции и корреляционное отношение дают более точную информацию о характере и силе связи, чем картина корреляционного поля.
4.2 Исследование коэффициентов парной корреляции
Итак, коэффициент корреляции - наиболее существенный критерий надежности регрессионного поля. Программа выполнила расчет коэффициентов парной корреляции для всех признаков:
Расчет коэффициентов парной корреляции :
Промежуточные цифры для 1-й пары признаков :
Среднее по признаку-функции : .175630E+05
Среднее по признаку-фактору : .759750E+04
Среднее по их произведению : .133661E+09
Отклонение признака-функции : .105580E+04
Отклонение признака-фактора : .240892E+03
Коэффициент парной корреляции : .888420E+00
Промежуточные цифры для 2-й пары признаков :
Среднее по признаку-функции : .175630E+05
Среднее по признаку-фактору : .173350E+04
Среднее по их произведению : .305907E+08
Отклонение признака-функции : .105580E+04
Отклонение признака-фактора : .143048E+03
Коэффициент парной корреляции : .961749E+00
Промежуточные цифры для 3-й пары признаков :
Среднее по признаку-функции : .175630E+05
Среднее по признаку-фактору : .604400E+04
Среднее по их произведению : .106647E+09
Отклонение признака-функции : .105580E+04
Отклонение признака-фактора : .576068E+03
Коэффициент парной корреляции : .815298E+00
Промежуточные цифры для 4-й пары признаков :
Среднее по признаку-функции : .175630E+05
Среднее по признаку-фактору : .396500E+04
Среднее по их произведению : .696165E+08
Отклонение признака-функции : .105580E+04
Отклонение признака-фактора : .415313E+03
Коэффициент парной корреляции : -.474881E-01
Полученные коэффициенты парной корреляции :
.888420E+00
.961749E+00
.815298E+00
-.474881E-01
Таким образом мы видим, что наиболее надежной является связь признака-функции Y с признаком-фактором Х2. Знак перед коэффициентом корреляции говорит о прямой или обратной связи между признаком-функцией и признаком-фактором. Соответственно, если знак «+» связь прямая, если «-» - обратная, что находит свое отражение при последующем отборе признаков для построения уравнения множественной регрессии (т.к. нельзя брать признаки, имеющие коэффициенты с разными знаками).
Анализируя данную таблицу, можем сказать, что имеет место не только прямая, но и обратная связь, так как один из коэффициентов имеет отрицательный знак. Отметим, что признак-фактор X4, имеющий отрицательное значение, не используется при составлении уравнения множественной регрессии.
Произведем ранжирование по коэффициенту парной корреляции:
Х2 (коэффициент парной корреляции = 0,96)
Х1 (коэффициент парной корреляции = 0,88)
Х3 (коэффициент парной корреляции = 0,81)
Х4 (коэффициент парной корреляции = -0,05)
5. Построение уравнение многофакторной корреляционной связи
5.1 Теоретическая справка о множественной регрессии
Общее назначение множественной регрессии состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях.
Статическая модель, представленная уравнением регрессии с несколькими переменными величинами, называется многофакторной моделью или множественной регрессией.
Двумя наиболее важными этапами построения многофакторных моделей являются:
· выбор формы связи (уравнения регрессии);
· отбор факторных признаков.
Наиболее приемлемым способом выбора формы связи, то есть вида исходного уравнения, является метод перебора различных уравнений.
Для оценки тесноты множественных корреляционных связей применяются линейный коэффициент множественной корреляции и теоретическое множественное корреляционное отношение.
Уравнение прямой линии записывается следующим образом: , где а - это константа(по-другому свободный член), b - это угловой коэффициент(по-другому регрессионный коэффициент или B-коэффициент). Таким образом, чтобы найти (предсказать) переменную Y, мы должны значение переменной X умножить на B-коэффициент и добавить константу а. Но это простейший двухмерный случай, когда мы имеем одну независимую переменную X, в случае если у нас несколько предикторов, то уравнение регрессии записывается следующим образом:
(5.1.26)
Это уравнение должно описывать связь между признаком-функцией и двумя наиболее результативными из числа признаков-факторов. Для построения уравнения важно определить характер связи (линейная или нелинейная) между признаком-функцией и выделенными признаками-факторами. Это устанавливается при сопоставлении коэффициента парной корреляции и корреляционного отношения для исходных и выпрямленных рядов указанных признаков-факторов. Полная балансовая связь имеет линейный характер.
Если значения указанных коэффициентов имеют одинаковый знак и корректны, то это подтверждает линейный характер связи.
5.2 Построение уравнения множественной регрессии
Итак, после проделанного анализа выбираем два наиболее подходящих признака. Признаки, по которым должно быть построено уравнение выбираются на основе рассчитанных линейных коэффициентов вариации - по минимальному значению, либо по максимальным значениям коэффициентов парной корреляции. А также по долевому представительству в средней функции.
Ими являются признак Х1, который подходит по всем показателям: он обладает наибольшей представительностью, у него максимальный коэффициент вариации и большой коэффициент парной корреляции (после признака Х2); и признак Х3: так его коэффициент парной корреляции практически такой же, как у признака Х2 . Мы не учитываем признак Х4, так как он имеет отрицательный знак при коэффициенте парной корреляции, а, следовательно, он выпадает. Признак Х2 так же может быть использован, но не желателен для построения уравнения множественной регрессии, так как, несмотря на самый большой коэффициент парной корреляции, он обладает наименьшей представительностью
Для построения уравнения множественной регрессии необходимо найти коэффициенты регрессии. Нам необходимо построить модель уравнения множественной регрессии по выбранным нами признакам: Х1 и Х3. С помощью программы определим коэффициенты регрессии (b) для уравнения, которое характеризует, в какой мере увеличивается функция Y с ростом на единицу величины X.
Программа посчитала для этих признаков коэффициенты регрессии:
Для пары признаков Х1 и Х3 получили следующие коэффициенты регрессии:
Коэффициенты регрессии :
---------------------------
| Kn | Значение |
---------------------------
| b1 | -.792277E+04 |
---------------------------
| b2 | .272678E+01 |
---------------------------
| b3 | .789059E+00 |
---------------------------
Расчет абсолютной ошибки :
Итерация равна : 64
Абсолютная ошибка равна : .923357E+03
Относительная ошибка равна : 5.13%
Расчет произведен по 11-му уровню.
Ошибка не превышает регламента.
Имитация явления данным уравнением надежна.
Подставим найденные коэффициенты в уравнение вида:
(5.2.27)
(5.2.28)
Произведем расчет относительной ошибки по пятому контрольному уровню:
Определенная по пятому контрольному уровню ошибка, которая равна 0,65%, не превышает регламента, что говорит о надежности поля регрессии и о справедливости учета нами линейной связи.
Поэтому, можно сделать вывод о том, что уравнение, составленное по признакам Х1 и Х3 полностью удовлетворяет всем поставленным условиям.
Данное уравнение имеет вид:
Заключение
Таким образом, в данной курсовой работе был проведен качественный и количественный анализ таблицы исходных динамических рядов, выполнено ранжирование признаков-факторов по их долевому представительству в средней функции и коэффициентам вариации, произведено количественное измерение тесноты связи между динамикой признака-функции и определенного числа признаков-факторов методом парной корреляции, а так же было построено уравнение множественной регрессии.
Полученное уравнение является корректным и надёжно имитирует динамику признака - функции, так как относительная ошибка не превышает допустимый регламент.
Список литературы
1) Скобелина В.П., Лебедева Е.П., Якшин А.В.// Статистика. Метод. указания к курсовой работе.// - СПб.:СПбГГИ, 1999.
2) Елисеева И.И., Юзбашев М.М. //Общая теория статистики. // - Москва: Финансы и статистика, 2001.
Размещено на Allbest.ru
Подобные документы
Анализ динамических рядов и выбор исходных данных. Графическое представление динамического ряда, расчет показателей изменения уровней динамических рядов и средних показателей. Периодизация динамических рядов и анализ основной тенденции динамики ряда.
курсовая работа [2,8 M], добавлен 16.09.2010Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.
курсовая работа [1,4 M], добавлен 22.11.2013Методика проведения анализа динамических рядов социально-экономических явлений. Компоненты, формирующие уровни при анализе рядов динамики. Порядок составления модели экспорта и импорта Нидерландов. Уровни автокорреляции. Корреляция рядов динамики.
курсовая работа [583,6 K], добавлен 13.05.2010Проведение расчета абсолютных, относительных, средних величин, коэффициентов регрессии и эластичности, показателей вариации, дисперсии, построение и анализ рядов распределения. Характеристика аналитического выравнивания цепных и базисных рядов динамики.
курсовая работа [351,2 K], добавлен 20.05.2010Расчет основных характеристик рядов динамики показателей денежного обращения в России. Выявление тенденций показателей денежного обращения на основе метода аналитического выравнивания и прогнозирования. Построение динамических регрессионных моделей.
курсовая работа [322,9 K], добавлен 23.10.2014Статистический анализ рядов динамики. Показатели изменения уровней ряда динамики. Связный анализ рядов динамики. Корреляционный анализ рядов динамики. Элементы интерполяции и экстраполяции. Встроенные функции MS Excel для анализа рядов динамики.
курсовая работа [1,0 M], добавлен 17.12.2015Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.
контрольная работа [712,1 K], добавлен 30.03.2014Анализ рядов распределения, их графическое изображение. Оценка дисперсии альтернативного признака. Расчет индивидуальных индексов цен по методикам Пааше и Лайпейреса. Исчисление предельной ошибки выборки для генеральной средней или генеральной доли.
контрольная работа [87,0 K], добавлен 17.10.2010Оценка силы вариации признака. Построение регрессионной модели. Парный линейный коэффициент корреляции. Оценка статистической надежности результатов. Значение коэффициента детерминации. Оценка силы связи признаков. Фактическое значение критерия Фишера.
контрольная работа [165,8 K], добавлен 27.05.2015Аналитическая группировка по факторному признаку. Построение вариационного частотного и кумулятивного рядов распределения на основе равно интервальной структурной группировки результативного признака – дивидендов, начисленных по результатам деятельности.
контрольная работа [109,4 K], добавлен 07.05.2009