Математические методы статистики
Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 11.01.2012 |
Размер файла | 179,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ОГЛАВЛЕНИЕ
Задание к курсовой работе
Введение
1 построение выборочной совокупности
1.1 построение интервального вариационного ряда по величине чистого капитала
1.2 построение графика
1.3 расчет показателей вариации
1.4 определение количественных характеристик распределения (показателей ассиметрии и эксцесса)
1.5 нахождение эмпирической функции, построение ее графика
1.6 определение теоретических частот по закону нормального распределения. Построение графиков
1.7 проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения
1.8 оценка параметров генеральной совокупности на основе выборочных данных
1.9 построение интервального вариационного ряда по величине прибыли
1.10 построение графика
1.11 определение количественных характеристик распределения (показателей асимметрии и эксцесса)
1.12 нахождение эмпирической функции, построение ее графика
1.13 определение теоретических частот по закону нормального распределения. Построение графиков
1.14 проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения.
1.15 оценка параметров генеральной совокупности на основе выборочных данных
2. Построение однофакторной модели взаимосвязи
2.1 отбор факторного и результативного признака модели
2.2 расчет парного коэффициента корреляции. Анализ зависимости между переменными
2.3 построение уравнения однофакторной регрессии с использованием метода наименьших квадратов
2.4 проверка значимости коэффициентов регрессии и коэффициента корреляции
Заключение
ЗАДАНИЕ К КУРСОВОЙ РАБОТЕ
1. По данным приложения 1 отберите 2-3 экономически связанных между собой показателя деятельности 200 крупнейших в России банков. Определите выборочную совокупность в количестве 30 банков, укажите и опишите способ отбора.
Проведите качественный анализ выборочной совокупности банков по отобранным показателям и исследуйте структуру данных показателей в следующей последовательности:
а) постройте интервальные вариационные ряды по каждому показателю, определив целесообразное количество групп;
б) по данным полученных рядов для каждого показателя постройте графики;
в) вычислите и проанализируйте среднюю арифметическую, моду и медиану, относительные и абсолютные показатели вариации;
г) определите количественные характеристики распределений (показатели асимметрии и эксцесса);
д) найдите эмпирическую функцию распределения и постройте ее график;
е) определите, теоретические частоты по закону нормального распределения и нанесите их на график;
ж) с помощью одного из математических критериев проверьте гипотезу о том, что изучаемые признаки подчиняются нормальному закону распределения;
з) определите границы, в которых с вероятностью 0,95 будет находиться среднее значение выбранных показателей в генеральной совокупности;
и) по каждому пункту сделайте выводы.
2. По данным экономических показателей деятельности коммерческих банков РФ, представленным в приложении 1, постройте однофакторную модель взаимосвязи, определите форму корреляционного уравнения и обоснуйте его выбор. С этой целью:
а) отберите факторный и результативный признаки для включения в регрессионную модель, предварительно оценив важность на основе логики экономического анализа;
б) рассчитайте парный коэффициент корреляции. Проанализируйте характер зависимости между переменными;
в) постройте уравнение однофакторной регрессии; Параметры уравнения определите методом наименьших квадратов;
г) проверьте значимость коэффициентов регрессии (а0, а1,) , а также коэффициента корреляции, на основе (-критерия Стьюдента).
д) по полученной модели рассчитайте теоретические значения.
е) сформулируйте выводы.
Задача может быть решена с использованием стандартных пакетов прикладных программ, реализованных на ЭВМ.
ВВЕДЕНИЕ
интервальный вариационный ряд мода
Статистический анализ выборочных данных является очень актуальной темой в наше время. Очень часто невозможно провести анализ по всей совокупности данных (любых данных) по причине их многочисленности. Либо анализ всей совокупности может занимать много времени. Для получения данных проводится анализ выборочных данных по этой совокупности.
В данном случае мы проводим выборочных анализ 30 банков из совокупности общей численностью 200 банков.
Целью данной работы является практическое закрепление теоретических данных статистического анализа вариационных рядов.
1. ПОСТРОЕНИЕ ВЫБОРОЧНОЙ СОВОКУПНОСТИ
По данным приложения 1 мы произвели выборку из 30 банков и выбрали 2 экономически связанных между собой показателя деятельности этих банков - чистые активы и прибыль. Выборка представлена в таблице 1.
Таблица 1
№пп |
Название банка |
Город |
Чистые активы |
Прибыль |
|
1 |
Национальный резервный банк |
Москва |
9911 |
645 |
|
2 |
Автобанк |
Москва |
6728 |
913 |
|
3 |
Мосбизнесбанк |
Москва |
8453 |
481 |
|
4 |
Газпромбанк |
Москва |
3649 |
265 |
|
5 |
Ситибанк Т/О |
Москва |
2728 |
258 |
|
6 |
Ростэсбанк |
Тольятти |
1255 |
243 |
|
7 |
Нижегородпромстрой- банк |
Н.Новгород |
764 |
179 |
|
8 |
АКБАРС |
Казань |
333 |
161 |
|
9 |
Российский капитал |
Москва |
949 |
8 |
|
10 |
Дальрыббанк |
Владивосток |
633 |
109 |
|
11 |
Желдорбанк |
Москва |
871 |
125 |
|
12 |
Восток-Запад |
Москва |
729 |
18 |
|
13 |
Зенит |
Москва |
1363 |
208 |
|
14 |
Прио-Внешторг-банк |
Рязань |
370 |
11 |
|
15 |
Кузбассоцбанк |
Кемерово |
704 |
19 |
|
16 |
Элбим-банк |
Москва |
439 |
8 |
|
17 |
Уралвнешторгбанк |
Екатеринбург |
550 |
83 |
|
18 |
Нефтяной |
Москва |
531 |
7 |
|
19 |
Интехбанк |
Казань |
232 |
23 |
|
20 |
Экономбанк |
Саратов |
443 |
29 |
|
21 |
АБН АМРО банк |
Москва |
1320 |
24 |
|
22 |
Федеральный депозитный банк |
Москва |
320 |
3 |
|
23 |
МБРР |
Москва |
582 |
9 |
|
24 |
Воронеж |
Воронеж |
368 |
29 |
|
25 |
Руссобанк |
Москва |
461 |
55 |
|
26 |
Орбита |
Москва |
185 |
1 |
|
27 |
Евросиббанк |
Москва |
275 |
23 |
|
28 |
Тольяттихимбанк |
Тольятти |
168 |
33 |
|
29 |
Сиф |
Якутск |
384 |
8 |
|
30 |
Банк Китая (ЭЛОС) |
Москва |
141 |
-8 |
|
Итого |
45839 |
3970 |
|||
Среднее значение |
1528,0 |
132,3 |
При произведении расчетов использовались стандартные пакеты прикладных программ, в частности Excel.
Способ отбора данных был следующий - из 200 банков выбрали каждый 6-ой банк начиная с 3-го по списку. Получился список из 33 банков. Из этого списка исключили каждый 11-ый банк. Получилась выборочная совокупность из 30 банков.
1.1 Построение интервального вариационного ряда по величине чистого капитала
Построим интервальный вариационный ряд распределения по величине чистого капитала
Для определения числа групп можно воспользоваться формулой Стерджесса:
,
где n - число групп;
N - число единиц в совокупности.
n = 1+3.322 lg30 = 5,90699 ? 6
Величина интервала определяется по формуле:
,
где Хmax - максимальное значение признака в ряду;
Xmin - минимальное значение признака в ряду.
Величина интервала для вариационного ряда распределения банков по величине чистых активов
H = (9911 - 141) / 6 = 1628,3 млн.руб.
В таблице 2 приведена группировка банков по величине чистых активов
Таблица 2
№ группы |
Величина чистых активов, млн.руб. |
Число банков, шт |
Средняя величина интервала, млн.руб. |
Общая величина чистых активов в группе, млн.руб. |
Средняя величина чистых активов в группе, млн.руб. |
|
1 |
141 - 1769,3 |
25 |
955,15 |
14370 |
574,8 |
|
2 |
1769 - 3397,6 |
1 |
2583,15 |
2583,15 |
2583,2 |
|
3 |
3397,6 - 5025,9 |
1 |
4211,75 |
3649 |
3649,0 |
|
4 |
5025,9 - 6654,2 |
0 |
0 |
0 |
- |
|
5 |
6654,2 -8282,5 |
1 |
7468,35 |
6728 |
6728,0 |
|
6 |
8282,5 - 9911 |
2 |
9096,65 |
18364 |
9182,0 |
|
Итого |
30 |
45694,15 |
1523,1 |
1.2 Построение графика
Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 1.
Гистограмма распределения банков по величине чистого капитала
Рис.1
В таблице 2 рассчитана средняя величина чистых активов по группировке.
Хср = 1 527,97 млн.руб.
Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной
, где
где xi -середина интервала усредняемого показателя;
n - число единиц (объем) совокупности;
fi - частота, которая показывает как часто встречается значение признака в статистической совокупности.
хср = 1877,84 млн.руб.
Однако средняя величина, рассчитанная в первом случае, является более точной и в последующих расчетах мы будем пользоваться ею.
1.3 Расчет показателей вариации
Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.
Мода - значение признака, которое наиболее часто встречается в ряду распределения. Для интервального ряда мода определяется по наибольшей частоте. Мода находится по формуле:
,
где x0 - нижняя (начальная) граница модального интервала;
k - величина интервала;
fMo - частота модального интервала;
fMo-1 - частота интервала, предшествующего модальному;
fMo+1 - частота интервала, следующего за модальным.
М0 = 141 + 1628,3*(25 - 0) / ((25 - 0) + (25 - 1)) = 971,77 млн.руб.
Медиана - значение признака, которое делит совокупность на две равные части, т.е. 50% единиц совокупности имеют значение меньше медианы, а остальные - больше медианы.
Для определения медианы рассчитывается ее порядковый номер по формуле:
= 31 / 2 = 15,5
где n - число единиц совокупности.
Затем рассчитывается накопленные частоты. После смотрят, какая из накопленных частот впервые превышает номер медианы.
Медиану рассчитывают по формуле:
,
где x0 - нижняя граница медианного интервала;
k - величина интервала;
?f = n - число единиц совокупности;
SMe-1 - накопленная частота (кумулятивная частота) интервала, предшествующего медианному;
fMe - медианная частота.
Ме = 141 + 1628,3 * (15 - 0) / 25 = 1117,98 млн.руб. - данная величина чистых активов находится в середине совокупности.
Степень близости данных отдельных единиц совокупности к средней величине измеряется рядом абсолютных и относительных показателей вариации.
К абсолютным показателям вариации относятся:
- размах вариации;
- среднее линейное отклонение;
- дисперсия;
- среднее квадратическое отклонение.
Размах вариации представляет собой разность между максимальным и минимальным значениями признака совокупности, и находится по формуле:
R = 9911 - 141 = 9770 млн.руб.
Среднее линейное отклонение представляет собой среднюю величину из отклонений значений признака от их средней величины, которое рассчитывается по формуле:
= 1688,6 млн.руб.
Так же среднее линейное отклонение можно рассчитать по формуле
В таблице 3 представлены дополнительные расчеты для исчисления показателей вариации
Таблица 3
№ группы |
Величина чистых активов, млн.руб. |
Число банков,шт, fi |
Средняя величина интервала, млн.руб. |
|х-хср| |
|х-хср|*fi |
(х-хср)2*fi |
|
1 |
141 - 1769,3 |
25 |
955,15 |
568,0 |
14199,71 |
8065268,67 |
|
2 |
1769 - 3397,6 |
1 |
2583,15 |
1060,0 |
1060,012 |
1123624,73 |
|
3 |
3397,6 - 5025,9 |
1 |
4211,75 |
2688,6 |
2688,612 |
7228632,69 |
|
4 |
5025,9 - 6654,2 |
0 |
0 |
1523,1 |
0 |
0,00 |
|
5 |
6654,2 -8282,5 |
1 |
7468,35 |
5945,2 |
5945,212 |
35345541,76 |
|
6 |
8282,5 - 9911 |
2 |
9096,65 |
7573,5 |
15147,02 |
114716157,93 |
|
Итого |
30 |
19358,5 |
39040,6 |
166479225,79 |
|||
Среднее |
645,3 |
1301,4 |
5549307,53 |
d = 1301,4 млн.руб.
Таким образом, средняя величина отклонений значений величины чистых вложений от их средней составляет 1301,4 млн. руб.
Дисперсия - это средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия находится по формуле:
-простая (невзвешенная) дисперсия
- дисперсия взвешенная
у2 = 5 895 974,6 - невзвешенная дисперсия
у2 = 5 549 307,53 млн.руб.2 - взвешенная дисперсия
Таким образом, средний квадрат отклонений индивидуальных значений величины чистого капитала от их средней величины составляет 5 549 307,53 млн. руб.2
Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии, т.е. корень квадратный из среднего квадрата отклонений индивидуальных значений признака от их средней величины. Среднее квадратическое отклонение находится по формуле:
Найдем среднее квадратическое отклонение по объему кредитных вложений:
= 2628,16 млн.руб. - невзвешенное значение
= 2355,7 (млн. руб.) - взвешенное значение
Относительные показатели вариации в общем виде показывают отношение абсолютных показателей вариации к их средней величине.
К относительным показателям вариации относятся:
- коэффициент осцилляции;
- относительное линейное отклонение;
- коэффициент вариации.
Коэффициент осцилляции находится по формуле:
Коэффициент осцилляции для выборки по величине чистых активов равен:
VR = 9770 / 1528 * 100% = 639,4 %
Относительное линейное отклонение рассчитывается по формуле:
Относительное линейное отклонение для выборки величине чистых активов равно:
VD = 1688,6 / 1528 * 100% = 110,5%
VD = 1301,4/ 1528 * 100% = 85,2%
Коэффициент вариации характеризует однородность совокупности. Совокупность считается однородной, если коэффициент вариации меньше либо равен 33%, иначе признается неоднородной. Коэффициент вариации определяется по формуле:
Тогда, коэффициент вариации для выборки по величине чистых активов равен:
Vу = 2628,16 / 1528 * 100% = 172%
Vу = 2355,7 / 1528 * 100% = 154,17%
Коэффициент вариации для выборки по величине чистых активов больше, чем 33%, следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.
1.4 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)
При анализе данных важно представить не только размер вариации, но и то, как распределены единицы совокупности по всему диапазону значений признака.
Показатели асимметрии и эксцесса используются для количественной оценки симметричности.
Для расчета показателя асимметрии используют формулу:
,
где M3 - центральный момент третьего порядка;
у - среднее квадратическое отклонение.
В свою очередь центральный момент третьего порядка рассчитывается по формуле:
М3 = 34 798 998 424,8 - невзвешенный момент третьего порядка
М3 = 36 419 174 665,3 - взвешенный момент третьего порядка
АS = 34 798 998 424,4 / 2628,163 = 2,43
АS = 328 797 195 203 / 2355,73 = 2,79
Для того, чтобы определить, является ли асимметрия существенной или не существенной, рассчитывается отклонение показателя асимметрии к среднеквадратическому отклонению. Для этого используют соотношение:
,
где As - показатель асимметрии;
- средняя квадратическая ошибка отклонения асимметрии, которая рассчитывается по формуле:
,
где n - число единиц в совокупности.
0,412
= 2,43 / 0,412 = 5,898
= 2,79 / 0,412 = 6,772
Если данное соотношение меньше 3, то асимметрия признается несущественной, иначе - существенной.
Как видим, данное соотношение значительно больше 3, поэтому в данном случае асимметрия признается существенной.
В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Поскольку в данном случае имеет место существенная асимметрия, но данный показатель может не рассчитываться.
1.5 Нахождение эмпирической функции, построение ее графика
Построим график эмпирического распределения банков в зависимости величины чистого капитала. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.
Рис.2
1.6 Определение теоретических частот по закону нормального распределения. Построение графиков
Для удобства вычислений вероятностей случайные величины нормируются, а затем по специальным таблицам находится плотность распределения нормируемой случайной величины. Для этого используются следующие формулы:
,
где t - нормируемое отклонение.
Теоретические частоты находятся по формуле:
,
где f - эмпирические частоты;
k - величина интервала.
у - невзвешенное значение среднеквадратичного отклонения
Определим теоретические частоты для выборки банков по объему кредитных вложений.
Таблица 4. Расчет теоретических частот
№ п/п |
Величина чистых активов, млн.руб. |
Число банков, fi |
Середина интервала, xi' |
t |
ц(t) |
Теоретические частоты, f' |
|
1 |
141 - 1769,3 |
25 |
955,15 |
-0,2359 |
0,3867 |
8 |
|
2 |
1769 - 3397,6 |
1 |
2583,15 |
0,4346 |
0,36050 |
7 |
|
3 |
3397,6 - 5025,9 |
1 |
4211,75 |
1,1053 |
0,21790 |
4 |
|
4 |
5025,9 - 6654,2 |
0 |
5840,05 |
1,7759 |
0,07900 |
2 |
|
5 |
6654,2 -8282,5 |
1 |
7468,35 |
2,4465 |
0,01980 |
0 |
|
6 |
8282,5 - 9911 |
2 |
9096,65 |
3,1170 |
0,00330 |
0 |
|
Итого |
- |
30 |
- |
- |
- |
21 |
По найденным теоретическим частотам построим график теоретического распределения банков по величине чистого капитала.
Рис.3
При совмещении графиков теоретического и эмпирического распределения получится следующее:
Рис.4
1.7 Проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения
Так как все предположения о характере распределения лишь гипотезы, а не категорические утверждения, то они должны быть подвергнуты статистической проверке с помощью одного из критериев согласия. Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождение между частотами эмпирического и теоретического распределений следует признать несущественными, то есть случайными, а когда существенными (в тех случаях, когда неверно выдвинута гипотеза о законе распределения).
Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского, который рассчитывается по формуле:
,
где h - число групп;
l - число независимых параметров, которые необходимо знать, чтобы построить кривую теоретического распределения.
В свою очередь рассчитывается по формуле:
,
где fi - эмпирические частоты распределения;
fi' - теоретические частоты распределения.
Таблица 5. Расчет значения критерия Пирсона для распределения по величине чистого капитала
№ п/п |
Величина чистых активов, млн.руб. |
Эмирические частоты, fi |
Теоретические частоты, f' |
(fi-f')2 |
(fi-f')2/f' |
|
1 |
141 - 1769,3 |
25 |
8 |
297 |
38,119 |
|
2 |
1769 - 3397,6 |
1 |
7 |
39 |
5,390 |
|
3 |
3397,6 - 5025,9 |
1 |
4 |
11 |
2,612 |
|
4 |
5025,9 - 6654,2 |
0 |
2 |
3 |
1,589 |
|
5 |
6654,2 -8282,5 |
1 |
0 |
0 |
0,909 |
|
6 |
8282,5 - 9911 |
2 |
0 |
4 |
0,000 |
|
Итого |
- |
30 |
21 |
48,619 |
Рассчитаем значение критерия Романовского для распределения по объему кредитных вложений:
= 18,624
Так как критерий Романовского больше 3 (равен 18,624), то гипотеза о распределении банков в зависимости от величины чистых активов по закону нормального распределения отвергается.
1.8 Оценка параметров генеральной совокупности на основе выборочных данных
Расхождение между генеральной и выборочной совокупностями измеряется средней ошибкой выборки, которая рассчитывается следующим образом:
,
где n - число единиц в выборочной совокупности;
N - число единиц в генеральной совокупности.
Среднюю ошибку необходимо знать для того, чтобы определить возможные пределы для средней генеральной совокупности
Суждение о том, что средняя в генеральной совокупности будет лежать в пределах можно гарантировать не с абсолютной точностью, а с некоторой вероятностью.
Для этого рассчитывают предельную ошибку выборки по формуле:
,
где t - коэффициент доверия, определяемый в зависимости от вероятности по таблицам.
Таким образом, показатели генеральной совокупности для генеральной средней при заданной вероятности определяются по показателям выборочной совокупности следующим образом:
Рассчитаем среднюю ошибку для выборки по величине чистых активов:
= 396,52 (млн.руб.)
Найдем предельную ошибку для выборки по кредитным вложениям, принимая вероятность равной 0,95. По таблице находим коэффициент доверия t, равный 1,96.
Д = 396,52 * 1,96 = 777,18 млн.руб.
Таким образом, границы, в которых с вероятностью 0,95 будет находиться среднее значение показателя величины чистых активов, принимают вид:
1528 - 777,18 < хср < 1528 + 777,18
750,82 < хср < 2305,18 млн.руб.
1.9 Построение интервального вариационного ряда по величине прибыли
Построим вариационный ряд распределения по величине прибыли. Число групп определено в предыдущих расчетах и равно 6.
Величина интервала составляет
H = (913 - (-8)) / 6 = 153,5 млн.руб.
В таблице 6 приведена группировка банков по величине чистых активов
Таблица 6
№ группы |
Величина прибыли, млн.руб. |
Число банков,шт, f |
Средняя величина интервала, млн.руб. |
Общая величина прибыли в группе, млн.руб. |
Средняя величина прибыли в группе, млн.руб. |
|
1 |
- 8 - 145,5 |
21 |
68,75 |
617 |
29,4 |
|
2 |
145,5 - 299 |
6 |
222,25 |
1314 |
219,0 |
|
3 |
299 - 452,5 |
1 |
375,75 |
481 |
481,0 |
|
4 |
452,5 - 606 |
0 |
529,25 |
0 |
- |
|
5 |
606 - 759,5 |
1 |
682,75 |
645 |
645,0 |
|
6 |
759,5 - 913 |
1 |
836,25 |
913 |
913,0 |
|
Итого |
30 |
3970 |
132,3 |
1.10 Построение Графика
Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 5
Гистограмма распределения банков по величине прибыли
Рис.5
В таблице 6 рассчитана средняя величина прибыли по группировке
Хср = 132,33 млн.руб.
Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной. В этом случае ее величина составит
Хср = 155,73 млн.руб.
Как видим две величины, рассчитанные разными способами значительно отличаются друг от друга. В дальнейших расчетах мы будем пользоваться средней величиной прибыли, рассчитанной в таблице 6, поскольку данная величина является более точной.
1.2.в) Расчет показателей вариации
Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.
Мо = -8 + 153,5*(21-0) / ((21-0) + (21-6)) = 81,54 млн.руб.
Рассчитаем медиану
Ме = -8 + 153,5* (15 - 0) / 21 = 28,55 млн.руб.- данная величина прибыли находится в середине совокупности.
Рассчитаем абсолютные показатели вариации
Размах вариации R = 913 - (- 8) = 921 млн.руб.
В таблице 7 представлены дополнительные расчеты для исчисления показателей вариации
Таблица 7
Величина прибыли, млн.руб. |
Число банков,шт, f |
Средняя величина интервала, млн.руб. |
|х-хср| |
|х-хср|*fi |
(х-хср)2*fi |
|
- 8 - 145,5 |
21 |
68,75 |
63,6 |
1335,25 |
84899,65 |
|
145,5 - 299 |
6 |
222,25 |
89,9 |
539,5 |
48510,04 |
|
299 - 452,5 |
1 |
375,75 |
243,4 |
243,42 |
59251,67 |
|
452,5 - 606 |
0 |
529,25 |
396,9 |
0 |
0,00 |
|
606 - 759,5 |
1 |
682,75 |
550,4 |
550,42 |
302958,51 |
|
759,5 - 913 |
1 |
836,25 |
703,9 |
703,92 |
495498,67 |
|
Итого |
30 |
2048,2 |
3372,5 |
991118,54 |
||
Среднее |
68,3 |
112,4 |
33037,28 |
Среднее линейное отклонение
D = 144,1 млн.руб. - невзвешенная величина среднего линейного отклонения
D = 112,4 млн.руб. - взвешенная величина среднего линейного отклонения
Дисперсия
у2 = 43 189,42 млн.руб.2 - невзвешенная дисперсия
у2 = 33 037,282 млн.руб.2 - взвешенная дисперсия
Среднее квадратическое отклонение
у = 207,82 млн.руб.- невзвешенное среднее квадратическое отклонение
у = 181,76 млн.руб.- взвешенное среднее квадратическое отклонение
Рассчитаем относительные показатели вариации
Коэффициент осцилляции
VR = 921 / 132,3 * 100 = 696,1%
Относительное линейное отклонение
VD = 144,1 / 132,3 * 100% = 108,9 %
VD = 112,4/ 132,3 * 100% = 84,96 %
Коэффициент вариации
Vу = 207,82 / 132,3 * 100% = 157,1 %
Vу = 181,76 / 132,3 * 100% = 137,38 %
Коэффициент вариации для выборки по величине прибыли значительно больше, чем 33%, следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.
1.11 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)
М3 = 20 997 502,5 - невзвешенный момент третьего порядка
М3 = 17 630 989,7 - взвешенный момент третьего порядка
АS = 20 997 502,5 / 207,823 = 2,34
АS = 20 997 502,5 / 181,763 = 2,94
Найдем соотношение
= 2,34 / 0,412 = 5,67
= 2,94 / 0,412 = 7,14
Данное соотношение в обоих случаях (как при расчете невзвешенной величины, так и при расчете взвешенной величины) значительно больше 3, поэтому асимметрия признается существенной
В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Поскольку в данном случае имеет место существенная асимметрия, но данный показатель может не рассчитываться.
1.12 Нахождение эмпирической функции, построение ее графика
Построим график эмпирического распределения банков в зависимости от величины прибыли. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.
Рис.6
1.13 Определение теоретических частот по закону нормального распределения. Построение графиков
Таблица 8. Расчет теоретических частот
№ п/п |
Величина прибыли, млн.руб. |
Число банков, fi |
Середина интервала, xi' |
t |
ц(t) |
Теоретические частоты, f' |
|
1 |
- 8 - 145,5 |
21 |
68,75 |
-0,3498 |
0,3752 |
8 |
|
2 |
145,5 - 299 |
6 |
222,25 |
0,4947 |
0,3521 |
8 |
|
3 |
299 - 452,5 |
1 |
375,75 |
1,3392 |
0,1604 |
4 |
|
4 |
452,5 - 606 |
0 |
529,25 |
2,1837 |
0,0355 |
1 |
|
5 |
606 - 759,5 |
1 |
682,75 |
3,0282 |
0,0041 |
0 |
|
6 |
759,5 - 913 |
1 |
836,25 |
3,8727 |
0,0003 |
0 |
|
Итого |
30 |
21 |
По найденным теоретическим частотам построим график теоретического распределения банков по величине прибыли.
Рис.7
При совмещении графиков теоретического и эмпирического распределения получится следующее:
Рис.8
1.14 Проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения
Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского.
Таблица 9. Расчет значения критерия Пирсона для распределения по величине прибыли
№ п/п |
Величина прибыли, млн.руб. |
Эмирические частоты, fi |
Теоретические частоты, f' |
(fi-f')2 |
(fi-f')2/f' |
|
1 |
- 8 - 145,5 |
21 |
8 |
161 |
19,358 |
|
2 |
145,5 - 299 |
6 |
8 |
3 |
0,416 |
|
3 |
299 - 452,5 |
1 |
4 |
7 |
1,836 |
|
4 |
452,5 - 606 |
0 |
1 |
1 |
0,787 |
|
5 |
606 - 759,5 |
1 |
0 |
1 |
9,098 |
|
6 |
759,5 - 913 |
1 |
0 |
1 |
0,000 |
|
Итого |
Итого |
30 |
21 |
31,494 |
Рассчитаем значение критерия Романовского
Р = = 11,63
Поскольку величина критерия Романовского больше 3 (равна 11,63), то гипотеза о распределении банков в зависимости от величины прибыли по закону нормального распределения отвергается.
1.15 Оценка параметров генеральной совокупности на основе выборочных данных
Рассчитаем среднюю ошибку выборки по величине прибыли
= 34,98 млн.руб.
Найдем предельную ошибку, принимая вероятность равной 0,95. Коэффициент доверия t = 1,96
Д = 34,98 * 1,96 = 65,56 млн.руб.
Таким образом, границы, в которых с вероятностью 0,95 будет находится среднее значение показателя величины чистых активов, принимают вид
132,3 - 65,56 < хср < 132,3 + 65,56
66,74 < хср < 197,86
2. Построение однофакторной модели взаимосвязи
2.1 Отбор факторного и результативного признака модели
Примем в качестве факторного признака величину чистых активов, а в качестве результативного - прибыль.
2.2 Расчет парного коэффициента корреляции. Анализ зависимости между переменными
Парный коэффициент корреляции можно вычислить по следующей формуле:
,
Таблица 10 - Данные для расчета парного коэффициента корреляции для выборочной совокупности.
№пп |
Чистые активы, млн.руб., хi |
Прибыль, млн.руб.,уi |
хi2 |
уi2 |
хiуi |
|
1 |
9911 |
645 |
98 227 921 |
416 025 |
6 392 595 |
|
2 |
6728 |
913 |
45 265 984 |
833 569 |
6 142 664 |
|
3 |
8453 |
481 |
71 453 209 |
231 361 |
4 065 893 |
|
4 |
3649 |
265 |
13 315 201 |
70 225 |
966 985 |
|
5 |
2728 |
258 |
7 441 984 |
66 564 |
703 824 |
|
6 |
1255 |
243 |
1 575 025 |
59 049 |
304 965 |
|
7 |
764 |
179 |
583 696 |
32 041 |
136 756 |
|
8 |
333 |
161 |
110 889 |
25 921 |
53 613 |
|
9 |
949 |
8 |
900 601 |
64 |
7 592 |
|
10 |
633 |
109 |
400 689 |
11 881 |
68 997 |
|
11 |
871 |
125 |
758 641 |
15 625 |
108 875 |
|
12 |
729 |
18 |
531 441 |
324 |
13 122 |
|
13 |
1363 |
208 |
1 857 769 |
43 264 |
283 504 |
|
14 |
370 |
11 |
136 900 |
121 |
4 070 |
|
15 |
704 |
19 |
495 616 |
361 |
13 376 |
|
16 |
439 |
8 |
192 721 |
64 |
3 512 |
|
17 |
550 |
83 |
302 500 |
6 889 |
45 650 |
|
18 |
531 |
7 |
281 961 |
49 |
3 717 |
|
19 |
232 |
23 |
53 824 |
529 |
5 336 |
|
20 |
443 |
29 |
196 249 |
841 |
12 847 |
|
21 |
1320 |
24 |
1 742 400 |
576 |
31 680 |
|
22 |
320 |
3 |
102 400 |
9 |
960 |
|
23 |
582 |
9 |
338 724 |
81 |
5 238 |
|
24 |
368 |
29 |
135 424 |
841 |
10 672 |
|
25 |
461 |
55 |
212 521 |
3 025 |
25 355 |
|
26 |
185 |
1 |
34 225 |
1 |
185 |
|
27 |
275 |
23 |
75 625 |
529 |
6 325 |
|
28 |
168 |
33 |
28 224 |
1 089 |
5 544 |
|
29 |
384 |
8 |
147 456 |
64 |
3 072 |
|
30 |
141 |
-8 |
19 881 |
64 |
-1 128 |
|
Итого |
246 919 701 |
1 821 046 |
19 425 796 |
|||
Среднее |
8 230 657 |
60 702 |
647 527 |
R = 0,882
Коэффициент корреляции является величиной положительной, следовательно, связь между факторами прямая. Величина коэффициента корреляции больше 0,5, значит, связь между факторами можно назвать тесной.
2.3 Построение уравнения однофакторной регрессии с использованием метода наименьших квадратов
Определим вид зависимости между объемом кредитных вложений и размером прибыли, используя графический метод.
Рис.9
По графику можно предположить, что зависимость прибыли от объема кредитных вложений приближается к уравнению прямой. Следовательно, сумма квадратов отклонений эмпирических точек от теоретических принимает вид:
В этом случае коэффициенты уравнения регрессии рассчитываются по формулам:
Рассчитаем данные коэффициенты:
А = 16,93
b = 0,0755
Таким образом, уравнение регрессии принимает вид:
У = 16,93 +0,0755х
2.4 Проверка значимости коэффициентов регрессии и коэффициента корреляции
Поскольку анализ взаимосвязей между явлениями проводят в выборочной совокупности, а данные необходимо обобщить на всю генеральную совокупность, то необходимо проверить коэффициенты уравнения регрессии на статистическую значимость.
При объеме выборки меньше или равном 30 единицам значимость коэффициентов уравнения регрессии определяют с помощью t-критерия Стьюдента, который находится по формуле (для коэффициента a):
,
где a - коэффициент уравнения регрессии;
n - число единиц совокупности;
- остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x), которое находится по формуле:
,
где yi - эмпирические значения результативного признака;
урасчх - теоретические значения результативного признака, найденные по уравнению регрессии;
n - число единиц в совокупности.
Проверка значимости для коэффициента b осуществляется по формуле:
,
где b - коэффициент уравнения регрессии;
n - число единиц совокупности;
- остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x);
- среднее квадратическое отклонение факторного признака, которое находится по формуле:
,
где xi - эмпирические значения факторного признака;
хср - среднее значение факторного признака.
Проведем проверку коэффициентов уравнения регрессии (a = 16,93 и b = 0,0755) на статистическую значимость.
Таблица 11. Проверка значимости коэффициентов регрессии
№пп |
Чистые активы, млн.руб.,х |
Прибыль, млн.руб.,у |
(х - хср)2 |
урасч |
у - урасч |
(у - урасч)2 |
|
1 |
9911 |
645 |
70275247,87 |
765,51 |
-120,51 |
14522,08 |
|
2 |
6728 |
913 |
27040346,67 |
525,09 |
387,91 |
150470,92 |
|
3 |
8453 |
481 |
47956086,67 |
655,38 |
-174,38 |
30409,85 |
|
4 |
3649 |
265 |
4498782,401 |
292,54 |
-27,54 |
758,23 |
|
5 |
2728 |
258 |
1440080,001 |
222,97 |
35,03 |
1226,93 |
|
6 |
1255 |
243 |
74510,80111 |
111,72 |
131,28 |
17235,48 |
|
7 |
764 |
179 |
583645,0678 |
74,63 |
104,37 |
10892,97 |
|
8 |
333 |
161 |
1427945,334 |
42,08 |
118,92 |
14142,69 |
|
9 |
949 |
8 |
335202,4011 |
88,60 |
-80,60 |
6496,96 |
|
10 |
633 |
109 |
800965,3344 |
64,74 |
44,26 |
1959,29 |
|
11 |
871 |
125 |
431605,2011 |
82,71 |
42,29 |
1788,25 |
|
12 |
729 |
18 |
638347,7344 |
71,99 |
-53,99 |
2914,60 |
|
13 |
1363 |
208 |
27214,00111 |
119,87 |
88,13 |
7766,31 |
|
14 |
370 |
11 |
1340886,801 |
44,87 |
-33,87 |
1147,28 |
|
15 |
704 |
19 |
678921,0678 |
70,10 |
-51,10 |
2611,08 |
|
16 |
439 |
8 |
1185848,401 |
50,08 |
-42,08 |
1770,99 |
|
17 |
550 |
83 |
956418,8011 |
58,47 |
24,53 |
601,86 |
|
18 |
531 |
7 |
993942,5344 |
57,03 |
-50,03 |
2503,20 |
|
19 |
232 |
23 |
1679529,601 |
34,45 |
-11,45 |
131,07 |
|
20 |
443 |
29 |
1177152,668 |
50,39 |
-21,39 |
457,33 |
|
21 |
1320 |
24 |
43250,13444 |
116,63 |
-92,63 |
8579,49 |
|
22 |
320 |
3 |
1459183,468 |
41,10 |
-38,10 |
1451,23 |
|
23 |
582 |
9 |
894852,9344 |
60,88 |
-51,88 |
2691,95 |
|
24 |
368 |
29 |
1345522,668 |
44,72 |
-15,72 |
247,14 |
|
25 |
461 |
55 |
1138417,868 |
51,74 |
3,26 |
10,60 |
|
26 |
185 |
1 |
1803559,468 |
30,90 |
-29,90 |
893,92 |
|
27 |
275 |
23 |
1569925,468 |
37,70 |
-14,70 |
215,98 |
|
28 |
168 |
33 |
1849509,334 |
29,61 |
3,39 |
11,46 |
|
29 |
384 |
8 |
1308659,734 |
45,93 |
-37,93 |
1438,61 |
|
30 |
141 |
-8 |
1923676,534 |
27,58 |
-35,58 |
1265,59 |
|
Итого |
45 839 |
3 970 |
176 879 237 |
3 970 |
0 |
286 613 |
Рассчитаем остаточное среднее квадратическое отклонение результативного признака:
уе = = 97,74
Вычислим t-критерий Стьюдента для коэффициента a уравнения регрессии:
= 0,917
Полученное расчетное значение сравним с табличным:
(х=28, б=0,05) = 2,0484 > = 0,0917 , следовательно, параметр a статистически не значим, и его нельзя распространять на всю совокупность.
Рассчитаем остаточное среднее квадратическое отклонение факторного признака:
2628,16
Вычислим t-критерий Стьюдента для коэффициента b уравнения регрессии:
= 10,74
Полученное расчетное значение сравним с табличным:
(х=28, б=0,05) = 2,0484 < = 10,74 , следовательно, параметр b статистически значим, и его можно распространять на всю совокупность.
При объеме выборочной совокупности менее или равном 30 единицам проверка коэффициента корреляции на статистическую значимость осуществляется при помощи t-критерия Стьюдента, который рассчитывается по формуле:
Рассчитаем t-критерий Стьюдента для выборочной совокупности:
= 9,93
Полученное расчетное значение сравним с табличным:
(х=28, б=0,05) = 2,0484 < = 15.76, следовательно, коэффициент корреляции признается статистически значимым и его можно распространять на всю совокупность.
Построение графика зависимости признаков по теоретическим частотам
Рис.10ЗАКЛЮЧЕНИЕ
В данной работе мы произвели выборку 30 банков из общей совокупности в 200 банков и произвели анализ данной выборки. Мы рассчитали показатели вариационного ряда по двум показателям - среднюю арифметическую, моду, медиану, относительные и абсолютные показатели вариации, количественные характеристики распределения, а так же нашли эмпирическую и теоретическую функцию распределения ряда и построили их графики.
Почти все характеристики ряда считались в двух вариантах - взвешенное значение и невзвешенное.
Можно сказать, что цель данной работы (практическое закрепление полученных теоретических данных) достигнута.
Хотелось бы только отметить, что в данном случае многие из взвешенных характеристик значительно отличаются по значению от невзвешенных. При данном объеме выборки (30 элементов) и даже при всем объеме выборки можно было бы все характеристики рассчитывать только в одном варианте - взвешенное значение, поскольку данное значение является более точным, а при сегодняшнем уровне автоматизации расчетов и применении электронных таблиц Exsel проведение таких расчетов не является трудоемким.
Размещено на Allbest.ru
Подобные документы
Предмет, метод и история возникновения статистики. Построение таблиц, понятие абсолютных и относительных величин и правила действия с ними. Сущность вариации, свойства дисперсии и расчет индексов. Особенности корреляционно-регрессионного анализа.
курс лекций [302,0 K], добавлен 14.07.2011Нахождение вероятности того, что наудачу взятое натуральное число не делится. Построение гистограммы для изображения интервальных рядов, расчет средней арифметической дискретного вариационного ряда, среднего квадратического отклонения и дисперсии.
контрольная работа [140,8 K], добавлен 18.05.2009Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.
курсовая работа [216,2 K], добавлен 28.09.2011Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.
практическая работа [109,3 K], добавлен 26.07.2012Порядок и принципы построения вариационного ряда. Расчет числовых характеристик статистического ряда. Построение полигона и гистограммы относительных частот, функции распределения. Вычисление асимметрии и эксцесса. Построение доверительных интервалов.
контрольная работа [108,5 K], добавлен 03.10.2010Вычисление вероятностей возможных значений случайной величины по формуле Бернулли. Расчет математического ожидания, дисперсии, среднеквадратического отклонения, медианы и моды. Нахождение интегральной функции, построение многоугольника распределения.
контрольная работа [162,6 K], добавлен 28.05.2012Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.
контрольная работа [77,6 K], добавлен 20.07.2010Исследование методов определения погрешностей и статистической оценки распределений. Построение эмпирической функции, определяющей частность события для каждого значения случайной величины. Расчеты по заданной выборке, ее анализ и определение параметров.
курсовая работа [323,0 K], добавлен 13.01.2011Закон больших чисел. Нахождение точечных оценок. Построение неизвестной дисперсии погрешности измерений. Выборочная функция распределения. Теорема Ляпунова и распределение Стьюдента. Вычисление доверительных интервалов. Построение интервальных оценок.
курсовая работа [4,3 M], добавлен 18.12.2011Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.
курсовая работа [241,3 K], добавлен 10.04.2011