Применение дисперсионного анализа в статистических исследованиях

Основные положения факторного анализа. Принципы и модели дисперсионного анализа, его роль и место в статистических исследованиях. Особенности применения дисперсионного анализа при исследовании социально-экономических показателей по Республике Беларусь.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 01.07.2014
Размер файла 762,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Название R-техники носит объемный анализ данных по m признакам, в результате него получают r линейных комбинаций (групп) признаков: Fr=f(Xj), (r=1..m). Анализ по данным о близости (связи) n наблюдаемых объектов называется Q-техникой и позволяет определять r линейных комбинаций (групп) объектов: F=f(ni), (i = l .. N).

Набор методов факторного анализа в настоящее время достаточно велик, насчитывает десятки различных подходов и приемов обработки данных. Чтобы в исследованиях ориентироваться на правильный выбор методов, необходимо представлять их особенности. Разделим все методы факторного анализа на несколько классификационных групп [5]:

- Метод главных компонент. Строго говоря, его не относят к факторному анализу, хотя он имеет с ним много общего. Специфическим является, во-первых, то, что в ходе вычислительных процедур одновременно получают все главные компоненты и их число первоначально равно числу элементарных признаков. Во-вторых, постулируется возможность полного разложения дисперсии элементарных признаков, другими словами, ее полное объяснение через латентные факторы (обобщенные признаки).

- Методы факторного анализа. Дисперсия элементарных признаков здесь объясняется не в полном объеме, признается, что часть дисперсии остается нераспознанной как характерность. Факторы обычно выделяются последовательно: первый, объясняющий наибольшую долю вариации элементарных признаков, затем второй, объясняющий меньшую, вторую после первого латентного фактора часть дисперсии, третий и т.д. Процесс выделения факторов может быть прерван на любом шаге, если принято решение о достаточности доли объясненной дисперсии элементарных признаков или с учетом интерпретируемости латентных факторов.

Методы факторного анализа целесообразно разделить дополнительно на два класса: упрощенные и современные аппроксимирующие методы. Простые методы факторного анализа в основном связаны с начальными теоретическими разработками. Они имеют ограниченные возможности в выделении латентных факторов и аппроксимации факторных решений. К ним относятся:

- однофакторная модель. Она позволяет выделить только один генеральный латентный и один характерный факторы. Для возможно существующих других латентных факторов делается предположение об их незначимости;

- бифакторная модель. Допускает влияние на вариацию элементарных признаков не одного, а нескольких латентных факторов (обычно двух) и одного характерного фактора;

- центроидный метод. В нем корреляции между переменными рассматриваются как пучок векторов, а латентный фактор геометрически представляется как уравновешивающий вектор, проходящий через центр этого пучка. Метод позволяет выделять несколько латентных и характерные факторы, впервые появляется возможность соотносить факторное решение с исходными данными, т.е. в простейшем виде решать задачу аппроксимации.

Современные аппроксимирующие методы часто предполагают, что первое, приближенное решение уже найдено каким либо из способов, последующими шагами это решение оптимизируется. Методы отличаются сложностью вычислений. К этим методам относятся:

- групповой метод. Решение базируется на предварительно отобранных каким-либо образом группах элементарных признаков;

- метод главных факторов. Наиболее близок методу главных компонент, отличие заключается в предположении о существовании характерностей;

- метод максимального правдоподобия, минимальных остатков, а-факторного анализа канонического факторного анализа, все оптимизирующие.

Эти методы позволяют последовательно улучшить предварительно найденные решения на основе использования статистических приемов оценивания случайной величины или статистических критериев, предполагают большой объем трудоемких вычислений. Наиболее перспективным и удобным для работы в этой группе признается метод максимального правдоподобия.

Основной задачей, которую решают разнообразными методами факторного анализа, включая и метод главных компонент, является сжатие информации, переход от множества значений по m элементарным признакам с объемом информации n х m к ограниченному множеству элементов матрицы факторного отображения (m х r) или матрицы значений латентных факторов для каждого наблюдаемого объекта размерностью n х r, причем обычно r < m.

Методы факторного анализа позволяют также визуализировать структуру изучаемых явлений и процессов, а это значит определять их состояние и прогнозировать развитие. Наконец, данные факторного анализа дают основания для идентификации объекта, т.е. решения задачи распознавания образа.

Методы факторного анализа обладают свойствами, весьма привлекательными для их использования в составе других статистических методов, наиболее часто в корреляционно-регрессионном анализе, кластерном анализе, многомерном шкалировании и др.

3.2 Парная регрессия. Вероятностная природа регрессионных моделей

Если рассмотреть задачу анализа расходов на питание в группах с одинаковыми доходами, например в $10.000(x), то это детерминированная величина. А вот Y - доля этих денег, затрачиваемая на питание - случайна и может меняться от года к году. Поэтому для каждого i-го индивида:

где еi - случайная ошибка;

б и в - константы (теоретически), хотя могут меняться от модели к модели.

Предпосылки для парной регрессии:

- X и Y связаны линейно;

- Х - неслучайная переменная с фиксированными значениями;

- е - ошибки нормально распределены N(0,у2);

- ;

- .

На рисунке 3.1 представлена модель парной регрессии.

Рисунок 3.1 - Модель парной регрессии

Примечание - Источник: [3]

Эти предпосылки описывают классическую линейную регрессионную модель.

Если ошибка имеет ненулевое среднее, исходная модель будет эквивалентна новой модели и другим свободным членом, но с нулевым средним для ошибки.

Если выполняются предпосылки, то МНК оценки и являются эффективными линейными несмещенными оценками

Если обозначить:

то что математическое ожидание и дисперсии коэффициентов и будут следующие:

Ковариация коэффициентов:

Если то и распределены тоже нормально:

Отсюда следует, что:

- Вариация в полностью определяется вариацией е;

- Чем выше дисперсия X - тем лучше оценка в.

Полная дисперсия определяется по формуле:

Дисперсия отклонений в таком виде - несмещенная оценка и называется стандартной ошибкой регрессии. N-2 - может быть интерпретировано как число степеней свободы.

Анализ отклонений от линии регрессии может представить полезную меру того, насколько оцененная регрессия отражает реальные данные. Хорошая регрессия та, которая объясняет значительную долю дисперсии Y и наоборот плохая регрессия не отслеживает большую часть колебаний исходных данных. Интуитивно ясно, что всякая дополнительная информация позволит улучшить модель, то есть уменьшить необъясненную долю вариации Y. Для анализа регрессионной модели проводят разложение дисперсии на составляющие, определяют коэффициент детерминации R2.

Отношение двух дисперсий распределено по F-распределению, т. е. если проверить на статистическую значимость отличия дисперсии модели от дисперсии остатков, можно сделать вывод о значимости R2.

Проверка гипотезы о равенстве дисперсий этих двух выборок:

Если гипотеза Н0 (о равенстве дисперсий нескольких выборок) верна, t имеет F-распределение с (m1,m2)=(n1-1,n2-1) степенями свободы.

Посчитав F - отношение как отношение двух дисперсий и сравнив его с табличным значением, можно сделать вывод о статистической значимости R2 [7].

4. Применение дисперсионного анализа в статистических исследованиях

С помощью дисперсионного анализа исследуют влияние одной или нескольких независимых переменных на одну зависимую переменную (одномерный анализ) или на несколько зависимых переменных (многомерный анализ). В обычном случае независимые переменные принимают только дискретные значения (и относятся к номинальной или порядковой шкале); в этой ситуации также говорят о факторном анализе. Если же независимые переменные принадлежат к интервальной шкале или к шкале отношений, то их называют ковариациями, а соответствующий анализ -- ковариационным.

Применим для исследования пакет прикладных программ SPSS.

В рамках SPSS предлагается выполнение дисперсионного анализа в рамках двух подходов [1]:

- при помощи традиционного "классического" метода по Фишеру (Fisher);

- при помощи нового метода "обобщенной линейной модели".

Первый подход сводится к разложению по методу наименьших квадратов (МНК); в однофакторном случае совокупная дисперсия всех наблюдаемых значений раскладывается на дисперсию внутри отдельных групп и дисперсию между группами. В основе обобщенной линейной модели напротив, лежит, корреляционный или регрессионный анализ.

Дисперсионный анализ может быть вызван посредством выбора меню Analyze (Анализ) General Linear Model (Общая линейная модель). Можно провести одномерный дисперсионный анализ (Univariate...), многомерный дисперсионный анализ (Multivariate...), многомерный дисперсионный анализ с учетом повторных измерений (Repeated Measures...). И, наконец, в данном меню имеется один пункт для расчёта компонентов дисперсии (Variance Components...).

Возможно также проведение дисперсионного анализа по традиционному "классическому" методу Фишера. Однако такой анализ выполним только за счёт использования программного синтаксиса (процедура ANOVA).

4.1 Статистическое исследование удельного веса мужчин по областям Республики Беларусь с помощью одномерного дисперсионного анализа

Одномерный дисперсионный анализ исследует влияние одной или нескольких независимых переменных на одну зависимую. Одномерный дисперсионный анализ может быть однофакторным (one-way ANOVA) или многофакторным (n-way ANOVA). В первом случае есть только одна независимая переменная; во втором -- несколько.

Необходимо отметить, что для проведения одномерного дисперсионного анализа на практике (в исследованиях социально-экономических процессов) существует одно весьма существенное ограничение. При увеличении количества факторов (то есть независимых переменных) в модели сложность интерпретации результатов расчета возрастает многократно. Так, однофакторный анализ является наиболее простым. Мультифакторные модели в большинстве своем могут успешно интерпретироваться только квалифицированными исследователями.

Исследуем зависимость между процентным соотношением мужчин (ud_ves_M) среди населения Беларуси и областью (obl). Переменная obl представлена категориями (1 - Брестская, 2 - Витебска, 3 - Гомельская, 4 - Гродненская, 5 - Минская, 6 - Могилевская). Проведем однофакторный одномерный дисперсионный анализ и установим, насколько значимо различается удельный вес мужчин в каждой области. Данные взяты из [10].

В качестве зависимой переменной в дисперсионном анализе выступает основание сегментирования по группам, то есть та переменная, которая и определяет различия между категориями независимой переменной. В область для независимых переменных Fixed Factor(s) поместим obl. Фиксированными факторами называют переменные, уровни которых охватывают все возможные состояния этой переменной. Случайные факторы представляют переменные, уровни которых охватывают лишь часть из всего многообразия возможных состояний.

Модель дисперсионного анализа -- это математическое соотношение, в котором каждая переменная представлена в виде суммы среднего значения и ошибки. В полнофакторной модели среднее значение каждого наблюдения представлено в виде генерального среднего и суммы вклада всех главных "эффектов" (факторов влияния), помимо которых производится также расчёт всех взаимодействий между факторами.

Установить равенство/неравенство дисперсий позволяет тест Levene. В общем случае мы не знаем, равны ли дисперсии и, соответственно, какую группу статистических тестов следует использовать. Поэтому рекомендуется сразу вывести тесты для равных и неравных дисперсий, чтобы сократить количество итераций при проведении дисперсионного анализа. Ограничимся наиболее популярным и универсальным тестом Scheffe для равных дисперсий и тестом Tamhane's T2 -- для неравных дисперсий [9].

Первой практически значимой таблицей является результат теста на равенство дисперсий зависимой и независимых переменных Levene's Test of Equality of Error Variances (рисунок 4.1). В столбце Sig. данной таблицы содержится единственное интересующее нас значение -- это статистическая значимость тестовой статистики F. Если значение в данном столбце показывает незначимость F -- значит, дисперсии равны, и в дальнейшем мы будем анализировать результаты расчета теста Scheffe (предполагающего равенство дисперсий).

В противном случае, если F-статистика значима, -- дисперсии не равны, и при анализе различий между группами следует использовать тест Tamhane's T2 (предполагающий неравенство дисперсий). Как вы видите на рисунке, статистика F значима (Sig. = 0,034) -- и, следовательно, можно сделать вывод о неравенстве дисперсий.

Рисунок 4.1 - Таблица Levene's Test of Equality of Error Variances

Levene's Test of Equality of Error Variancesa

Dependent Variable:ud_ves_M

F

df1

df2

Sig.

2,647

5

48

,034

Tests the null hypothesis that the error variance of the dependent variable is equal across groups.

a. Design: Intercept + obl

Примечание - Источник: [собственная разработка]

Следующая таблица -- это Tests of Between-Subjects Effects (рисунок 4.2). Данная таблица является центральной в выводимых результатах дисперсионного анализа и показывает наличие/отсутствие значимых различий между категориями исследуемых переменных. Первое, на что следует обратить внимание при анализе описываемой таблицы, -- это величина R2, отражающая долю совокупной дисперсии в зависимой переменной. Другими словами, это та часть вариации зависимой переменной, которую можно объяснить на основании независимой переменной. В данном случае величина R2 достаточно велика, следовательно, около 80% вариации зависимой переменной можно объяснить независимой переменной.

Рисунок 4.2 - Таблица Tests of Between-Subjects Effects

Tests of Between-Subjects Effects

Dependent Variable:ud_ves_M

Source

Type III Sum of Squares

df

Mean Square

F

Sig.

Corrected Model

5,166a

5

1,033

39,639

,000

Intercept

118816,463

1

118816,463

4,559E6

,000

obl

5,166

5

1,033

39,639

,000

Error

1,251

48

,026

Total

118822,880

54

Corrected Total

6,417

53

a. R Squared = ,805 (Adjusted R Squared = ,785)

Второе, на что обращают внимание исследователи при интерпретации таблицы Tests of Between-Subjects Effects, -- это собственно значимость различия между группами независимой переменной. Этот вывод следует из значения на пересечении строки, содержащей соответствующую независимую переменную, и столбца Sig. Как вы видите на рисунке, имеет место статистически высоко значимое различие между различными областями по удельному весу мужчин (значимость F-статистики у переменной obl < 0,00).

После того как мы установили наличие статистически значимого различия между областями, необходимо определить, какие из 6 имеющихся групп отличаются от остальных и каким образом (в большую или в меньшую сторону). Сделаем это при помощи таблицы Multiple Comparisons, представленной на рисунке 4.3. При интерпретации данной таблицы прежде всего вспомним результаты теста Levene. Так, в нашем случае на основании данного теста дисперсии оказались неравными, и поэтому в данной таблице мы будем рассматривать только ту ее часть, в которой приведены расчеты по методу Tamhane.

Multiple Comparisons

Dependent Variable:ud_ves_M

(I) obl

(J) obl

Mean Difference (I-J)

Std. Error

Sig.

95% Confidence Interval

Lower Bound

Upper Bound

Tamhane

1

2

,6333*

,03287

,000

,5169

,7498

3

,7222*

,03287

,000

,6058

,8387

4

,2444*

,05720

,015

,0384

,4504

5

-,1111

,11811

,999

-,5774

,3552

6

,1333*

,03287

,019

,0169

,2498

2

1

-,6333*

,03287

,000

-,7498

-,5169

3

,0889*

,02485

,037

,0036

,1742

4

-,3889*

,05300

,000

-,5913

-,1865

5

-,7444*

,11614

,003

-1,2133

-,2756

6

-,5000*

,02485

,000

-,5853

-,4147

3

1

-,7222*

,03287

,000

-,8387

-,6058

2

-,0889*

,02485

,037

-,1742

-,0036

4

-,4778*

,05300

,000

-,6802

-,2754

5

-,8333*

,11614

,001

-1,3021

-,3645

6

-,5889*

,02485

,000

-,6742

-,5036

4

1

-,2444*

,05720

,015

-,4504

-,0384

2

,3889*

,05300

,000

,1865

,5913

3

,4778*

,05300

,000

,2754

,6802

5

-,3556

,12522

,217

-,8215

,1103

6

-,1111

,05300

,621

-,3135

,0913

5

1

,1111

,11811

,999

-,3552

,5774

2

,7444*

,11614

,003

,2756

1,2133

3

,8333*

,11614

,001

,3645

1,3021

4

,3556

,12522

,217

-,1103

,8215

6

,2444

,11614

,646

-,2244

,7133

6

1

-,1333*

,03287

,019

-,2498

-,0169

2

,5000*

,02485

,000

,4147

,5853

3

,5889*

,02485

,000

,5036

,6742

4

,1111

,05300

,621

-,0913

,3135

5

-,2444

,11614

,646

-,7133

,2244

Based on observed means.

The error term is Mean Square(Error) = ,026.

*. The mean difference is significant at the ,05 level.

Рисунок 4.3 - Таблица Multiple Comparisons

Примечание - Источник: [собственная разработка]

Итак, в первой части таблицы мы видим сравнение различий между каждой из 6 областей с остальными областями. На основе этих данных и определяются та или те группы, которые значимо отличаются от других. Так, из столбца Sig. (статистическая значимость) мы видим, что только вторая и третья группы статистически значимо отличаются от всех остальных. Остальные целевые группы не отличаются друг от друга. При этом из столбца Mean Difference можно видеть, насколько отличается среднее значение той или иной группы от среднего значения других групп (звездочками отмечены значимые различия при 95%-ном доверительном уровне).

Также из рассматриваемой таблицы можно сделать вывод о направлении различия между выделенными категориями. Так, в нашем случае мы можем заключить, что в Витебской и Гомельской областях удельный вес мужчин ниже, чем в других областях.

Рассмотрим таблицу Homogeneous Subsets (рисунок 4.4).

ud_ves_M

obl

N

Subset

1

2

3

Scheffea

3

9

46,4556

2

9

46,5444

4

9

46,9333

6

9

47,0444

47,0444

1

9

47,1778

47,1778

5

9

47,2889

Sig.

,926

,086

,086

The error term is Mean Square(Error) = ,026.

a. Uses Harmonic Mean Sample Size = 9,000.

Рисунок 4.4 - Таблица Homogeneous Subsets

Примечание - Источник: [собственная разработка]

В этой таблице представлена однозначная картина различий между группами независимой переменной. Здесь все группы разделены на три категории на основании различий в удельном весе мужчин. В первую категорию входит целевая группа из Гомельской и Витебской областей; во вторую -- Брестская, Гродненская и Могилевская, в третью - Могилевская, Брестская, Минская. Если бы оказалось, что статистически значимых различий в удельном весе мужчин в различных областях не наблюдается, все группы независимой переменной были бы отнесены к одной категории (Subset был бы только 1).

4.2 Статистическое исследование удельного веса занятых на предприятиях государственной формы собственности по областям Республики Беларусь с помощью двухфакторного дисперсионного анализа

Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независимые переменные (и взаимодействия между ними), то есть выполнить двухфакторный одномерный дисперсионный анализ.

Исходные данные останутся такими же, как в предыдущем случае, однако теперь мы будем устанавливать различие в занятых на предприятиях государственной формы собственности в зависимости от области и удельного веса мужчин. Переменная ud_ves_f_sob будет представлена тремя группами - 1 - до 50%, 2 - от 50% до 60%, 3 - больше 60%.

При проведении многофакторного анализа (двухфакторной и более) зададим исследование всех возможных взаимодействий между независимыми переменными (в нашем случае будет установлено различие не только между областями и удельным весом мужчин, но и на основе взаимодействия). В диалоговом окне Options необходимо добавить переменную ud_ves_M, а также ее взаимодействие с переменной -- ud_ves_M * obl, что позволит вывести средние значения по каждой группе при определении направления различия между ними.

Тест Левене на равенство дисперсий показывает, значимый результат со значением вероятности ошибки р = 0,009. Это означает, что отсутствует однородность дисперсий между группами, которая наряду с нормальным распределением значений выборки, является основной предпосылкой для возможности проведения дисперсионного анализа (рисунок 4.5).

Levene's Test of Equality of Error Variancesa

Dependent Variable:ud_ves_f_sob

F

df1

df2

Sig.

53,651

16

37

,000

Tests the null hypothesis that the error variance of the dependent variable is equal across groups.

a. Design: Intercept + obl + ud_ves_M + obl * ud_ves_M

Рисунок 4.5 - Таблица Levene's Test of Equality of Error Variances

Примечание - Источник: [собственная разработка]

В таблице Tests of Between-Subjects Effects появились результаты расчета значимости F-статистики для переменной ud_ves_M, а также для взаимодействия ud_ves_M * obl. Как видно из рисунка 4.6, удельный вес мужчин оказывает воздействие на количество занятых на предприятиях государственной формы собственности. Однако совместное воздействие переменных ud_ves_M * obl не является статистически значимым. При этом, несмотря на неравенство дисперсий, переменная obl оказывает значимое влияние на зависимую переменную (Sig. = 0,000), то удельный вес занятых на предприятиях государственной формы собственности разнится по областям.

Необходимо также отметить, что доля совокупной дисперсии в зависимой переменной, объясняемая построенной моделью, несколько высока (R2 = 0,764).

Tests of Between-Subjects Effects

Dependent Variable:ud_ves_f_sob

Source

Type III Sum of Squares

df

Mean Square

F

Sig.

Corrected Model

14,170a

16

,886

7,504

,000

Intercept

118,734

1

118,734

1,006E3

,000

obl

5,666

4

1,417

12,003

,000

ud_ves_M

5,035

9

,559

4,741

,000

obl * ud_ves_M

,216

2

,108

,913

,410

Error

4,367

37

,118

Total

215,000

54

Corrected Total

18,537

53

a. R Squared = ,764 (Adjusted R Squared = ,663)

Рисунок 4.6 - Таблица Tests of Between-Subjects Effects

Примечание - Источник: [собственная разработка]

В таблице Homogeneous Subsets (рисунок 4.7) представлена однозначная картина различий между группами независимой переменной. Здесь все группы разделены на три категории на основании различий в удельном весе занятых на предприятиях государственной формы собственности. В первую категорию входит целевая группа из Гродненской и Брестской областей; во вторую -- Брестская и Минская, в третью - Минская, Витебская, Могилевская и Гомельская.

ud_ves_f_sob

obl

N

Subset

1

2

3

Scheffea

4

9

1,2222

1

9

1,5556

1,5556

5

9

1,8889

1,8889

2

9

2,2222

6

9

2,2222

3

9

2,3333

Sig.

,525

,525

,212

The error term is Mean Square(Error) = ,118.

a. Uses Harmonic Mean Sample Size = 9,000.

Рисунок 4.7 - Таблица Tests of Between-Subjects Effects

Примечание - Источник: [собственная разработка]

Завершают вывод результатов двухфакторного анализа таблицы с расчетами апостериорных тестов (рисунок 4.8).

Multiple Comparisons

Dependent Variable:ud_ves_f_sob

(I) obl

(J) obl

Mean Difference (I-J)

Std. Error

Sig.

95% Confidence Interval

Lower Bound

Upper Bound

Tamhane

1

2

-,6667

,22906

,146

-1,4572

,1239

3

-,7778

,24216

,079

-1,6095

,0540

4

,3333

,22906

,934

-,4572

1,1239

5

-,3333

,20787

,880

-1,0697

,4030

6

-,6667

,22906

,146

-1,4572

,1239

2

1

,6667

,22906

,146

-,1239

1,4572

3

-,1111

,22222

1,000

-,8760

,6538

4

1,0000*

,20787

,003

,2864

1,7136

5

,3333

,18426

,760

-,3073

,9739

6

,0000

,20787

1,000

-,7136

,7136

3

1

,7778

,24216

,079

-,0540

1,6095

2

,1111

,22222

1,000

-,6538

,8760

4

1,1111*

,22222

,002

,3462

1,8760

5

,4444

,20031

,488

-,2608

1,1497

6

,1111

,22222

1,000

-,6538

,8760

4

1

-,3333

,22906

,934

-1,1239

,4572

2

-1,0000*

,20787

,003

-1,7136

-,2864

3

-1,1111*

,22222

,002

-1,8760

-,3462

5

-,6667*

,18426

,038

-1,3073

-,0261

6

-1,0000*

,20787

,003

-1,7136

-,2864

5

1

,3333

,20787

,880

-,4030

1,0697

2

-,3333

,18426

,760

-,9739

,3073

3

-,4444

,20031

,488

-1,1497

,2608

4

,6667*

,18426

,038

,0261

1,3073

6

-,3333

,18426

,760

-,9739

,3073

6

1

,6667

,22906

,146

-,1239

1,4572

2

,0000

,20787

1,000

-,7136

,7136

3

-,1111

,22222

1,000

-,8760

,6538

4

1,0000*

,20787

,003

,2864

1,7136

5

,3333

,18426

,760

-,3073

,9739

Based on observed means.

The error term is Mean Square(Error) = ,118.

*. The mean difference is significant at the ,05 level.

Рисунок 4.8 - Таблица Tests of Between-Subjects Effects

Примечание - Источник: [собственная разработка]

Переменная obl и в этом случае оказывает ощутимое влияние на зависимую переменную. Видим, что значительно отличаются результаты анализа по Гродненской области, в которой меньше всего населения занято на предприятиях государственной формы собственности.

ЗАКЛЮЧЕНИЕ

Стохастическое моделирование факторных систем взаимосвязей отдельных сторон хозяйственной деятельности строится на обобщении закономерностей варьирования значений экономических показателей - количественных характеристик факторов и результатов хозяйственной деятельности. Количественные параметры связи выявляются на основе сопоставления значений изучаемых показателей в совокупности хозяйственных объектов или периодов.

В стохастическом анализе, где сама модель составляется на основе совокупности эмпирических данных, предпосылкой получения реальной модели является совпадение количественных характеристик связей в разрезе всех исходных наблюдений. Это означает, что варьирование значений показателей должно происходить в пределах однозначной определенности качественной стороны явлений, характеристиками которых являются моделируемые экономические показатели (в пределах варьирования не должно происходить качественного скачка в характере отражаемого явления).

Современные приложения дисперсионного анализа охватывают широкий круг задач экономики и трактуются обычно в терминах статистической теории выявления систематических различий между результатами непосредственных измерений, выполненных при тех или иных меняющихся условиях.

Благодаря автоматизации дисперсионного анализа исследователь может проводить различные статистические исследования с применение ЭВМ, затрачивая при этом меньше времени и усилий на расчеты данных. В настоящее время существует множество пакетов прикладных программ, в которых реализован аппарат дисперсионного анализа.

Применяя пакет SPSS для проведения дисперсионного анализа на статистических данных по Республике Беларусь, были получены следующие результаты.

При анализе колебания показателя удельного веса мужчин по областям Республики Беларусь, было выявлено неравенство дисперсий исследуемого показателя по областям (значимость F-статистики у переменной obl < 0,00). Дальнейшие результаты подтвердили вывод о том, что в Витебской и Гомельской областях удельный вес мужчин ниже, чем в других областях.

При анализе удельного веса занятых на предприятиях государственной формы собственности снова была выявлена неоднородность дисперсий. Переменная obl и в этом случае оказывает ощутимое влияние на зависимую переменную. Видим, что значительно отличаются результаты анализа по Гродненской области, в которой меньше всего населения занято на предприятиях государственной формы собственности.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1 Бююль, А. SPSS: искусство обработки информации. Анализ статистических данных и восстановления скрытых закономерностей. Пер с нем./ А. Бююль, П. Цефель. - СПб.: ООО «ДмаСофтЮП», 2005. - 608 с.

2 Гмурман, В.Е. Теория вероятностей и математическая статистика. /В.Е. Гмурман. - М.: Высшая школа, 2003. - 523 с.

3 Гусев, А.Н. Дисперсионный анализ в экспериментальной психологии. / А.Н. Гусев. - М.: Учебно-методический коллектор «Психология», 2000. - 136 с.

4 Канке, А.А. Кошевая, И.П. Анализ финансово-хозяйственной деятельности предприятия: учебное пособие./ А.А.Канке. - М.: Инфра-М, 2007. - 288 с.

5 Ким, Дж.-О., Мьюллер, Ч.У. и др. Факторный, дискриминантный и кластерный анализ. / Дж.-О. Ким. -- М.: Финансы и статистика, 1989. - 215 с.

6 Комплексный экономический анализ хозяйственной деятельности: Учебное пособие / А.И.Алексеева, Ю.В.Васильев, А.В., Малеева, Л.И.Ушвицкий. - М.: Финансы и статистика, 2006. - 672с.

7 Кремер, Н.Ш. Теория вероятности и математическая статистика / Н.Ш. Кремер. - М.: Юнити - Дана, 2002. - 343с.

8 Лысенко, Д.В. Комплексный экономический анализ хозяйственной деятельности: учебник для вузов / Д.В. Лысенко. - М.: Инфра-М, 2008. - 320 с.

9 Наследов, А.Д. SPSS: компьютерный анализ данных в психологии и социальных науках/ А.Д. Наследов. - СПб.: Питер, 2005. - 416 с.

10 Регионы Республики Беларусь. Статистический сборник. / Министерство статистики и анализа Республики Беларусь; редкол.: В.И. Зиновский [и др.] - Мн.: Министерство статистики и анализа Республики Беларусь, 2011. - 810 с.

11 Савицкая, Г.В. Анализ хозяйственной деятельности предприятия: учебник. / Г.В. Савицкая. - М.: Инфра-М, 2009. - 536 с.

Размещено на Allbest.ru


Подобные документы

  • Применение дисперсионного анализа для исследования влияния качественных переменных на зависимую количественную переменную. Регрессионный анализ со статистической значимостью. Процесс проведения дисперсионного, кластерного, регрессионного анализов.

    курсовая работа [498,5 K], добавлен 11.05.2022

  • Сущность и основные функции группировки статистических показателей. Понятие и виды дисперсионного анализа. Показатели экономической активности, занятости и безработицы населения. Качественные показатели работы порта. Индивидуальный индекс себестоимости.

    контрольная работа [107,3 K], добавлен 14.10.2010

  • Применение математического планирования эксперимента в научных исследованиях. Начальные навыки работы с совокупностью случайных величин. Расчёт математического ожидания, дисперсии и среднеквадратического отклонения. Результаты дисперсионного анализа.

    курсовая работа [1,7 M], добавлен 26.11.2013

  • Расчет матрицы выборочных парных коэффициентов корреляции при помощи пакета анализа программы Excel. Однофакторный и двухфакторный дисперсионный анализ. Построение регрессионной модели. Модальный интервал по значению числа видов производимой продукции.

    контрольная работа [281,7 K], добавлен 29.03.2010

  • Предмет экономического анализа и его научный аппарат, виды и связь со смежными дисциплинами, основные цели, задачи. Система показателей экономического анализа, его методика. Информационное обеспечение и последовательность. Особенности факторного анализа.

    контрольная работа [117,1 K], добавлен 23.06.2011

  • Обработка данных лесной промышленности: получение распределения случайной величины, проверка гипотезы, проведение дисперсионного, корреляционного и регрессивного анализа. Сущность и содержание, особенности применения теории принятия решений, ее принципы.

    контрольная работа [314,2 K], добавлен 12.02.2013

  • Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.

    курсовая работа [68,4 K], добавлен 11.06.2002

  • Понятие экономического анализа. Характеристика основных приемов и методов экономического анализа. Методика факторного анализа. Многофакторные мультипликативные модели. Построение факторной модели - первый этап детерминированного анализа.

    контрольная работа [105,1 K], добавлен 12.09.2006

  • Определение и классификация индексов, применение индексного метода в статистических исследованиях. Виды индексов количественных и качественных показателей, выбор базы и весов индексов. Индекс-дефлятор и методология расчёта индекса потребительских цен.

    презентация [203,3 K], добавлен 27.04.2013

  • Методика расчета показателей вариации по средней арифметической взвешенной. Произведение расчетов по данным интервального вариационного ряда. Построение полигона и гистограммы. Элементы и проведение дисперсионного анализа. Правило сложения дисперсий.

    лабораторная работа [67,2 K], добавлен 21.06.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.