Вариационные ряды

Построение и графическое изображение вариационных рядов. Дискретный вариационный ряд распределения урожайности зерновых, сельскохозяйственных предприятий по качеству почв. Показатели центра распределения. Показатели формы и колеблемости признака.

Рубрика Математика
Вид лабораторная работа
Язык русский
Дата добавления 15.05.2014
Размер файла 208,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Построение и графическое изображение вариационных рядов

Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: качеством почв и урожайностью зерновых.

вариационный сельскохозяйственный почва ряд

Таблица 1. Исходные данные

№ хозяйства

Качество почв, балл (х)

Урожайность зерновых, ц/га (у)

1

80

30

2

64

21

3

68

21

4

67

21

5

88

36

6

89

37

7

79

35

8

78

25

9

65

20

10

79

35

11

65

20

12

69

25

13

75

30

14

68

30

15

65

21

16

88

36

17

70

36

18

80

30

19

90

37

20

78

30

21

58

21

22

65

36

23

80

30

24

88

30

25

70

25

26

78

30

27

80

35

28

88

36

29

78

35

30

64

20

В результате логического рассуждения приходим к выводу, что зависимым, результативным признаком в данном случае является урожайность зерновых, а независимым, факторным - качество почв.

Следовательно, в соответствии с заданием дискретный вариационный ряд строим по результативному признаку - урожайности зерновых, интервальный вариационный ряд - по факторному признаку - качеству почв.

Для того чтобы составить дискретный вариационный ряд, необходимо расположить значения признака в порядке возрастания, т.е. произвести ранжирование статистических данных, а затем подсчитать частоты.

Таблица 2. Дискретный ряд распределения урожайности зерновых

Варианты

Частоты

Накопленные частоты

20

3

3

21

8

11

22

7

18

23

6

24

24

5

29

25

8

37

26

8

45

27

8

53

28

7

60

29

6

66

30

13

79

31

12

91

32

11

102

33

10

112

34

9

121

35

10

131

36

13

144

37

13

157

Для графического изображения дискретного ряда служит многоугольник (полигон). При его построении на оси абсцисс откладываются варианты, на оси ординат - частоты.

Рис. 1. Полигон распределения сельскохозяйственных предприятий по урожайности зерновых

Для построения интервального вариационного ряда:

· определяется число групп (число интервалов) по формуле Стерджесса:

К=1+3.32*log(n), (1)

где К - число групп (интервалов); n - число единиц наблюдения;

К=1+3.32*log(30) = 5.9 ? 6

· рассчитывается величина интервала, т.е. разность между верхним и нижним значением признака в группе:

, (2)

где xmax - максимальное значение признака; xmin - минимальное значение признака.

· формируются группы, т.е. устанавливаются верхние и нижние границы для каждого интервала;

· рассчитываются частоты и накопленные частоты для интервального ряда;

Графически интервальный ряд изображают с помощью гистограммы. На оси абсцисс берутся отрезки, соответствующие величине интервала. На каждом отрезке строят прямоугольник, длина второй стороны которого соответствует частоте.

Для построения диаграммы необходимо найти середины интервалов по формуле:

, (3)

Таблица 3. Интервальный вариационный ряд распределения качества почв

Интервалы

Частоты

Накопленные частоты

Середины интервалов

58,0 - 63,33

1

1

60,67

63,33 - 68,67

0

1

66,00

68,67 - 74,0

8

9

71,33

74,0 - 79,33

10

19

76,67

79,33 - 84,67

16

35

82,00

84,67 - 90,0

19

54

87,33

Рис. 2. Гистограмма распределения сельскохозяйственных предприятий по качеству почв

2. Статистические характеристики рядов распределения

2.1 Показатели центра распределения

· средняя арифметическая;

· мода;

· медиана.

Средняя арифметическая вычисляется по формулам:

простая

; (4)

взвешенная

, (5)

где среднее значение признака; - варианты; - частоты;

Мода вычисляется по формуле:

, (6)

где - нижняя граница интервала, содержащего моду;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота послемодального интервала.

Медиана рассчитывается по формуле:

, (7)

где - нижняя граница медианного интервала;

- величина медианного интервала;

- сумма накопленных частот, предшествующих медианному интервалу;

- частота медианного интервала.

2.2 Показатели колеблемости признака

· размах вариации;

· среднее линейное отклонение;

· дисперсия;

· среднее квадратическое отклонение;

· коэффициент вариации.

Дисперсия определяется по формуле:

, (8)

Среднеквадратическое отклонение вычисляется по формуле:

, (9)

Коэффициент вариации вычисляется по формуле:

, (10)

- коэффициент вариации для качества почв

- коэффициент вариации для урожайности зерновых

2.3 Показатели формы распределения

· коэффициент асимметрии определяется по формуле:

; (11) или , (12)

где - центральный момент третьего порядка.

· коэффициент эксцесса определяется по формуле:

, (13)

где - центральный момент четвертого порядка.

Таблица 4. Показатели центра, вариации и формы распределения

Качество почв, балл (х)

Урожайность зерновых, ц/га (у)

Название показателя

Размер

Название показателя

Размер

Среднее

80,91

Среднее

29,13

Стандартная ошибка

1,15

Стандартная ошибка

1,12

Медиана

82

Медиана

30

Мода

85,4

Мода

30

Среднее квадратическое отклонение

6,28

Среднее квадратическое отклонение

6,15

Дисперсия выборки

39,39

Дисперсия выборки

37,85

Эксцесс

0,24

Эксцесс

- 1,48

Асимметричность

- 0,83

(- 0,71)

Асимметричность

- 0,14

Интервал

32

Интервал

17

Минимум

58

Минимум

20

Максимум

90

Максимум

37

Сумма

2254

Сумма

874

Счет

30

Счет

30

Уровень надежности (95,0%)

3,43

Уровень надежности (95,0%)

2,34

Коэффициент вариации

7,76%

Коэффициент вариации

21,11%

На основе данных таблицы формулируем выводы.

В данной совокупности сельскохозяйственных предприятий средняя урожайность зерновых составляет 29,13 ц/га, средний показатель качества почв составляет 80,91 баллов.

Медиана показывает, что половина сельскохозяйственных предприятий совокупности имеет качество почв меньше 82 баллов, а половина - больше 82 баллов; Медиана = 30 показывает, что половина сельскохозяйственных предприятий имеет урожайность зерновых меньше 30 ц/га, а половина - больше 30 ц/га.

Мода = 85,4 показывает, что наиболее часто в данной совокупности встречается качество почв 85,4 баллов; Мода = 30 показывает, что наиболее часто в данной совокупности встречается урожайность зерновых 30 ц/га.

Коэффициент вариации свидетельствует о слабой вариации обоих признаков, так как оба коэффициента меньше 33%.

Коэффициенты эксцесса показывают, что распределение хозяйств по качеству почв является островершинным, так как = 0,240, а распределение по урожайности зерновых является плосковершинным, так как .

По коэффициентам асимметрии можно сделать вывод, что распределение хозяйств по урожайности зерновых и по качеству почв имеет левую асимметричность, так как .

2.4 Статистические оценки параметров распределения

Изучаемую совокупность можно считать выборкой из генеральной совокупности, состоящей из большого множества сельскохозяйственных предприятий. На основе показателей, рассчитанных по выборке, дают статистическую оценку параметров генеральной совокупности.

Возможное расхождение между выборочными и генеральными характеристиками составляет ошибку выборки.

Стандартная ошибка выборки определяется по формуле:

, (14)

Для определения интервальной оценки необходимо найти доверительный интервал:

, (15)

, (16)

,

где - предельная ошибка выборочной средней; - коэффициент доверия, который определяют по таблице распределения Стьюдента по заданным n и при малой выборке n 30.

Коэффициент доверия по таблице Стьюдента равен 2,0452.

Для урожайности зерновых предельная ошибка

Строим доверительный интервал:

Для качества почв предельная ошибка

Строим доверительный интервал:

.

С вероятностью 0,95 можно утверждать, что генеральная средняя урожайности зерновых не выйдет за пределы от 26,79 до 31,47 ц/га.

С вероятностью 0,95 можно утверждать, что генеральная средняя качества почв находится в интервале от 78,52 до 83,3 баллов и не выйдет за его пределы.

2.5 Проверка гипотезы о законе нормального распределения по критерию Пирсона

Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Романовского и др.

Критерий Пирсона (хи-квадрат) определяется по формуле:

, (17)

где (хи-квадрат) - критерий Пирсона; - эмпирические частоты;

- теоретические частоты.

Теоретические частоты вычисляются по формуле:

, (18)

где - теоретические частоты; - фактические частоты; h - шаг;

- нормированные отклонения; - значения функции плотности стандартизированного нормального распределения.

Вычисления выполняются в следующей последовательности:

1) Определяются нормированные отклонения;

2) При рассчитанных значениях нормированных отклонений по таблице плотности нормального распределения отыскиваются значения функции плотности стандартизированного нормального распределения;

3) Вычисляется выражение ;

4) Определяются теоретические частоты;

5) Рассчитывается критерий Пирсона.

Таблица 5. Расчет теоретических частот

Группа предприятий по качеству почв

Фактические частоты

Середины интервалов

t

ц(t)

(h??)/у

58,0 - 63.33

1

60.67

-3,22

0,0022

45,83

63.33 - 68.67

0

66.0

-2,37

0,0241

45,83

68.67 - 74,0

8

71.34

-1,52

0,1257

45,83

74,0 - 79.33

10

76.67

-0,68

0,3166

45,83

79.33 - 84.67

16

82.0

0,17

0,3932

45,83

84.67 - 90,0

19

87.34

1,02

0,2371

45,83

54

Критерий согласия Пирсона рассчитываем в следующей таблице.

Таблица 6. Расчет критерия согласия Пирсона

Варианты

Частоты

эмпирические

теоретические

58.0 - 63.33

1

0,100826

0,899174

0,808514

8,018903

63.33 - 68.67

0

1,104503

-1,1045

1,219927

1,104503

68.67 - 74.0

8

5,760831

2,239169

5,013878

0,870339

74.0 - 79.33

10

14,50978

-4,50978

20,3381

1,401682

79.33 - 84.67

16

18,02036

-2,02036

4,081838

0,226513

84.67 - 90.0

19

10,86629

8,133707

66,15719

6,088294

17,71023 (фактическое значение критерия Пирсона)

(критическое значение критерия Пирсона по таблице)

Так как фактическое значение критерия Пирсона больше критического значения, можно утверждать, что исследуемое эмпирическое распределение имеет отличный от теоретического закон распределения, т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, не принимается.

Генеральная совокупность не распределена по нормальному закону.

3. Корреляционно-регрессионный анализ

В процессе корреляционно-регрессионного анализа решаются следующие задачи:

1) Определение формы и направления связи, ее количественное выражение в виде уравнения регрессии.

2) Определение характеристики тесноты связи.

3) Определение значимости выборочных характеристик тесноты корреляционной связи.

Таблица 7. Результаты вычисления параметров и показателей для КРА

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,754929

R-квадрат

0,569918

Нормированный R-квадрат

0,554558

Стандартная ошибка

0,079849

Наблюдения

30

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

647,1226

647,1226

37,10382

1,43E-06

Остаток

28

488,3441

17,44086

Итого

29

1135,467

Коэф.

Станд. ошибка

t-статистика

Р-значение

Нижние 95%

Верхние 95%

Y-пересечение

-9,53209

6,393286

-1,49095

0,147155

-22,6281

3,563966

Переменная X1

0,514624

0,084485

6,091291

1,43E-06

0,341564

0,687684

На основе данных таблицы построим уравнение регрессии:

ух = - 9,532 + 0,515х

Выводы

Коэффициент регрессии а1 = 0,515 означает, что с повышением качества почв на 1 балл урожайность зерновых повышается на 0,515 ц/га.

Коэффициент корреляции r = 0,750,7, следовательно, связь между изучаемыми признаками в данной совокупности тесная.

Коэффициент детерминации r2 = 0,57 показывает, что 57% вариации результативного признака (урожайности зерновых) вызвано действием факторного признака (качества почв).

В таблице критических точек распределения Фишера-Снедекора находим критическое значение F - критерия при уровне значимости 0,05 и числе степеней свободы К1 = m - 1=2 - 1=1 и К2 = n - m=30 - 2=28, оно равно 4,21.

Так как рассчитанное значение F - критерия больше F табличного (F=37,1, то уравнение регрессии признается значимым.

Для оценки значимости коэффициента корреляции рассчитываем t - критерий Стьюдента:

В таблице критических точек распределения Стьюдента найдем критическое значение t-критерия при уровне значимости 0,05 и числе степеней свободы n - 1=30 - 1=29, оно равно 2,0452.

Так как рассчитанное значение t-критерия больше табличного, то коэффициент корреляции является значимым.

Размещено на Allbest.ru


Подобные документы

  • Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.

    курсовая работа [110,0 K], добавлен 23.07.2009

  • Поиск вариационного ряда по выборке. Функция распределения, полигон частот. Ранжированный и дискретный вариационный ряды. Вычисление числа групп в вариационном ряду по формуле Стерджесса. Гипотеза о нормальном характере эмпирического распределения.

    контрольная работа [57,6 K], добавлен 12.04.2010

  • Понятие генеральной совокупности, математического ожидания и дисперсии. Обеспечение случайности и репрезентативности выборки в статистическом планировании. Дискретный и интервальный вариационный ряд, точечные оценки параметров распределения признака.

    реферат [259,1 K], добавлен 13.06.2011

  • Интервальный вариационный ряд. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х. Функция плотности рассматриваемого закона распределения "Построение ее на гистограмме".

    курсовая работа [104,4 K], добавлен 20.03.2011

  • Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.

    курсовая работа [179,8 K], добавлен 11.01.2012

  • Понятие и виды статистических рядов распределения, основные формы их представления. Расчет и анализ показателей, характеризующих центральную тенденцию, вариацию, структуру и форму ряда распределения. Проведение сглаживания эмпирического распределения.

    курсовая работа [698,3 K], добавлен 07.06.2011

  • Закон распределения случайной величины Х, функция распределения и формулы основных числовых характеристик: математическое ожидание, дисперсия и среднеквадратичное отклонение. Построение полигона частот и составление эмпирической функции распределения.

    контрольная работа [36,5 K], добавлен 14.11.2010

  • Описание признака сходимости числовых рядов Даламбера, решение задач на исследование сходимости. Формулировка радикального признака сходимости Коши знакоположительного ряда в предельной форме. Доказательство знакочередующихся и знакопеременных рядов.

    реферат [190,9 K], добавлен 06.12.2010

  • Составление характеристики непрерывного признака. Методы составления приближенного распределения признака, имеющего непрерывное распределения. Относительные частоты и их плотности. Статистическое распределение частот интервального вариационного ряда.

    творческая работа [17,8 K], добавлен 10.11.2008

  • Обработка и анализ статистической информации. Выборочная теория; интервальные оценки и графическое представление параметров распределения. Точечные оценки характеристик положения и мер изменчивости. Корреляционная зависимость; уравнение регрессии.

    курсовая работа [1023,9 K], добавлен 21.03.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.