Статистичний аналіз показників продуктивності корів
Статистичне спостереження. Статистична оцінка продуктивності корів та чинників, що на неї впливають. Види статистичних групувань. Аналіз рядів розподілу. Кореляційний аналіз продуктивності корів. Особливості рангової, простої, множинної кореляції.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | украинский |
Дата добавления | 14.04.2016 |
Размер файла | 508,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Вступ
Статистика сільського господарства -- одна з основних галузевих статистик, яка розробляє зміст і методи обчислення та аналізу статистичних показників, що характеризують стан і розвиток сільського господарства. Об'єктом її вивчення є сільське господарство як галузь матеріального виробництва, в якій праця людини спрямована на вирощування рослин і тварин, а також на використання життєдіяльності рослин і тварин для одержання продукції. Тваринництво є однією з найважливіших галузей сільського господарства України, яка забезпечує виробництво продуктів харчування тваринного походження, сировини для харчової, легкої, фармацевтичної та інших галузей промисловості.
Метою роботи є проведення статистичного аналізу показників продуктивності корів, обґрунтування напрямків підвищення ефективності виробництва продукції тваринництва, систематизувати, закріпити та розширити здобуті теоретичні знання, аналіз продуктивності корів, застосування системи статистичних показників, побудова таблиць, застосування статистичних методів у економічному аналізі, розробка пропозицій по підвищенню ефективності сільського виробництва. Зробити власні науково обґрунтовані висновки щодо обраної теми.
Об'єкт курсової роботи: продуктивність корів в запропонованих групах.
Актуальністю даної теми є те, що на всіх етапах розвитку сільського господарства одним із основних напрямів є виробництво продукції тваринництва, а обґрунтування заходів щодо його стабілізації і підвищення ефективності - загальнодержавним завданням.
Розділ 1. Статистичне спостереження
статистичний спостереження кореляційний
Статистичне спостереження - це планомірне, науково організоване збирання масових даних про явища і процеси суспільного життя за допомогою реєстрації суттєвих ознак за заздалегідь розробленою програмою.
Залежно від рівня реєстрації даних статистичні спостереження поділяють на первинні і вторинні.
Первинне спостереження - це реєстрація вихідних даних, що надходять від об`єкта, який їх продукує (наприклад, поточний облік зареєстрованих шлюбів в органах реєстрації актів громадянського стану). Під вторинним спостереженням розуміють збирання раніше зареєстрованих та оброблених даних (наприклад, звітів підприємств, підсумків біржових торгів).
Статистичне спостереження - найважливіший метод статистики і перший етап статистичного дослідження. Від його правильної організації і якісного проведення значно залежить успіх усього дослідження. Якщо статистичне спостереження проведено неправильно і одержано невірогідні дані, то, як би добре не було опрацьовано ці дані, матеріали статистичного дослідження будуть низької якості, оскільки недоліки первинних даних не можна усунути за подальшої їх обробки.
Наукова організація статистичного спостереження зумовлює дотримання певних вимог щодо його здійснення. Назвемо їх.
1. Явища, які підлягають спостереженню, повинні мати певне народногосподарське значення, а також наукову чи практичну цінність
2. Оскільки суспільні явища знаходяться у постійній зміні й розвитку та мають різний якісний стан, статистичне спостереження повинне забезпечувати збір масових даних. в яких відбивається вся сукупність фактів. Неповнота зведень про досліджувані процеси призведе до помилкових висновків з результатів аналізу.
3. Складний взаємозв'язок і взаємопереплетіння економічних явищ зумовлює орієнтацію статистичного спостереження на збирання не тільки інформації, яка безпосередньо характеризує досліджуваний об'єкт, а й такої, що сприяє зміні його стану. Отже, дані спостереження повинні бути повними. Під повнотою даних розуміють повноту просторового охоплення одиниць досліджуваної сукупності, істотних сторін явищ, а також повноту охоплення у часі.
4. Інформація, одержувана за результатами статистичного спостереження, повинна бути вірогідною. Тобто спостережувані дані підлягають ретельній і всебічній перевірці з боку їх якості. Особливість зазначеної вимоги полягає у тому, що у разі одержання недостовірної інформації, не можна усунути її дефекти в процесі подальшої обробки, що ускладнює прийняття науково обґрунтованих рішень. Зрозуміло, що статистична інформація вважається якісною, якщо вона правдива, вірогідна і точна.
5. Статистичне спостереження здійснюється на науковій основі по заздалегідь розробленій програмі, яка забезпечує науковий підхід до вирішення методологічних і організаційних питань.
6. Дані статистичного спостереження повинні бути, порівнювані. Лише в такому разі забезпечується їх узагальнення і зіставлення у просторі і час.
Статистичне спостереження автомобілебудівної компанії « Bugatti »
Мета спостереження - одержання статистичних даних, які є підставою для узагальненої характеристики стану та розвитку продажу автомобілів марки «Bugatti» в Київській області для визначення привабливості побудови централізованогоавтосалону в м.Київ.
0`єкт спостереження - розподіл інвестиційної привабливості автосалонів в м.Київ.
Одиниця сукупності - загальний обсяг продажу автомобілів в Київській області.
Одиниця спостереження - автосалон «Bugatti » в м.Київ.
Анкета
1.Ваш вік?
А.18-25 років.
Б. 25-35 років.
В. 35-40 років.
Г. 40 і більше.
2.Ваша стать?
А.Чоловіча.
Б. Жіноча.
3. Чи маєте ви автомобіль?
А. Так.
Б. Ні.
4. Якій марці автомобіля ви надаєте перевагу?
А. Audi.
Б.BMW.
В.Citroen.
Г. Renault.
Д.Bugatti.
5.Чи віддаєте ви перевагу якійсь конкретній компанії по виробництву автомобілів?
А.Так, звичайно.
Б.Ні, це не суттєво.
6. Як ви оцінюєте свій середньомісячний сімейний бюджет?
А.Недостатній.
Б.Достатній.
В.Більш ніж достатній.
7.Чи вважаєте ви себе забезпеченою людиною?
А.Так.
Б.Ні.
8. Чи могли б ви собі дозволити автомобіль VIP класу ?
А.Так.
Б.Ні.
9. При виборі автомобіля ви перш за все звертаєте увагу на :
А.На ціну даного пристрою.
Б.На марку виробника.
В.На зовнішній вигляд.
Г.На зручність в користуванні та функціональність.
10. Чи подобаються вам автомобілі марки « Bugatti » ?
А.Так.
Б.Ні.
11. Чи вважаєте ви, що компанії « Bugatti » варто покращити виробництво автомобілів?
А.Так.
Б.Ні.
12. Якщо «так» то в чому? Напишіть.
13. Якщо ви віддаєте перевагу автомобілям марки « Bugatti », то чому?
А.Тому, що вони зручні в користуванні.
Б.Тому, що це найкращий варіант із всіх.
В.Це моя улюблена марка.
Д.Ваш варіант.
14. Хотіли б ви, щось змінити в діяльності компанії « Bugatti » ?
А.Так.
Б.Ні, мене все влаштовує.
15. Якщо так то, що саме?Напишіть.
16.Яка ймовірність того, що ви порекомендуєте автомобіль марки « Bugаtti » другу чи колезі?
А.Зовсім неможливо.
Б.Вкрай ймовірно.
17. Наскільки ймовірно те, що ви порекомендуєте нас кому-небудь?
А.Надзвичайно ймовірно.
Б.Досить імовірно.
В.Зовсім не можливо.
18. Чи буде розумно відкрити централізований автосалон « Bugаtti » у м.Київ?
А.Так.
Б.Ні.
19. Якщо так, то в якому районі міста?
А.Голосіївському.
Б.Дарницькому.
В.Оболонському.
Г.Печерському.
Д.Святошинському.
20. Чи вважаєте ви доцільною дану анкету?
А.Так.
Б.Ні.
Розділ 2. Статистична оцінка продуктивності корів та чинників, що на неї впливають
2.1 Статистичні групування та їх види
Статистичне зведення - це систематизація, обробка і підрахунок групових і загальних підсумків даних статистичного спостереження для характеристики сукупності узагальненими показниками.
Основна мета і зміст статистичного зведення - узагальнити матеріал, повно і об'єктивно охарактеризувати всю сукупність фактів, розкрити закономірності масових процесів, що фіксуються в показниках.
Групування - найважливіший етап статистичного зведення. Це метод дослідження масових суспільних явищ шляхом об'єднання одиниць сукупності в однорідні групи за істотними ознаками. Воно дає змогу в первинному статистичному матеріалі відокремити суттєві риси від несуттєвих, відчути перехід кількісних змін у якісні, у багатьох випадковостях виявити необхідність у вигляді тих або інших закономірностей досліджуваного явища.
Крім того, метод групування створює умови для наукового застосування інших статистичних методів аналізу: методу середніх, відносних величин, індексного методу тощо. Зміст групувань має важливе значення у соціально-правових дослідженнях, оскільки дає змогу: виявити якісно однорідні сукупності, типи явищ; охарактеризувати структуру сукупності та структурні зрушення; дослідити взаємозв'язок між юридично залежними показниками. Відповідно до цих завдань статистика застосовує три основні види групувань: типологічні, структурні та аналітичні.
Під типологічним групуванням розуміють розподіл досліджуваної сукупності на якісно однорідні типи явищ і процесів. (Групування підприємств за формами власності; населення - за суспільними групами; злочинів - за формами і видами провини - умисні, необережні та за категоріями тяжкості; особистостей винних - неповнолітні, дорослі, засуджені, виправдані; злочинців за - статтями Кримінального кодексу тощо.)
Структурне групування характеризує розподіл якісно однорідної сукупності на групи за певною ознакою з метою вивчення структури (складу) типово однорідних груп культур. Отже, типологічне групування передує структурному.
Аналітичне групування уможливлює виявлення взаємозв'язку досліджуваних явищ і процесів. В основу аналітичного групування покладено щонайменше дві ознаки: факторну і результативну. Факторною називається така ознака, під впливом якої змінюється інша ознака, що називається результативною.
При групуванні за ознаками, які мають безпосереднє кількісне вираження, необхідно розв'язати питання про кількість груп і про вибір інтервалу групування за формулою:
де Xmax та Xmin - відповідно найбільше та найменше значення ознаки; п - число груп.
Визначаємо кількість груп: . У моєму проектному завданні N=28, тому . Отже, виділимо 5 груп.
Групування господарств за виходом приплоду та продуктивністю корів
Отже, використовуючи формулу до моєї сукупності даних, визначимо, що інтервал приблизно дорівнюватиме2
Для того, щоб виділити інтервал по групі, необхідно до найменшого значення ознаки (90) додати визначений інтервал (1,4). Враховуючи те, що у нас 4 груп, цю операцію потрібно здійснити п`ять разів, при цьому нижня межа першої групи і верхня межа п`ятої повинна відповідати мінімальному та максимальному значенню сукупності. Отже вирахувано такі групи:
Таблиця 1. Групи за виходом телят на 100 корів, голів.
Групи господарств за виходом телят на 100 корів, голів |
Кількість господарств |
|
90 - 91, 4 |
4 |
|
91, 4 - 92, 8 |
4 |
|
92, 8 - 94, 2 |
9 |
|
94, 2 - 95, 6 |
4 |
|
95, 6 - 97 |
7 |
Для того, щоб побудувати таблицю 2 " Аналітичне групування господарств за виходом приплоду та продуктивністю корів" беремо дані таблиці 1. Для цього потрібно визначити середні дані за результативною і факторною ознакою.
Таблиця 3
Групи господарств за виходом телят на 100 корів, голів, |
Кількість господарств, n |
Середній вихід телят на 100 корів по групі, голів? |
Середній надій на корову по групі, ц |
|
90 - 91, 4 |
4 |
90, 75 |
35, 1 |
|
91, 4 - 92, 8 |
4 |
92 |
35, 7 |
|
92, 8 - 94, 2 |
9 |
93, 66 |
36, 87 |
|
94, 2 - 95, 6 |
4 |
95 |
36, 67 |
|
95, 6 - 97 |
7 |
96, 14 |
37, 91 |
|
Всього |
28 |
467, 55 |
182, 25 |
Допоміжна таблиця для аналітичного групування
Групи господарств за виходом телят на 100 корів, голів? |
Надій на корову, ц Y |
||
Група 1 (90 - 91, 4) |
90 |
31, 1 |
|
91 |
33, 6 |
||
91 |
37, 8 |
||
91 |
37, 9 |
||
Разом |
363 |
140, 4 |
|
Група 2 (91, 4 - 92, 8) |
92 |
32, 3 |
|
92 |
34, 9 |
||
92 |
37, 3 |
||
92 |
38, 3 |
||
Разом |
368 |
142, 8 |
|
Група 3 (92, 8 - 94, 2) |
93 |
35, 2 |
|
93 |
36 |
||
93 |
37, 7 |
||
94 |
35, 9 |
||
94 |
36, 6 |
||
94 |
37, 3 |
||
94 |
37, 3 |
||
94 |
37, 8 |
||
94 |
38, 1 |
||
Разом |
843 |
331, 9 |
|
Група 4 (94, 2 - 95, 6) |
95 |
35, 9 |
|
95 |
36, 3 |
||
95 |
36, 3 |
||
95 |
38, 2 |
||
Разом |
380 |
146, 7 |
|
Група 5 (95, 6 - 97) |
96 |
35, 5 |
|
96 |
35, 5 |
||
96 |
36, 3 |
||
96 |
39, 2 |
||
96 |
39, 3 |
||
96 |
41, 1 |
||
97 |
38, 5 |
||
Разом |
673 |
265, 4 |
Проаналізувавши дані таблиці 2, можна зробити висновок, що між виходом приплоду та продуктивністю корів існує пряма залежність. Це проявляється в тому, що із підвищенням в господарствах І групи в порівнянні з господарствами V групи на 94, 39% (), рівень продуктивності збільшився на 92, 58% (
Групування господарств за рівнем годівлі та продуктивністю корів
За даними формулами проведемо своєрідне групування господарств за рівнем годівлі та продуктивністю корів.
Таблиця 4. Групи за рівнем витрат кормів на корову, ц к. од
Групи господарств за продуктивністю корів, ц |
Кількість господарств |
|
35, 2 - 36, 78 |
3 |
|
36, 78 - 38, 36 |
14 |
|
38, 36 - 39, 94 |
5 |
|
39, 94 - 41, 52 |
4 |
|
41, 52 - 43, 1 |
2 |
Таблиця 5. Аналітичне групування господарств за рівнем годівлі та продуктивністю корів
Групи господарств за витратами кормів на корову, ц к. од, |
Кількість господарств, n |
Середні витрати кормів по групі на 1 корову, ц к. од, |
Середня продуктивність по групі, ц, |
|
35, 2 - 36, 78 |
3 |
35, 96 |
33, 73 |
|
36, 78 - 38, 36 |
14 |
37, 65 |
35, 91 |
|
38, 36 - 39, 94 |
5 |
39, 44 |
38, 16 |
|
39, 94 - 41, 52 |
4 |
40, 85 |
39, 17 |
|
41, 52 - 43, 1 |
2 |
42, 65 |
37, 90 |
|
Всього |
28 |
196, 55 |
184, 87 |
Таблиця 6. Допоміжна таблиця для аналітичного групування
Групи господарств за витратами кормів на корову, ц к. од, |
Надій на корову, ц, Y |
||
Група 1 (35, 2 - 36, 78) |
35, 2 |
31, 1 |
|
36, 1 |
34, 9 |
||
36, 6 |
35, 2 |
||
Разом |
107, 9 |
101, 2 |
|
Група 2 (36, 78 - 38, 36) |
36, 9 |
32, 3 |
|
37 |
35, 9 |
||
37, 3 |
35, 9 |
||
37, 4 |
36, 3 |
||
37, 5 |
36, 3 |
||
37, 5 |
36, 3 |
||
37, 6 |
33, 6 |
||
37, 6 |
36 |
||
38 |
35, 5 |
||
38 |
35, 5 |
||
38 |
37, 3 |
||
38 |
37, 3 |
||
38, 1 |
36, 6 |
||
38, 3 |
37, 9 |
||
Разом |
527, 2 |
502, 7 |
|
Група 3 (38, 36 - 39, 94) |
38, 6 |
37, 7 |
|
39, 4 |
38, 3 |
||
39, 6 |
37, 8 |
||
39, 8 |
37, 8 |
||
39, 8 |
39, 2 |
||
Разом |
197, 2 |
190, 8 |
|
Група 4 (39, 94 - 41, 52) |
40, 1 |
41, 1 |
|
40, 6 |
38, 2 |
||
41, 2 |
38, 1 |
||
41, 5 |
39, 3 |
||
Разом |
163, 4 |
156, 7 |
|
Група 5 (41, 52 - 43, 1) |
42, 2 |
37, 3 |
|
43, 1 |
38, 5 |
||
Разом |
85, 3 |
75, 8 |
Проаналізувавши дані таблиці 5, можна зробити висновок, що між рівнем годівлі та продуктивністю корів існує пряма залежність. Це проявляється в тому, що із підвищенням рівня годівлі в господарствах І групи в порівнянні з господарствами V групи на 84,31 % ()рівень урожайності збільшився на 88, 99% ().
Провівши аналітичне групування, можна сказати, що між рівнем продуктивності корів, витратами кормів та виходом телят існує пряма лінійна залежність. Це підтверджується розрахунками, а саме: зі збільшенням витрат кормів та виходом телят в кожній групі - відповідно збільшується рівень продуктивності корів.
2.2 Ряди розподілу та їх графічне зображення. Аналіз рядів розподілу
При статистичному групуванні даних кожну групу характеризують системою показників, які мають повний зв'язок і взаємозалежність з групувальною ознакою. Якщо ж виділені групи характеризують не системою показників, а лише кількістю одиниць, що відносяться до кожної групи, то дістають ряди розподілу.
Ряд розподілу - групування одиниць сукупності за однією ознакою. Якщо в основу ряду розподілу покладена атрибутивна ознака, то й ряд називається атрибутивним. Якщо ряд розподілу утворений за кількісною ознакою, він називається варіаційним.
Різновидом, атрибутивних рядів є альтернативні ряди. Альтернативними називають ряди якісних ознак, які мають два значення,що виключають одне одного: так або ні. Прикладом таких рядів може бути розподіл аграрних формувань на прибуткові та збиткові, або на такі, що виконали і не виконали планове завдання.
Варіаційний ряд розподілу складається з варіантів і частот. Варіантами називають окремі значення групувальної ознаки, а частотою - кількість одиниць спостереження, що мають однакове значення ознаки. Іноді замість частот використовують частості. Частість - це відносна величина структури, тобто частка частоти варіанта в загальній сумі частот. Нагромаджені частоти (частості) - це сума частот (частостей) варіантів від мінімального значення ознаки до даного.
Розрізняють дискретні та інтервальні варіаційні ряди. Дискретними називають ряди, в яких варіанти виражені циліми числами. Інтервальними називають ряди, в яких варіанти виражені у вигляді інтервалів.
Побудуємо інтервальний ряд розподілу за рівнем продуктивності корів:
1)Визначимо кількість груп:
2)Визначимо величину інтервалу:
3) Знаючи величину інтервалу і кількість груп, будуємо межі груп:
Таблиця 7. Групи за продуктивністю корів, ц
Групи господарств за продуктивністю корів, ц |
Кількість господарств |
|
31, 1 - 33, 1 |
2 |
|
33, 1 - 35, 1 |
2 |
|
35, 1 - 37, 1 |
10 |
|
37, 1 - 39, 1 |
11 |
|
39, 1 - 41, 1 |
3 |
|
Х |
28 |
Таблиця 8. Інтервальний варіаційний ряд розподілу за рівнем продуктивності корів
Продуктивність корів, ц, Y |
Частота (кількість господарств) |
Середина інтервалу |
Нагромаджена частота |
|
31, 1 - 33, 1 |
2 |
32, 1 |
2 |
|
33, 1 - 35, 1 |
2 |
34, 1 |
4 |
|
35, 1 - 37, 1 |
10 |
36, 1 |
14 |
|
37, 1 - 39, 1 |
11 |
38, 1 |
25 |
|
39, 1 - 41, 1 |
3 |
40,1 |
28 |
|
Разом |
28 |
Х |
Х |
Для графічного зображення інтервальних варіаційних рядів часто використовують гістограми. Порядок побудови цього виду графіків такий: на осі абсцис відкладають інтервали значень варіанти. Вони ж є основами прямокутників, висота яких (ордината) пропорційна частоті (частоті) інтервалів.
Полігон розподілу будується в прямокутній системі координат, при цьому на осі абсцис відкладається варіанта, а на осі ординат - частота. За допомогою полігону розподілу, графічно зображають дискретні варіаційні ряди.
При зображенні варіаційного ряду з нагромаджуваними частотами у прямокутній системі координат одержується так звана крива сум - кумулята. Кумуляту застосовують при порівнянні різних варіаційних рядів, а також в економічних дослідженнях, зокрема для аналізу концентрації виробництва.
Аналогічно кумуляті в прямокутній системі координат будують огіву. Різниця графіка лише в тому, що на вісь абсцис наносять нагромаджувальні частоти, а на вісь ординат - значення варіант.
Середні величини - це узагальнюючі кількісні показники, що характеризують типові розміри варіативних ознак якісно однорідних сукупностей.
Середні величини характеризують центральну тенденцію в розподілі. Центральна тенденція - це властивість значень досліджуваної ознаки групуватися навколо центра розподілу частот, статистичною характеристикою якого є середня величина. Середня величина є узагальнюючою характеристикою центральної тенденції тільки тоді, коли вона обчислена для однорідної сукупності, окремі варіанти якої концентруються поблизу деякого значення. Якщо сукупність неоднорідна, то варіанти значно відрізняються один від одного і не виявляють загальної тенденції. Обчислена середня при цьому буде формальною величиною; оскільки вона не є типовою характеристикою сукупності.
У статистиці застосовуються кілька видів середніх величин. Усі вони належать до класу степеневих середніх, загальна формула якої має такий вигляд:
,
де - середня величина; X-- варіанта; т -- показник степеня середньої; n - число одиниць сукупності.
Якщо т = 1, то середня арифметична - ;
Якщо т = 2, то середня квадратична - ;
Якщо т = -1, то середня гармонійна - ;
Якщо m=0, то середня геометрична - ,
де К1, К2, ….Кn - ланцюгові коефіцієнти динаміки.
Крім степеневих середніх величин, у статистиці застосовуються описові характеристики ряду розподілу ознаки -- мода (Мо) і медіана (Ме).
У статистиці широко застосовується середня арифметична величина, її застосовують тоді, коли відомі значення усередненої ознаки у кожної одиниці сукупності.
Середня геометрична величина використовується для визначення середніх темпів динаміки значимих явищ.
Середня квадратична величина застосовується при вивченні зв'язків між досліджуваними явищами та їх причинами методом кореляційного аналізу та ін.
Вивчення варіації ознаки дає можливість визначити, які чинники і якою мірою впливають на розмір досліджуваних ознак.
Вивчення варіації ознаки необхідно для наукової організації вибіркового спостереження, дисперсійного і кореляційного аналізу.
Для вивчення варіації ознаки використовують такі показники як:
розмах варіації (R),
середнє лінійне відхилення (d),
дисперсія і середнє квадратичне відхилення (д2, д),
коефіцієнт варіації (V).
Розмах варіації -- це різниця між найбільшим і найменшим значенням ознаки: R= Xmax -Xmin.
Середнє лінійне відхилення - середня арифметична з абсолютних значень (модулів) відхилень окремих значень варіаційної ознаки від його середнього значення.
Середнє лінійне відхилення обчислюється за такими формулами: для не згрупованих даних:
;
для згрупованих даних, коли частоти різні:
.
Дисперсія -- це середня величина із квадратів відхилень варіант від середньої величини (д2 ), а корінь квадратний із дисперсії називається середнім квадратичним відхиленням.
Дисперсія обчислюється за формулами:
для незгрупованих даних -
;;
для згрупованих даних, коли частоти різні:
Усі розглянуті показники варіації характеризують абсолютний розмір відхилення і виражаються в тих самих одиницях виміру, в яких виражені варіанти і середня. Для порівняльної характеристики варіації рядів із різними рівнями застосовується відносний показник варіації -- коефіцієнт варіації.
Коефіцієнт варіації-- це відношення середнього квадратичного відхилення до середньої величини, виражене у відсотках:
.
Він наочно характеризує варіацію ознаки і є певною мірою надійності середньої. Якщо коефіцієнт варіації більший 33 %, то це означає, що середня не дуже надійна для даної сукупності і сукупність за цією ознакою неоднорідна.
Ознайомившись з основним теоретичним матеріалом з цієї теми, необхідно використати дані проектного завдання та розрахунки попередньої теми, щоб розрахувати середню арифметичну зважену, моду, медіану та показники варіації за даними, які характеризують рівень урожайності. Окремо необхідно розрахувати середню способом моментів.
Для розрахунку середньої арифметичної способом моментів необхідно використовувати дві властивості середньої арифметичної:
1. якщо усі варіанти зменшити на якесь число а, то і середня зменшиться на це саме число;
2. якщо варіанти зменшити в і разів (розділити), то і середня зменшиться у стільки ж разів.
Середня способом моментів обчислюється за формулою:
=m1i + a,
де m1 - момент першого порядку. Він дорівнює:
,
де а - число, на яке зменшуються усі варіанти, частіше це варіанта, що перебуває в середині ряду або має найбільшу частоту; і - величина інтервалу (оскільки в нашому випадку ряд рівноінтервальний).
Використовуючи інтервальний варіаційний ряд розподілу за продуктивністю корів, визначимо середній рівень продуктивності для всієї сукупності способом моментів.
Таблиця 9. Розрахунок середньої арифметичної способом моментів
Групи за рівнем продуктивності корів, ц |
Частоти, f |
Середина інтервалу, У |
у - а, а = 38, 1 |
, i= 2 |
уf |
||
31, 1 - 33, 1 |
2 |
32, 1 |
-6 |
-3 |
-6 |
64, 2 |
|
33, 1 - 35, 1 |
2 |
34, 1 |
-4 |
-2 |
-4 |
68, 2 |
|
35, 1 - 37, 1 |
10 |
36, 1 |
-2 |
-1 |
-10 |
361 |
|
37, 1 - 39, 1 |
11 |
38, 1 |
0 |
0 |
0 |
419, 1 |
|
39, 1 - 41, 1 |
3 |
40, 1 |
2 |
1 |
3 |
120, 3 |
|
Разом |
28 |
Х |
Х |
Х |
-17 |
1032, 8 |
Результати обчислень, наведених у таблиці, підставляємо у формулу:
,
Паралельно визначаємо середню арифметичну зважену:
Отже, середня арифметична, розрахована двома різними способами, дає один і той самий результат, і ми можемо стверджувати, що середній рівень продуктивності корів по сукупності становить 36, 88 ц.
Окрім степеневих середніх величин, у статистиці застосовуються описові характеристики ряду розподілу ознаки -- мода (Мо) і медіана (Ме).
Модою у статистиці називають величину ознаки варіанти, котра найчастіше зустрічається в сукупності. У інтервальних рядах розподілу моду визначають за такою формулою:
,
де у0 - мінімальна межа модального інтервалу, і - розмір модального інтервалу, f1 - частота інтервалу, що передує модальному, f2 - частота модального інтервалу, f3 - частота інтервалу, що стоїть за модальним.
За даними таблиці 8 визначимо моду :
Медіана - це варіанта, що стоїть у середині рангованого ряду і поділяє його навпіл, тобто ряду, розташованого у порядку зростання або спадання варіантів.
Медіана в інтервальному ряду розподілу визначається за формулою:
Ме=,
де у0 - мінімальна межа медіанного інтервалу; і- величина медіанного інтервалу; - напівсума частот (половина одиниць сукупності); SMe-1- сума накопичувальних частот, що стоять перед медіанним інтервалом; fMe - частота медіанного інтервалу.
За даними таблиці 8 визначимо медіану. Медіанним буде той інтервал, сума накопичувальних частот якого перша перевищує половину сукупності:
Додатково до медіани для характеристики структури варіаційного ряду розподілу обчислюють квартилі, які поділяють ранжирований ряд на 4 рівні частиниі децилі, які поділяють ранжирований ряд на 10 рівних частин. Другий квартиль дорівнює медіані, а першийітретій обчислюють аналогічно розрахунку медіані, тільки замість медіанного інтервалу беруть для першого квартиля інтервал, в якому знаходиться варіанта, що відокремлює 1/4 кількості частот, а для третього квартиля - інтервал, в якому знаходиться варіанта, що відокремлює 3/4 кількості частот.
Визначення першого і третього квартилів розглянемо на прикладі даних таблиці8. Для першого квартиля частина всіх частот дорівнює Сьомий варіант знаходиться в інтервалі 35, 1 - 37, 1. Нижня межа його = 35,1, величина i = 2, частота = 14, а сума нагромаджених частот інтервалів, що передують відповідним квартильним = 4. Отже, перший квартиль становить:
Це означає, що одна чверть корів має продуктивність 35, 52 ц. і менше, а три четверті - більш як 35, 52 ц.
Для третього квартиля частини всіх частот дорівнює Цей варіант лежить в інтервалі 37, 1 - 39, 1. Його нижня межа , величина i = 2, частота , а сума нагромаджених частот інтервалів, що передують відповідним квартильним, . Отже, третій квартиль становить:
ц.
Це означає, що три четверті корів мають продуктивність до 37, 66 ц., а одна чверть - більш як 37, 66 ц.
Децилі визначають за такою формулою:
Отже, десята частина всіх корів має продуктивність 33, 5 ц. і менше, а решта (90 %) - більш як 33, 5 ц.
Середня арифметична ( має певні властивості, які розкривають її суть.
1.Алгебраїчна сума відхилень окремих варіант ознаки від середньої дорівнює нулю:, тобто в середній взаємно компенсуються додатні та від'ємні відхилення окремих варіант.
2.Сума квадратів відхилень окремих варіант ознаки від середньої менша, ніж від будь-якої іншої величини:.
3. Якщо всі варіанти збільшити (зменшити) на одну і ту саму величину А, або в А раз, то й середня зміниться аналогічно.
4. Величина середньої залежить не від абсолютних значень ваг, а від пропорцій між ними. При пропорційній зміні всіх ваг середня не зміниться. Згідно з цією властивістю замість абсолютних ваг - частот fj - можна використати відносні ваги у вигляді часток або процентів 100dj. Математичний вираз:
або у відсотках .
Таблиця 10. Вихідні та розрахункові дані для обчислення властивостей середньої
1 2 3 4 5 |
Групи господарств за рівнем продуктивності корів, ц |
Частоти |
Середина інтервалу, у |
Розрахункові дані |
||||
а = 2 |
yk, k = 4 |
ykf |
||||||
31, 1 - 33, 1 |
2 |
32, 1 |
34, 1 |
68, 2 |
128,4 |
256,8 |
||
33, 1 - 35, 1 |
2 |
34, 1 |
36, 1 |
72, 2 |
136,4 |
272,8 |
||
35, 1 - 37, 1 |
10 |
36, 1 |
38, 1 |
381 |
144,4 |
1444 |
||
37, 1 - 39, 1 |
11 |
38, 1 |
40, 1 |
441, 1 |
152,4 |
1676,4 |
||
39, 1 - 41, 1 |
3 |
40, 1 |
42, 1 |
126, 3 |
160,4 |
481, 2 |
||
Разом |
28 |
Х |
Х |
1088, 8 |
Х |
4131,2 |
Отже, з таблиці 10 ми бачимо, що якщо кожне значення ознаки збільшити на числа а (в моєму випадку а = 2), то середнє значення відповідно зміниться на це саме число.. Тобто, дорівнює 36, 88 ц. , а якщо кожне значення ознаки збільшити на 2, то і збільшиться на 2. ( 38, 88 - 36, 88 = 2).
Або, якщо кожне значення ознаки збільшити в kчисло (У моєму випадку k = 4), то і середнє збільшиться в k число разів. , .
Після визначення середніх виникає питання про їх типовість або показовість, тобто про те, наскільки правильно і точно характеризує середня сукупність за досліджуваною ознакою, наскільки однорідна сукупність, що характеризується цією середньою. Для цього в статистиці використовуються показники варіації.
Таблиця 11. Розрахунок показників варіації за продуктивністю корів
1 2 3 4 5 |
Групи господарств за рівнем продуктивності корів, ц |
Частоти |
Середина інтервалу, у |
Розрахункові дані |
||||
f |
||||||||
31, 1 - 33, 1 |
2 |
32, 1 |
4, 78 |
9, 56 |
22, 85 |
45, 7 |
||
33, 1 - 35, 1 |
2 |
34, 1 |
2, 78 |
5, 56 |
7, 73 |
15, 46 |
||
35, 1 - 37, 1 |
10 |
36, 1 |
0, 78 |
7, 8 |
0, 61 |
6, 1 |
||
37, 1 - 39, 1 |
11 |
38, 1 |
1, 22 |
13, 42 |
1, 49 |
16, 39 |
||
39, 1 - 41, 1 |
3 |
40, 1 |
3, 22 |
9, 66 |
10, 37 |
31, 11 |
||
Разом |
28 |
Х |
Х |
46 |
Х |
114, 76 |
Оскільки наші данні представлено у вигляді інтервального варіаційного ряду розподілу, використовуємо формули для згрупованих даних.
1) Розмах варіації:
2) Середнє лінійне відхилення:
3) Дисперсія:
4) Середнє квадратичне відхилення:
ц.
5) Коефіцієнт варіації:
Розрахувавши середні величини і показники варіації, я можу зробити висновок, що в цілому в сукупності (28 господарств) середній рівень продуктивності корів становить 36, 88 ц. в той же час він коливається на 2, 02 ц., або на 5, 5 % відносно середнього рівня.
Дисперсія має деякі математичні властивості, використання яких значно спрощує її розрахунки, зокрема:
1. Якщо всі варіанти зменшити або збільшити на будь-яке постійне число, то величина дисперсії при цьому не зміниться:
2. Якщо всі варіанти зменшити або збільшити в а число разів, то дисперсія від цього зміниться в разів:
3. Якщо розрахувати середній квадрат відхилень від довільної величини а. яка відрізняється від середньої арифметичної , то він завжди буде більший за середній квадрат відхилень, обчислений від середньої арифметичної: >
4. При цьому середній квадрат відхилень означень ознаки від довільної величини завжди більший за дисперсію ознаки на квадрат різниці між середньою арифметичною і довільної величинами:
5. Якщо довільну величину а прирівняти до нуля, то попередня формула матиме такий вигляд:
6. Дисперсія постійної величини дорівнює нулю.
= 0.
Визначення дисперсії способом відліку від умовного початку (або від умовного нуля) використовують формулу:
Таблиці 12. Вихідні та розрахункові дані для обчислення властивостей дисперсії продуктивності корів.
Групи господарств за продуктивністю корів, ц |
Частоти, f |
Середина інтервалу, у |
Розрахункові дані |
||||
уа, а = 2 |
|||||||
31, 1 - 33, 1 |
2 |
32, 1 |
64, 2 |
-9, 57 |
91, 58 |
183, 17 |
|
33, 1 - 35, 1 |
2 |
34, 1 |
68, 2 |
31, 02 |
31, 02 |
62, 05 |
|
35, 1 - 37, 1 |
10 |
36, 1 |
72, 2 |
2, 46 |
2, 46 |
24, 65 |
|
37, 1 - 39, 1 |
11 |
38, 1 |
76, 2 |
5, 90 |
5, 90 |
64, 95 |
|
39, 1 - 41, 1 |
3 |
40, 1 |
80, 2 |
41, 34 |
41, 34 |
124, 03 |
|
Разом |
28 |
Х |
Х |
Х |
Х |
458, 86 |
.
Отже, дисперсія Це означає, що якщо всі варіанти збільшити в а число разів (у моєму випадку а = 2), то дисперсія від цього зміниться в разів (тобто в 4 рази):
.
Для аналізу закономірностей розподілу потрібно оцінити ступінь однорідності сукупності, асиметрію та ексцес розподілу.
Однорідними вважаються такі сукупності, елементи яких мають спільні властивості і належать до одного типу, класу.
В однорідних сукупностях розподіли, як правило, одновершинні (одно модальні ). Критерієм однорідності сукупності вважається V<33%, отже наша сукупність однорідна. Є розподіли багатовершинні для сукупностей неоднорідного складу.
Розподіли є: симетричні та асиметричні (скошені), гостро та плоско - вершинні. Асиметрія та ексцес - це дві пов'язані з варіацією властивості форми розподілу. Комплексне їх оцінювання здійснюють на основі центральних моментів розподілу. Алгебраїчно центральний момент розподілу - це середня арифметична к - го степеня відхилень індивідуальних значень ознаки від середньої.
В симетричному розподілі характеристики центра - середня, мода, медіана рівні між собою
.
У разі правосторонньої асиметрії: , в разі лівосторонньої: .
Найпростішою мірою асиметрії є величина , яка характеризує напрям і міру скошеності в середині розподілу. A>0- правостороння асиметрія, A<0- лівостороння. В помірно скісних розподілах A?1.
Ступінь зосередженості елементів сукупності навколо центра розподілу називають ексцесом розподілу. Це інша властивість одновершинних розподілів.
Асиметрія та ексцес оцінюється за допомогою центральних моментів розподілу:
де к - порядок моменту
µ1=0
µ2 - дисперсія
µ3 - для вимірювання асиметрії. µ3=0 - розподіл симетричний.
µ4 - для оцінювання ексцесу.
Таблиця 13
Таблиця 13.Вихідні та розрахункові дані для обчислення асиметрії та ексцесу
Групи господарств за рівнем продуктивності корів |
Частоти |
Середина Інтервалу,у |
Розрахункові дані |
|||||||
у - |
||||||||||
31, 1 - 33, 1 |
2 |
32, 1 |
-4,78 |
22,8484 |
-109,215 |
522,0494 |
45,6968 |
-218,431 |
1044,099 |
|
33, 1 - 35, 1 |
2 |
34, 1 |
-2,78 |
7,7284 |
-21,485 |
59,72817 |
15,4568 |
-42,9699 |
119,4563 |
|
35, 1 - 37, 1 |
10 |
36, 1 |
-0,78 |
0,6084 |
-0,47455 |
0,370151 |
6,084 |
-4,74552 |
3,701506 |
|
37, 1 - 39, 1 |
11 |
38, 1 |
1,22 |
1,4884 |
1,815848 |
2,215335 |
16,3724 |
19,97433 |
24,36868 |
|
39, 1 - 41, 1 |
3 |
40, 1 |
3,22 |
10,3684 |
33,38625 |
107,5037 |
31,1052 |
100,1587 |
322,5112 |
|
Разом |
28 |
Х |
Х |
Х |
Х |
Х |
114,7152 |
-146,013 |
1514,136 |
Обчислимо асиметрію і ексцес:
- центральний момент першого порядку.
===;
== -5, 214
- лівостороння (від'ємна) асиметрія.
==
= 0,25-гостровершинний розподіл, оскільки, Е.
Розділ 3. Кореляційний аналіз продуктивності корів
3.1 Рангова кореляція
Формули для визначення тісноти зв'язку між ознаками передбачають, що сукупності, до яких вони застосовуються, мають нормальний або близький до нормального розподіл. Якщо ж характер розподілу досліджуваної сукупності навіть передбачувано невідомий, то тісноту зв'язку можна обчислити за допомогою непараметричних критеріїв визначення тісноти зв'язку.
Особливістю цих критеріїв є те, що тіснота зв'язку між ознаками визначається не за кількісними значеннями варіантів, а за допомогою порівняння їх рангів. Під рангом розуміють порядковий номер одиниці сукупності в ранжированому ряду розподілу. Чим менші розбіжності між рангами, тим тісніший зв'язок між ознаками.
До непараметричних критеріїв показників тісноти зв'язку відносяться коефіцієнти: кореляції рангів, знаків Фехнера, асоціації, контингенції та ін.
Коефіцієнт кореляції рангів - це один з найпростіших показників тісноти зв'язку (його ще називають ранговим коефіцієнтом кореляції Спірмена). Суть його розрахунку полягає в такому: парні спостереження двох взаємопов'язаних ознак (результативної і факторної) ранжируються, а потім відповідно величині ознаки їм надається ранг від 1 до . Тіснота зв'язку визначається на основі близькості рангів, і формула коефіцієнта кореляції рангів буде мати вигляд:
де - різниці між величинами рангів в порівнюваних рядах; - число спостережень.
Коефіцієнт кореляції рангів може приймати значення від - 1 до + 1. Якщо ранги двох паралельних рядів повністю співпадають, то = 0, і тоді має місце прямий функціональний зв'язок, а = 1. При повному зворотному зв'язку (ранги розміщуються в зворотному порядку) = - 1. Ранжирувати обидві ознаки потрібно в одному і тому самому порядку: або від менших значень ознаки до більших, або навпаки. Методику розрахунку коефіцієнта кореляції рангів показано в таблиці 14.
Таблиця 14. Вихідні та розрахункові дані для обчислення рангової кореляції
Господарства |
Надій на корову, ц |
Витрати кормів на корову, ц к. од |
Ранги |
Різниця рангів |
Квадрат різниці |
||
За надоєм |
За витратами кормів |
||||||
1 |
36,3 |
37,4 |
12 |
7 |
5 |
25 |
|
2 |
37,7 |
38,6 |
18 |
18 |
0 |
0 |
|
3 |
38,3 |
39,4 |
24 |
19 |
5 |
25 |
|
4 |
37,3 |
42,2 |
16 |
27 |
-11 |
121 |
|
5 |
37,8 |
39,6 |
19,5 |
20 |
-0,5 |
0,25 |
|
6 |
38,2 |
40,6 |
23 |
24 |
-1 |
1 |
|
7 |
35,2 |
36,6 |
5 |
3 |
2 |
4 |
|
8 |
37,8 |
39,8 |
19,5 |
21,5 |
-2 |
4 |
|
9 |
38,1 |
41,2 |
22 |
25 |
-3 |
9 |
|
10 |
31,1 |
35,2 |
1 |
1 |
0 |
0 |
|
11 |
36,3 |
37,5 |
12 |
8,5 |
3,5 |
12,25 |
|
12 |
35,5 |
38,0 |
6,5 |
13,5 |
-7 |
49 |
|
13 |
37,3 |
38,0 |
16 |
13,5 |
2,5 |
6,25 |
|
14 |
37,9 |
38,3 |
21 |
17 |
4 |
16 |
|
15 |
41,1 |
40,1 |
28 |
23 |
5 |
25 |
|
16 |
35,9 |
37,0 |
8,5 |
5 |
3,5 |
12,25 |
|
17 |
35,9 |
37,3 |
8,5 |
6 |
2,5 |
6,25 |
|
18 |
39,2 |
39,8 |
26 |
21,5 |
4,5 |
20,25 |
|
19 |
38,5 |
43,1 |
25 |
28 |
-3 |
9 |
|
20 |
34,9 |
36,1 |
4 |
2 |
2 |
4 |
|
21 |
32,3 |
36,9 |
2 |
4 |
-2 |
4 |
|
22 |
36,6 |
38,1 |
14 |
16 |
-2 |
4 |
|
23 |
39,3 |
41,5 |
27 |
26 |
1 |
1 |
|
24 |
36,0 |
37,6 |
10 |
10,5 |
-0,5 |
0,25 |
|
25 |
33,6 |
37,6 |
3 |
10,5 |
-7,5 |
56,25 |
|
26 |
36,3 |
37,5 |
12 |
8,5 |
3,5 |
12,25 |
|
27 |
35,5 |
38,0 |
6,5 |
13,5 |
-7 |
49 |
|
28 |
37,3 |
38,0 |
16 |
13,5 |
2,5 |
6,25 |
|
Сума |
Х |
Х |
406 |
406 |
Х |
482,5 |
Розрахований коефіцієнт кореляції рангів свідчить про наявність прямого тісного зв'язку між продуктивністю корів і кількістю витрачених кормів.
Коефіцієнт кореляції рангів Спірмена коливається від -1 до +1. Чим ближче до 1, тим тісніший зв'язок. Знак + або - вказує напрям зв'язку. Якщо ранги за обома ознаками співпадають, то зв'язок прямий. Якщо = 0, то зв'язок між ознаками відсутній.
Таблиця 15. Вихідні та розрахункові дані для обчислення рангової кореляції
Господарства |
Надій на корову, ц |
Вихід телят на 100 корів, голів |
Ранги |
Різниця рангів |
Квадрат рангів |
||
За надоєм |
За виходом телят |
||||||
1 |
36,3 |
96 |
12 |
24,5 |
-12,5 |
156,25 |
|
2 |
37,7 |
93 |
18 |
10 |
8 |
64 |
|
3 |
38,3 |
92 |
24 |
6,5 |
17,5 |
306,25 |
|
4 |
37,3 |
92 |
16 |
6,5 |
9,5 |
90,25 |
|
5 |
37,8 |
94 |
19,5 |
14,5 |
5 |
25 |
|
6 |
38,2 |
95 |
23 |
19,5 |
3,5 |
12,25 |
|
7 |
35,2 |
93 |
5 |
10 |
-5 |
25 |
|
8 |
37,8 |
91 |
19,5 |
3 |
16,5 |
272,25 |
|
9 |
38,1 |
94 |
22 |
14,5 |
7,5 |
56,25 |
|
10 |
31,1 |
90 |
1 |
1 |
0 |
0 |
|
11 |
36,3 |
95 |
12 |
19,5 |
-7,5 |
56,25 |
|
12 |
35,5 |
96 |
6,5 |
24,5 |
-18 |
324 |
|
13 |
37,3 |
94 |
16 |
14,5 |
1,5 |
2,25 |
|
14 |
37,9 |
91 |
21 |
3 |
18 |
324 |
|
15 |
41,1 |
96 |
28 |
24,5 |
3,5 |
12,25 |
|
16 |
35,9 |
94 |
8,5 |
14,5 |
-6 |
36 |
|
17 |
35,9 |
95 |
8,5 |
19,5 |
-11 |
121 |
|
18 |
39,2 |
96 |
26 |
24,5 |
1,5 |
2,25 |
|
19 |
38,5 |
97 |
25 |
28 |
-3 |
9 |
|
20 |
34,9 |
92 |
4 |
6,5 |
-2,5 |
6,25 |
|
21 |
32,3 |
92 |
2 |
6,5 |
-4,5 |
20,25 |
|
22 |
36,6 |
94 |
14 |
14,5 |
-0,5 |
0,25 |
|
23 |
39,3 |
96 |
27 |
24,5 |
2,5 |
6,25 |
|
24 |
36,0 |
93 |
10 |
10 |
0 |
0 |
|
25 |
33,6 |
91 |
3 |
3 |
0 |
0 |
|
26 |
36,3 |
95 |
12 |
19,5 |
-7,5 |
56,25 |
|
27 |
35,5 |
96 |
6,5 |
24,5 |
-18 |
324 |
|
28 |
37,3 |
94 |
16 |
14,5 |
1,5 |
2,25 |
|
Сума |
Х |
Х |
406 |
406 |
Х |
2310 |
Розрахований коефіцієнт кореляції рангів свідчить про наявність прямого зв'язку між продуктивністю корів і виходом приплоду. Крім того, між продуктивністю корів та рівнем годівлі - зв'язок тісний, трохи слабший зв'язок між продуктивністю корів та виходом телят.
3.2 Аналіз простої кореляції
Явища та процеси, які відбуваються в суспільстві, зокрема у сфері правової діяльності, взаємопов'язані і взаємообумовлені. Ці взаємозв'язки статистика вивчає, використовуючи кореляційно-регресійний аналіз.
В основі цього аналізу лежить припущення про те, що залежність між значеннями факторної ознаки та умовними середніми значеннями результативної оцінки може бути представлена у вигляді функції:
яка називається рівнянням регресії. Розраховані за цим рівнянням очікувані середні значення результативної ознаки для кожної (із рівнів) факторної ознаки позначаються і називаються теоретичними, на відміну від емпіричних, тобто одержаних у результаті безпосередніх спостережень за значенням .
Якщо аналітичне групування дає змогу виявити тільки наявність та напрям зв'язку, то за допомогою рівняння регресії можна встановити, наскільки в середньому зміниться значення результативної ознаки при зміні факторної на одну одиницю.
Існують деякі передумови застосування кореляційного аналізу:
1. наявність причинно-наслідкових зв'язків між досліджуваними ознаками;
2. достатня варіація
3. однорідність сукупності (визначається за ф- критерієм)
4. числовий вираз досліджуваної ознаки.
Розглянемо парну модель, тобто з однією факторною ознакою. При виборі функціонального її виду використовують графіки, аналітичні групування, теоретичне обґрунтування.
При невеликому обсязі сукупності доцільно будувати графіки у вигляді кореляційного поля, де кожному елементу сукупності відповідає точка, а всі елементи утворюють певне скупчення точок. Загальний вигляд кореляційного поля дозволяє зробити висновок щодо форми лінії регресії. При великому обсязі сукупності використовують метод аналітичного групування. Графік групових середніх є емпіричною лінією регресії.
Можливий перебір функцій, коли обчислюють рівняння регресії різних видів і з них вибирають найкраще. Як правило, це рівняння з найвищим коефіцієнтом тісноти зв'язку між ознаками, що вивчають.
Серед безлічі функцій найпоширенішою в статистико-економічному аналізі є лінійна Y = а0+а1x. Це пояснюється, передусім, її простотою та змістовністю параметрів. Крім того, факторна ознака часто варіює в невеликих межах, що дає змогу показати апроксимацію зв'язку лінійною функцією. Параметр а1 лінійного рівняння називають коефіцієнтом регресії. Він показує, на скільки одиниць власного виміру в середньому змінюється значення ознаки у зі збільшенням значення ознаки х на одиницю. Параметр а0 з економічної точки зору не несе ніякої інформації.
На стані оцінки лінії регресії визначають параметри обраного рівняння методом найменших квадратів. Основна умова цього методу полягає у мінімізації суми квадратів відхилень емпіричних значень у від теоретичних У.
У(у -- Y)2= min.
Це дає можливість отримати найкращі оцінки параметрів а0 і а1.Для їх обчислення треба скласти і розв'язати систему нормальних рівнянь. Лінійній моделі відповідає система рівнянь з двома невідомими:
Дослідження форми зв'язку іноді приводить до необхідності використання нелінійних рівнянь регресії. У цьому разі при визначенні параметрів методом найменших квадратів рівняння регресії слід привести до лінійного виду певними перетвореннями. При вивченні взаємозв'язків найчастіше використовують такі функції:
1) степеневу Y=b0xа', яка приводиться до лінійного вигляду логарифмуванням logy=logаo+а1logx.
2)гіперболу Y=а0+а1/х приводять до лінійного вигляду, замінивши х новою змінною (її зворотним значенням z=1/x ): Y = а0 +а1z;
3) параболу другого порядку Y=а0+а1х+а2x2. Якщо замінити квадрат значень факторної ознаки (z=х2), то дістанемо лінійну функцію від двох змінних Y= а0+а1х+а2z.
Визначення тісноти зв'язку в кореляційно-регресійному аналізі ґрунтується на правилі складання дисперсій. В кореляційно-регресійному аналізі використовують теоретичні значення дисперсії. Дисперсію теоретичних значень називають факторною і обчислюють за формулою:
Вона характеризує варіацію результативної ознаки у, пов'язану з варіацією факторної ознаки х. З використанням факторної дисперсії обчислюють індекс кореляції, який є універсальним показником:
Індекс кореляції змінюється у межах від 0 до +1.
Для вимірювання тісноти зв'язку при залежності використовують коефіцієнт кореляції. Індекс кореляції змінюється в межах від 0 до 1, характеризує тісноту зв'язку, але економічної інтерпретації немає.
Значення rколиваються від -1 до +1 характеризують не тільки тісноту, але й напрям зв'язку. Додатне значення г означає прямий зв'язок між ознаками, від'ємне -- зворотний. На практиці лінійний коефіцієнт кореляції визначають за формулою:
Абсолютна величина коефіцієнту кореляції збігається з індексом кореляції. Чим більше коефіцієнт кореляції наближається до 1, тим тісніший зв'язок між досліджуваними ознаками.
r<0,3 - немає зв'язку
r=0,3 - 0,5 - слабкий зв'язок
r=0,5 - 0,7 - середній зв'язок
r> 0,7 - тісний зв'язок.
Мірою тісноти зв'язку в кореляційно-регресійному аналізі є коефіцієнт детермінації R2, який показує на скільки відсотків варіація результативної ознаки зумовлена варіацією факторної ознаки.
R=r2*100%.
Цей коефіцієнт характеризує ту частину варіації результативної ознаки у, яка відповідає лінійному рівнянню регресії. Коефіцієнт детермінації R2, як і кореляційне відношення, приймає значення від 0 до 1. При R = 0 теоретична дисперсія дорівнює нулю, всі теоретичні значення Yзбігаються з середнім значенням . Лінійний кореляційний зв'язок між х і у відсутній. При R2=1 теоретична дисперсія дорівнює загальній, залишкова -- нулю; емпіричні значення y і теоретичні Yзбігаються, зв'язок між ознаками х та y лінійно-функціональний.
Перевірку істотності зв'язку в кореляційно-регресійному аналізі здійснюють за допомогою F-критерію Фішера, який визначається за формулою:
,
де
p - кількість параметрів, n - кількість значень.
Якщо фактичне значення F більше від критичного, то зв'язок між результативною і факторною ознаками вважається істотним. Якщо фактичне значення F менше критичного, то наявність кореляційного зв'язку між ознаками не доведена і зв'язок вважається неістотним.
Як правило, кореляційно-регресійний аналіз проводиться за не згрупованими даними, але вихідна інформація може бути подана у вигляді аналітичного групування, або комбінаційного розподілу.
Проведемо кореляційний аналіз між 2-ма ознаками: продуктивністю корів, ц та витратами кормів ц. к. од.
Порахуємо критерій ф для визначення однорідності сукупності:
ф=
Оскільки 1.08<3, дана сукупність є однорідною.
Таблиця 16. Вихідні розрахункові дані для обчислення кореляційної залежності:
№ |
Надій на корову, ц |
Витрати кормів на корову, ц к. од |
Розрахункові величини |
Yx |
(Yx-Yc)2 |
||||
XY |
Y2 |
X2 |
|||||||
1 |
36,3 |
37,4 |
1357,62 |
1317,69 |
1398,76 |
35,68194 |
1,007556 |
||
2 |
37,7 |
38,6 |
1455,22 |
1421,29 |
1489,96 |
36,67978 |
3,52E-05 |
||
3 |
38,3 |
39,4 |
1509,02 |
1466,89 |
1552,36 |
37,345 |
0,434665 |
||
4 |
37,3 |
42,2 |
1574,06 |
1391,29 |
1780,84 |
39,67329 |
8,925625 |
||
5 |
37,8 |
39,6 |
1496,88 |
1428,84 |
1568,16 |
37,51131 |
0,681611 |
||
6 |
38,2 |
40,6 |
1550,92 |
1459,24 |
1648,36 |
38,34284 |
2,746075 |
||
7 |
35,2 |
36,6 |
1288,32 |
1239,04 |
1339,56 |
35,01671 |
2,785547 |
||
8 |
37,8 |
39,8 |
1504,44 |
1428,84 |
1584,04 |
37,67761 |
0,983873 |
||
9 |
38,1 |
41,2 |
1569,72 |
1451,61 |
1697,44 |
38,84176 |
4,64854 |
||
10 |
31,1 |
35,2 |
1094,72 |
967,21 |
1239,04 |
33,85257 |
8,026678 |
||
11 |
36,3 |
37,5 |
1361,25 |
1317,69 |
1406,25 |
35,76509 |
0,847537 |
||
12 |
35,5 |
38,0 |
1349 |
1260,25 |
1444 |
36,18086 |
0,254876 |
||
13 |
37,3 |
38,0 |
1417,4 |
1391,29 |
1444 |
36,18086 |
0,254876 |
||
14 |
37,9 |
38,3 |
1451,57 |
1436,41 |
1466,89 |
36,43032 |
0,065226 |
||
15 |
41,1 |
40,1 |
1648,11 |
1689,21 |
1608,01 |
37,92707 |
1,540982 |
||
16 |
35,9 |
37,0 |
1328,3 |
1288,81 |
1369 |
35,34933 |
1,78592 |
||
17 |
35,9 |
37,3 |
1339,07 |
1288,81 |
1391,29 |
35,59879 |
1,181404 |
||
18 |
39,2 |
39,8 |
1560,16 |
1536,64 |
1584,04 |
37,67761 |
0,983873 |
||
19 |
38,5 |
43,1 |
1659,35 |
1482,25 |
1857,61 |
40,42167 |
13,95737 |
||
20 |
34,9 |
36,1 |
1259,89 |
1218,01 |
1303,21 |
34,60095 |
4,34623 |
||
21 |
32,3 |
36,9 |
1191,87 |
1043,29 |
1361,61 |
35,26617 |
2,015084 |
||
22 |
36,6 |
38,1 |
1394,46 |
1339,56 |
1451,61 |
36,26401 |
0,17783 |
||
23 |
39,3 |
41,5 |
1630,95 |
1544,49 |
1722,25 |
39,09122 |
5,786462 |
||
24 |
36,0 |
37,6 |
1353,6 |
1296 |
1413,76 |
35,84825 |
0,701347 |
||
25 |
33,6 |
37,6 |
1263,36 |
1128,96 |
1413,76 |
35,84825 |
0,701347 |
||
26 |
36,3 |
37,5 |
1361,25 |
1317,69 |
1406,25 |
35,76509 |
0,847537 |
||
27 |
35,5 |
38,0 |
1349 |
1260,25 |
1444 |
36,18086 |
0,254876 |
||
28 |
37,3 |
38,0 |
1417,4 |
1391,29 |
1444 |
36,18086 |
0,254876 |
||
Разом |
1027,2 |
1081 |
39736,9 |
37802,8 |
41830,1 |
1027,2 |
66,19786 |
||
Середнє |
36,685714 |
38,607143 |
1419,175 |
1350,101 |
1493,931 |
36,68572 |
2,364209 |
Побудуємо лінійне кореляційне поле для Y та X1
ц. к. од.
5,62597 % < 33%
<33%
Перевіривши передумови використання методу найменших квадратів, побудуємо лінійне кореляційне рівняння залежності Y (надій на корову,ц) та X1 (витрати корів на корову,ц к.од):
Розв'яжемо систему рівнянь поділивши перше і друге рівняння почленно на коефіцієнт при а0.
Віднімемо перше рівняння від другого і отримаємо:
Знайдемо параметр а0 підставивши параметр а1 в друге рівняння другої системи:
Рівняння регресії матиме такий вигляд:
На практиці використовують різні модифікації формули коефіцієнта кореляції. Для оцінки щільності зв'язку між кількістю витрат кормів та продуктивністю корів скористаємося однією з модифікацій з формули:
Отриманий коефіцієнт кореляції свідчить про те, що зв'язок між продуктивністю корів та рівнем годівлі є прямий, оскільки r >0, крім того зв'язок тісний.
Щоб визначити міру впливу фактора на результат обчислюють індекс кореляції:
Розходження між індексом кореляції та коефіцієнтом кореляції невелике (допустимо 0,3)
На основі коефіцієнта кореляції визначають коефіцієнт детермінації, який показує скільки відсотків загального коливання результативної ознаки зумовлено впливом на неї факторної ознаки.
Визначимо коефіцієнт детермінації для Y та X1:
Отже, 55,532304% загального коливання продуктивності корів зумовлено відмінностями рівня годівлі, а решта - 44,467696% впливом неврахованих факторів.
Таблиця 17. Вихідні розрахункові дані для обчислення кореляційної залежності:
№ |
Надій на корову, ц |
Вихід приплоду, гол |
Розрахункові величини |
Yx |
(Yx-Yc)2 |
|||
XY |
Y2 |
X2 |
||||||
1 |
36,3 |
96 |
3484,8 |
1317,69 |
9216 |
37,85442 |
1,365876 |
|
2 |
37,7 |
93 |
3506,1 |
1421,29 |
8649 |
36,2451 |
0,194139 |
|
3 |
38,3 |
92 |
3523,6 |
1466,89 |
8464 |
35,70866 |
0,954631 |
|
4 |
37,3 |
92 |
3431,6 |
1391,29 |
8464 |
35,70866 |
0,954631 |
|
5 |
37,8 |
94 |
3553,2 |
1428,84 |
8836 |
36,78154 |
0,009183 |
|
6 |
38,2 |
95 |
3629 |
1459,24 |
9025 |
37,31798 |
0,399762 |
|
7 |
35,2 |
93 |
3273,6 |
1239,04 |
8649 |
36,2451 |
0,194139 |
|
8 |
37,8 |
91 |
3439,8 |
1428,84 |
8281 |
35,17222 |
2,290659 |
|
9 |
38,1 |
94 |
3581,4 |
1451,61 |
8836 |
36,78154 |
0,009183 |
|
10 |
31,1 |
90 |
2799 |
967,21 |
8100 |
34,63578 |
4,202221 |
|
11 |
36,3 |
95 |
3448,5 |
1317,69 |
9025 |
37,317 |
0,399762 |
|
12 |
35,5 |
96 |
3408 |
1260,25 |
9216 |
37,85442 |
1,365876 |
|
13 |
37,3 |
94 |
3506,2 |
1391,29 |
8836 |
36,78154 |
0,009183 |
|
14 |
37,9 |
91 |
3448,9 |
1436,41 |
8281 |
35,17222 |
2,290659 |
|
15 |
41,1 |
96 |
3945,6 |
1689,21 |
9216 |
37,85442 |
1,365876 |
|
16 |
35,9 |
94 |
3374,6 |
1288,81 |
8836 |
36,78154 |
0,009183 |
|
17 |
35,9 |
95 |
3410,5 |
1288,81 |
9025 |
37,31798 |
0,399762 |
|
18 |
39,2 |
96 |
3763,2 |
1536,64 |
9216 |
37,85442 |
1,365876 |
|
19 |
38,5 |
97 |
3734,5 |
1482,25 |
9409 |
38,39086 |
2,907525 |
|
20 |
34,9 |
92 |
3210,8 |
1218,01 |
8464 |
35,70866 |
0,954631 |
|
21 |
32,3 |
92 |
2971,6 |
1043,29 |
8464 |
35,70866 |
0,954631 |
|
22 |
36,6 |
94 |
3440,4 |
1339,56 |
8836 |
36,78154 |
0,009183 |
|
23 |
39,3 |
96 |
3772,8 |
1544,49 |
9216 |
37,85442 |
1,365876 |
|
24 |
36,0 |
93 |
3348 |
1296 |
8649 |
36,2451 |
0,194139 |
|
25 |
33,6 |
91 |
3057,6 |
1128,96 |
8281 |
35,17222 |
2,290659 |
|
26 |
36,3 |
95 |
3448,5 |
1317,69 |
9025 |
37,31798 |
0,399762 |
|
27 |
35,5 |
96 |
3408 |
1260,25 |
9216 |
37,85442 |
1,365876 |
|
28 |
37,3 |
94 |
3506,2 |
1391,29 |
8836 |
36,78154 |
0,009183 |
|
Всього |
1027,20000 |
2627,00000 |
96426 |
37802,8 |
246567 |
1027,201 |
28,23206 |
|
В середньому |
36,685714 |
93,821429 |
3443,786 |
1350,101 |
8805,964 |
36,68575 |
1,008288 |
Побудуємо лінійне кореляційне поле для Y та X2
ц. к. од.
3,503827
% < 33%
<33%
Перевіривши передумови використання методу найменших квадратів, побудуємо лінійне кореляційне рівняння залежності Y (надій на корову,ц) та X2 (вихід приплоду, гол):
Розв'яжемо систему рівнянь поділивши перше і друге рівняння почленно на коефіцієнт при а0.
Віднімемо перше рівняння від другого і отримаємо:
Знайдемо параметр а0 підставивши параметр а1в друге рівняння другої системи:
Рівняння регресії матиме такий вигляд:
На практиці використовують різні модифікації формули коефіцієнта кореляції. Для оцінки щільності зв'язку між кількістю витрат кормів та продуктивністю корів скористаємося однією з модифікацій з формули:
Отриманий коефіцієнт кореляції свідчить про те, що зв'язок між продуктивністю корів та рівнем годівлі є прямий, оскільки r >0, крім того зв'язок тісний.
Щоб визначити міру впливу фактора на результат обчислюють індекс кореляції.
На основі коефіцієнта кореляції визначають коефіцієнт детермінації, який показує скільки відсотків загального коливання результативної ознаки зумовлено впливом на неї факторної ознаки.
Визначимо коефіцієнт детермінації для Y та X1:
Отже, 24,01% загального коливання продуктивності корів зумовлено відмінностями рівня годівлі, а решта - 75,99% впливом неврахованих факторів.
3.3 Аналіз множинної кореляції
Кореляція, за допомогою якої визначається вплив на результативну ознаку двох та більше взаємопов'язаних факторних ознак, називають множинною. Під час вивчення множинної кореляції можна застосовувати як прямолінійні, так і криволінійні рівняння регресії.
Багатофакторні регресійні моделі дають змогу оцінювати вплив на досліджувану результативну ознаку кожного окремого із включених у рівняння факторів за фіксованого значення (на середньому рівні) інших факторів. До того ж важливою умовою множинної кореляції є відсутність функціонального зв'язку між факторами.
Важливе значення за множинної кореляції має вибір форми зв'язку та відповідного математичного рівняння множинної кореляції. Вибір типу функції має ґрунтуватися на теоретичному аналізі досліджуваного явища або на досвіді попередніх аналогічних досліджень. Ураховуючи, що будь-яку функцію багатьох змінних можна звести до лінійного типу логарифмуванням, рівняння множинної регресії частіше будують у лінійній формі. Формула лінійного рівняння множинної регресії має такий вигляд:
,
де Yx1x2…xn - теоретичне значення результативної ознаки; a0,a1,a2,a3,an- параметри рівняння;x1,x2,x3,xn - факторні ознаки.
Параметри a0, a1 та a2 розраховують розв'язуючи систему нормальних рівнянь:
Параметр а0- вільний член і не несе ніякого економічного змісту.
Параметри а1 та а2 називають частковими коефіцієнтами регресії (або коефіцієнти чистої регресії). Вони показують пропорцію впливу даного фактора на результат при умові, що інші фактори незмінні.
Якщо а1 , а2 > 0, зв'язок прямий;
Якщо а1 , а2 < 0, зв'язок обернений;
Якщо а1 , а2 = 0, то зв'язок відсутній.
Подобные документы
Статичний аналіз продуктивності корів, валового виробництва продукції. Аналіз рівня факторів продуктивності корів методом аналітичного групування. Аналіз динаміки продуктивності корів. Індексний аналіз продуктивності корів, валового виробництва продукції.
курсовая работа [205,9 K], добавлен 16.04.2011Методологія розрахунку основних показників статистики тваринництва в сегменті великої рогатої худоби. Статистичні угрупування результатів спостережень за продуктивністю корів. Кореляційний аналіз продуктивності та факторів, що на неї впливають.
курсовая работа [1,3 M], добавлен 11.07.2010Основи економічного аналізу продуктивності праці. Система статистичних показників рівня продуктивності праці у тваринництві. Застосування кореляційного методу в аналізі продуктивності. Визначення тенденції трудомісткості продукції тваринництва.
курсовая работа [128,3 K], добавлен 10.11.2010Сучасний розвиток сільського господарства України. Система показників статистики рослинництва. Статистична оцінка показників врожайності цукрових буряків та фактори, що на неї впливають. Характеристика рядів розподілу. Кореляційний аналіз врожайності.
курсовая работа [146,0 K], добавлен 11.05.2009Зв’язки суспільних явищ, види їх зв’язків. Загальні методи вивчення зв’язків. Метод аналітичних групувань, порівняння паралельних рядів. Кореляційний аналіз, коефіцієнт Фішера. Аналіз зв’язку між атрибутивними ознаками. Показник рангової кореляції.
курсовая работа [410,4 K], добавлен 20.10.2012Групування статичних даних та обчислення статичних показників. Практичне застосування методики проведення статистичних групувань, вивчення залежності. Аналіз рядів динаміки, індексний і кореляційний аналіз. Визначення тенденції розвитку та прогнозування.
курсовая работа [39,0 K], добавлен 17.10.2009Основи аналізу простої лінійної та нелінійної кореляції, аналіз регресії і оцінка тісноти зв’язку. Аналіз урожайності зернових культур методом множинної кореляції. Особливості використання непараметричних методів визначення тісноти кореляційного зв’язку.
курсовая работа [318,6 K], добавлен 19.05.2011Динаміка і виконання плану продуктивності праці по галузях і в цілому по господарству, за основними видами сільськогосподарської продукції. Аналіз співвідношення темпів росту продуктивності праці і її оплати. Фактори, що впливають на продуктивність праці.
курсовая работа [69,8 K], добавлен 20.03.2012Статистична оцінка динаміки абсолютних показників та структури прямих іноземних інвестицій в економіку України у 1995–2005 роках. Індексний аналіз та характеристики статистичних вибірок. Статистичні спостереження та характеристики статистичних вибірок.
контрольная работа [2,1 M], добавлен 11.07.2010Значення та система показників аналізу ефективності використання трудових ресурсів. Економічна характеристика господарсько-фінансової діяльності Диканської райспоживспілки. Аналіз впливу екстенсивних та інтенсивних факторів на рівень продуктивності праці.
курсовая работа [74,3 K], добавлен 07.09.2009