Статистичний аналіз залежностей економічних показників типових підприємств для надання практичних рекомендацій по підвищенню продуктивності праці

Методи одержання стійких статистичних оцінок. Агломеративні методи кластерного аналізу. Грубі помилки та методи їх виявлення. Множинна нелінійна регресія. Метод головних компонент. Сутність завдання факторного аналізу. Робастне статистичне оцінювання.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык украинский
Дата добавления 28.04.2014
Размер файла 1,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ХМЕЛЬНИЦЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

Кафедра прикладної математики та соціальної інформатики

КУРСОВА РОБОТА

Статистичний аналіз залежностей економічних показників типових підприємств для надання практичних рекомендацій по підвищенню продуктивності праці

КРПМ. 010061.00.00.00

Студент групи ПМ - 10 - 1

С.С. Григорук

Керівник

к. п. н., доцент І.І. Ігнатьєва

2014р.

Вступ

У сучасному суспільстві з високим рівнем розвитку науки та технологій, зокрема комп'ютерних, особливого значення набуває вміння користуватись надбаннями сучасної техніки, використовувати для підвищення рівня життя різноманітні методи науки. Тут потрібно не лише бути добре обізнаним в тих чи інших методах, не лише знати про існування передових технологій, але й вміти обрати серед існуючих найкращі, тобто найефективніші для розв'язання певної конкретної задачі. Перед керівництвом підприємств за умов жорсткої конкуренції на теренах сучасного, ще не повністю розвиненого ринку за необхідності приймати максимально ефективні рішення виникає проблема: в якому напрямку скеровувати діяльність підприємства, щоб забезпечити оптимальний план виробництва; якими методами користуватись, щоб максимально повно реалізувати виробничий потенціал підприємства.

Світ сучасних математичних знань має особливі інструменти для вирішення подібних проблем. Існуючі статистичні методи дозволяють провести досить повний аналіз діяльності підприємства та знайти шлях переходу від існуючого стану до бажаного, тобто оптимізувати виробництво, забезпечити максимальну ефективність функціонування.

Мета курсової роботи: надання практичних рекомендацій щодо шляхів підвищення продуктивності праці.

Об'єкт дослідження: продуктивність праці.

Предмет дослідження: підприємства.

Поставлена в роботі мета передбачає необхідність вирішення таких завдань:

– за допомогою кластерного аналізу виділити типову групу;

– визначити залежності між показниками за допомогою кореляційного аналізу;

– побудувати регресійні моделі (парну, множинну лінійну, множинну нелінійну) та визначити регресійне рівняння, що якнайкраще аналітично описує залежність продуктивності праці від інших ознак;

– методами факторного аналізу визначити приховані (латентні) ознаки, що мають вплив на результуючу ознаку;

– розробити рекомендації щодо підвищення продуктивності праці підприємств даної галузі.

Для реалізації поставлених задач та проведення розрахунків було використано наступні програмні продукти: Microsoft Office Excel, С#.

Дана робота складається з трьох розділів. У першому розділі описано економічний зміст показників та сформульовано постановку задачі.

У другому містяться теоретичні відомості, за допомогою яких реалізовувались поставлені завдання.

У третьому розділі проведено розрахунки та наведено результати дослідження.

1. Опис предметної області

1.1 Економічний зміст показників

В управлінні підприємством або організацією, що здійснюють будь-які види господарської діяльності в ринковому економічному середовищі, застосовуються різні показники. Їх використання має відображати особливості діяльності підприємства або організації, давати змогу вести певну аналітичну роботу.

Тому будь-яке підприємство можна охарактеризувати такими економічними показниками:

– продуктивність праці;

– індекс зниження собівартості продукції;

– рентабельність;

– трудомісткість одиниці продукції;

– питома вага робітників у складі ПП;

– питома вага покупних виробів;

– коефіцієнт змінності устаткування;

– премії і винагороди на одного працівника;

– питома вага утрат від браку;

– фондовіддача;

– середньорічна чисельність ПП;

– середньорічна вартість ОВФ;

– середньорічний фонд заробітної плати ПП;

– фондоозброєність праці;

– оборотність нормованих оборотних коштів;

– оборотність ненормованих оборотних коштів;

– невиробничі витрати.

Для даного дослідження обрано наступні показники:

1) Продуктивність праці

Продуктивність праці - це показник трудової діяльності працівників. Характеризує кількість продукції, виробленої за одиницю часу, або витрати часу на виробництво одиниці продукції.

2) Премії і винагороди на одного працівника

Винагорода - цінності, які отримує особа в обмін на послуги (роботи), які вона надала (виконала) для іншої особи. Зазвичай складається з грошової винагороди, яка часто називається розрахунком або заробітною платою.

Премія - основний, найбільш ефективний стимулюючий виробничу, підприємницьку, торговельну або комерційну діяльність вид додаткової, понад основну, заробітної плати, яка виплачується за поліпшення основних показників колективної та індивідуальної праці працівників, а також кінцевих загальних результатів виробничої, підприємницької, торговельної або комерційної діяльності.

Добре спланована система мотивації дозволяє суттєво підвищувати ефективність роботи персоналу, збільшувати обсяги продажу, покращувати виробничий процес та обслуговування клієнтів, без особливо великих матеріальних затрат з боку компанії. Адже, коли працівник виконує свої посадові обов'язки з повною самовіддачею і його цілі саморозвитку включають розвиток підприємства загалом, тоді коефіцієнт корисної дії зростає в декілька разів.

Таким чином, премії та винагороди для працівників підприємства мають прямий вплив на продуктивність їх праці.

3) Питома вага утрат від браку

Брак у виробництві - це продукція, напівфабрикати, деталі, вузли й роботи, які не відповідають за своєю якістю встановленим стандартам або технічним умовам і не можуть бути використані за своїм прямим призначенням, або можуть бути використані тільки після додаткових витрат на виправлення.

Питома вага утрат від браку прямо пропорційно впливає на продуктивність праці. Оскільки зниження втрат від браку у виробництві дає значну економію часу й дозволяє підприємству збільшувати випуск продукції без додаткових витрат праці. Скорочення браку супроводжується відносною економією чисельності, веде до зростання продуктивності праці.

4) Фондовіддача

Фондовіддача - це відношення вартості випущеної продукції у вартісному виразі до середньорічної вартості основних виробничих фондів. Вона виражає ефективність використання засобів праці, тобто показує, скільки виробляється готової продукції на одиницю основних виробничих фондів.

Для характеристики повної фондовіддачі нерідко її розраховують як відношення валового продукту до всіх виробничих фондів. Для цього визначають середньорічну вартість основних і оборотних виробничих фондів (їхню загальну вартість на початок і кінець року ділять на 2, або їхню вартість по місяцях ділять на 12).

Фондовіддача основних фондів знаходитися в прямо пропорційній залежності від продуктивності праці і обернено пропорційній від фондоозброєності. Фондовіддача розраховується до всіх активних основних виробничих фондів

5) Середньорічна чисельність ПП

Середньооблікова чисельність працівників - визначається за кожний місяць підсумовуванням облікового складу працівників за всі дні місяця і діленням одержаного результату на кількість календарних днів у місяці. Він застосовується для обчислення продуктивності праці, середньої заробітної плати, коефіцієнтів обороту, плинності кадрів і низки інших показників.

Продуктивність праці прямо пропорційно залежить від середньорічної чисельності працівників підприємства, оскільки для підвищення продуктивності праці необхідно або збільшувати обсяги виробництва або зменшувати кількість працівників підприємства.

6) Середньорічна чисельність ОВФ

Середньорічна вартість основних виробничих фондів - середньорічна вартість засобів праці, які беруть участь у процесі виробництва протягом тривалого періоду, при цьому не змінюють своєї натурально-речової форми і поступово частинами переносять свою вартість на вартість виготовленої продукції.

Такі показники, як фондомісткість, фондовіддача, фондоозброєність дають можливість оцінити економічну ефективність використання ОФ. Базою для їх обчислення служить середньорічна вартість основних фондів.

При зменшенні фондомісткості відповідно збільшується фондовіддача, це свідчить про те, що ефективність використання основних засобів підвищується. На величину фондовіддачі і фондомісткості величезний вплив справляє фондоозброєність - середньорічна вартість основних фондів у розрахунку на середньооблікова за рік чисельність працівників.

Таким чином, продуктивність праці прямо пропорційно залежить від середньорічної вартості основних фондів.

7) Невиробничі витрати

Невиробничі витрати - витрати пов'язані з основними фондами, товарними запасами, предметами споживчого призначення, які безпосередньо не залежать від процесів виробництва (витрати на експлуатацію будівель, заклади охорони здоров'я, освіти, культури, витрати пов'язані із збереженням товарів, транспортні витрати та ін.).

Невиробничі витрати підприємства входять до повної собівартості реалізованої продукції і впливають на зменшення суми прибутку, тому завданням кожного підприємства є максимальне скорочення невиробничих витрат

1.2 Постановка задачі

В результаті вимірювань семи економічних показників досліджуваних змінних на 53 об'єктах сукупності, що аналізується, методами прикладного статистичного аналізу дослідити залежність продуктивності праці (Y1) від премій і винагород на одного працівника (Х8), питомої ваги утрат від браку (Х9), фондовіддачі (Х10), середньорічної чисельності працівників підприємства (Х11), середньорічної вартості ОВФ (Х12), невиробничих витрат (Х17), яка б дозволила найкращим чином надати практичні рекомендації по підвищенню продуктивності праці Y1 за даними значень пояснюючих змінних

2. Теоретична частина

2.1 Робастне статистичне оцінювання

2.1.1 Грубі помилки та методи їх виявлення

При дослідженні статистичних сукупностей даних часто доводиться мати справу з даними, значення яких відрізняються від значень основного масиву (помилки або викиди). При розв'язуванні завдань робастного оцінювання виділяють два типи даних, що засмічують вихідну статистичну сукупність.

До першого типу відносять дані, які неістотно відрізняються від значень, що є типовими для сукупності. Такі дані не викликають значних спотворень в аналітичних результатах і можуть опрацьовуватись традиційними статистичними.

До другого типу відносять ті дані, які значно відхиляються від типових даних сукупності. Їх називають грубими помилками. Вони підлягають спеціальній обробці.

Причинами грубих помилок є:

– специфічні особливості окремих елементів досліджуваної сукупності;

вони, як правило, призводять до випадкових відхилень;

– невірне групування або розбиття елементів на однорідні підмножини, і,

як наслідок, неправильне зарахування окремих елементів до досліджуваної сукупності;

– грубі помилки при реєстрації та опрацюванні даних.

Кожне зі значень, яке є підозрілим на помилковість, перевіряється за допомогою спеціальних статистичних критеріїв.

Т-критерій Граббса. Даний критерій дозволяє здійснити перевірку одного помилкового значення сукупності. Перевірка здійснюється за наступним алгоритмом:

1) обчислення вибіркової середньої по безпомилкових даних, тобто, тих даних, з яких вилучене підозріле на помилку значення;

2) обчислення вибіркового середньоквадратичного відхилення по

безпомилкових даних;

3) розрахунок спостереженого значення критерія:

(2.1)

4) знаходження за таблицею критичного значення критерія при рівні

значущості та кількості безпомилкових даних . Якщо , то гіпотеза про помилковість досліджуваного значення приймається.

Перевірка наступних підозрілих значень здійснюється після вилучення помилки з сукупності. Перевагою даного критерія є його простота у застосуванні.

L-критерій Тіт'єна та Мура застосовується для перевірки групи значень на помилковість. В такому випадку можливі наступні ситуації:

– помилки знаходяться у верхній частині ранжованого ряду даних;

– помилки знаходяться у нижній частині ранжованого ряду даних.

Розглянемо спочатку перший випадок. Алгоритмом:

1) обчислення вибіркової загальної середньої по всіх даних сукупності;

2) обчислення вибіркової середньої по безпомилкових даних, тобто, тих даних, з яких вилучені підозрілі на помилку значення;

3) розрахунок спостереженого значення критерія:

(2.2)

де -кількість помилок.

Чисельник розраховується по безпомилкових даних, знаменник - по всіх даних сукупності.

4) знаходження за таблицею критичного значення критерія при рівні значущості , кількості вихідних даних та кількості безпомилкових даних . Якщо , то гіпотеза про помилковість досліджуваного значення приймається.

Аналогічно критерій використовується у випадку розташування групи помилок у нижній частині ранжованого ряду даних.

E-критерій Тіт'єна та Мура використовується у випадку розташування помилкових даних з обох кінців ранжованої сукупності. Емпіричне значення критерію обчислюється за формулою:

(2.3)

де та - кількість підозрілих на помилковість значень у нижній та верхній частинах ранжованого ряду даних,

- безпомилкова середня, обчислена по відкинутих підозрілих значеннях з обох кінців ряду;

- загальна середня.

Емпіричне значення критерію порівнюється з критичним, знайденим за відповідною таблицею при рівні значущості , кількості вихідних даних та кількості безпомилкових даних . Гіпотеза про помилковість значень приймається, якщо емпіричне значення менше за критичне.

2.1.2 Методи одержання стійких статистичних оцінок

Після знаходження помилок вирішується завдання оцінювання параметрів вибіркової сукупності. При цьому помилкові дані або відкидаються, або модифікуються. Далі будуть розглянуті два підходи робастного оцінювання вибіркової середньої.

Формула середньої за Пуанкаре. Нехай у вихідній сукупності є помилкових даних, розташованих у верхній частині ранжованого ряду. Тоді вони вилучаються з сукупності. Однак щоб вилучення не вплинуло істотно на зміну розрахованого значення стосовно істинного, з нижньої частини вихідної сукупності також вилучається перших значень. Вибіркова середня тоді знаходиться за формулою

(2.4)

Аналогічно здійснюється розрахунок стійкої середньої у випадку розташування помилки у нижній частині ряду.

Якщо помилкові дані розташовані з обох кінців сукупності, вона модифікується таким чином, щоб мінімізувати кількість безпомилкових даних, які будуть вилучені з сукупності. Тобто, з одного кінця ранжованої сукупності вилучаються всі помилкові дані, а з іншого - того, де їх було менше, крім помилкових вилучаються і безпомилкові.

Наведений спосіб робастного оцінювання є досить простим, але має недолік - значно скорочується вихідна сукупність даних.

Формула середньої за Вінзором. Обчислення середньої за Вінзором передбачає попередню модифікацію вихідної сукупності даних. Нехай помилки у кількостіодиниць розташовані у верхній частині впорядкованого за зростанням ряду даних. Тоді всі помилкові значення замінюються на перше безпомилкове значення у верхній частині сукупності . Відповідним чином перетворюються дані у нижній частині сукупності - перших значень замінюються на значення . Наведений процес перетворення сукупності називається вінзорізацією даних. Тоді стійка середня обчислюється за загальною формулою середньої для перетворених даних. Якщо вінзорізовані дані позначити через , то вираз для розрахунку має вигляд

(2.5)

Аналогічно перетворюються дані у випадку розташування помилок в нижній частині ранжованого ряду даних. Якщо помилки знаходяться в обох частинах ряду, то вінзорізація відбувається таким чином, щоб максимально їх виключити.

Формули стійких середніх за Пуанкаре та за Вінзором дають гарні результати для сукупностей зі симетричним розподілом засмічень, коли грубі помилки розташовані в обох кінцях ранжованої сукупності даних.

2.2 Ієрархічний кластерний аналіз

Кластерний аналіз - це сукупність методів, що дозволяють класифікувати багатомірність спостереження за відсутності апріорної інформації про розподіл генеральної сукупності з якої зроблено вибірку досліджуваних об'єктів. Мета кластерного аналізу - утворення груп, схожих між собою об'єктів, які називаються кластерами.

Кластерний аналіз призводить до розбиття на групи з урахуванням всіх ознак одночасно. Методи кластерного аналізу: агломеративні, диви зимні та ітераційні. Використається як спосіб вимірювання евклідова відстань:

(2.4)

Оцінка розбиття на кластери проводиться за допомогою функціоналу якості розбиття . Використовуються наступні види функціоналів:

– загальна сума внутрішньо - групових дисперсій

(2.5)

– загальна сума попарних внутрішньо - кластерних відстаней між елементами:

(2.6)

– узагальнена внутрішньо - класова дисперсія:

(2.7)

де - кількість кластерів;

- вектор середніх значень ознак об'єктів -го кластера;

- дисперсія об'єктів -го кластера;

- коваріаційна матриця об'єктів -го кластера;

- кількість об'єктів, що належать -му кластеру.

Найкращим вважається таке розбиття, при якому функціонал досягає свого екстремального (min) значення.

2.2.1 Агломеративні методи кластерного аналізу

Сутність методів: послідовне об'єднання двох найбільш подібних кластерів в один, що містить в собі всі об'єкти.

Загальний алгоритм:

– кожен об'єкт розглядається як окремий кластер;

– обчислюється матриця відмінностей між об'єктами;

– на основі матриці відмінностей знаходяться два найбільш близькі кластери;

– перераховується матриця відстаней між кластерами;

– процес повторюється з кроку 3 до утворення одного кластера;

– визначається кількість кластерів, на які розіб'ється вхідна сукупність шляхом аналізу відстаней між кластерами.

Існує загальна формула, яка дозволяє обчислити відстань між кластерами незалежно від методу її оцінки. Нехай на деякому кроці в кластер були об'єднані кластери: , то відстань від нього до деякого кластера визначають за формулою:

(2.8)

Параметри визначаються методом яким проводилося об'єднання. Значення параметрів подано у таблиці 2.1.

Таблиця 2.1 - Значення параметрів формули перерахунку відстані між кластерами в залежності від методу оцінки їх близькості

Метод

Ближнього сусіда

0,5

0,5

0

-0,5

Дальнього сусіда

0,5

0,5

0

0,5

Метод оцінки відстані між кластерами повинен обиратись з урахуванням відомостей про існуючу структуру в сукупності об'єктів спостережень або з урахуванням вимог до оптимізації обраного критерію якості кластеризації.

2.2.2 Дивизимний метод кластерного аналіз

Дивизимний метод за процесом розрахунків є протилежним агломеративному. Початково припускається, що всі об'єкти належать одному кластеру.

Алгоритм методу:

1) обчислюється матриця відстаней;

2) знаходять два об'єкти, відстань між якими найбільша, ці об'єкти утворять центри нових кластерів;

3) решта об'єктів розподіляють на два кластери за ступенем близькості їх до центрів;

4) обраний кластер ділимо на 2 кластери згідно пунктів 2 - 4;

5) процедуру повторюємо поки не буде утворено кластерів по одному об'єкту в кожному з них;

6) найбільш доцільна кількість кластерів визначається на тому кроці після якого зменшення відстані між кластерами приріст був найбільший.

Перевагою дивизимного методу є те, що він не вимагає перерахунку матриці відстаней на кожному кроці.

2.2.3 Ітераційні методи кластерного аналізу

Суть ітераційних методів полягає в тому, що процес класифікації починається із визначення початкових умов, тобто кількості утворюваних кластерів та еталонів.

Метод -середніх належить до групи ітераційних методів еталонного типу.

Алгоритм цього методу: нехай є спостережень, кожне з яких характеризується ознаками. Ці спостереження необхідно розбити на кластерів.

З точок відбирають випадковим чином або задають виходячи з деяких апріорних міркувань точок об'єктів, які обирають за “еталони” .

З об'єктів, що залишилися, витягується точка і перевіряється до якого з еталонів вона знаходиться найближче. Для перевірки використовується одна з наведених метрик в таблиці 1.2.

Таблиця 2.2 - Метрики

Назва

Формула

1

Евклідова відстань

2

Лінійна відстань

(відстань міських кварталів)

3

Відстань Мінковського

4

Супремум - норма

5

Відстань Махаланобіса

де коваріаційна матриця

Початкова вага кожного кластера буде рівна . Після приєднання елемента до якогось -го кластера, еталон цього кластера та його вага перераховується за формулами

,

Процедуру повторюємо з другого кроку. Процес закінчується тоді, коли не залишається вільних елементів.

2.3 Кореляційний аналіз

Кореляційний аналіз представляє собою інструмент, який дозволяє кількісно оцінити зв'язки між великим числом взаємодіючих економічних явищ - при цьому, деякі з них невідомі. Схема складання прогнозу полягає в зборі даних про значення залежних змінних, їх аналізі на предмет наявності зв'язку і, якщо такий зв'язок існує, необхідно оцінити тісноту цього зв'язку, це і є кореляція.

Кореляційний аналіз проводиться за наступною схемою:

З метою встановлення залежностей між параметрами будують попарні кореляційні поля. Обчислюють точкові оцінки числових характеристик за формулою

для того, щоб знайти коефіцієнти кореляції.

Коефіцієнт кореляції обчислюється за формулою:

(2.9)

Обчислюють коефіцієнт детермінації за формулою:

(2.10)

За допомогою якого встановлюють найсильніші та найслабші зв'язки між параметрами. Обчислюють точкові оцінки умовних середніх квадратичних відхилень за формулою:

(2.11)

Обчислюють точкові оцінки часткових коефіцієнтів кореляції. Для цього записують кореляційну матрицю:

(2.12)

Обчислюють точкові оцінки коефіцієнтів кореляції за формулою:

(2.13)

де - алгебраїчні доповнення до кореляційної матриці.

Якщо значення часткових коефіцієнтів кореляції менші від значень квадратичних коефіцієнтів кореляції, то можна зробити висновок про те, що при виключенні одного з параметрів зв'язок між іншими параметрами слабшає. Це говорить про те, що той параметр що виключається посилює кореляцію між іншими змінними.

Обчислюють часткові коефіцієнти детермінації. Якщо часткові коефіцієнти детермінації менші за квадратичні (парні), то це свідчить про те, що тісна залежність, яку показали обчислення парних коефіцієнтів обумовлено частково або повністю дією на цю пару інших фіксованих випадкових величин. Якщо частковий коефіцієнт детермінації більший за парний, то фіксовані компоненти послаблюють зв'язок.

Обчислюють точкові оцінки залишкових дисперсій при фіксованих значеннях за формулою:

(2.14)

Обчислюють точкові оцінки множинних коефіцієнтів детермінації та кореляції за формулами:

(2.15)

Коефіцієнти показують залежність однієї величини від усіх інших.

Перевіряють за рівнем значущості значимість множинних коефіцієнтів детермінації в генеральній сукупності. Спочатку обчислюють емпіричне значення критерію за формулою:

(2.16)

За таблицею розподілу Фішера знаходять критичні значення критерію . Якщо критичне значення менше ніж емпіричне, то відхиляється, якщо навпаки, то приймається. Якщо коефіцієнт не значимий, то в генеральній сукупності залежність відсутня.

2.3.1 Мультиколінеарність

При моделюванні багатьох соціально-економічних явищ та процесів виникає задача виявлення та оцінки зв'язку між ними. У багатьох дослідженнях виявляється, що деяка результативна ознака змінюється під впливом не одного, а кількох факторів.

Одна з передумов застосування методу найменших квадратів до оцінки параметрів лінійних багатофакторних моделей - це відсутність лінійних зв'язків між незалежними змінними моделі. Якщо такі зв'язки існують, то це явище називають мультиколінеарність.

Суть мультиколінеарності полягає в тому, що в багатофакторній регресійній моделі дві або більше незалежних змінних пов'язані між собою лінійною залежністю або, іншими словами, мають високий ступінь кореляції:

Наявність мультиколінеарності створює певні проблеми при розробці моделей. Насамперед, визначник матриці спостережень наближається до нуля, і оператор оцінювання за звичайним МНК стає надзвичайно чутливий до похибок вимірювань і похибок обчислень. При цьому МНК оцінки можуть мати значне зміщення відносно дійсних оцінок узагальненої моделі, а в деяких випадках можуть стати взагалі беззмістовними.

Найповніше дослідити мультиколінеарність дає змогу алгоритм Фаррара-Глобера:

1) нормалізування змінних економетричної моделі:

(2.17)

де n - кількість спостережень;

m - кількість незалежних змінних;

- дисперсія незалежної змінної;

- середнє значення фактора Хі.

2) обчислення кореляційної матриці:

, (2.18)

де R - кореляційна матриця.

Однак на основі цієї залежності не можна стверджувати, що отриманий зв'язок є явищем мультиколінеарності. Якщо діагональні елементи матриці не дорівнюють одиниці, то на діагоналі цієї матриці потрібно проставити одиниці, а до решти елементів додати різницю між одиницею й значенням діагонального елемента.

3) визначення визначника кореляційної матриці . Обчислення критерю :

(2.19)

Порівняти це значення з табличним при ступенях свободи і рівні значущості (якщо , то в масиві незалежних змінних існує мультиколінеарність).

4) визначення матриці похибок: .

5) розрахунок F критерію:

, (2.20)

Значення критеріїв порівняти з табличним при і ступенях свободи й рівня значущості (якщо , то відповідна незалежна змінна мультиколінеарна з іншими).

6) розрахування коефіцієнтів детермінації та часткових коефіцієнтів кореляції, які характеризують щільність зв'язку між двома змінними за умови, що інші змінні не впливають на цей зв'язок.

7) обчислення t критерію

(2.21)

Значення критеріїв порівняти з табличним при (m-n) ступенях свободи та рівні значущості (якщо , то то між незалежними змінними існує мультиколінеарність).

Якщо , то певна змінна залежить від усіх інших незалежних змінних і треба вирішити питання про її виключення з переліку змінних. Якщо то і щільно пов'язані між собою. Аналізуючи F і t критерій, робимо висновок, яку зі змінних треба виключити з моделі.

2.4 Регресійний аналіз

Кількісний вплив факторів на результативний показник вивчається за допомогою регресійного аналізу, який дозволяє встановити вид аналітичної залежності між ознакамита оцінити параметри моделі.

2.4.1 Парна лінійна регресія

Модель будується на основі кореляційного аналізу. У загальному вигляді регресійна модель між факторною ознакою та результативною ознакою з врахуванням фактора випадкових величин (помилок) записується у вигляді:

(2.22)

де і - невідомі параметри регресійної моделі.

Задача регресійного аналізу полягає у відшуканні невідомих параметрів і рівняння регресії. При цьому необхідно досягти “найкращої” апроксимації. Найчастіше при цьому користуються методом найменших квадратів, що передбачає мінімізацію виразу:

,

де - фактичні (емпіричні), а - розрахункові (теоретичні) значення результативної ознаки.

Невідомі параметри і можна знайти із системи нормальних рівнянь:

(2.23)

Необхідно розрахувати базисні середні та залишкову дисперсію.

Для визначення значущості моделі за - критерієм Фішера необхідно обчислити розрахункове значення:

. (2.24)

Табличне значення критерію Фішера для рівня значущості та числа ступенів свободи становить .

Якщо , то побудована модель адекватна статистичним даним, якщо , то модель неадекватна.

Для перевірки перевіряють значущість параметрів за - критерієм Стьюдента необхідно розрахувати розрахункове значення критерію.

(2.25)

Якщо більші ,то параметри моделі значущі.

2.4.2 Парна нелінійна регресія

На практиці часто зустрічаються економетричні моделі з нелінійною залежністю між показником та фактором .

За методикою оцінок параметрів парну нелінійну регресію поділяють на два типи:

– нелінійна за факторами, але лінійна за невідомими параметрами;

– нелінійна за факторами та параметрами.

Найчастіше використовують такі парні нелінійні моделі:

1) поліноміальна:

2) гіперболічна:

3) логарифмічна:

4) степенева:

5) показникова:

6) експоненціальна:

Лінеаризуємо дану модель. Далі працюємо з нею як зі звичайною парною лінійною регресією.

2.4.3 Множинна лінійна регресія

У реальному житті при аналізі соціально-економічних явищ та процесів має місце багатомірний їх опис, тобто є необхідність використовувати в аналізі велике число показників (параметрів або ознак). Для опису таких процесів застосовується множинна регресія.

Загальний вигляд рівняння множинної регресії:

(2.26)

Параметри моделі оцінюються методом найменших квадратів.

Алгоритм виконання множинної лінійної регресії:

1) Знаходження добутку:

,

де - об'єм вибірки.

2) Обчислення:

.

3) Знаходження .

4) Збчислення оцінки для коефіцієнта регресії:

за формулою .

5) Записується оцінка для рівняння регресії, яка має вигляд:

.

6) Перевіряється значущість одержаного рівняння регресії (перевірка наадекватність одержаної моделі). Висувають дві гіпотези: - рівняння регресії не значуще, - рівняння регресії значуще.

Знаходиться

,

де - сума квадратів відхилень значень результуючої ознаки у регресії

,

сума квадратів відхилень значень регресії від нуля

.

Застосовується - критерій:

(2.27)

кількість незалежних змінних, - об'єм вибірки.

Порівнюється , яке визначається при рівні значущості і ступенях свободи , з .

Якщо , то нульова гіпотеза відхиляється, дана модель значима в генеральні сукупності, тобто хоча б одне значення з .

Якщо , тоді приймається нульова гіпотеза, що свідчить про неадекватність моделі в реальному процесі. У випадку, якщо приймається нульова гіпотеза, то наступний пункт можна не робити.

7) Якщо нульова гіпотеза відхилилась, то перевіряємо значущість кожного коефіцієнта регресії окремо. Для цього знаходять оцінку для залишкової дисперсії

.

Знайти оцінку коваріаційної матриці вектора :

Перевіряється значущість коефіцієнта регресії:

За t-критерієм Стьюдента

(2.28)

,

, приймається (), відхиляється ().

Якщо хоча б один з коефіцієнтів не значимий, переходимо до покрокового регресійного аналізу.

8) В моделі регресії не враховуються доданки, які містять не значимий коефіцієнт регресії, проводиться перерахунок моделі наступним чином. З вхідних даних виключаються значення фактора, який має не значимий коефіцієнт регресії, будується множинна лінійна регресійна модель.

9) У випадку, коли всі коефіцієнти значимі, перевіряється ступінь впливу залишків на регресійну модель, тобто обчислюється кореляційне відношення:

(2.29)

Якщо кореляційне відношення , то модель можна використовувати на практиці. Якщо - є значний вплив випадкових факторів.

2.4.4 Множинна нелінійна регресія

Найбільш розповсюджені моделі нелінійної регресії:

– адитивні - моделі, величина результуючої ознаки яких дорівнює сумі відповідних значень факторів. До адитивних моделей відносяться:

1) ;

2) ;

3) ;

– мультиплікативні - моделі, в яких величина результуючої ознаки дорівнює добутку відповідних значень факторних ознак. До мультиплікативних моделей відносяться

а) ;

б) .

Лінеаризація - це перехід від нелінійної моделі до лінійної.

Якщо модель адитивна, то:

1) , ;

2) , ;

3) , .

Якщо модель мультиплікативна, то спочатку застосовується логарифмування, тобто зведення до адитивної моделі:

а) , ;

б) , .

Алгоритм побудови моделі представлений далі.

Нехай модель мультиплікативна виду:

.

1) проводимо лінеаризацію функції:

;

2) лінеаризуємо вхідні дані;

3) виконуємо усі дії по побудові множинної лінійної регресії моделі відповідно до пункту (2.4.2);

4) знаходимо ,тобто експоненціюємо;

5) знаходимо , тобто шукається з моделі одержаної в пункті 3;

6) перевіряємо адекватність та знаходимо допустиму область.

2.5 Факторний аналіз

2.5.1 Сутність завдання факторного аналізу

Сутність методів факторного аналізу полягає в переході від опису деякої множини досліджуваних об'єктів, заданої великим набором непрямих безпосередньо вимірюваних ознак, до їх опису меншим числом максимально інформативних глибинних змінних, що відображають найбільш істотні властивості явища. Такого роду змінні, що називаються факторами, є деякими функціями початкових ознак. В більшості випадків фактори являють собою латентні (скриті) ознаки, які не підлягають прямому вимірюванню, але здійснюють безпосередній вплив на досліджуване явище чи процес.

Фактор є розрахунковою змінною, тобто якоюсь новою характеристикою об'єктів, що вивчаються. Опис фактора в термінах його зв'язку з набором початкових ознак відшуковується у вигляді так званої факторної матриці, або матриці факторних навантажень розмірністю , де - кількість вихідних ознак, а - число факторів. Основою для побудови факторної матриці служить кореляційна матриця. Вона відображає ступінь взаємозв'язку між кожною парою ознак, тоді як факторна матриця характеризує ступінь зв'язку між кожною з даних ознак і факторів, виявлених в процесі аналізу. При цьому значення обирається виходячи з двох умов: повинне бути багато менше за , а рівень втрат в інформації достатньо малим.

Факторна матриця дозволяє виділити для кожного фактора групу параметрів, найтісніше з ним зв'язаних. Тим самим відкривається можливість зіставити фактори один з одним, дати їм змістовне тлумачення і найменування, тобто навести інтерпретацію факторів.

2.5.2 Постановка завдання факторного аналізу

Нехай є набір стандартизованих вихідних ознак , . Необхідно замінити ці ознаки іншими . Нові ознаки називають факторами. При цьому виходять з припущення, що початкові ознаки є результатом дії деяких спільних чинників, в ролі яких і будуть виступати нові фактори. Загальна модель факторного аналізу має такий вигляд:

(2.30)

Ознаки відображають характерні риси вихідних ознак і називаються характерностями. - факторні ознаки, відображають спільні риси вхідних ознак. - факторні навантаження (показують частку загального фактора у вихідній ознаці ). Значення факторних навантажень коливаються в межах від -1 до 1. Чим ближчі вони за модулем до 1, тим зв'язок між фактором та ознакою щільніший. Якщо величина факторного навантаження додатна, то вплив фактора на ознаку позитивний, інакше - негативний.

Лінійність взаємозв'язку у факторній моделі є припущенням, оскільки в дійсності основні параметри, що визначають соціально-економічні явища, взаємодіють більш складно. Тому модель факторного аналізу є першим наближенням до відображення реальних процесів.

Матричний запис факторної моделі:

,

де - матриця реалізацій вихідних ознак розмірності (mn);

- матриця факторних навантажень, спільностей розмірності (nk);

- матриця реалізацій факторів, розмірності (m k);

- діагональна матриця факторних навантажень характерностей, розмірності (n n);

- матриця реалізацій характерностей, розмірності (mn);

Кожне рівняння системи (2.31) можна подати у вигляді:

.

Залежність між компонентами ознак та факторів її можна записати таким чином:

,

де - -те значення -ї ознаки;

- факторне навантаження -го фактора;

- -те значення -того фактора;

- факторне навантаження характерності -ї ознаки;

- -те значення характерності -ї ознаки;

Одержані фактори будуються таким чином, щоб вони були взаємно некорельовані між собою та характерностями.

У факторному аналізі при розрахунку факторних навантажень відіграє роль кореляційна матриця стандартизованих вхідних ознак , вона побудована за значеннями вихідних ознак. Її елементи обчислюються за формулою:

(2.33)

При проведенні перетворень враховано ознаку ортогональності, що .

Дисперсія вихідної ознаки:

,

де - частка дисперсії ознаки , яка пояснюється відібраними факторами;

- відображає частку характерного фактора в дисперсії.

Основним завданням факторного аналізу є пояснення відібраними факторами якомога більшої частки дисперсії вхідних ознак. Факторне навантаження виражає кореляцію між факторами і ознакою, і між характерністю і ознакою.

2.5.3 Метод головних компонент

Метод головних компонент відноситься до компонентного аналізу і є самостійним методом багатомірного статистичного аналізу. Даний метод дозволяє за вихідними ознаками побудувати узагальнених ознак, які називаються головними компонентами і являють собою штучні змінні, що є лінійними комбінаціями вихідних ознак.

Властивості головних компонент:

а) їх кількість дорівнює кількості вихідних ознак;

б) вони є ортогональними;

в) вони є стандартизованими;

г) вони впорядковані таким чином, що перша головна компонента пояснює

найбільшу частку дисперсії вхідних ознак. Наступна найбільшу частку дисперсії, що залишилась непоясненою першою компонентою.

На практиці для аналізу беруть, як правило, тільки ті компоненти, сумарна частка дисперсії яких не менше 80%, а інші відкидаються як такі, що не значимі.

Алгоритм методу головних компонент:

1) Обчислюється матриця стандартизованих ознак .

2) Обчислюється кореляційна матриця стандартизованих ознак .

3) Обчислюється матриця власних значень:

та матриця нормованих власних векторів

.

4) Обчислюємо матрицю факторних навантажень:

(2.31)

5) За матрицею власних значень обчислюється частка дисперсії (власне значення це і є дисперсія).

(2.32)

6) Обчислюється матриця значень факторів:

(2.33)

7) За початковими та одержаною будуємо регресійну модель лінійну.

Склад компоненти визначається за коефіцієнтом інформованості:

(2.34)

Набір пояснюючих ознак вважається задовільним, якщо величина коефіцієнта інформованості становить не менше 0,75.

2.5.4 Метод головних факторів

При знаходженні факторів за методом головних факторів передбачається , що характерності вже відомі. Це означає, що в кореляційній матриці R діагональні елементи виражають лише спільності, а тому менші одиниці. Метод головних факторів полягає в знаходженні такої матриці факторних навантажень W, яка задовольняє співвідношенню:

WWT = R - H12 = R, (2.35)

де H - діагональна матриця, що виражає характерність;

R - редукована матриця кореляцій.

Матриця факторних навантажень знаходиться з точністю до ортогонального перетворення.

На практиці редукцію вихідної кореляційної матриці можна провести декількома способами:

– методом найбільшої кореляції - діагональний елемент замінюється на найбільше по відповідному рядку (стовпчику) недіагональне значення коефіцієнта кореляції;

– методом Барта - для кожного рядка спочатку знаходиться середнє значення коефіцієнта кореляції; якщо воно порівняно велике, то діагональний елемент замінюється трохи більшим за найбільше по рядку значення коефіцієнта кореляції, а якщо воно порівняно мале, то діагональний елемент замінюється трохи меншим за найбільше по рядку значення коефіцієнта кореляції.

– методом тріад - діагональний елемент обчислюється за формулою

, (2.36)

де rik та ris - найбільші по рядку значення коефіцієнта кореляції.

Оцінка значущості кореляційної матриці може проводитись за критерієм Уілкіса 2 .

Спостережене значення критерію обчислюється за формулою

. (2.37)

Це значення порівнюється з критичним для 2 - розподілу, знайденим при заданому рівні значущості та кількості ступенів вільності =n(n-1)/2. Значущість кореляційної матриці підтверджується, якщо спостережене значення перевищує критичне

.

Достатність виділених факторів може бути перевірена за критерієм Лоулі 2 .

Спостережене значення критерію обчислюється за формулою

. (2.38)

де R+ - матриця залишкових кореляцій, значущість якої перевіряється;

R - вихідна редукована матриця.

Критичне значення знаходиться при заданому рівні значущості та кількості ступенів вільності

=((n-k)2 -n- k) /2

де k - кількість виділених головних факторів. Ця кількість є достатньою, якщо спостережене значення критерію менше за критичне:

.

Отже, алгоритм обчислень за методом головних факторів має наступний вигляд:

1) обчислення матриці стандартизованих ознак: XZ;

2) обчислення кореляційної матриці стандартизованих ознак: ZR;

3) обчислення редукованої кореляційної матриці: RR;

4) обчислення першого власного значення 1 та відповідно йому нормованого власного вектора V1 редукованої кореляційної матриці: R(1, V1);

5) обчислення вектора факторних навантажень першого фактора F1: (1,V1)W1;

6) обчислення матриці залишкових кореляцій : (R, W1) R1;

7) перевірка значущості матриці залишкових кореляцій. Якщо вона значуща, то ітераційний процес продовжується.

Інтерпретація одержаних факторів здійснюється наведеному розглянутому підходу при розгляді методу головних компонент.

3 Практична частина

3.1 Робастне статистичне оцінювання

З метою виявлення грубих помилок у вибірковій сукупності було проведено робастне статистичне оцінювання.

У вхідній сукупності даних є значення, які значно відхиляються від інших. Для перевірки результативного показника та кожного з факторів на наявність грубих помилок було проранжовано вхідні дані (Додаток B).

Візуально проаналізувавши проранжовані дані визначено, що значні відхилення значень є у всіх факторах. У таблиці 3.1.1 подано порядкові номери підозрілих на помилку значень у вибірці початкових даних.

Таблиця 3.1.1 - Підозрілі елементи

Порядковий номер підозрілого елемента

Фактор, в якому присутній підозрілий елемент

52

Y1

18

X9

29

X8 , X10

31

X17

15

X11

25

X11, X12

39

X11

37

X11, X12

38

X11

49

X8

50

X11

Для того, щоб перевірити чи підозрілі елементи є грубими помилками застосовано критерії:

· Т-критерій Граббса для факторів Y1, X9, X10, X17;

· L-критерій Тітьєна та Мура для фактора X12;

· Е-критерій Тітьєна та Мура для факторів X8 та X11.

Результат перевірки вхідних даних на грубі помилки занесені до таблиці 3.1.2.

Таблиця 3.1.2 - Результати робастного оцінювання

Фактор

Значення критерію

Y1

Значення помилкові

X8

Значення помилкові

X9

Значення помилкові

X10

Значення помилкові

X11

Значення помилкові

X12

X17

Значення не помилкові

Аналіз результатів таблиці показує, що з даної вибіркової сукупності необхідно виключити 52-ге підприємство, оскільки воно є помилковим у результуючій ознаці.

Знайдено середні вибіркові за Пуанкаре (формула 2.4), Вінзором (формула 2.5) та описовою статистикою Excel. Результати занесено до таблиці 3.1.3.

Таблиця 3.1.3 - Середні вибіркові

Фактори

Середнє вибіркове за Пуанкаре

Середнє вибіркове за Вінзором

Описова статистика Excel

Y1

7,93

7,881

7,970

X8

1,068

1,034

1,072

X9

0,470

0,477

0,486

X10

1,534

1,520

1,526

X11

14742,805

13728,491

14707,792

X12

80,929

84,579

91,876

X17

19,570

19,570

19.570

Аналіз даних таблиці показує, що значення середніх для фактора X17 є однаковими, оскільки у даній сукупності відсутні помилкові значення.

Таким чином, у результаті проведеного робастного статистичного оцінювання було проаналізовано дану вибіркову сукупність та висунуто гіпотези про помилковість значень, які візуально відрізняються від основної групи (Таблиця 3.1.1)

У результаті перевірки за Т-критерієм Граббса, L-критерієм та Е-критерієм Тітьєна та Мура гіпотеза про помилковість даних підтвердилася для підприємств у факторах: Y1 (продуктивність праці), X8 (премії та винагороди на одного працівника), X9 (питома вага утрат від браку), X10 (фондовіддача), X11 (середньорічна чисельність ПП), X12 (середньорічна вартість ОВФ).

Спираючись на отримані результати було прийнято рішення про виключення з генеральної сукупності 52-ге підприємство, оскільки воно є помилковим в результуючій ознаці.

Оцінено параметри вибіркової сукупності за формулами вибіркової середньої за Пуанкаре та Вінзором, а також за пакетом аналізу Excel (Таблиця 3.1.3).

3.2 Ієрархічний кластерний аналіз

З метою виділення типової групи підприємств було проведено кластерний аналіз.

Групування об'єктів проведено трьома методами: агломеративним, дивизимним та ітераційним методами. Для цього було використано програмний продукт на C# (Додаток C).

За алгоритмами агломеративного методу (п. 2.2.1), дивизимного методу (п. 2.2.2) та ітераційного методу (п. 2.2.3) вибіркову сукупність було розбито на два кластери

Оцінку розбиття на кластери було проведено за допомогою функціоналу якості розбиття - загальна сума попарних внутрішньогрупових дисперсій (2.5).

Функціонал досягає свого мінімального значення для розбиття за ітераційним методом. Отже, до типової групи увійшло 41 підприємство:

Таблиця 3.2.1 - Результати кластерного аналізу

Назва методу

Кластери

Значення функціоналу якості

Агломеративний метод дальнього сусіда

302887415,4

Дивизимний метод

302887415,4

Ітераційний метод k - середніх

112549992,3

Дану типову групу будемо використовувати для подальшого дослідження.

3.3 Кореляційний аналіз

Проведено попередню оцінку наявності лінійного зв'язку за допомогою кореляційних полів. (Додаток Е)

Побудувавши кореляційні поля залежності результуючого показника від кожного з факторів, а також факторів між собою бачимо, що лінійна залежність спостерігається між такими парами:

Y1 і X11 - продуктивність праці та середньорічна чисельність ПП (Рисунок Е.4);

Y1 та X10 - продуктивність праці та фондовіддача (Рисунок Е.3);

Y1 і X12 - продуктивність праці та середньорічна вартість ОВФ (Рисунок Е.5);

X8 і X12 - премії та винагороди на одного працівника та середньорічна вартість ОВФ (Рисунок Е.10);

X9 і X17 - питома вага утрат від браку та невиробничі витрати (Рисунок Е.15);

X11 і X12 - середньорічна чисельність ПП та середньорічна вартість ОВФ (Рисунок Е.19).

Коефіцієнти кореляції обчислено за формулою (2.9): Матриця парних коефіцієнтів кореляції має вигляд:

Таблиця 3.3.1- Парні коефіцієнти кореляції

Y1

X8

X9

X10

X11

X12

X17

Y1

1,000

0,119

0,121

0,254

0,185

0,270

-0,015

X8

0,119

1,000

0,121

-0,047

0,258

0,572

-0,342

X9

0,121

0,121

1,000

-0,273

0,194

0,306

-0,400

X10

0,254

-0,047

-0,273

1,000

0,078

-0,257

0,033

X11

0,185

0,258

0,194

0,078

1,000

0,741

-0,041

X12

0,270

0,572

0,306

-0,257

0,741

1,000

-0,139

X17

-0,015

-0,342

-0,400

0,033

-0,041

-0,139

1,000

Коефіцієнт детермінації обчислено за формулою (2.10). Матриця парних коефіцієнтів детермінації має вигляд:

Таблиця 3.3.2 - Парні коефіцієнти детермінації

Y1

X8

X9

X10

X11

X12

X17

Y1

1,000

0,014

0,015

0,065

0,034

0,073

0,000

X8

0,014

1,000

0,015

0,002

0,067

0,327

0,117

X9

0,015

0,015

1,000

0,074

0,038

0,094

0,160

X10

0,065

0,002

0,074

1,000

0,006

0,066

0,001

X11

0,034

0,067

0,038

0,006

1,000

0,548

0,002

X12

0,073

0,327

0,094

0,066

0,548

1,000

0,019

X17

0,000

0,117

0,160

0,001

0,002

0,019

1,000

За результатами перевірки на мультиколінеарність (Додаток F) було виключено фактори Х12 - середньорічна чисельність ОВФ та Х17 - невиробничі витрати.

Тоді матриця парних коефіцієнтів кореляції має вигляд:

Таблиця 3.3.3 - Матриця парних коефіцієнтів кореляції

Y1

X8

X9

X10

X11

Y1

1,000

0,014

0,015

0,065

0,034

X8

0,014

1,000

0,015

0,002

0,067

X9

0,015

0,015

1,000

0,074

0,038

X10

0,065

0,002

0,074

1,000

0,006

X11

0,034

0,067

0,038

0,006

1,000

Визначено оцінки параметрів семивимірного нормального закону розподілу - вектори середніх арифметичних і стандартних відхилень, матриці парних коефіцієнтів кореляції та детермінації.

Таблиця 3.3.4 - Середні арифметичні та стандартні відхилення

Y1

X8

X9

X10

X11

Середнє

7,129

1,014

0,525

1,538

10683,805

Стандартне відхилення

1,773

0,715

0,373

0,415

4707,697

Обчислено точкові оцінки числових характеристик за формулою

:

Визначено елементи матриці часткових коефіцієнтів кореляції за формулою (2.13).

Матриця часткових коефіцієнтів кореляції має вигляд

Таблиця 3.3.5 - Матриця часткових коефіцієнтів кореляції

Y1

X8

X9

X10

X11

Y1

1,000

-0,087

0,168

-0,289

0,107

X8

-0,087

1,000

-0,041

-0,073

-0,234

X9

0,168

-0,041

1,000

0,323

0,181

X10

-0,289

-0,073

0,323

1,000

-0,108

X11

0,107

-0,234

0,181

-0,108

1,000

Таблиця 3.3.6 - Матриця часткових коефіцієнтів детермінації:

Y1

X8

X9

X10

X11

Y1

1,000

0,008

0,028

0,083

0,011

X8

0,008

1,000

0,002

0,005

0,055

X9

0,028

0,002

1,000

0,104

0,033

X10

0,083

0,005

0,104

1,000

0,012

X11

0,011

0,055

0,033

0,012

1,000

Перевіримо часткові коефіцієнти кореляції на значущість. З таблиці - статистики Фішера-Ієйтса для числа знаходимо проміжок для критичного значення . З межами проміжку для критичного значення -статистики порівнюємо модулі точкових оцінок часткових коефіцієнтів кореляції. Якщо значення більше за верхню межу, то - відхиляється, а якщо менше за нижню межу - приймається. Якщо потрапляє в проміжок, то може бути відхилено.

Значення - статистики Фішера-Ієйтса рівне: верхня межа - 0,325, нижня межа - 0,304. Значення часткового коефіцієнта вибираємо більше, ніж 0,304.

Таблиця 3.3.7 - Перевірка на значущість часткових коефіцієнтів кореляції

Номер коефіцієнта

Значення коефіцієнта

r1,8

-0,087

r1,9

0,168

r1,10

-0,289

r1,11

0,107

r8,9

-0,041

r8,10

-0,073

r8,11

-0,234

r9,10

0,323

r9,11

0,181

r10,11

-0,108

rкр

0,304

Таким чином, значущими є частковий коефіцієнт кореляції між факторами та :

Для значущих коефіцієнтів кореляції знайдено довірчі інтервали. Таким чином, частковий коефіцієнт кореляції r9,10 знаходиться в межах

Оскільки значення часткових коефіцієнтів кореляції менші за значення парних між факторами Y1 та X8 , Y1 та X11, X8 та X11, X9 та X11, X10 та X11 то при виключенні фактора X12 зв'язок між цими факторами слабшає. Це свідчить про те, що саме цей фактор посилює кореляцію між даними змінними.

Значення часткових коефіцієнтів детермінації між факторами Y1 та X10, X8 та X10, X9 та X10, X10 та X11 більші, ніж значення парних коефіцієнтів. Це означає, що фіксовані компоненти послаблюють зв'язок між парами даних факторів.

Обчислено точкові оцінки множинних коефіцієнтів кореляції та детермінації за формулами (2.14?2.15) для того, щоб виявити залежності між однією ознакою з усіма іншими (Таблиця 3.3.7). Дані коефіцієнти детермінації перевірено на значимість.

Таблиця 3.3.8 - Точкові оцінки множинних коефіцієнтів кореляції та детермінації без мультиплікативного фактора

Ознака

Коефіцієнт кореляції

Коефіцієнт детермінації

Емпіричне значення критерію Фішера

Критичне значення критерію Фішера

0,355

0,126

1,294

2,634

0,285

0,081

0,794

0,385

0,148

1,569

0,412

0,170

1,842

0,351

0,123

1,261

Таким чином маємо, що не значущими є всі коефіцієнти детермінації, оскільки

і , ,

Таким чином, провівши кореляційний аналіз було побудовано кореляційні поля (додаток Е), проаналізувавши які було висунуто гіпотези, що кореляційний зв'язок існує між парами:

Y1 і X11 - продуктивність праці та середньорічна чисельність ПП (Рисунок Е.4);

Y1 та X10 - продуктивність праці та фондовіддача (Рисунок Е.3);

Y1 і X12 - продуктивність праці та середньорічна вартість ОВФ (Рисунок Е.5);

X8 і X12 - премії та винагороди на одного працівника та середньорічна вартість ОВФ (Рисунок Е.10);

X9 і X17 - питома вага утрат від браку та невиробничі витрати (Рисунок Е.15);

X11 і X12 - середньорічна чисельність ПП та середньорічна вартість ОВФ (Рисунок Е.19).

Обчислено матрицю парних коефіцієнтів кореляції (таблиця 3.3.1).

Значення коефіцієнтів кореляції підтверджують високу залежність між факторами Y1 та X10 , Y1 і X12 , X8 і X12 , X9 і X17, X11 і X12 , що підтверджує висунуті гіпотези. Між факторами Х11 та Х17 , Х10 та Х17 , Y1 та X17, існує слабка залежність.


Подобные документы

  • Завдання та етапи кластерного аналізу, вимоги до інформації. Приклад класифікації економічних об'єктів за допомогою алгоритму кластерного аналізу, методи перевірки стійкості кластеризації, інтерпретація результатів аналізу та побудування дендрограми.

    реферат [311,2 K], добавлен 15.07.2011

  • Система управління технологічним процесом. Методи експертних оцінок. Принципи виявлення колективної думки експертів про перспективи розвитку об'єкта аналізу. Статистична обробка результатів. Методи евристичного програмування, "мозкової атаки" й аналогії.

    реферат [34,1 K], добавлен 11.05.2009

  • Статистичні методи аналізу та обробки спостережень. Характерні ознаки типової і спеціалізованої звітності підприємств. Оцінка параметрів простої лінійної моделі методом найменших квадратів. Аналіз показників багатофакторної лінійної і нелінійної регресії.

    контрольная работа [327,1 K], добавлен 23.02.2014

  • Мета кластерного аналізу: поняття, алгоритм, завдання. Головні особливості процедури Мак-Кіна. Графік середніх значень за трьома кластерами. Метод К-методів, переваги та недоліки використання. Поняття про сіткові алгоритми кластеризації (grid-based).

    реферат [238,3 K], добавлен 27.05.2013

  • Методи розв’язування, аналізу та використання задач зі знаходженням екстремуму функції на множині допустимих варіантів у широкому спектрі теоретико-економічних та практичних проблем. Модель задачі лінійного програмування. Складання симплексної таблиці.

    контрольная работа [960,6 K], добавлен 08.10.2013

  • Упорядкування одиниць сукупності за допомогою інтегральних оцінок. Багатовимірне ранжування у системі Statistica. Формування однорідних одиниць сукупності за допомогою кластерного аналізу. Порядок об’єднання в кластери через опцію Amalgamation schedule.

    контрольная работа [1,8 M], добавлен 08.12.2010

  • Використання абсолютних, відносних та середніх величин, рядів динаміки у фінансовому аналізі, складання аналітичних таблиць. Застосування індексного та графічного методів. Послідовність аналізу економічних показників, взаємозв’язок факторних показників.

    курсовая работа [145,2 K], добавлен 31.05.2010

  • Особливості побудови математичної моделі економічного явища. Множинна лінійна регресія в стандартизованому масштабі. Множинна нелінійна регресія, комп’ютерна реалізація методу Брандона. Моделювання для підприємств аграрно-промислового комплексу.

    курсовая работа [1,9 M], добавлен 29.04.2010

  • Сутність статистичних індексів в економічних дослідження. Індивідуальні та загальні індекси кількісних та якісних показників. Аналіз статистичних даних по купівельній спроможності середньої заробітної плати та середньої пенсії на продовольчих ринках.

    курсовая работа [666,4 K], добавлен 16.07.2010

  • Зміст і мета кластеризації. Переваги її застосування перед іншими методами класифікації даних. Ієрархічні і неієрархічні методи кластерного аналізу. Приклад вертикальної дендрограми. Алгоритми найближчого і дальнього сусіда. Схема ітеративного методу.

    контрольная работа [2,4 M], добавлен 12.06.2019

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.