Кореляційний аналіз

Оцінка коефіцієнта парної кореляції. Встановлення аналітичної залежності між вихідною і вхідною величинами. Обробка степеневої і експоненціальної залежностей. Накопичення сум для логарифмічної залежності. Визначення і виведення мінімального значення.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык украинский
Дата добавления 01.09.2015
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ЗМІСТ

ВСТУП

1. ПОСТАНОВКА ЗАДАЧІ

1.1 КОРЕЛЯЦІЙНИЙ АНАЛІЗ

1.2 РЕГРЕСІЙНИЙ АНАЛІЗ

2. АЛГОРИТМ РІШЕННЯ ЗАДАЧІ

3. ОПИС АЛГОРИТМУ РІШЕННЯ ЗАДАЧІ

4. ХАРАКТЕРИСТИКА ДАНИХ І ЇХ УМОВНІ ПОЗНАЧКИ

5. ПРОГРАМА РІШЕННЯ ЗАДАЧІ

6. ОПИС ПРОГРАМИ

7. РІШЕННЯ ЗАДАЧІ У ПАКЕТІ EXCEL

8. ГРАФIЧНИЙ АНАЛIЗ

ВИСНОВОК

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ

ДОДАТОК 1. РЕЗУЛЬТАТИ РОБОТИ ПРОГРАМИ

ДОДАТОК 2. РЕЗУЛЬТАТИ РІШЕННЯ ЗАДАЧІ З ВІДОБРАЖЕННЯМ РОЗРАХУНКІВ ФОРМУЛ В ПАКЕТІ EXCEL

ВСТУП

Припустимо, що приладом з випадковими помилками нескінченно велике число разів виміряна точна величина. Отримана в результаті такого експерименту безліч величин називається генеральною сукупністю.

Дослідник при постановці дослідів робить кінцеве, звичайно невелике, число замірів. Їх можна розглядати, як випадкову вибірку з гіпотетичної генеральної сукупності. Завдання обробки зводиться до визначення за даними вибірки показників, що оцінюють параметри генеральної сукупності.

Розподіл величин у сукупності може бути різним. В інженерних експериментах у більшості випадків можна вважати, що розподіл підпорядковується нормальному закону. Для нормального розподілу характерна симетричність - позитивні і негативні помилки зустрічаються однаково часто. Нормальний розподіл характеризується двома параметрами:

- генеральним середнім (математичним очікуванням);

- генеральним середнім квадратичним відхиленням.

Математичне очікування виступає, як найбільш ймовірне значення вимірюваної величини. Дисперсія ж є чисельною характеристикою ступеня розсіювання. Звичайно проводиться двадцять п'ять дослідів, і потім визначаються оцінки для математичного очікування і середньоквадратичного відхилення. Оцінкою для математичного очікування є вибіркове середнє М, а для визначення оцінки генерального середньоквадратичного відхилення спочатку знаходиться дисперсія вибірки D.

1. ПОСТАНОВКА ЗАДАЧІ

1.1 КОРЕЛЯЦІЙНИЙ АНАЛІЗ

Кореляційний аналіз є одним з широко поширених методів оцінки статистичних зв'язків. Він відповідає на питання: чи впливає вхідна величина на вихідну і яка ступінь зв'язку між величинами? Ступінь зв'язку оцінюється коефіцієнтом кореляції. Коефіцієнт кореляції між випадковими величинами за абсолютною величиною не перевищує 1. Чим ближче значення R до 1, тим тісніше лінійний зв'язок між Х і У. якщо оцінюється вплив на вихідну величину однієї вхідної величини, то визначається коефіцієнт парної кореляції. В кореляційному аналізі виходять з того, що як вхідні, так і вихідні величини є однаковими.

Оцінкою коефіцієнта парної кореляції є величина:

,

де

і - порядковий номер експерименту;

n - кількість експериментів;

Mx, My - математичне очікування для змінних Х і Y відповідно;

, ,

Gx, Gy - середньоквадратичне відхилення для змінних Х і Y відповідно;

, ,

Dx, Dy - дисперсія для змінних X i Y відповідно;

, ,

Mk - коефіцієнт, що визначається по таблиці 1, у залежності від числа ступенів свободи f=n-1

Таблиця 1 - Значення коефіцієнта Mk

f

1

2

3

4

5

6

7

8

9

10

60

Mk

1,253

1,128

1,085

1,064

1,051

1,042

1,036

1,032

1,028

1,025

1,004

Vx - коефіцієнт варіації для змінної X;

.

Перевірка значимості коефіцієнта кореляції здійснюється за виразом:

де

- табличне значення критерію Стьюдента для f=n-2 i відповідного рівня значимості, величина якого наведена в таблиці 2.

Таблиця 2- Значення критерію Стьюдента для рівня значимості = 0,05

f

1

2

3

4

5

6

8

10

20

30

60

12,71

4,303

3,182

2,775

2,571

2,447

2,305

2,228

2,086

2,042

2,00

1.2 РЕГРЕСІЙНИЙ АНАЛІЗ

Метою регресійного аналізу є встановлення аналітичної залежності між вихідною і вхідної величинами. У загальному випадку залежність між величинами може бути представлена у вигляді таблиці, графічно і аналітично. Перший спосіб полегшує визначення вихідної величини для наведених у таблиці значень вхідних; графічний - створює наочність представлення. Аналітична залежність дозволяє досліджувати функцію методом математичного аналізу, тобто визначити значення максимуму, мінімуму, точок перегину і т.д. Дана залежність є найбільш універсальною.

Завдання отримання аналітичної залежності включає три етапи: вибір рівняння регресії, визначення коефіцієнтів рівняння, перевірка відповідності встановленої залежності експериментальному матеріалу.

Перший етап.

З'ясувати вид функції можна або з теоретичних міркувань, або аналізуючи розташування точок (xn, yn) на координатній площині. На практиці зазвичай використовують наступні залежності:

1. лінійна y=ax+b ;

2. параболічна y=ax2+bx+c ;

3. логарифмічна y=alnx+b ;

4. степенева y=axb ;

5. експоненціальна y=beax .

Другий етап.

Найбільш достовірні значення коефіцієнтів виходять при використанні для їх визначення методу найменших квадратів. Сутність зводиться до того, що коефіцієнти шукаються такими, щоб сума квадратів відхилень експериментальних значень функції від значень, обчислених за емпіричною формулою, виявилося мінімальною.

Наприклад, для експоненцiальної залежностi

,

Де

- фактичне значення функції для ;

- розрахункове значення функції.

Для визначення коефіцієнтів рівняння необхідно вирішити систему рівнянь для конкретної залежності.

Для логарифмічної залежності система рівнянь має вигляд:

Степенева ті експоненціальна залежності перетворюються в лінійні наступним чином:

1) якщо в степеневій залежності виду lg(y) = blg(x) + lg(a) застосувати заміну: Y1=lg(y); A=lg(a), X1=lg(x), то отримаємо рівняння виду: Y1=bXi+A.

Тоді для степеневої залежності система рівнянь має вигляд:

2) якщо в експоненціальній залежності виду ln(y) = ax+ln(b) застосувати заміну: Y1=ln(y), B=ln(b), то отримаємо рівняння виду: Y1=aX+B.

Тоді для експоненціальної залежності система нормальних рівнянь має вигляд:

Обробка степеневої і експоненціальної залежностей відбувається аналогічно лінійній з урахуванням проведених замін. Після розрахунку коефіцієнтів регресійної моделі необхідно обчислити дійсні коефіцієнти, використовуючи перетворення:

-для степеневої залежності a=10A;

-для експоненційної залежності b=eB.

2. АЛГОРИТМ РІШЕННЯ ЗАДАЧІ

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

3. ОПИС АЛГОРИТМУ РІШЕННЯ ЗАДАЧІ

Блок 1 - початок процесу обробки даних.

Блок 2 - введення початкових даних; кількість дослідів N.

Блок 3, 4 - організація циклу для введення елементів масиву X, Y.

Блок 5-7 - організація циклу для накопичення суми елементів масиву X.

Блок 8 - розрахунок математичного очікування для змінної X.

Блок 9-11 - організація циклу для накопичення суми SDx.

Блок 12 - розрахунок дисперсії для змінної Х.

Блок 13 - присвоєння коефіцієнту Mk значення з таблиці 1.

Блок 14 - розрахунок середнього квадратичного відхилення для змінної X.

Блок 15 - розрахунок коефіцієнта варіації для змінної Х.

Блок 16-18 - організація циклу для накопичення суми елементів масиву Y.

Блок 19 - розрахунок математичного очікування для змінної Y.

Блок 20-22 - накопичення суми SDy.

Блок 23 - розрахунок дисперсії для змінної Y.

Блок 24 - розрахунок середнього квадратичного відхилення для змінної Y.

Блок 25-27- організація циклу для накопичення суми SR.

Блок 28 - розрахунок оцінки коефіцієнта парної кореляції.

Блок 29 - виведення статистичних показників: математичного очікування, дисперсії, середньоквадратичного відхилення, коефіцієнту варіації, оцінки коефіцієнта парної кореляції.

Блок 30 - присвоєння коефіцієнту T значення з таблиці 2.

Блок 31-33 - перевірка умови і виведення відповідного повідомлення.

Блок 34-36 - накопичення сум для ступеневої залежності.

Блок 37 - обчислення показників.

Блок 38, 39 - розрахунок коефіцієнтів для ступеневої залежності.

Блок 40-42 - накопичення сум для експоненційної залежності.

Блок 43 - обчислення визначників.

Блок 44, 45 - розрахунок коефіцієнтів для експоненціальної залежності.

Блок 46-48 - накопичення сум для логарифмічної залежності.

Блок 49 - обчислення визначників.

Блок 50 - розрахунок коефіцієнтів для логарифмічної залежності.

Блок 51 - виведення коефіцієнтів для ступеневої, експоненційної та логарифмічної залежностей.

Блок 52-54 - організація циклу для розрахунку значень, обчислених за емпіричними формулами.

Блок 55-58 - визначення і виведення мінімального значення

Блок 59-63 - визначення виду залежності та виведення відповідного повідомлення.

Блок 64 - кінець обробки даних.

4. ХАРАКТЕРИСТИКА ДАНИХ І ЇХ УМОВНІ ПОЗНАЧКИ

п/п

Назва величини

Позначення в алгоритмі

Позначення в програмі

Тип величини

1

Кількість дослідів

N

N

Integer

2

Експериментальні дані

X(), Y()

X(), Y()

Масив

3

Допоміжні змінні

i

I

Integer

4

Математичне очіування для Х і Y

Mx, My

Mx, My

Real

5

Дисперсія для змінних Х і Y

Dx, Dy

Dx, Dy

Real

6

Допоміжні змінні

SDx, SDy, S1, S2, S3, S4, SR

SDx, SDy, S1, S2, S3, S4, SR

Real

7

Середнє квадратичне відхилення для змінних X i Y

Gx, Gy

Gx, Gy

Real

8

Коефіцієнт варіації для змінної Х

Vx

Vx

Real

9

Коефіцієнт парної кореляції

R

R

Real

10

Константи

T, Mk

T, Mk

Real

11

Визначники

?, ?1, ?2, ?3

?, ?1, ?2, ?3

Real

12

Коефіцієнти ступеневої залежності

A1, B1

A1, B1

Real

13

Коефіцієнти експоненційної залежності

A2, B2

A2, B2

Real

14

Коефіцієнти логарифмічної залежності

A3, B3

A3, B3

Real

15

Допоміжний масив

m()

m()

Масив

16

Мінімальна сума квадратів відхилень експериментальних значень

min

min

Real

5. ПРОГРАМА РІШЕННЯ ЗАДАЧІ

Program kursovaya;

var x,y,m: array[1..15] of real;

i,n:integer; nmin,min, S1, S2, S3, S4, A1, A2, A3, B1, B2, B3, d, d1, d2, Mx, My, Dx, Dy, SDx,SDy, Gx, Gy, Vx, SR, R, S, Mk, Ta:real;

begin

writeln('vvod n');

readln(n);

writeln('vvod mas x');

for i:=1 to n do

begin

writeln('vvod x[',i,']=');

read (x[i]);

end;

writeln('vvod mas y');

for i:=1 to n do

begin

writeln('vvod y[',i,']=');

read (y[i]);

end;

S:=0;

for i:=1 to n do

S:=S+x[i];

Mx:=S/n;

SDx:=0;

for i:=1 to n do

SDx:=SDx+sqr(x[i]-Mx);

Dx:=SDx/(n-1);

Mk:=1.025;

Gx:=Mk*sqrt(Dx);

Vx:=(Gx/Mx)*100;

S:=0;

for i:=1 to n do

S:=S+y[i];

My:=S2/n;

for i:=1 to n do

Sdy:=Sdy+sqr(y[i]-My);

Dy:=Sdy/(n-1);

Gy:=Mk*sqrt(Dy);

SR:=0;

for i:=1 to n do

SR:=SR*((x[i])-Mx)*(y[i]-My);

R:=SR/(n-1)*Gx*Gy;

writeln('Mx=',Mx:5:3,'Gx=',Gx:5:3,'Dx=',Dx:5:3,'Vx=',Vx:5:3,'R=',R:5:3);

Ta:=2.228;

if(abs(R))*sqrt(n-2)/sqrt(1-sqrt(R))>Ta then

writeln('коефіцієнт кореляції задовільнює умові ')

else

writeln(''коефіцієнт кореляції не задовільнює умові ');

S1:=0; S2:=0; S3:=0; S4:=0;

for i:=1 to n do

S1:=S1+ln(x[i])/ln(10);

S2:=S2+ln(y[i])/ln(10);

S3:=S3+sqr(ln(x[i])/ln(10));

S4:=S4+(ln(x[i])/ln(10))*(ln(y[i])/ln(10));

d:=N*S3-S1*S1;

d1:=S2*S3-S1*S4;

d2:=N*S4-S2*S1;

A1:=d1/d;

B1:=d2/d;

A1:=exp(A1*ln(10));

S1:=0; S2:=0; S3:=0; S4:=0;

for i:=1 to n do

S1:=S1+x[i];

S2:=S2+ln(y[i]);

S3:=S3+sqr(x[i]);

S4:=S4+(X[i]*ln(y[i]));

d:=N*S3-S1*S1;

d1:=S2*S3-S1*S4;

d2:=N*S4-S2*S1;

B2:=d1/d;

A2:=d2/d;

B2:=exp(B2);

S1:=0; S2:=0; S3:=0; S4:=0;

for i:=1 to n do

S1:=S1+ln(x[i]);

S2:=S2+y[i];

S3:=S3+x[i];

S4:=S4+ln(x[i])*y[i];

d:=N*S3-S1*S1;

d1:=S2*S3-S1*S4;

d2:=N*S4-S2*S1;

A3:=d2/d;

B3:=d1/d;

Writeln('Коефіцієнти ступеневої залежності: a1=',a1:5:3, ' b1=',b1:5:3);

Writeln('Коефіцієнти експоненційної залежності: a2=',a2:5:3, ' b2=',b2:5:3);

Writeln('Коефіцієнти логарифмічної залежності: a3=',a3:5:3, ' b3=',b3:5:3);

m[1]:=0;m[2]:=0;m[3]:=0;

for i:= 1 to n do

begin

m[1]:=m[1]+sqr(y[i]-(A1*exp(B1*ln(x[i]))));

m[2]:=m[2]+sqr(y[i]-(B2*exp(A2*x[i])));

m[3]:=m[3]+sqr(y[i]-(A3*ln(x[i])+B3));

end;

min:=m[1];

nmin:=1;

for i :=2 to n do

begin

if m[i]<min then

begin

min:=m[i];

nmin:=i;

end;

end;

if nmin=2 then

writeln ('експоненційна залежність')

else

if nmin=3 then

writeln('логарифмічна залежність')

else

writeln('ступенева залежність');

end.

6. ОПИС ПРОГРАМИ

коефіцієнт кореляція залежність логарифмічний

У даній роботі для рішення завдання використовується програма Pascal. Програма починається з заголовка Program kursovaya;

Після заголовка іде розділ оголошення змінних Var, наприклад :

Var: i, n: integer; nmin,min, S1, S2, S3, S4, A1, A2, A3, B1, B2, B3, d, d1, d2, Mx, My, Dx, Dy, SDx,SDy, Gx, Gy, Vx, SR, R, S, Mk, Ta:real; x,y,m:mas1;

У роботі використовуються такі типи даних: цілий - (integer), дійсний - (real), масиви - (array).

Розділ операторів полягає в операторні дужки : begin .. end.

Для введення вихідних даних використовується оператор read і оператор writeln для виведення пояснювального тексту, наприклад:

writeln (`ввод n'); read (n);

Для введення елементів масиву використовується оператор циклу з відомим числом повторень for i оператор read, наприклад:

for i:= 1 to n do read (y[i]);

Для перевірки логічних умов використовується умовний оператор if… then…else, наприклад:

if abs(r)*sqrt(n-2)/sqrt(1-sqr(R))>=Ta then

writeln ('Коефіцієнт задовольняє умові ')

else

writeln ('Коефіцієнт не задовольняє умові ');

Для виведення результатів на екран використовується оператор writeln, наприклад:

writeln (`R= `, R:7:3);

де в апострофах полягає пояснювальний текст, перша цифра в шаблоні виведення змінної позначає загальну кількість позицій для виведення числа, а друга цифра - кількість символів у дробовій частині.

Програма завершується оператором end з крапкою.

7. РІШЕННЯ ЗАДАЧІ У ПАКЕТІ EXCEL

Рис. 1- Розрахунок статистичних показників на робочому листі 1

Рис. 2- Розрахунок допоміжних сум на робочому листі 2

Рис3-Розрахунок коефіцієнтів методом Крамера, та методом зворотної матриці на робочому листі 3

Рис. 4 - Оцінка погрішності методу найменших квадратів на робочому листі 4

8. ГРАФIЧНИЙ АНАЛIЗ

Рис. 5 Побудова графіку на робочому листі 4

За даними в таблиці, було побудовано графік, нанесені лінії тренду та рівняння залежностей: експоненціальної, логарифмічної, ступеневої.

Рівняння експоненціальної залежності ;

Рівняння логарифмічної залежності

Рівняння ступеневої залежності

За рівняннями встановлено, що експоненціальна залежність краще апроксимує дані, так як значення R найбільш наближається до одиниці.

ВИСНОВОК

У результаті курсової роботи було проведено кореляційний аналіз і знайдені статистичні показники - R=-0,73, Mx=3,081; Dx=1,16; Gx=1,102; Vx=36% Даний коефіцієнт показує, яка ступінь зв'язку між величинами. Отриманий коефіцієнт задовольняє умові, що було з'ясовано при обробці даних в програмі Паскаль і абсолютно збігається з результатом, отриманим в пакеті Excel.

У результаті курсової роботи були отримані коефіцієнти для трьох залежностей:

- Для логарифмiчної залежності: a= -2,79; b=16,77;

- Для ступеневої залежності: a=1,02; b=28,51;

- Для експоненційної залежності: a= -0,08; b=17,75;

Дані коефіцієнти були отримані в програмі Pascal і абсолютно збігаються з результатами, отриманими в пакеті Excel при вирішенні матриць двома методами : методом зворотної матриці і методом Крамера і коефіцієнтами, отриманими при графічному аналізі результатів, що підтверджує правильність виконання програми.

У результаті курсової при обробці експериментальних даних було з'ясовано, що параболічна залежність краще апроксимує вихідні дані.

Курсова робота виконувалася на основі знань, отриманих при вивченні курсу «Обчислювальна математика і програмування». Для виконання роботи було використано програми: Microsoft Word, Microsoft Excel, Pascal ABC, що закріпило отримані знання.

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ

1. Методическое пособие к выполнению лабораторных работ в среде программирования TURBO PASCAL(для студентов направления подготовки «химическая технология»)/сост.: Л.А. Лазебная.- Донецк: ДонНТУ, 2012. - 95 с.

2. Методическое пособие к выполнению лабораторных работ в текстовом редакторе WORD /сост.: Л.А. Лазебная, И.Ю. Анохин. - Донецк: ДонНТУ, 2012. - 82 с.

3. Методическое пособие к выполнению лабораторных работ по теме «решение математических задач средствами Excel»/сост.: Л.А. Лазебная, С. В. Масло.- Донецк: ДонНТУ, 2006. - 37 с.

ДОДАТОК 1. РЕЗУЛЬТАТИ РОБОТИ ПРОГРАМИ

ДОДАТОК 2. РЕЗУЛЬТАТИ РІШЕННЯ ЗАДАЧІ З ВІДОБРАЖЕННЯМ РОЗРАХУНКІВ ФОРМУЛ В ПАКЕТІ EXCEL

Размещено на Allbest.ru


Подобные документы

  • Аналіз прогнозу заробітної плати при прогнозному значенні середнього добового прожиткового мінімуму. Побудова лінійного рівняння парної регресії. Розрахунок лінійного коефіцієнта парної кореляції, коефіцієнта детермінації й середньої помилки апроксимації.

    лабораторная работа [409,7 K], добавлен 24.09.2014

  • Визначення кореляційної залежності ціни і витрат від кількості реалізованої продукції; встановлення зв'язку між відповідними ознаками та обчислення коефіцієнту детермінації; перевірка адекватності значень параметрів параболічної однофакторної моделі.

    практическая работа [613,4 K], добавлен 30.03.2013

  • Перевірка загальної якості рівняння регресі та статистичної значущості оцінок параметрів економетричної моделі. Прогнозування значень залежної змінної. Визначення коефіцієнта еластичності. Економетричний аналіз лінійної функції парної регресії в MS Exel.

    презентация [1,4 M], добавлен 10.10.2013

  • Поняття про кореляцію і регресію. Сутність дисперсійного аналізу. Однофакторний дисперсійний аналіз. Функціональна і статистична залежності. Визначення параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за незгрупованих даних.

    реферат [123,3 K], добавлен 12.02.2011

  • Транспортна задача відкритого типу, критерій мінімальної вартості транспортування однорідного вантажу. Мінімальна вартість перевезення. Пошук кореляційної залежності ціни й витрат від кількості реалізованої продукції. Коефіцієнт кореляції та детермінації.

    контрольная работа [109,6 K], добавлен 04.10.2011

  • Визначення числових характеристик випадкових величин. Дослідження залежності розподілу об'ємності та щільності мотальних бобін від діаметру намотування. Визначення виду регресійної однофакторної математичної моделі з використанням методу Чебишева.

    курсовая работа [173,6 K], добавлен 13.11.2013

  • Специфікація економетричної моделі парної регресії. Побудова лінійної, степеневої та показникової економетричної моделі, поняття коефіцієнта регресії та детермінації. Графічне зображення моделювання лінійного зв’язку, застосування F–критерію Фішера.

    контрольная работа [5,1 M], добавлен 17.03.2010

  • Визначення оптимального плану графічним та симплексним методом. Побудова економетричної моделі залежності між витратами обігу та вантажообігом. Розрахунок детермінаціі, кореляції, еластичності. Виявлення мультиколінеарності між заданими факторами.

    контрольная работа [451,8 K], добавлен 03.12.2013

  • Структурна схема ВАТ "Вагоно-ремонтний завод". Аналіз фінансового та економічного стану підприємства. Методики побудови апроксимаційних нелінійних залежностей за допомогою методу Ньютона нелінійного оптимального пошуку. Розробка методики прогнозування.

    дипломная работа [986,3 K], добавлен 08.03.2010

  • Побудова економетричної моделі парної регресії. На основі даних про витрати обігу (залежна змінна) і вантажообігу (незалежна змінна) побудувати економетричну модель. Рівняння регресії. Коефіцієнт парної детермінації та кореляції. Перевірка надійності.

    задача [563,6 K], добавлен 28.12.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.