Прогнозирование потребления сахара в Российской Федерации

Сущность социально-экономического прогнозирования. Роль сахара в жизни человека. Математический аппарат, используемый при прогнозировании потребления. Регрессионный анализ. Методы наименьших квадратов и моментов. Оценка качества моделей прогнозирования.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 26.11.2012
Размер файла 1,5 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

  • 1. Описание предметной области и постановка задачи исследования
  • Сущность социально-экономического прогнозирования.
  • В современных условиях экономические прогнозы необходимы для определения возможных целей развития общества и обеспечивающих их достижение экономических ресурсов, для выявления наиболее вероятных и экономически эффективных вариантов долгосрочных, среднесрочных и текущих планов, обоснования основных направлений экономической и технической политики, предвидения последствий принимаемых решений и осуществляемых в каждый данный момент мероприятий. Поэтому социально-экономическое прогнозирование становится одним из решающих научных факторов формулирования стратегии и тактики общественного развития.
  • Значение сахара в жизни человека.
  • Данная курсовая работа затрагивает тему прогнозирования потребления сахара в Российской Федерации не случайно, ведь сахар является одним из основных продуктов питания. Кроме того, он характеризуется высокой транспортабельностью и пригодностью к длительному хранению, что дает возможность формировать как национальные, так и мировые продовольственные запасы.
  • В рационе человека около четверти энергетических калорий приходится на сахар, который наряду с крахмалопродуктами покрывает потребность организма в углеводах, а также служит важным компонентом многих пищевых продуктов. В питании человека крахмал, сахар и мед играют важную роль, так как являются одним из основных источников поли-, ди- и моносахаридов. В них содержатся также другие питательные и биологически активные вещества.
  • В питании человека и технологии производства пищевых продуктов сахар имеет существенное значение. Он быстро и хорошо усваивается организмом, имеет высокую энергоценность (более 400 ккал в 100 г), его широко используют при производстве кондитерских, кулинарных и булочных изделий, варенья, джема, повидла, десертных блюд, приготовлении чая, кофе, какао. В нашей стране для выработки сахара используют сахарную свеклу, в странах с тропическим климатом -- сахарный тростник.
  • Решение мировой продовольственной проблемы и рост производства сельскохозяйственной продукции массового потребления, к которым относится и сахар, напрямую определяется действием комплекса факторов политического и экономического характера.

Сахар - это углевод в чистом виде, основной поставщик энергии для организма. Таким образом, сахар необходим организму. Мало того, организм человека без сахара не мог бы функционировать. Но если он необходим, значит, сама Природа должна обеспечить сахаром наш организм. И она обеспечивает! Фрукты, овощи, орехи, кроме минеральных солей и витаминов, в изобилии содержат органический естественный сахар в виде фруктозы, который легко преобразуется в организме в глюкозу и усваивается кровью, клетками и тканями.

Поджелудочная железа, расположенная за двенадцатиперстной кишкой, извлекает из продуктов питания сахар и при этом точно столько, сколько требуется в данное время определенному организму.

Если же человек съедает много рафинированных и животных жиров, его поджелудочная железа вынуждена работать особенно усиленно. Такая переработка утомительна. А когда функции поджелудочной железы нарушаются, часть этого органа прекращает вырабатывать инсулин -- гормон, под влиянием которого сахар превращается в глюкозу. В тот момент, когда инсулина становится недостаточно, сахар «заполняет» кровь и действует, как яд. Человек заболевает диабетом. Поэтому следует запомнить: неорганический (промышленный) сахар -- продукт токсичный (ядовитый).

Природный сахар полезен, он преобразуется в глюкозу и отлично усваивается. Но и промышленный сахар не всегда вреден. Он эффективно налаживает работу селезенки и печени, и часто людям с заболеваниями этих органов рекомендуется «сладкая» диета. К тому же, учеными обнаружена польза сахара в уменьшении опасности образования бляшек кровеносных сосудов и предотвращении тромбоза. Сахар стимулирует кровообращение в мозге, предотвращает возникновение артритов.

Именно сахар существенно уменьшает опасность поражения бляшками кровеносных сосудов, а значит, предотвращает тромбозы.

Артриты у сладкоежек бывают гораздо реже, чем у людей, отказывающих себе в удовольствии побаловаться сладеньким.

Сахар помогает наладить работу печени и селезенки. Именно поэтому людям с заболеваниями этих органов часто рекомендуют диету с повышенным содержанием сладкого.

Предполагают, что сахар играет здесь такую же роль, как в варенье. Ведь варенье, когда в нем достаточно сахара, не портится потому, что крепкий раствор сахара вытягивает влагу из любых попавших в него микроорганизмов и тем убивает их.

При диабете можно есть сахар, но совсем немного. Доказано, что малые количества обычного сахара не приносят вреда организму. Безвредным считается такое количество сахара, калорийность которого не превышает 5 % от суточной нормы углеводов.

В последнее время неожиданно возникла новая возможность использования сахара. Французские хирурги показали, что, посыпая плохо заживающие операционные раны обыкновенным сахарным песком, можно устранить их нагноение и ускорить заживление. Одну группу больных с такими ранами лечили антибиотиками, и лечение длилось в среднем 85 дней, а в другой группе применяли сахар - и раны заживали в среднем за 54 дня.

Польские медики провели независимое исследование, в результате которого выяснили следующий неоспоримый факт: вообще лишенный сахара человеческий организм долго не протянет. Сахар активизирует кровообращение в головном и спинном мозге, и в случае полного отказа от сахара могут наступить склеротические изменения.

Несмотря на то, что сахар вреден для организма, в народной медицине его применяют для лечения некоторых недугов.

Во время икоты необходимо положить в рот кусочек сахара, сосать его не спеша, понемногу проглатывая со слюной.

Жженый сахар отлично помогает при сухом кашле. Этот рецепт использовали еще в древние времена, поэтому он проверен годами. Помимо своих лечебных свойств, он имеет приятный вкус, который непременно понравится детям. Жженый сахар от кашля помогает достаточно быстро.

Таким образом, хоть сахар и считается в народе «белой смертью», но оспаривать его большое значение в жизни человека невозможно.

Цель работы

Целью работы является построение и анализ эконометрической модели прогнозирования потребления сахара в Российской Федерации.

Постановка задачи исследования

Для работы взята тема «Прогнозирование потребления сахара в Российской Федерации».

Имеются данные о Потребление сахара Российской Федерации (на душу населения в год; килограммов) за 1990-2011 годы. Были собраны статистические данные по пяти факторам за этот же период, которые, теоретически, влияют на выбранную выше величину.

В ходе работы необходимо составить, рассчитать и проанализировать модель данной проблемы, проверить адекватность модели реальной ситуации на числовых данных в среде Eviews.

Подтвердить правильность предположения о влиянии данных факторов с использованием математической модели и статистических данных.

В итоге будет выявлена статистическая значимость (незначимость) выбранных факторов.

Статистические данные

Y - Потребление сахара Российской Федерации (на душу населения в год; килограммов)

Х1 - Валовые сборы сахарной свеклы по Российской Федерации (сельскохозяйственные организации; тысяч тонн)

Х2 - Индекс потребительских цен по Российской Федерации, (в %)

Х3 - Посевные площади по Российской Федерации (сельскохозяйственные организации; тысяч гектаров)

Х4 - Урожайность сахарной свеклы в Российской Федерации (в сельскохозяйственных организациях; центнеров с одного гектара убранной площади)

Х5 - Среднемесячная номинальная начисленная заработная плата (рублей);

Переменная Y - зависимая (эндогенная), переменные X1, X2, X3, X4, X5 - независимые (экзогенные). Данные образуют временной ряд (с 1990 по 2011 год) с размером выборки равным 22 и числом переменных, равным 6.

На рисунке 1 показано графическое представление исходных данных.

Рис.1. Графическое представление данных

2. Математический аппарат, используемый при проведении прогнозирования

Регрессионный анализ

В качестве математического аппарата выступает регрессионный анализ - статистический метод исследования зависимости случайной величины у от переменных (аргументов) хj (j = 1, 2,..., k), рассматриваемых в регрессионном анализе как неслучайные величины независимо от истинного закона распределения xj.

Цели регрессионного анализа:

· Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)

· Предсказание значения зависимой переменной с помощью независимой(-ых)

· Определение вклада отдельных независимых переменных в вариацию зависимой.

Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.

Линейная регрессия:

где бi -- коэффициенты модели;

уj, хij -- соответственно значения j-й функции (зависимой переменной) и i-й независимой переменной;

еj -- случайная ошибка;

n - число независимых переменных в модели (в ряде случаев полагается, что бi -- свободный член и х0j =1).

В векторном виде эта модель записывается так:

где вектор Y T = (у1. у2… уn) и вектор бT = (б1, б2… бn) - соответственно векторы значений зависимой переменной и коэффициентов модели, матрица

порядка (nЧM);

матрица независимых переменных;

еT = (е1, е2,.. еn)-- вектор случайных ошибок.

Неизвестные коэффициенты модели находятся из условия минимума функционала рассогласований, который представляет собой сумму квадратов рассогласований реальных значений зависимой переменной и значений. В векторном виде функционал рассогласований записывается как:

Условия минимума Ф реализуются при равенстве нулю первых производных функционала по неизвестным коэффициентам, т. е.

Данное условие эквивалентно выполнению векторного соотношения

ХT Xб = ХTY, что дает значения оценок коэффициентов модели:

Надежность получаемой с помощью оценок в модели определяется с помощью величины остаточной дисперсии, которая вычисляется по формуле

и коэффициента множественной корреляции, вычисляемого по формуле

D(n+1)(n+1) - алгебраическое дополнение определителя корреляционной матрицы r = r[xi xj] к элементу rx n=1x n+1. Величина R2 - множественный коэффициент детерминации; она показывает, какая доля дисперсии функции объясняется изменениями входящих в уравнение регрессии независимых переменных при полученных значениях коэффициентов модели. Надежность коэффициента множественной корреляции определяется по критерию Фишера:

при заданном уровне надежности и степени свободы н1 = n, v1 = N-n.

Наличие связи между зависимой переменной уi и независимыми переменными хij определяется с помощью коэффициентов корреляции

где S2yxi; S2yy; S2xixk - коэффициенты ковариации, определяемые по формуле

где Їxi , Їxk - средние значения независимых переменных xi и xk.

Истинное значение коэффициента корреляции заключено в пределах

thz1? rxixk ? thz2, где

z - преобразование Фишера;

th z - гиперболический тангенс аргумента z.

Для определения надежности оценок строится доверительный интервал для полученных оценок в коэффициентов модели:

где tp,v - значения критерия Стъюдента с уровнем надежности р и степенями свободы v = (N-n-1),

сii -- i-й диагональный элемент матрицы (ХT Х)-1 . Поэтому истинное значение коэффициента a модели будет лежать в интервале

Использование вычислительной процедуры по методу наименьших квадратов с целью получения оценок коэффициентов модели вi, которые удовлетворяли бы условиям несмещенности, состоятельности, эффективности, предполагает выполнение ряда условий:

· независимые переменные представляют собой неслучайный набор чисел, их средние значения и дисперсии конечны;

· случайные ошибки еj -- имеют нулевую среднюю и конечную дисперсию

· между независимыми переменными отсутствует корреляция и автокорреляция;

· случайная ошибка не коррелированна с независимыми переменными;

· случайная ошибка подчинена нормальному закону распределения.

Можно выделить условие отсутствия мультиколлениарности, когда несколько независимых переменных связаны между собой линейной зависимостью, и условие гомоскедастичности, т. е. одинаковой дисперсии для всех случайных ошибок. Важным является условие линейной формы связи между зависимой и независимой переменными. Зависимость должна быть именно линейной или сводимой к линейной с помощью некоторых преобразований.

Но иногда исследуемый процесс не может быть сведен к линейной зависимости никакими преобразованиями, как, например, в случае логистической зависимости. Тогда используется ряд методов, например, метод симплексов. Данный метод отличается сравнительной простотой, легкой реализуемостью на ЭВМ, эффективностью при определении оценок коэффициентов модели.

Важной характеристикой реализованной модели является оценка ошибки прогноза:

где Хt -- вектор значений независимых переменных в момент (t+ф) . Поэтому доверительный интервал для значений зависимой переменной

определяется в момент t как

где I - единичный столбец;

tp,v - значение критерия Стьюдента.

Или же находится более эффективная оценка доверительного интервала для прогнозных значений:

Важным условием получения надежных оценок для модели по методу наименьших квадратов является отсутствие автокорреляции.

Оценка автокорреляции для полученной по МНК модели осуществляется по критерию Дарбина -Уотсона:

где Т - длина временного ряда.

Полученное расчетное значение d сравнивается с нижней и верхней границей d1 и d2, критерия. Если:

· d < d1, то гипотеза отсутствия автокорреляции отвергается;

· d > d2, то гипотеза отсутствия автокорреляции принимается;

· d1 ? d ? d2, то необходимо дальнейшее исследование. Одним из известных способов уменьшения автокорреляции является авторегрессионное преобразование для исходной информации или переход к разностям, т. е. ДYt = Yt+1 -Yt; ДXt = Xt+1 -Xt.

Если же автокорреляцию устранить не удается, то полученные оценки считаются состоятельными, и среднеквадратическое отклонение корректируется на величину Дj для j-ro коэффициента.

где r1 -- коэффициент автокорреляции случайных слагаемых первого

порядка;

R1j -- коэффициент автокорреляции для j-й независимой переменной первого порядка.

Другим условием, необходимым для получения состоятельных оценок, является отсутствие мультиколлениарности. Действительно, при наличии мультиколлениарности определитель квадратной матрицы [XT Х ] равен или близок нулю, следовательно, матрица вырождена, и поэтому решения системы нормальных уравнений не существует.

Эффективный подход к определению мультиколлениарности предполагает следующую последовательность расчетов. Пусть рассматривается уравнение регрессии y = f(x1, ..., xn). Тогда для выявления существования мультиколлениарности предлагается критерий

где ¦ ЮХT Х ¦- определитель матрицы [ ЮХT Х], имеющий асимптотическое распределение Пирсона Ѕn(n-1) степенями свободы.

N - число наблюдений по каждой переменной;

n - число независимых переменных.

Матрица Х включает значения переменных, преобразованных по формуле

где Si,, Їxi -- соответственно оценки среднеквадратического отклонения и среднее значение для i-й независимой переменной.

Далее вычисляются величины , которые при неколлениарности переменных близки единице, а при наличии мультиколлениарности близки к бесконечности, что дает основание оставить или отбросить показатель хi, что определяется статистикой

wi =(dii -1) (N-1)/(n-1), имеет распределение Фишера с v1 =N-n и

v2 =n-1степенями свободы.

Существует еще ряд способов определения мультиколлениарности. В целях устранения или уменьшения ее можно переходить к разностям для исходной информации, использовать метод факторного анализа или метод главных компонент.

Получение прогнозов с помощью многофакторных регрессионных моделей предполагает неизменность значений коэффициентов этих моделей во времени. Тем не менее, в процессе исследования объекта возможно появление новой информации, что позволяет с помощью рекуррентного оценивания корректировать значения оценок коэффициентов моделей. В то же время исходная информация может содержать в себе различные динамики изменения независимых переменных, которые возникают в результате различных «режимов» функционирования исследуемого объекта. В этом случае важным является как сам факт установления различия динамик процессов на разных временных интервалах, так и выбор такого интервала для построения на нем модели прогнозирования, который был бы наиболее адекватным будущему поведению объекта. Если оказывается, что для одного интервала времени построена многофакторная модель

а для другого интервала - модель

где бi1? бi2 , то прогноз будет смещен, а следовательно, резко возрастает дисперсия прогноза.

Метод наименьших квадратов

Косвенный и двухшаговый метод наименьших квадратов (КМНК) рассматриваются как традиционные методы оценки коэффициентов структурной модели.

КМНК применяется для идентифицируемой системы одновременных уравнений, а ДМНК используется для оценки коэффициентов сверхидентифицируемой модели.

Метод максимального правдоподобия рассматривается как наиболее общий метод оценивания, результаты которого при нормальном распределении признаков совпадают с МНК, но при большом числе уравнений системы этот метод приводит к достаточно сложным процедурам вычислений.

Дальнейшим развитием ДМНК является ТМНК. Этот метод пригоден для оценки параметров всех видов уравнений структурной модели. Однако при некоторых ограничениях на параметры более эффективен ДМНК.

Процедура применения косвенного метода наименьших квадратов (КМНК) предполагает выполнение следующих этапов:

ь преобразование структурной модели в приведенную форму;

ь для каждого уравнения приведенной формы модели обычным МНК оцениваются приведенные коэффициенты .

Коэффициенты приведенной формы модели трансформируются в параметры структурной модели.

Рассмотрим применение КМНК для простейшей идентифицируемой модели:

;

Приведенная форма модели имеет вид:

где, ,- случайные ошибки приведенной формы.

Применяя, для каждого уравнения этой системы, МНК определяем коэффициенты .

Соответствующие системы будут выглядеть следующим образом:

(3)

(4)

Решая системы 3 и 4, находим коэффициенты , , .

От полученной приведенной формы модели переходим к структурной форме модели. Для этого из 2-го уравнения системы (2) выражаем х и подставляем в 1-е уравнение, получим 1-е уравнение системы (4). И наоборот, выражая из 1-го уравнения системы (2) х и подставляя во 2-е уравнение, получаем 2-е уравнение системы (1).

При непосредственном применении традиционного МНК к каждому уравнению структурной формы результаты могут сильно отличаться от результатов применения КМНК.

Если система сверхидентифицируема, то КМНК не даст однозначных оценок параметров структурной модели и поэтому он не используется. В этом случае можно использовать разные методы, среди которых наиболее распространен ДМНК.

Основная идея ДМНК - получение на основе приведенной формы модели для сверхидентифицируемого уравнения теоретических значений эндогенных переменных, содержащихся в правой части уравнения.

Затем, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифицируемого уравнения.

Если все уравнения системы сверхидентифицируемы, то для оценки структурных коэффициентов каждого уравнения используется ДМНК.

Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.

Пусть дана идентифицируемая модель:

(5)

Если на параметр b наложить ограничение, а именно, , то система превращается в простейшую сверхидентифицируемую модель

(6)

в которой 1-е уравнение уже является сверхидентифицируемым:

Н=1 (у), D=1 (х), значит D+1>H.

Второе уравнение является (как и было) точно идентифицируемым:

Н=2 , у), D=1 (х), D+1=H.

Применим ДМНК к полученной модели (6):

1 шаг: применив МНК, найдем приведенную форму модели:

2 шаг: на основе 2-го уравнения данной системы, подставляя заданные значения хи х, определяем теоретические значения для эндогенной переменной у, т.е. у.

Введем новую переменную Z: Z= у+ х.

Тогда первое уравнение системы (6)

Применяя МНК к данному уравнению, находим : S уZ=SZоткуда =S уZ/SZ.

второе уравнение системы (6) не изменилось, поэтому система одновременных уравнений будет иметь вид:

Большую популярность получила динамическая модель Клейна.

Построение системы структурных уравнений позволяет глубже изучить причины связи результирующих признаков. При этом происходит выделение и оценка косвенных и непосредственных влияний признаков.

Авторегрессионая модель условной гетероскедастичности (ARCH)

Основная идея ARCH модели состоит в различии между условными и безусловными моментами второго порядка. Тогда как безусловные вариации и ковариации постоянны, условные моменты нетривиально зависят от прошлых состояний мира и развиваются во времени. Эта концепция и конкретная спецификация были впервые представлены в работе Engle Robert F. (1982), за которой последовали бесчисленные модификации базовой конструкции и примеры применения новой модели к финансовым и макроэкономическим временным рядам.

Первым объектом моделирования стала инфляционная неопределенность.

Впоследствии ARCH модели нашли применение в анализе волатильности цен и доходностей спекулятивных активов. Применением ARCH моделей установлено, что динамика волатильности многих финансовых переменных подчиняется устойчивым закономерностям.

Обобщенный метод моментов

Метод квази-максимального правдоподобия не является асимптотически эффективным. Потери эффективности, возникающие, в частности, при t- распределенных ошибках невелики, однако могут быть весьма существенными, если распределение ошибок асимметрично.

Нарушение гипотезы об условной нормальности мотивирует применение обобщенного метода моментов. На основе данного метода построена процедура оценивания модели с параметризованными совместно функциями условного среднего и дисперсии. Обобщенный метод моментов обладает следующими достоинствами:

· не требует явных предположений относительно плотности условного распределения и допускает присутствие ненулевых куртозиса и асимметрии;

· использует лишь производные первого порядка функций условного среднего и дисперсии и позволяет избежать тем самым применения методов численного дифференцирования;

· асимптотически более эффективен, чем метод квази-максимального правдоподобия.

Оценка качества моделей прогнозирования

Качество (надежность, достоверность) модели тем выше, чем «ближе» расчетные значения к фактическим. Оценка этой «близости» будет осуществляется путем вычисления значения того или иного критерия. При этом абсолютные показатели ошибки прогноза позволяют количественно определить величину расхождения прогноза и факта в единицах измеряемого показателя.

Абсолютная ошибка прогноза:

, где

- фактическое значение показателя на t-й момент времени;

- прогнозное значение показателя на t-й момент времени.

Средняя абсолютная ошибка прогноза:

, где

n - период упреждения прогноза.

Среднеквадратическая ошибка прогноза:

.

Значения этих показателей зависят от масштаба измерений, который в ряде случаев уменьшает объективность оценок, для того, чтобы избежать этого используют относительные показатели измерения ошибки прогноза, выраженные либо в долях единицы, либо в процентах .

Относительная ошибка прогноза:

.

Средняя относительная ошибка прогноза:

.

3. Описание используемого в расчетах программного продукта

Пакет прикладных программ Eviews

Для проведения регрессионного анализа выбран эконометрический пакет Eviews и вот почему. Этот пакет позволяет выполнить регрессионный анализ, построить прогнозы в в Windows-ориентированной компьютерной среде благодаря наличию особо сложного и тонкого инструментария обработки данных. Воспользовавшись Eviews можно быстро выявить наличие статистической зависимости в анализируемых данных и затем, используя полученные взаимосвязи, сделать прогноз изучаемых показателей.

Сферы применения Eviews:

· моделирование;

· финансовый анализ;

· макроэкономическое прогнозирование;

· прогнозирование состояния рынков.

· анализ научной информации и оценивание.

Также данный пакет используется при анализе данных, представленных в виде временных рядов.

В Eviews можно провести анализ несколькими методами:

· Logit - нелинейная модель для бинарной зависимой переменной с использованием функции логического распределения;

· Probit - нелинейная модель для бинарной зависимой переменной с использованием функции стандартного нормального распределения.

· GMM - обобщенный метод моментов;

· TSLS - двух шаговый метод наименьших квадратов;

· ARCH - авторегрессионая условно гетероскедастичная модель;

  • 4. Результаты расчетов по предметной области
  • Данная работа осуществляется в пакете EViews4. Начальным этапом является ввод данных.

Создаем новый рабочий файл. В строке главного меню выбираем File/New/Workfile, после чего откроется диалоговое окно (рис 2.).

Рис. 2. Создание нового рабочего файла

В пакете допускается восемь типов данных:

- годы 20 века идентифицируются по последним двум цифрам (97 эквивалентно 1997), для данных, относящихся к 21 веку необходима полная идентификация (например, 2020);

- 1999:1, 2001:2 (формат - год и номер полугодия);

- 1992:1, 65:4, 2005:3 (формат - год и номер квартала);

Годовые (Annual)

Полугодовые (Semi-annual)

Квартальные (Quarterly)

Ежемесячные (Monthly)

Недельные (Weekly);

Дневные (5 day weeks);

Дневные (7 day weeks);

Недатированные или нерегулярные (Undated or irregular)

- 1956:1, 1990:11 (формат - год и номер месяца);

- допускают работу с данными, строго не привязанными к определенным временным периодам;

В нашем случае используем тип Annual, так как данные годовые.

Пакет создаст рабочий файл без имени, и на дисплее в рабочей области появится окно (рис. 2). Все рабочие файлы пакета всегда содержат вектор коэффициентов C и серию RESID - серия остатков (рис.3).

Рис. 3. Создание нового рабочего файла

Следующим этапом является ввод данных задачи в среде EViews.

Импортируем анализируемые данные таким образом, чтобы зависимый фактор стоял бы на первом месте. В строке главного меню выберем File/ Import/Read Text-Lotus-Excel. Появится окно импортированных данных (рис. 4).

Рис. 4 Окно импортированных данных

экономический прогнозирование сахар потребление

После того, как исходные данные перенесены в рабочую область пакета, надо провести их верификацию. Необходимо создать новую группу, содержащую все импортированные серии (переменные). Это делается следующим образом: необходимо кликнуть мышкой по имени зависимой переменной (Y), затем, удерживая клавишу CTRL кликнуть по переменным Х1, X2, X3, X4, X5. Далее необходимо выбрать опцию Open Group.

Пакет создаст группу, имя которой можно присвоить с помощью кнопки Name (рис. 5). В рабочем файле сразу добавится одна переменная с введенным именем Group1.

Рис.5. Данные в пакете Eviews

Образовалась группа, в которой каждый столбец (серия) имеет такое название, которое задано в файле Excel.

Образованную группу Group1 можно просматривать как линейные графики по каждой переменной (View/Multiple Graphs), как показано на рисунке 6.

Рис 6. Графическое представление данных в пакете Eviews.

Регрессионный анализ будет проведен с помощью следующих моделей и методов:

· МНК (метод наименьших квадратов)

· Обобщенный метод моментов

· Авторегрессионная условно гетероскедастичная модель.

Выбор метода осуществляется следующим образом - в строке меню группы выбираем Procs/Make Equation. Перед нами появится диалоговое окно (рис 7.).

Рис. 7. Выбор метода

В окне Equation Specification перечисены переменные, входящие в уравнение регрессии (на первом месте - зависимая переменная, затем - независимые переменные, которые включены в уравнение; с - это вектор коэффициентов при свободном члене уравнения регрессии). В строке Method есть методы:

LS - метод наименьших квадратов, минимизируется сумма квадратов отклонения для каждого уравнения.

TSLS - двустадийный метод наименьших квадратов, применяется, когда присутствует корреляция между переменными, стоящими в правой части уравнения регрессии.

ARCH - метод авторегрессии с условием гетероскедастичности, используется для моделирования и прогнозирования условных колебаний и изменений.

GMM - общий метод моментов, принадлежит к классу оценочных методов, известных как М-оценка, определяемых минимизацией некоторой функции критерия.

Binary - двоичный отбор (логит-преобразование, метод пробитов, экстремальное значение) используется для тех моделей, в которых зависимая переменная Y может принимать два значения.

Ordered - упорядоченный отбор, применяется когда присутствует многообразие скрытых ошибок распределения. Наблюдаемая переменная Y представляется на выходе в виде упорядоченной или ранжированной категории.

Cencored - Цензурированные данные. Используется для оценивания тех моделей в которых зависимая переменная либо цензурирована, либо искажена.

Count - целые, натуральные числовые данные. Применяется, когда Y принимает целые значения, представляющие число событий.

1) Метод наименьших квадратов - Least Squares.

Построим и рассчитаем модель множественной регрессии для всей совокупности независимых факторов (для этого воспользуемся схемой пошагового исследования назад). Чтобы показать уравнение с коэффициентами и уравнение с уже подставленными значениями коэффициентов воспользуемся View/Representations (рис 8).

Рис 8. Уравнение регрессии с помощью МНК

Уравнение регрессии имеет вид:

Y = -0,0001797025244*X1 - 0.02867117878*X2 + 0.0156202727*X3 + 0,05324660079*X4 - 0.0001475263891*X5 + 18.19767146

Уравнение регрессии позволяет понять, как формируется рассматриваемая экономическая переменная потребление сахара:

1) При увеличении валовых сборов сахарной свеклы по Российской Федерации на 1 тыс. тонн потребление сахара уменьшится на 0,00018 кг.

2) При увеличении индекса потребительских цен на 1% потребление сахара уменьшится на 0.029 кг.

3) При увеличении посевных площадей на 1 тыс гектаров потребление сахара увеличится на 0.016 кг.

4) При увеличении урожайности сахарной свеклы на 1 центнер с одного гектара убранной площади потребление сахара увеличится на 0,053 кг.

5) При увеличении среднемесячной номинальной зарплаты на 1 руб потребление сахара уменьшится на 0,00015 кг.

Рассчитываем прогнозное значение потребления сахара на 2012 и 2013 годы. Используя функцию Forecast в объекте Equation, получаем следующие прогнозные значения на 2 года вперёд (рис 9).

Рис 9. Прогнозные значения на 2 года вперед

Рис 10. График прогнозных значений.

Как видим, показатели незначительно убывают. Проверка справедливости данных невозможна, так как информации на данный период времени нет.

На рис 11 представлен график уравнения регрессии, построенного с помощью МНК.

Рис. 11. График уравнения регрессии, построенного с помощью МНК

Оценим статистическую значимость прогнозного уравнения. На рис 12 представлены необходимые показатели.

Рис. 12. Показатели уравнения МНК

Рассчитывается коэффициент детерминации - показатель, отражающий в какой мере функция регрессии определяется экзогенными переменными. Чем ближе коэффициент детерминации к единице, тем лучше регрессия аппроксимирует эмпирические данные и ею можно воспользоваться для прогноза значений результативного признака.

Мерой качества уравнения регрессии, характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации(R-squared). Он показывает, какая часть вариации зависимой переменной обусловлена вариацией объясняющей переменной. Чем ближе коэффициент детерминации к единице, тем лучше регрессия аппроксимирует эмпирические данные.

Коэффициент детерминации R2=0,7050003>0,7 говорит о том, что доля влияния независимых переменных на зависимую значительна (71%).

Адекватность регрессии опытным данным можно проверить с помощью критерия Фишера F-statistic и вероятности Prob (F-statistic). Выдвигается нулевая гипотеза H0 о статистической незначимости линейного уравнения регрессии в целом и отсутствии связи между зависимой и независимыми переменными (bi = 0 и ryxi = 0). Если Prob (F-statistic) > =0,05, то H0 принимаем.

Будем проводить проверку с помощью Prob (F-statistic).

Т.к. Prob (F-statistic)= 0.000769<0,05, то отвергаем гипотезу H0 о незначимости регрессии.

Значимость оценок регрессии можно проверить с помощью критерия Стьюдента и вероятности Prob. Выдвигается нулевая гипотеза H0 о статистической незначимости коэффициента линейного уравнения регрессии (bi = 0). В отличие от критерия Фишера, каждый коэффициент проверяется отдельно. Если Prob > =0,05, то H0 принимаем. Так как все коэффициенты больше б = 0.05, то гипотеза о незначимости для этих коэффициентов отклоняется.

S.E. of regression - стандартная ошибка регрессии в результате решения уравнения. Т.е. разность между фактическим и прогнозируемым значением yt- yt = 2,42.

Standart error - стандартные ошибки коэффициентов уравнения. Стандартные ошибки показывают статистическую надежность коэффициента.

Durbin-Watson Stat - статистика Дарбина-Уотсона. Используется для выявления автокорреляции. Нулевая теория состоит в отсутствии автокорреляции. В качестве альтернативной гипотезы может выступать либо гипотеза о наличии автокорреляции, либо односторонняя гипотеза, например, о наличии отрицательной автокорреляции. Далее, по приведенной ниже таблице можно сделать более точные выводы о наличии или отсутствии автокорреляции.

Durbin-Watson Stat = 1,42

2) Обобщенный метод моментов- Generalized Method Moments

На рис 13 представлено диалоговое окно, в котором перечислены зависимая переменная (на первом месте), выбранные зависимые переменные и вектор коэффициентов С.

Рис.13. Построение уравнения регрессии

Сделав преобразования, получено уравнение регрессии с помощью обобщенного метода моментов (рис 14).

Рис. 14. Уравнение регрессии с помощью обобщенного метода моментов

Уравнение регрессии имеет вид:

Y = -5.945677635е-05*X1 - 0.01379271037*X2 + 0.002546170056*X3 + 0,01645537698*X4 + 0.0001594489116*X5 + 31.5893471

Уравнение регрессии позволяет понять, как формируется рассматриваемая экономическая переменная потребление сахара:

1) При увеличении валовых сборов сахарной свеклы по Российской Федерации на 1 тыс. тонн потребление сахара уменьшится на -5.945677635е-05 кг.

2) При увеличении индекса потребительских цен на 1% потребление сахара уменьшится на 0.01379271037 кг.

3) При увеличении посевных площадей на 1 тыс гектаров потребление сахара увеличится на 0.002546170056 кг.

4) При увеличении урожайности сахарной свеклы на 1 центнер с одного гектара убранной площади потребление сахара увеличится на 0,01645537698 кг.

5) При увеличении среднемесячной номинальной зарплаты на 1 руб потребление сахара увеличится на 0.0001594489116 кг.

Рассчитываем прогнозное значение потребления сахара на 2012 и 2013 годы. Используя функцию Forecast в объекте Equation, получаем следующие прогнозные значения на 2 года вперёд (рис 15).

Рис 15. Прогнозные значения на 2 года вперед

Рис 16. График прогнозных значений.

Как видим, показатели незначительно убывают. Проверка справедливости данных невозможна, так как информации на данный период времени нет.

На рис 17 построен график уравнения регрессии, построенного с помощью обобщенного метода моментов.

Рис. 17. График уравнения регрессии, построенного с помощью обобщенного метода моментов

Оценим статистическую значимость прогнозного уравнения. На рис 18 представлены необходимые показатели.

Рис. 18. Показатели уравнения на основе обобщенного метода моментов.

Коэффициент детерминации R2=0,367362<0,7 говорит о том, что доля влияния независимых переменных на зависимую незначительна (37%).

Значимость оценок регрессии можно проверить с помощью критерия Стьюдента и вероятности Prob. Выдвигается нулевая гипотеза H0 о статистической незначимости коэффициента линейного уравнения регрессии (bi = 0). В отличие от критерия Фишера, каждый коэффициент проверяется отдельно. Если Prob > =0,05, то H0 принимаем. Так как все коэффициенты больше б = 0.05, то гипотеза о незначимости для этих коэффициентов отклоняется.

S.E. of regression - стандартная ошибка регрессии в результате решения уравнения. Т.е. разность между фактическим и прогнозируемым значением yt- yt = 3,54.

Standart error - стандартные ошибки коэффициентов уравнения. Стандартные ошибки показывают статистическую надежность коэффициента.

Durbin-Watson Stat - статистика Дарбина-Уотсона. Используется для выявления автокорреляции. Durbin-Watson Stat = 0.51

3) Авторегрессионная модель условной гетероскедастичности - Autoregressive Conditional Heteroskedasticity

На рис.19 представлено диалоговое окно, в котором перечислены зависимая переменная (на первом месте), выбранные зависимые переменные и вектор коэффициентов С.

Рис. 19. Построение уравнения регрессии

Сделав преобразования, получим уравнение регрессии с помощью авторегрессионной модели условной гетероскедастичности (рис 20).

Рис. 20. Уравнение регрессии с помощью авторегрессионной модели условной гетероскедастичности

Уравнение регрессии имеет вид:

Y = -0.0004240363821*X1 - 0.01657459704*X2 + 0.01168692309*X3 + 0,06046920822*X4 + 4.903568552е-05*X5 + 21.43326387

Уравнение регрессии позволяет понять, как формируется рассматриваемая экономическая переменная потребление сахара:

1) При увеличении валовых сборов сахарной свеклы по Российской Федерации на 1 тыс. тонн потребление сахара уменьшится на 0.0004240363821 кг.

2) При увеличении индекса потребительских цен на 1% потребление сахара уменьшится на 0.01657459704 кг.

3) При увеличении посевных площадей на 1 тыс гектаров потребление сахара увеличится на 0.01168692309 кг.

4) При увеличении урожайности сахарной свеклы на 1 центнер с одного гектара убранной площади потребление сахара увеличится на 00,06046920822 кг.

5) При увеличении среднемесячной номинальной зарплаты на 1 руб потребление сахара увеличится на 4.903568552е-05 кг.

Рассчитываем прогнозное значение потребления сахара на 2012 и 2013 годы. Используя функцию Forecast в объекте Equation, получаем следующие прогнозные значения на 2 года вперёд (рис 21).

Рис 21. Прогнозные значения на 2 года вперед

Рис 22. График прогнозных значений.

Как видим, показатели незначительно убывают. Проверка справедливости данных невозможна, так как информации на данный период времени нет.

На рис 23 построен график уравнения регрессии, построенного с помощью обобщенного метода моментов.

Рис. 23. График уравнения регрессии, построенного с помощью авторегрессионной модели условной гетероскедастичности

Оценим статистическую значимость прогнозного уравнения. На рис 24 представлены необходимые показатели.

Рис. 24. Показатели уравнения авторегрессионной модели условной гетероскедастичности

Коэффициент детерминации R2=0,460087<0,7 говорит о том, что доля влияния независимых переменных на зависимую незначительна (46%).

S.E. of regression - стандартная ошибка регрессии в результате решения уравнения. Т.е. разность между фактическим и прогнозируемым значением yt- yt = 3,63.

Standart error - стандартные ошибки коэффициентов уравнения. Стандартные ошибки показывают статистическую надежность коэффициента.

Durbin-Watson Stat - статистика Дарбина-Уотсона. Используется для выявления автокорреляции. Durbin-Watson Stat = 0.64

Далее представлена сводная таблица полученных значений разными методами (табл 2).

Таблица 2 Сводная таблица значений, полученных выбранными методами

Метод

Коэффициент детерминации

Стандартная ошибка

Статистика Дарбина-Уотсона

Метод наименьших квадратов

0,71

2,42

1,42

Обобщенный метод моментов

0,37

3,54

0,51

Авторегрессионная модель условной гетероскедастичности

0,46

3,63

0,64

Самый высокий коэффициент детерминации при применении метода наименьших квадратов, что говорит нам о том, что доля влияния независимых переменных на зависимую значительна. Наименьшую стандартную ошибку дает так же метод наименьших квадратов. Статистика Дарбина-Уотсона показывает, что в интервал 1,5<d<2,5, где отсутствует автокорреляция остатков попадает все методы.

Таким образом, наиболее приемлемым является метод наименьших квадратов. Необходимо проверить ряд предпосылок, невыполнение которых может привести к значительным ошибкам. Исследуем остатки и оценим степень адекватности модели.

5. Анализ адекватности выбранной модели прогнозирования

При оценке параметров уравнения регрессии применяется метод наименьших квадратов. После того как с его помощью проведена оценка параметров модели, рассчитав разности фактических и теоретических значений результативного признака y, можно определить оценки случайной составляющей y-yx. Их можно считать некоторой выборочной реализацией неизвестного остатка заданного уравнения.

При изменении спецификации модели, добавлении в нее новых наблюдений выборочные оценки остатков могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование остаточных величин (случайных отклонений).

Статистические проверки параметров регрессии, показателей корреляции основаны на непроверяемых предпосылках распределения остатков. Они носят лишь предварительный характер. После построения уравнения регрессии проводится проверка наличия у случайных остатков тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям: быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции.

Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК, соблюдение которых желательно для получения достоверных результатов регрессии.

Если распределение случайных остатков не соответствует некоторым предпосылкам МНК, то следует корректировать модель, изменяя ее спецификацию, добавлять (исключать) некоторые факторы, преобразовывать исходные данные для того, чтобы получить оценки коэффициентов регрессии, которые обладают свойством несмещенности, имеют меньшее значение дисперсии остатков и обеспечивают в связи с этим более эффективную статистическую проверку значимости параметров регрессии.

Исследование остатков предполагает проверку выполнения 5 предпосылок метода наименьших квадратов:

1) Случайный характер остатков i , i=1,n;

2) Математическое ожидание возмущения i равно нулю;

3) Условие гомоскедастичности, т.е. дисперсия ошибок должна быть постоянной при разных наблюдениях;

4) Отсутствие автокорреляции, т.е. независимость остатков;

5) Возмущение есть нормально распределенная случайная величина.

1. Проверка случайного характера остатков.

Чтобы построить график остатков, нужно войти в окно параметров регрессии и в строке меню этого окна выбрать View/Actual,Fitted,Residual/Actual,Fitted,Residual Table (рис 25).

Рис. 25. График остатков

Actual - исходное значение Y;

Fitted - значение Y, вычисленное по уравнению регрессии;

Residual - остатки.

Из р видно, что остатки не имеют никакой закономерности и все остатки (за исключением 3-х) не выходят за границы области. Поэтому можно сказать, что остатки имеют случайный характер, т.е. достаточно хорошо аппроксимирует опытные данные Y.

2. Проверка равенства нулю математического ожидания.

Неравное нулю математическое ожидание позволяет сделать вывод, что зависит от Х и что модель неадекватна. Равенство нулю нарушается либо из-за неправильной спецификации модели (зависимость не линейная, а иная), либо из-за нарушения 3-ей предпосылки МНК (о постоянном значении дисперсии).

Получить значение математического ожидания можно следующим образом: в строке меню выбираем View/Residual Tests/Histogram-Normality Test (рис 26)

Рис. 26. Гистограмма распределения остатков

Значение математического ожидания (Mean)=4.88Е-15 очень близко к нулю, т.е. предпосылка E(Ui)=0 выполняется.

3. Проверка на гомоскедастичность.

Равенство дисперсий возмущений (ошибок) регрессии является существенным условием линейной классической регрессионной модели множественной регрессии. Свойство постоянства дисперсий ошибок регрессии называется гомоскедастичностью. Однако на практике это условие нередко нарушается, и мы имеем дело с гетероскедастичностью модели.

Наиболее простой и часто употребляемый тест на гетероскедастичность - тест Уайта. Выдвинем нулевую гипотезу Н0: дисперсии возмущений регрессии не постоянны (т.е. наблюдается гетероскедастичность). Также выберем устраивающую нас вероятность ошибки I рода б=0,05.

Для проведения теста в среде EViews в меню окна с характеристиками модели выбираем View/Residual Tests/White Heteroskedascity ( no cross terms) (рис 27).

Рис. 27. Тест Уайта

Полученное значение F-статистики: Prob(F-statistic)=0.042741 меньше уровня б=0,05, значит, гипотеза о наличии гетероскедастичности отвергается с вероятностью ошибки I рода б=0,05.

Также есть значение Obs*R-squared, по которому тоже проверяется наличие гетероскедастичности. Prob(Obs*R-squared)=0.026898 меньше уровня 0,05, значит, гипотеза о наличии гетероскедастичности отвергается с вероятностью ошибки I рода б=0,05.

4. Проверка на наличие автокорреляции (независимость остатков).

В соответствии с предпосылками метода наименьших квадратов, возмущения должны быть случайными. Однако нередко встречается ситуация, когда остатки содержат тенденцию или циклические колебания, т.е. каждое следующее значение возмущения зависит от предшествующих. В этом случае говорят об автокорреляции остатков. Для определения наличия автокорреляции используется тест Дарбина-Уотсона.

Выдвинем нулевую гипотезу Н0: автокорреляция отсутствует. Также выберем устраивающую нас вероятность ошибки I рода б=0,05.

Существуют два пороговых значения dн и dв, зависящие только от числа наблюдений, числа регрессоров и уровня значимости, такие, что выполняются следующие условия.

Если фактически наблюдаемое значение попадает в интервал:

- гипотеза Н0 не отвергается;

или - вопрос об отвержении или принятии гипотезы Н0 остается открытым (область неопределенности критерия);

- гипотеза Н0 отвергается и принимается альтернативная гипотеза H1 о положительной автокорреляции;


Подобные документы

  • Методы социально-экономического прогнозирования. Статистические и экспертные методы прогнозирования. Проблемы применения методов прогнозирования в условиях риска. Современные компьютерные технологии прогнозирования. Виды рисков и управление ими.

    реферат [42,4 K], добавлен 08.01.2009

  • Классификационные принципы методов прогнозирования: фактографические, комбинированные и экспертные. Разработка приёмов статистического наблюдения и анализа данных. Практическое применение методов прогнозирования на примере метода наименьших квадратов.

    курсовая работа [77,5 K], добавлен 21.07.2013

  • Эффективная оценка по методу наименьших квадратов. Корелляционно-регрессионный анализ в эконометрическом моделировании. Временные ряды в эконометрических исследованиях. Моделирование тенденции временного ряда. Расчет коэффициента автокорреляции.

    контрольная работа [163,7 K], добавлен 19.06.2015

  • Обзор основных инструментов, применяемых в прогнозировании. Характеристика базовых методов построения прогнозов социально-экономических систем при помощи программного обеспечения MS EXCEL. Особенности разработки прогнозных моделей на 2004, 2006 и 2009 гг.

    лабораторная работа [218,4 K], добавлен 04.12.2012

  • Метод наименьших квадратов; регрессионный анализ для оценки неизвестных величин по результатам измерений. Приближённое представление заданной функции другими; обработка количественных результатов естественнонаучных опытов, технических данных, наблюдений.

    контрольная работа [382,4 K], добавлен 16.03.2011

  • Прогнозирование, его основные подходы и виды. Текущее состояние российского кинематографа, его проблемы и тенденции. Прогнозирование числа выходящих кинофильмов в Российской Федерации методом экстраполяции временного ряда и методом наименьших квадратов.

    курсовая работа [280,0 K], добавлен 20.06.2014

  • Общее понятие о прогнозировании, методы. Абсолютные, сравнительные и качественные показатели оценки качества прогноза. Метод наименьших квадратов. Модели линейного роста. Новшества программы Excel 5.0. Пример решения задачи по прогнозу объема кредита.

    курсовая работа [1,1 M], добавлен 07.08.2013

  • Основные методы прогнозирования. Критерии качества прогнозных моделей. Разработка прогнозной модели. Классификация прогнозных моделей. Математическая прогнозная модель. Разработка аналитических моделей. Основные ограничения длины прогнозного периода.

    презентация [1,2 M], добавлен 09.07.2015

  • Понятие экстрополяции. Условия и методы применения ее при прогнозировании. Способы определения величины доверительного интервала. Классификация методов и основные этапы прогнозирования, аналитическое выражение тренда. Интерпретация полученных результатов.

    презентация [197,0 K], добавлен 02.05.2014

  • Теоретические основы сценарного подхода в прогнозировании. Основные принципы организации процесса формирования сценариев на различных этапах. Анализ вариантов планирования сценарных условий социально-экономического развития на период 2013-2015 годов.

    контрольная работа [17,1 K], добавлен 14.07.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.