Проблематика прогнозирования спроса

Принципы и методы построения линейных, нелинейных моделей спроса, применение эконометрических моделей на практике. Эконометрическое моделирование спроса на автомобили в РФ, проверка значимости коэффициентов, автокорреляции, наличия гетероскедастичности.

Рубрика Экономико-математическое моделирование
Вид дипломная работа
Язык русский
Дата добавления 30.01.2016
Размер файла 3,9 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

    • Введение
    • Глава 1. Проблематика прогнозирования спроса
    • 1.1 Теоретическая модель
    • 1.2 Построение модели спроса
    • 1.2.1 Основные этапы построения модели спроса
    • 1.2.2 Принципы и методы построения линейных, нелинейных моделей спроса
    • 1.3 Применение эконометрических моделей на практике
    • 1.3.1 Моделирование экономики на основе эконометрической модели LAM
    • 1.3.2 Оценивание ценовой функции для картин
    • Глава 2. Эконометрическое моделирование спроса на автомобили в России
    • 2.1 Сбор статистических данных
    • 2.2 Анализ эконометрической модели
    • 2.2.1 Проверка значимости коэффициентов модели
    • 2.2.2 Проверка автокорреляции
    • 2.2.3 Проверка на наличие гетероскедастичности
    • 2.2.4 Проверка качества модели
    • 2.3 Программное обеспечение для анализа модели
    • 2.3.1 Статистические пакеты для анализа данных
    • 2.3.2 Пакет SPSS
    • Глава 3. Построенные эконометрические модели спроса на зарубежные и отечественные автомобили в России
    • 3.1 Анализ парных корреляций
    • 3.2 Модель общего спроса на автомобили в России
    • 3.2.1 Построение модели
    • 3.2.2 Ретроспективный прогноз
    • 3.2.3 Качественные выводы из построенной модели
    • 3.3 Модель спроса на отечественных автомобилей
    • 3.3.1 Построение модели
    • 3.3.2 Ретроспективный прогноз
    • 3.3.3 Качественные выводы из построенной модели
    • 3.4 Модель спроса на зарубежных автомобилей
    • 3.4.1 Построение модели
      • 3.4.2 Ретроспективный прогноз
    • 3.4.3 Качественные выводы из построенной модели
    • Заключение
    • Литература
    • Приложения
    • Введение
    • Анализ объема и динамики продаж - один из основных этапов в управлении продажами. Выявление зависимостей спроса на товар и его прогнозирование помогает в принятии ответственных стратегических решений, планировании деятельности и организации работы отделов продаж.
    • Современная экономическая теория, как на микро, так и на макро уровне стремительно развивается. Постоянно усложняющиеся экономические процессы привели к необходимости создания и совершенствования особых методов изучения и анализа. При этом широкое распространение получило использование моделирования и количественного анализа. На базе последних выделилось и сформировалось одно из направлений экономических исследований - эконометрика.
    • Эконометрия - наука, изучающая количественные взаимосвязи экономических объектов и процессов при помощи математических и статистических методов и моделей. Основная задача эконометрии - построение количественно определенных экономико-математических моделей, разработка методов определения их параметров по статистическим данным и анализ их свойств. Наиболее часто используемым математическим аппаратом решения задач данного класса служат методы корреляционно-регрессионного анализа.
    • Эконометрическое моделирование составляет основу математического описания экономического развития любой сферы хозяйственной деятельности. Наибольшую актуальность оно приобретает в момент развития рыночных отношений, поскольку функционирование компаний с учетом конкурентной среды так или иначе оценивается как работа в условиях неопределенности, которая предполагает присутствие различного рода возмущений, которые непосредственно влияют на объясняемые переменные. Построение прогноза на базовой методологии эконометрической модели, конечно, не исключит ошибки результирующих параметров модели, но определенно уменьшит их количественное значение.
    • Целью настоящей работы является построение эконометрической модели динамики продаж зарубежных и отечественных автомобилей на основе собранных статистических данных для прогнозирования спроса в России.

Исходя из поставленной цели определен следующий круг задач:

1) Проанализировать общие принципы построения эконометрической модели;

2) Определить факторы, влияющие на уровень спроса на отечественные и зарубежные автомобили в России, собрать статистические данные по ним;

3) Построить эконометрическую модель спроса на автомобили в России;

4) Провести ретроспективный прогноз на основании построенной модели.

Объект исследования - рынок продаж автомобилей в России.

Предмет исследования - исследование спроса на отечественные и зарубежные марки автомобилей в России.

Глава 1. Проблематика прогнозирования спроса

1.1 Теоретическая модель

Если обобщить теоретическую модель, описывающую взаимосвязи между явлениями или закономерности их развития, то можно записать следующее соотношение:

y = (,x) +

В указанном соотношении (,x) - это функционал, соответствующий виду и структуре взаимосвязей. Величина у называется результативным признаком или объясняющей (зависимой) переменной, она характеризует уровень исследуемого явления. Величина x = (x1, x2, .., xn) представляет собой вектор значений независимых (объясняющих) переменных xi. Величина б=(б0, б1, б2, ..., бn) составляет вектор произвольных констант, которые называются параметрами модели, а е - ошибка модели Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. - 5-е изд., испр. - М.: Дело, 2001..

Ошибка модели е рассматривается как случайная величина и характеризует различие реального значения объясняющей переменной y от вычисленного в соответствии с указанным соотношением при определенных условиях (конкретных значениях независимых переменных факторов xi).

Для расчета числового значения параметров б012,...,бn используется заранее собранный массив наблюдений относящийся к изучаемому процессу и рассматриваемым факторам. В одном наблюдении присутствует множество значений (yt,x1t,x2t,...,xnt). Индекс t характеризует отдельное наблюдению.

Зависимую переменную y часто называют эндогенной (внутренней) переменной модели, отображая той факт, что значения зависимой переменной определяется только значениями независимых переменных xi.

Объясняющие переменные (предикаторы) x1,x2,...,xn называют экзогенными (внешними) переменными. Термин "внешний" сообщает о том, что значения предикаторов xi являются заданными, так как определяются вне исследуемой модели.

По типу взаимосвязи факторов с зависимой переменной y модели разделяются на линейные и нелинейные. По характеристикам своих параметров модели можно разделить на две категории: модели с постоянной и переменной структурой. К специфичному виду модели можно отнести системы взаимосвязанных эконометрических уравнений, включающих несколько уравнений общего вида теоретической модели.

В общем случае алгоритм создания модели можно разбить на несколько шагов:

1) Aнализ особых свойств исследуемых явлений и процессов, описание наиболее подходящих классов моделей для их обоснования;

2) Оценка выбранного типа эконометрической модели с учетом исходных данных, выражающих значения предикаторов в определенные моменты времени;

3) Проверка качества полученной модели и обоснования целесообразности ее применения в ходе дальнейшего эконометрического исследования;

4) В случае принятия решения о нецелесообразности использования созданной эконометрической модели необходимо вернуться к предыдущему этапу работы и попытаться построить другой вариант модели, который будет более точнее описывать изучаемые явления и процессы.

1.2 Построение модели спроса

1.2.1 Основные этапы построения модели спроса

1) Постановочный этап

На данном этапе производится определения итоговых целей строящейся модели, отбор задействованных факторов, анализ их влияния. Главными цели: оценка состояния и анализ изменения экономического объекта, прогнозирование основных экономических показателей объекта, сценарный анализ, применение полученных результатов для планирования управления.

2) Априорный этап

На втором этапе оценивается сущность исследуемого объекта, идет систематизация имеющихся данных.

3) Этап параметризации

На этапе параметризации определяется общий вид модели, типы взаимосвязей, их состав. Главная цель этапа - определить тип функции f(x).

4) Информационный этап

Производится анализ и сбор статистических данных.

5) Этап идентификации

На этапе идентификации модели осуществляется основная часть исследований. Проводится эконометрическая оценка модели и ее параметров.

6) Этап верификации

При верификации модели идет оценка адекватности модели, проводится анализ точности полученных значений. Проверяется смоделированный процесс на соответствие с реальным, высчитывается ошибка прогноза.

1.2.2 Принципы и методы построения линейных, нелинейных моделей спроса

Каждый раз анализируя предложения и спрос появляется необходимость сделать некоторый прогноз. Для корректного прогнозирования важно построить качественную модель, с помощью которой возможно будет сделать прогноз.

При создании линейной модели спроса или предложения зачастую учитываются не только сами значения показателей, важно уделить внимание влияющим на спрос факторам. Например, на спрос напрямую влияет уровень доходов населения, период (сезонность), ставки процентов в банке и многие другие факторы. Так и на предложение могут повлиять высокие цены на ресурсы, новые дорогостоящие технологии, налоги и многое другое.

Разберем в первую очередь наиболее часто применяющуюся модель для описания спроса и других различных экономических показателей.

Экономико-математические методы и прикладные модели: Учеб. пособие для вузов / В.В. Федосеев, А.Н. Гармаш, Д.М. Дайитбегов и др.; Под ред В.В. Федосеева. - М.: ЮНИТИ, 2002.

где а0 и а1 - расчетные параметры, t - временной фактор, относительно которого изменяется спрос и предложение;.

Указанная выше модель называется трендовой моделью экономической динамики. Другими словами - кривая роста для экономических процессов. Главной целью данной модели является прогнозирование изучаемого процесса на исследуемый период времени.

На данный момент существует большое количество типов кривых роста для экономических процессов. В приоритетном порядке в экономике применяются полиномиальные, экспоненциальные и S-образные кривые роста. Указанная выше модель относится к типу полиномиальной кривой роста. Наиболее простые кривые роста могут принимать схожий вид:

(полином первой степени)

(полином второй степени)

(полином третьей степени)

где а1 - линейный прирост, а2 - ускорение роста, а3 - изменение ускорения роста.

Для вычисления параметров модели применяется метод наименьших квадратов. Также можно записать уравнения в матричной форме. Опишем вычисление параметров с помощью метода МНК.

Полином первой степени:

Полином второй степени:

Полином третьей степени:

Подобным образом можно рассчитать все параметры для полиномиальных моделей.

Для корректного выбора кривой роста для дальнейшего моделирования и прогнозирования нужно учитывать специфику каждого вида кривых. Но на практике получается так, что используется модель, анализ которой дает наилучшие результаты. Оценка качества модели осуществляется относительно случайной величине t. Параметры модели можно записать в следующем виде:

,

где

кривая роста (полиномиальная или другая), а t - случайная величина. Существует две причины возникновения случайной величины:

1. Прогнозирование экономического показателя на основе временного ряда базируется на экстраполяции Бокс Дж., Дженкинс Г. Анализ временных рядов. Выпуск 1: Прогноз и управление. - М. Мир, 1974. (анализ будущих значений на основании изменения прошедших) и относится к одномерным методам прогнозирования. Обычно в таких случаях исследуемых показатель зависит от множества факторов, четко определить которые достаточно проблематично. Исходя из этого модель является упрощением действительности, поэтому отклонения и возникают.

2. Возникновение неких препятствий при измерении данных (наличие ошибок измерений), а также возникновение ошибки при округлении расчетных значений.

Процесс вычисления данного показателя во временном ряде соотносят не с фактором, а с течением времени, что отражается в создании одномерных временных рядов.

Помимо полиномиальных кривых роста широко распространенным способом моделирования тенденции временного ряда является создание аналитической нелинейной функции, объясняющую зависимость ряда от времени. Так как зависимость от времени может быть различна, для представления модели используются разнообразные виды функций. В создании эконометрических моделей спроса и предложения зачастую применяют экспоненциальный тренд:

.

Нужно выявить подходящую из рассмотренных модель, которая наиболее качественно описывает исследуемый параметр, другими словами определить тип тенденции.

Вариантов для определения вида тенденции несколько. Среди известных способов наиболее распространены: качественный анализ исследуемого процесса, построение графика и его визуальный анализ, вычисление некоторых показателей динамики. В подобных случаях возможно рассмотреть коэффициент автокорреляции уровней ряда. Если рассчитать коэффициент автокорреляции по уровням ряда (исходным и преобразованным), тип тенденции можно определить путем их сравнения. Если тенденция временного ряда определена как линейная, его соседние значения yt и yt-1 коррелированы между собой. В такой ситуации коэффициент автокорреляции первого порядка для значений начального ряда должен быть высоким. Если для временного ряда наблюдается нелинейная тенденция, то коэффициент автокорреляции первого порядка по логарифмам значений начального ряда будет выше, чем соответствующий коэффициент, вычисленный по значениям ряда. Чем сильнее будут различаться величины коэффициентов, тем более явно будет прослеживаться нелинейная тенденция в исследуемом временном ряде.

Существует и другой случай - степенная модель, имеющая вид:

Рассмотрим анализ параметров модели в нелинейных трендах Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2001.. Каждый из них может быть рассчитан с помощью метода МНК, если нелинейную модель привести к линейному виду. В таком случае экспоненциальный тренд примет следующий вид:

.

Отсюда вычислим и :

Параметры а и b вычисляются обратным способом.

В случае степенной модели:

.

Для получения параметров и b необходимо решить систему нормальных уравнений:

Взаимосвязь спроса от времени не всегда четко выражена. Наилучший способ для анализа подобных явлений использовать модель множественной регрессии, в которой исследуемый фактор будет зависеть от набора переменных. На практике подобные модели используются чаще, так как позволяют оценить исследуемое значение при изменении влияющих на него факторов.

Рассмотрим пример спроса на картофель (переменная y), который зависит от уровня заработной платы (х1), время года (х2), территориальной расположенности (х3), количества сбережений населения (х4), показателя динамики инфляции (х5). Для некоторых независимых переменных можно сопоставить количественные значения. В таком случае строится модель многофакторной регрессии:

.

Подобная модель будет четко отображать ситуации, при возможных изменениях различных факторов.

При вычислении параметров модели применяют метод МНК или используют матричную запись.

В матрице Х хранятся значения факторов, в матрице Y - зависимые переменные, в матрице А - коэффициенты регрессии.

; ;

В данной случае уравнение множественной регрессии будет иметь вид:

.

С помощью стандартных преобразований над матрицей получим выражение матрицы А:

,

где X' - транспонированная матрица Х.

Среди моделей в теории спроса и предложения встречаются не только линейные и нелинейные. Большинство экономистов выявляют различные связи предложения и спроса. Можно привести пример системы совместных уравнений - модель кейнсианского типа:

где - спрос на товар;

- предложение на товар;

- цена товара;

- доход;

- цена товара в предыдущий период;

t - момент времени.

Как правило, система совместных уравнений состоит из эндогенных и экзогенных переменных.

В нашем случае эндогенные переменные обозначены как Q. Это объясняемые переменные, их количество должно соответствовать количеству уравнений в системе.

Все остальное относится к экзогенным переменным. Это объясняющие переменные, которые влияют на эндогенные переменные, но сами от них не зависят.

Структура подобной модели отражает уровень влияния любого фактора на значение зависимой переменной. Корректируя уровень цен на товары и доходы, есть возможность прогнозировать величины спроса и потребления.

При оценке возможностей спроса часто используются однофакторные функции. Соответственно, кривую спроса можно описать следующим соотношением

Бабешко Л.О. Основы эконометрического моделирования: Учеб. Пособие. - М.: КомКнига, 2006.,

где Z - доход. Такие функции называются кривыми Энгеля. Формы подобных кривых могут различаться для различных видов товаров. Функция будет иметь линейный вид в случаях пропорционально возрастающего спроса и дохода. Подобный вид имеет спрос на фрукты и одежду, пример кривой представлен на рисунке 1.1.

В случаях роста спроса относительно высокими темпами по сравнению с доходом, кривая примет более выпуклый вид (рис. 1.2). Такая ситуация наблюдается с дорогостоящим товаром.

В обратном случае, когда темп роста спроса замедляется с определенного момента, кривая Энгеля примет вогнутый вид (рис. 1.3). Подобная ситуация характерна для товаров первой необходимости.

Рисунки 1.1-1.3. Кривые спроса

Помимо перечисленных, для исследования спроса на товары применяются и другие функции (например, S-образные). Зачастую, для построение модели используются специфичные данные конкретной области, поэтому модели очень индивидуальны.

1.3 Применение эконометрических моделей на практике

Существует три классификации задач, для решения которых применяются эконометрические модели Вербик Марно Путеводитель по современной эконометрике. - М.: Научная книга, 2008.:

1) отличие по конечным целям;

2) отличие по уровню иерархии;

3) отличие по области исследования.

По конечным прикладным целям различают две основные задачи:

- прогнозирование экономических показателей, описывающих состояние и уровень развития исследуемой системы;

- сценарный анализ: оценка состояния системы при возможных изменения ее параметров.

По иерархии задачи подразделяются последующим уровням:

- макроуровень (страна);

- мезоуровень (области, отрасли, монополии);

- микроуровень (семья, компании, магазин).

Области исследования экономической системы:

- рынок;

- инвестиционная, финансовая, социальная политики;

- ценообразование;

- распределительные отношения;

- спрос и потребление;

- комплекс проблем.

1.3.1 Моделирование экономики на основе эконометрической модели LAM

Первоначально модель LAM (Long-run Adjustment Model) разработали для моделирования и прогнозирования экономик стран восточной Европы в переходный период. Первые версии модели были использованы 1993 году для моделирования процесса приватизации в Польше и Чехословакии. Следующая версия модели применялась для прогнозирования основных макроэкономических показателей Венгрии, Польши, Литвы, Эстонии, Словакии, Чехии, Румынии. Во второй версии модели LAM-2 не учитывались уравнения, описывающие характеристику потребления и инвестиций. Это было основным недостатком модели, который был устранен в новой версии LAM-3. Помимо исправления недочета предыдущей модели, для LAM-3 был доработан механизм коррекции ошибок: линейный заменен на билинейный.

Принцип и назначение модели:

1) Модель LAM-3 считается малой моделью, целью которой является анализ и краткосрочный (квартальный) прогноз основных макроэкономических показателей: ВВП, импорт, экспорт, индекс потребительских цен, показатели доходов и потребления, инвестиций, средне-душевой доход и занятость населения, уровень безработицы, спрос на деньги и другие.

2) Модель легка в управлении и достаточна проста в сопровождении. Есть возможность быстрого доступа к корректировке модели при появлении новых данных.

3) Структура модели для различных национальных экономик не изменяется, отличается только входными параметрами. Сама модель состоит из 25 уравнений: четыре из них описывают долгосрочные зависимости, двадцать одно - краткосрочные.

4) Основу модели LAM-3 составляет билинейный вектор авторегрессии

(Bilinear Vector AutoRegressive model- BiVAR).

В статье "О моделировании экономик России и Беларуси на основе эконометрической модели LAM-3" Харемза В.В., Харин Ю.С., Макарова С.Б. Прикладная эконометрика "О моделировании экономик России и Беларуси на основе эконометрической модели LAM-3" 3-е изд., 2006. с помощью универсальной методологии построены эконометрические модели LAM-Rus и LAM-Bel для квартального прогнозирования динамики основных макроэкономических показателей для экономики России и Беларуси соответственно. Также модель позволяет количественно измерить различные сценарии экономической политики. Анализ качества модели на основе полученных оценок показал практическую значимость модели. Вычисленные в статье показатели позволяют разработать план дальнейших действий для эконометрических исследований.

1.3.2 Оценивание ценовой функции для картин

Важность рынок произведений искусства с экономической точки зрения является общепризнанным фактом. Для инвесторов, которые нацелены на извлечения максимальной выгоды из своих активов, предметы искусства - лишь финансовый инструмент. В кризисный период цены на стандартные активы падают. Но цены на произведения искусства не подвергаются таким изменениям ввиду самостоятельности актива, что соответствует низкой корреляции с другими активами.

Хотя рынок по продаже произведений искусства появился в семнадцатом веке, его анализ и исследование стали проводиться относительно недавно.

В статье "Оценивание гедонистической ценовой функции для картин Клода Моне" Ратникова Т.А., Сергеева Е.С. Прикладная эконометрика "Оценивание гедонистической ценовой функции для картин Клода Моне" 4-е изд., 2010. оценивается гедонистическая регрессионная модель зависимости цены от набора факторов (характеристик работы), построенная на основе 296 случаях продажи картин мастера по всему миру с апреля 1997 года по декабрь 2009 года. Для объясняющих переменных были выбраны материал основы, техника исполнения, размер полотна, наличие даты и подписи, аукционный дом продажи, наличие упоминаний о работе, опыт мастера к моменту написания картины, порядок лота. Регрессии получилась значимой для 76% вариации цен. Рассчитанные коэффициенты модели позволяют оценить стоимость работ, определять случаи продажи по "завышенной" цене. В ходе построения модели была подтверждена гипотеза о том, что написанные маслом картины самые дорогие. Гипотеза об отсутствии влияния кризиса на цену, напротив, была опровергнута.

Глава 2. Эконометрическое моделирование спроса на автомобили в России

2.1 Сбор статистических данных

Для прогнозирования спроса на автомобили выделены доминантные факторы, описанные в таблице 2.1.

Таблица 2.1. Доминантные факторы спроса на автомобили

Фактор

Обозначение

Средневзвешенная процентная ставка по кредитам, предоставленными кредитными организациями физическим лицам на срок свыше 1 года, %

Credite_rate

Бивалютная корзина, руб

Currency_basket

Розничная цена на бензин АИ-95, руб/л

Cosoline_price

Среднедушевой доход, руб/месяц

Average income

Численность населения

Population

Динамика инфляции, %

Inflation_dynamic

В таблице 2.2 описаны марки автомобилей, по которым были собраны данные по продажам. Статистика продаж содержится в приложении 4.

Таблица 2.2. Список марок автомобилей, проданных в России с января 2007 года

Отечественные автомобили

Зарубежные автомобили

Vortex, ГАЗ комм., ГАЗ легк., ЗАЗ, Иж, Лада, Ока, ТагАЗ, УАЗ.

Acura, Alfa Romeo, Audi, BAW, BMW, Brilliance, BYD, Cadillac, Changan, Chery, Chevrolet, Chrysler, Citroen, Daewoo, Datsun, Dodge, Dongfeng, FIAT, Ford, Foton, Geely, Great Wall, Hafei, Haima, Honda, Hummer, Hyundai, Infiniti, Iran Khodro, Isuzu, Iveco, JAC, Jaguar, Jeep, Kia, Land Rover, Lexus, Lifan, Luxgen, Mazda, Mercedes-Benz, Mercedes-Benz комм., Mini, Mitsubishi, Nissan, Opel, Peugeot, Porsche, Renault, SAAB, SEAT, Skoda, smart, SsangYong, Subaru, Suzuki, Toyota, Volkswagen, Volkswagen комм., Volvo, Богдан.

В таблице 2.3 описаны зависимые переменные:

Таблица 2.3. Прогнозируемые переменные

Описание переменной

Обозначение

Общие продажи автомобилей

Sold_out

Продажи отечественных марок авто

Russian_cars

Продажи зарубежных автомобилей

Foreign_cars

Статистические данные собраны из следующих источников:

Таблица 2.4. Источники статистических данных

Фактор

Источник

Population, Average income

Федеральная служба государственной статистики

Sold_out, Russian_cars, Foreign_cars

Association of European Businesses (AEB)

Credite_rate, Currency_basket

Статистика Центрального банка Российской Федерации

Cosoline_price

Котировки Яндекс (данные предоставлены: Петрол Плюс Регион)

Inflation_dynamic

Уровень-инфляции.рф (основаны на индексах потреб. цен, взятых у ФСГС)

Для построения модели спроса использовалась линейная регрессионная модель зависимости показателей продаж от объясняющих переменных. Модель построена на основании 90 наблюдений: данные по каждому месяцу, начиная с января 2007 года (приложение 4).

2.2 Анализ эконометрической модели

2.2.1 Проверка значимости коэффициентов модели

Чтобы оценить значимость того или иного коэффициента линейной регрессии, используется t-критерий Стьюдента.

1) Для проверки значимости выдвигается гипотеза H0 о статистической незначимости коэффициента уравнения регрессии;

2) Производится вычисление значение t-критерия фактического (tфакт) и с помощью таблицы t-распределения Стьюдента определяется табличное (критическое) значение t-критерия (tтабл);

3) Далее необходимо проверить условие | tфакт | ? tтабл. Если условие выполняется, то нулевая гипотеза H0 подтверждается, коэффициент уравнения регрессии статистически незначим (коэффициент недостоверен, равен нулю). Если | tфакт | > tтабл, то гипотеза H0 опровергается, статистическая значимость коэффициента признается.

Формулы для вычисления величин tb,факт, ta,факт:

где Sa и Sb - стандартные ошибки коэффициентов регрессии, которые вычисляются по формулам:

где yi - вычисленные значения зависимой переменной,

yi - фактические значения объясняемой переменной,

n - объем выборки,

xi - фактические значения предикатора,

- средняя величина фактических значений предикаторов.

2.2.2 Проверка автокорреляции Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курдышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2002.

Для тестирования автокорреляции первого порядка элементов исследуемой последовательности используется статистический критерий, известный как критерий Дарбина-Уотсона (или DW-критерий).

Критерий назван в честь Джеффри Уотсона и Джеймса Дарбина. Вычисляется критерий Дарбина-Уотсона по следующей формуле:

где - коэффициент автокорреляции первого порядка.

Принято считать, что в модели регрессии

ошибки распределены как

,

где специфировано, как белый шум ,

,

а ,

где .

В случае наличия положительной автокорреляции стремится к нулю, при ее отсутствии ;, а при отрицательной - критерий стремится к 4:

Применение критерия Дарбина-Уотсона на практике реализуется при сопоставлении величины DW с тобличными значениями dL и dU для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости б.

1. Если DW < dL, то гипотеза о независимости случайных отклонений отвергается (равносильно наличию положительная автокорреляция);

2. Если DW > dU, то гипотеза не отвергается;

3. Если dL < DW < dU, то оснований для принятия решений недостаточно.

В тех случаях, когда DW превышает 2, с dL и dU необходимо сравнивать выражение (4 - DW), а не сам коэффициент DW.

2.2.3 Проверка на наличие гетероскедастичности Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия - М.: Диалектика, 2007.

Один из статистических критериев для проверки наличия гетероскедастичности (то есть непостоянной дисперсии) случайных ошибок модели линейной регрессии - Критерий Бройша-Пагана. Применяется, если есть основания полагать, что дисперсия ошибок может зависеть от некоторой совокупности наблюдаемых переменных:

, где .

Проверяемая гипотеза сформулирована следующим образом:

остатки гомоскедастичны;

Альтернативная гипотеза:

неверна (остатки гетероскедастичны).

Процедуру вычисления статистики можно описать следующими шагами.

1) Начальная модель

оценивается стандартным методом наименьших квадратов (МНК), определяются остатки .

2) Предположив гомоскедастичность модели, дисперсия ее ошибки вычисляется как

.

3) Вычисляются стандартизированные остатки .

4) Производится построение дополнительной регрессия квадратов стандартизированных ошибок на начальные значения предикаторов:

.

5) ,

где - коэффициент детерминации построенной на предыдущем этапе регрессии.

Если статистика критерия имеет распределение хи-квадрат с степенями свободы, то гипотеза о гомоскедастичности остатков подтверждается.

2.2.4 Проверка качества модели

Проверка адекватности модели или, другими словами, тестирование значимости объясняющей переменной X проводится по критерию Фишера. Другими словами, проверяется, значимо ли влияние предикатора X влияет на значение объясняемой переменной Y.

Используя суммы квадратов отклонений, вычислим F-критерий Фишера по формуле:

При учете степеней свободы расчетная формула для вычисления критерия Фишера выглядит следующим образом:

где m, (n-m-1) - число степеней свободы числителя и знаменателя зависимости соответственно; n - количество наблюдений; m - количество предикаторов.

Тестирование значимости переменной X по критерию Фишера состоит из следующих этапов:

1. Формулируем нулевую гипотезу H: в1=0;

2. Принимаем вероятность ошибки (уровень значимости) б (5%);

3. Производим вычисления F-отношения;

4. Из таблицы F-распределения Фишера определяем величину F-критическое при заданном уровне значимости (или ошибки) и по степеням свободы f1 и f2;

5. Если Fфакт < Fтабл то гипотезу о незначимости предикатора отклоняем с 5%-ным риском ошибиться, где Fтабл - значение F при 5%-ном риске ошибки.

Значение Fтабл определяют по специальным таблицам в зависимости от степеней свободы f1 и f2:

f1=(n-m-1), f2=(n-1).

Если неравенство Fфакт > Fтабл справедливо, то можно сделать заключение об адекватности построенной модели, следовательно линейная связь между предикатором и объясняемой переменной допустима.

Итоговое оценочное значение качества модели отражается в коэффициент детерминации RІ. Если регрессия является парной, коэффициент детерминации будет совпадать с квадратом коэффициента корреляции:

где uІi - разница между исходным значением Y и предсказанным значением с помощью построенной модели.

Коэффициент детерминации определяет долю разброса объясняемой переменной, которая определяется регрессией Y на X; дробное отношение определяет составляющую часть разброса объясняемой переменной, которая не определяется регрессией.

Для общего случая корректным является соотношение 0?RІ=1. Чем ближе коэффициент детерминации к единице, тем сильнее линейная связь между X и Y. Чем связь слабее, тем RІ ближе к нулю.

Средняя ошибка аппроксимации - еще одно средство оценки уравнения регрессии является.

Фактические значения результативного признака отличаются от теоретических, вычисленных по уравнению регрессии, т.е. y и yx. Чем меньше эта разность, тем теснее теоретические значения к эмпирическим данным, качество модели лучше.

Средняя ошибка аппроксимации рассчитывается по следующей формуле:

Для качественно построенных моделей, величина этого показателя не должно превышать 10%.

2.3 Программное обеспечение для анализа модели

2.3.1 Статистические пакеты для анализа данных

В связи с ростом потребности статистического анализа данных практически во всех сферах деятельность, а особенно в научной, рынок программного обеспечения для статистической обработки данных стремительно развивался. В течение последних 20 лет компьютерные программы, способные статистически анализировать большие объемы данных для прогнозирования событий, оценки вероятных альтернатив выбора, выявления закономерностей, сделали большой шаг в своем развитии. Постоянно ведутся работы по совершенствованию программ в части сокращения времени работы с данными, повышения качества представления отчетов с результатами, модернизации интерфейса, актуализации справочной информации, добавления новых статистических методов, процедур и прочего.

Рынок программного обеспечения развивается стремительными темпами. Задачи по обработке данных разнообразны, для их решения применяются разноплановые типы статистических процедур анализа для получения ответов на вопросы по всем областям деятельности. Все это вызвало появление большого разнообразия статистических пакетов. На текущий момент на рынке можно встретить порядка тысячи статистических пакетов (компьютерных программ) для обработки данных.

Для рынка ПО для статистического анализа данных характерна высокая конкуренция, зачастую происходит объединение или поглощение компаний по разработке программ. К примеру, один из лидеров на рынке компания SPSS Inc. поглотила компанию SYSTAT Software Inc в 1994 году, а в 1996 году - BMDP Statistical Software Inc. За счет данных "покупок" компания повысила качество своих продуктов. Приобретение SYSTAT позволило оптимизировать процедуру обработки и анализа данных, а поглощение BMDP Software - улучшить графические инструментарий SPSS. В 2009 году компанию IBM Inc. поглотила компанию SPSS Inc.

Пользователю каждый раз необходимо выбирать оптимальный и подходящий для него статистический пакет, исходя из поставленного круга задач. Ни для кого не секрет, что оптимальным является вариант, комбинирующий в себе высокий уровень работы, нужные функциональные возможности и умеренную цену. При выборе важно обратить внимание на следующие характеристики:

· соответствие параметрам поставленных задач;

· объем данных для статистического анализа;

· квалификация пользователя в области статистики (уровень знаний);

· соответствие компьютерного оборудования пользователя.

По функциональности программы для статистического анализа можно разделить на 3 основные группы.

1. Универсальные пакеты, или пакеты общего назначения (например, Minitab, STATISTICA, STATA, S-PLUS, STATGRAPHICS, Stadia, SYSTAT, SPSS).

Данные программы не заточены под определенную предметную область, их можно применять для анализа данных в различных областях деятельности. В основном в этих программах используется простой интерфейс и предложен широкий спектр статистических методов и процедур. Как правило, с подобными статистическими пакетами работают начинающие пользователи, обладающие начальным уровнем знаний в статистике, или же опытные пользователи, которые находятся на начальном этапе работы и с набором статистических методов еще не определились. Возможность использовать широкий спектр статистических методов для пробного анализа различных типов данных делает данный пакет многопрофильным и универсальным. Практические все универсальные пакеты имеют ряд схожих друг с другом встроенных статистических процедур.

Каждый универсальный статистический пакет должен соответствовать следующему перечню требований:

o иметь достаточно широкий перечень встроенных стандартных методов и процедур для статистического анализа.;

o быть понятным для "новичка" в освоении интерфейса и применении различных методов анализа;

o быть способным обрабатывать большие базами данных и соответствовать высоким требованиям к хранению данных;

o иметь стандартизированный вид представления данных для их последующего использования в других пакетах анализа и базах данных;

o иметь в наличии широкий выбор в графическом представлении данных и результатов анализа;

o иметь некую базу знаний, или справочную систему, в которой пользователь сможет найти ответы на свои вопросы по использованию пакета; иметь документационное.

2. Профессиональные пакеты (например, BMDP, SAS).

Основное отличие профессиональных пакетов от универсальных в том, что первые позволяют обрабатывать гораздо больший объем данных, имеют более узкоспециализированные методы, есть возможность для создания своей системы для обработки данных. Зачастую, такие пакеты сложны для начинающих пользователей. Для профессионалов, наоборот, подобные пакеты предоставляют дополнительный широкий круг возможностей для более подробного анализа данных, исходя из своих потребностей к построенным моделям. Конечно, такие возможности добавляют к себестоимости, и профессиональные пакеты являются более дорогостоящи. Ценовой фактор препятствует широкому распространению использования профессиональных статистических пакетов в различных областях деятельности.

3. Специализированные пакеты (например, DATASCOPE, BioStat, MESOSAUR).

Существуют некоторые области деятельности, исследуемые данные которых специфичны и отличны от других, требуют применения соответствующих специфических методов, которых нет в универсальных пакетах.

Специализированные пакеты предназначены для проведения анализа данных отдельно взятой предметной области с применением узкого круга специализированных статистических процедур. Подобные пакеты используют высококвалифицированные специалисты соответствующей предметной области. Приведем примеры существующих специализированных пакетов:

· BioStat - нацелен на анализ данных в области биологии и медицины.

· MESOSAUR - отечественный статистический пакет, используется при анализе одномерных и многомерных временных рядов и построении регрессионных моделей.

· DATASCOPE - российский статистический пакет, используется при анализе многомерных данных.

В случаях необходимости систематического решения для конкретной области или решения с использованием ограниченного набора сложных статистических методов, следует использовать соответствующий специализированный пакет.

Преобладающее количество существующих на рынке статистических пакетов имеют гибкую модульную структуру, которую можно изменять и дополнять за счет установки дополнительных плагинов (модулей), представленных для покупки или свободного скачивания в Интернете. Данная способность способствует адаптации пакета к требованиям конкретного пользователя.

Перечень минимальных требований, которым должен соответствовать каждый статистический пакет:

· модульность;

· ассистирование при выборе способа обработки данных;

· использование простого проблемно-ориентированного языка для формулировки задания пользователя;

· автоматическая организация процесса обработки данных;

· ведение банка данных пользователя и составление отчета о результатах проделанного анализа;

· диалоговый режим работы пользователя с пакетом;

· совместимость с другим программным обеспечением.

Как правило, постоянно ведется поддержка существующих статистических пакетов. Каждая последующая версия приобретает новые возможности для анализа (добавление новых методов), не теряя при этом старый функционал. Новые версии зачастую остаются с начальным названием, меняется лишь порядковый номер версии. Распространенные пакеты поддерживают мультиязычность.

Каждая команда разработчиков рекламирует свой статистический пакет, как самый наилучший для анализа данных. При широком выборе зачастую сложно выбрать правильный пакет. В любом случае, статистический пакет лишь инструмент в руках аналитика. Если специалист не компетентен в конкретной области, то никакой совершенный пакет не поможет ему проделать качественный анализ. С другой стороны, неверно выбранный пакет может сильно затруднить процесс работы даже высококвалифицированного специалиста.

Таблица 2.1. Статистические пакеты

Универсальные пакеты или пакеты общего назначения

Профессиональные пакеты

Специализированные пакеты

SPSS, STATA, STATISTICA, Stadia, STATGRAPHICS, Minitab

SAS

BioStat

Ниже приведен минимальный набор статистических методов, который включены в каждый наиболее известный программный продукт, предназначенный для статистической обработки данных и относящихся к упомянутым ранее трем основным группам программ (таб. 2.1).

· описательная статистика (базовые статистические методы, проверка нормальности распределения данных);

· дисперсионный анализ;

· кластерный анализ;

· непараметрическая статистика (анализ таблиц сопряженности, непараметрические сравнения, дисперсионный анализ);

· контроль качества;

· обработка данных (сортировка, трансформация данных, отбор);

· анализ выживаемости;

· дискриминантный анализ;

· регрессионный анализ;

· факторный анализ.

2.3.2 Пакет SPSS

Statistical Package for the Social Sciences (далее пакет SРSS) - один из универсальных статистических пакетов, который был разработан компанией SРSS Inc. Первая версия продукта была представлена еще в 1968 году. В 2009 году, после поглощения компанией IBM, название пакета включает в свое название аббревиатуру IBM (IBM SPSS Statistics).

Команда разработчиков статистического данного пакета считает, что их программный продукт занимает одну из лидирующих позиций среди существующих по части решения вопросов при анализе данных в академической, правительственной и бизнессфере.

SРSS относится к типу многомодульной программы. В стартовом пакете идет SPSS Base (базовый модуль), который предоставляет возможность управлять данными и содержит основные методы статистического анализа, перечисленные в предыдущей главе. Чтобы проделать более широкий и глубокий анализ данных, дополнительно потребуется установить модули пакета. Для 19 версии пакета IBM SPSS Statistics существует шестнадцать дополнительных модулей. Например, модуль Advanced Statistics позволяет проводить глубокий анализ взаимосвязей, процедуры, которые способны учитывать свойства данных. Также в модуле присутствуют мощные инструменты для создания моделей. Подобной возможности в базовом модуле нет. Среди разработанных модулей есть модуль Direct Marketing, с помощью которого маркетологи могут самостоятельно проводить основные виды анализа. Модуль Bootstrapping предоставляет специалистам возможность тестировать модель на устойчивость. Модуль Data Entry облегчает процедуру создания анкет и заполнения результатов, автоматизируя его.

Достоинства SPSS:

· мощный аппарат статистического анализа;

· пакет относится к универсальным (возможность использовать широкий спектр статистических методов для анализа различных типов данных в разных областях деятельности);

· большой ряд статистических и графических процедур и методов (свыше 50 типов диаграмм) для анализа данных исоздания отчетов;

· понятный для пользователя интерфейс, высокая производительность;

· открытый доступ для свободного скачивания пробной версии программного продукта на официальном сайте, поддержка мультиязычности;

· совместимость с ОС Windows, Mac, Linux;

· наличие достаточного количества справочной информации, литературы по работе с пакетом.

Недостатки SPSS:

· для хорошей работы пакета необходима высокая производительная мощность компьютера;

· в сравнении с аналогичными статистическими пакетами относительно высокая стоимость.

В последнюю на данный момент версию пакета добавлены следующие возможности:

· возможность импортировать данные из SAS и MS Excel;

· возможность экспортировать результаты в MS Office, PDF; сохранение результатов в формате HTML;

· способность обрабатывать несколько наборов данных одновременно;

· возможность создания диаграммы для переменных с несколькими ответами;

· возможность создания диаграммы с двумя осями ординат;

· модернизированный редактор синтаксиса для самостоятельного написания скриптов (поддержка автозавершения, цветовое кодирование команд);

· с помощью Data Preparation осуществляется быстрая подготовка данных к анализу, что способствует облегчению процедуры ручного анализа данных, выявляя, объясняя и исправляя недочеты. С помощью указанной функции подготовки данных возможно построить различные отчеты по существующим данным.

На рисунке 2.1 отображено окно редактора данных SPSS. В нижней части окна по центру расположены две вкладки: Данные и Переменные, позволяющие переключаться с режима просмотра/редактирования значений переменных в режим просмотра/редактирования их характеристик.

Рисунок 2.1. Окно редактора данных SPSS

Результаты статистического анализа приводятся в диалоговом окне под названием Вывод (рис. 2.2).

Рисунок 2.2. Окно вывода SPSS

В качестве основного программного обеспечения, используемого в течение практической работы, выступает статистический пакет SPSS.

SPSS обеспечивает достаточный инструментарий обработки данных, позволяет выполнять регрессионный анализ и строить прогностические модели. С помощью этого программного средства можно очень быстро выявить наличие статистической зависимости в анализируемых данных и затем, используя полученные взаимосвязи, сделать прогноз изучаемых показателей.

Глава 3. Построенные эконометрические модели спроса на зарубежные и отечественные автомобили в России

В построении модели спроса использованы количественные переменные:

1) Credite_rate - средневзвешанная процентная ставка по кредитам, предоставленными кредитными организациями физическим лицам на срок свыше 1 года, %

2) Currency_basket - бивалютная корзина, руб

3) Cosoline_price -розничная цена на бензин АИ-95, руб/л

4) Average income - среднедушевой доход, руб/месяц 5) Population - численность населения

6) Inflation_dynamic - динамика инфляции, %

Для наблюдения сезонности продаж в процессе построения модели будут добавлены 11 номинальных переменных: February, March, April, May, June, July, August, September, October, November, December. Фиктивная переменная принимает значение 1 в соответствующем названию периоду наблюдения, во всех остальных случаях - 0.

Также в модель будут добавлены две фиктивные переменные: Crisis и After_crisis. Переменная Crisis будет равна 1, если на момент наблюдения в стране будет финансовый кризис. After_crisis равна 1, если кризис закончился и начался послекризисный период. Во всех остальных случаях значения этих переменных принимают значение 0. В работе период кризиса напрямую отражает падение фондового рынка.

3.1 Анализ парных корреляций

Так как для построения модели используются переменные с количественными шкалами, используем коэффициент корреляции Пирсона. Высоким коэффициент корреляции принимаем при значении коэффициента большем 0.75.

Таблица 3.1. Парные корреляции независимых переменных

Из таблицы 3.1 видно, что следующие переменные имеют наивысший коэффициент корреляции: Population и Gasoline_price. В значениях данных переменных наблюдается тендеция увеличения, можем сделать вывод о наличии временной зависимости. Избавимся от нее, убрав тренд из переменных Gasoline_price и Population. Разберем процедуру избавления от тренда на примере переменной Gasoline_price. Представим зависимость розничной цены на бензин y от времени t в виде линейной модели первого порядка:

в0 и в1 - параметры модели, а е - ошибка, распределение которой подчиняется нормальному закону с нулевым средним значением и постоянным отклонением у2.

Построим линейную регрессию, где зависимой переменной будет Gasoline_price, независимой - Time (ряд натуральных чисел от 1 до 90, соответствующий номеру наблюдения).

Таким образом мы можем записать:

Где означает предсказанное моделью значение y при данном x, b0 и b1 - выборочные оценки параметров модели, а

- значения ошибок аппроксимации.

Убрав из уравнения b1xi, мы избавимся от явления тренда для переменной Gasoline_price. Рассчитаем новую переменную Gasoline_price_cor, как значение y без b1xi. Проделаем аналогичную процедуру для Population, получим скорректированную переменную Population_cor. Вновь построим таблицу парных корреляций для проверки зависимости переменных друг от друга.

Таблица 3.2. Парные корреляции независимых переменных

Из таблицы 3.2 видно, что убрав тренд из переменных Gasoline_price и Population, избавились от корреляционной зависимости. Все коэффициенты меньше 0.75 - можно использовать переменные для построения модели прогноза уровня продаж.

При построении моделей спроса вместо переменных Gasoline_price и Population будут использоваться скорректированные переменные Gasoline_price_cor и Population_cor соответственно.

3.2 Модель общего спроса на автомобили в России

3.2.1 Построение модели

Зависимая переменная: Sold_out - общее кол-во продаж автомобилей в России за период

Отбор переменных

Рисунок 3.1.Блок-схема метода Forward Selection

Методом прямого отбора (рис. 3.1) определим переменные, которые будут использованы при построении модели. Фактор, который сильнее всего коррелирован с результирующим признаком, имеет больший приоритет на включение в модель.

Таблица 3.3.Корреляция входных переменных с результирующим признаком

Credit_rate

Currency_basket

Gasoline_price_cor

Average_income

Population_cor

Inflatiom_dynamic

Sold_out

-0,359

-0,213

0,604

0,404

0,163

-0,179

Из таблицы 3.3 видно, наибольшая тесная связь с зависимой переменной наблюдается у показателя Gasoline_price_cor. Следуя алгоритму метода прямого отбора эту переменную в первую очередь следует проверить на включение в модель. Вычислим оценки значений результирующего признака, которые получим из модели, включающую в себя одну переменную Gasoline_price_cor. Результаты сведены в таблицу:

Таблица 3.4.Расчетные данные для проверки переменной на включение в модель

Gasoline_proce_cor (X)

Sold_out (Y)

Pred_Sold (Y)

Yср

(Y - Yср)^2

(Y - Y)^2

1

20,01

117256

217657,7922

202988,1444

215198566,2

10080519883

2

20,9

130675

237946,7571

202988,1444

1222104599

11507229871

3

20,76

179057

234682,7005

202988,1444

1004544885

3094218558

4

20,52

201867

229380,4017

202988,1444

696551243,6

756987273,7

5

20,48

204478

228381,0587

202988,1444

644800095,9


Подобные документы

  • Основные принципы и методы построения линейных, нелинейных эконометрических моделей спроса, предложения. Типы взаимосвязей между переменными. Этапы интерпретации уравнения регрессии. Коэффициент (индекс) корреляции. Рассмотрение альтернативных моделей.

    контрольная работа [83,1 K], добавлен 14.02.2014

  • Методы исследования и моделирования социально-экономических систем. Этапы эконометрического моделирования и классификация эконометрических моделей. Задачи экономики и социологии труда как объект эконометрического моделирования и прогнозирования.

    курсовая работа [701,5 K], добавлен 14.05.2015

  • Газовая промышленность как составная часть топливно-энергетического комплекса РФ. Потребление природного газа в России, анализ факторов, обуславливающих его спрос на внутреннем рынке. Эконометрическое моделирование спроса на газ на внутреннем рынке РФ.

    дипломная работа [552,6 K], добавлен 14.11.2012

  • Оценка адекватности эконометрических моделей статистическим данным. Построение доверительных зон регрессий спроса и предложения. Вычисление коэффициента регрессии. Построение производственной мультипликативной регрессии, оценка ее главных параметров.

    контрольная работа [1,2 M], добавлен 25.04.2010

  • Сущность, содержание и цели экономического прогнозирования. Классификация и обзор базовых методов прогнозирования спроса. Основные показатели динамики экономических процессов. Моделирование сезонных колебаний при использовании фиктивных переменных.

    дипломная работа [372,5 K], добавлен 29.11.2014

  • Построение эконометрической модели спроса в виде уравнений парной и множественной регрессии. Отбор факторов для построения функции потребления. Расчет коэффициентов корреляции и детерминации, проверка правильности выбранных факторов и формы связи.

    контрольная работа [523,7 K], добавлен 18.08.2010

  • Анализ основных способов построения математической модели. Математическое моделирование социально-экономических процессов как неотъемлемая часть методов экономики, особенности. Общая характеристика примеров построения линейных математических моделей.

    курсовая работа [1,3 M], добавлен 23.06.2013

  • Тесты, с помощью которых можно построить эконометрические модели. Эконометрическое моделирование денежного агрегата М0, в зависимости от валового внутреннего продукта и индекса потребительских цен. Проверка рядов на стационарность и гетероскедастичность.

    курсовая работа [814,0 K], добавлен 24.09.2012

  • Математические методы как инструмент анализа экономических явлений и процессов, построения теоретических моделей. Числовые функции и их свойства, практические примеры их использования в экономике. Производственные функции, функция спроса и предложения.

    курсовая работа [974,5 K], добавлен 11.10.2014

  • Построение эконометрических моделей и адекватная оценка их параметров для принятия обоснованных экономических решений. Проведение анализа и краткосрочного прогнозирования урожайности зерновых культур в Нижнем Поволжье методом многократного выравнивания.

    реферат [51,4 K], добавлен 25.02.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.