Математическая статистика и её частные методы

Понятие, происхождение и предмет статистики с точки зрения современной науки и практики; стадии и методы статистического исследования, математическая составляющая. Метод главных компонент, его применение. Закон больших чисел, парадокс сэра Гиффена.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 17.05.2012
Размер файла 955,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Метод главных компонент интенсивно используется в биологии для сокращения размерности описания, выделения значимой информации, визуализации данных и др. Также он используется в хемометрике Хемометрика происходит не от русской «химии», а от английского прописания - Chemometrics. Авт. - химической дисциплине, применяющей математические и статистические методы, основанные на формальной логике, для построения или отбора оптимальных методов измерения и планов эксперимента, а также для извлечения наиболее важной информации при анализе экспериментальных данных». Этот метод позволяет разделить матрицу исходных данных X на две части: «содержательную» и «шум».

Самым важным для нас является применимость Метода главных компонент в эконометрике, где он применяется для наглядного представления данных; обеспечения лаконизма моделей, упрощения счета и интерпретации; а также сжатия объемов хранимой информации. Этот метод обеспечивает максимальную информативность и минимальное искажение геометрической структуры исходных данных.

В социологии метод необходим для анализа данных с описанием результатов опросов или других исследований, представленных в виде массивов числовых данных, а также для описания социальных явлений с построением моделей явлений, в том числе и математических моделей. Гуц А. К., Фролова Ю. В., Математические методы в социологии, Серия: Синергетика: от прошлого к будущему. - Издательство «УРСС», 2007. - 216 с.

В политологии метод главных компонент - основной инструмент для линейного и нелинейного анализа рейтингов 192 стран мира по пяти специально разработанным интегральным индексам (уровня жизни, международного влияния, угроз, государственности и демократии). Политический атлас современности: Опыт многомерного статистического анализа политических систем современных государств. - М.: Изд-во «МГИМО-Университет», 2007. - 272 с.

Целевой подход к оценке числа главных компонент по необходимой доле объяснённой дисперсии формально применим всегда, однако где он предполагает, что нет разделения на «сигнал» и «шум», и любая заранее заданная точность имеет смысл. Таким образом:

«Сигнал» предполагает сравнительно малую размерность при относительно большой амплитуде.

«Шум» предполагает большую размерность при относительно малой амплитуде. С этой точки зрения метод главных компонент работает как фильтр: сигнал содержится, в основном, в проекции на первые главные компоненты, а в остальных компонентах пропорция шума намного выше.

2.4 Закон больших чисел

Закон больших чисел имеет важное значение для статистки. В соответствии с ним, в массе явлений взаимопогашаются случайные отклонения от основной линии развития. Согласно теории вероятностей Закон больших чисел утверждает, что среднее арифметическое (или эмпирическое среднее) при достаточно большой конечной выборке из фиксированного распределения близко к теоретическому среднему показателю. В зависимости от вида сходимости различают слабый закон больших чисел, когда имеет место сходимость по вероятности, и усиленный закон больших чисел, когда имеет место сходимость почти по всюду.

Слабый закон больших чисел можно представить примером такого рода - «Пусть есть бесконечная последовательность одинаково распределённых и некоррелированных случайных величин , определённых на одном вероятностном пространстве . То есть их ковариация (в теории вероятностей это мера линейной зависимости двух случайных величин) . Пусть . Обозначим Sn выборочное среднее первых n членов:

.

Тогда .

Усиленный закон больших чисел можно представить примером такого рода - «Пусть есть бесконечная последовательность независимых одинаково распределённых случайных величин , определённых на одном вероятностном пространстве . Пусть . Обозначим Sn выборочное среднее первых n членов:

.

Тогда почти наверное.

Общий смысл Закона больших чисел заключается в том, что совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая. На этом свойстве основаны методы оценки вероятности на основе анализа конечной выборки. Наглядным примером является прогноз результатов выборов на основе опроса выборки избирателей.

2.5 Ложь, наглая ложь, статистика и парадокс сэра Гиффена

«Ложь, наглая ложь и статистика» есть цитата из высказывания о том, что «существуют три вида лжи: ложь, наглая ложь и статистика», которое обыденно приписывается премьер-министру Великобритании Бенджамину Дизраэли (21.12.1804 г. - 19.04.1881 г.). Известность оно получило благодаря Марку Твену, обнародовавшему «Главы моей биографии» в журнале «Северо-Американское обозрение» («North American review») 05 июля 1907 г.: «Цифры обманчивы, - писал он, - я убедился в этом на собственном опыте; по этому поводу справедливо высказался Дизраэли: «Существует три вида лжи: ложь, наглая ложь и статистика». Однако этого высказывания в работах Дизраэли нет.

Сейчас известно, что впервые это высказывание было использована в письме, написанном 8 июня 1891 года и опубликованном 13 июня 1891 года в журнале «Народный обозреватель» («National Observer»): «Сэр, … очень остроумно замечено, что существует три вида лжи: первая - неправда, вторая - прямая ложь, и, наконец, самое страшное - это статистика».

Однако как упоминает экономист Манчестерской школы сэр Роберт Гиффен (sir Robert Giffen, 1837-1910 гг.), помощник редактора журнала The Economist, а в 1882-1884 г.г. Президент Британского Статистического Общества, высказывание «о статистике» лишь интерпретация фразы - «Есть старая шутка о том, что существует три вида лжецов: обычные обманщики, возмутительные лжецы и научные эксперты. Лишь позже стали говорить несколько иначе: есть три степени лжи: ложь, бессовестная ложь и статистика». Но до этого в журнале «Природа» (Nature) от 26 ноября 1885 г. было размещена заметка, содержавшая высказывание о том, что «…одному известному адвокату, в настоящее время - судье, пришло в голову разделить свидетелей на три группы: простые лжецы, проклятые лгуны, и эксперты».

Таким образом, статистика совершенно не при чём, а речь идёт об очередном заимствовании из права, то есть о перенесении греха юриспруденции на чистую математику.

К слову Роберт Гиффен автор «парадокса Гиффена о дешёвых и дорогих товарах». Суть его заключается в том, что при повышении цен на определённые виды товара (в основном товары первой необходимости) их потребление в ценовом выражении повышается за счёт экономии на других товарах.

Рис. 7. Парадокс Гиффена

Существуют несколько математических моделей, объясняющих существование товаров Гиффена.

Например, задан доход потребителя S. При ценах на товары потребитель выбирает потребление в соответствии с какими-то критериями. Если у какого-то товара i при заданных будет , этот товар и будет товаром Гиффена.

Примерами «товаров Гиффена» были картофель во время голода в Ирландии 1845-1849 гг. «Товарами Гиффена» являются также рис и макароны в Китае, бензин в США, спички в СССР. Ярким современным примером «товаров Гиффена» являются банковские «продукты» - кредиты. При повышении процентной ставки по кредиту, то есть повышению цены кредита, происходит увеличение доли расходов на обслуживание кредита за счёт сокращения других расходов.

Парадокс Гиффена прекрасно раскрывается простым советским анекдотом.

«Дитё обращается к папеньке:

- Батюшка! В связи с многочисленными обращениями советских трудящихся с просьбой поднять цены на алкоголь, Коммунистическая Партия Советского Союза откликнулась на эти пожелания. Означает ли это, что Вы будете меньше пить?

- Нет, чадо моё! Это означает, что Вы с маменькой будете меньше жрать!»

Практически Гиффен лишь математически изложил общеизвестные отношения, правомерно закрепив за ними своё имя.

Другим направлением, пришедшим в статистику из математики, является комбинаторика. Комбинаторика это раздел элементарной математики, связанный с изучением количества комбинаций, подчинённых тем или иным условиям, которые можно составить из заданного конечного множества объектов (буквы, цифры, какие-либо предметы и т.п.). Также под комбинаторикой понимают конкретный «комбинаторный анализ».

В силу невозможности отвлечься на столь важное направление придётся ограничиться для раскрытия темы этого предмета такой забавной историей.

«Студенты для пересдачи экзамена по комбинаторике прибыли вечером на дом к Профессору, который проживал в с супругой и юной дочерью в трёхспальной квартире.

После шумной и продуктивной сдачи экзамена студенты были уже не в силах покинуть жилище гостеприимного, но острожного Профессора, на что получили предложение заночевать в свободной комнате. Профессор желал разделить одну комнату с супругой, в другой юную дочь, а в третьей - обоих учащихся.

Сии юноши пусть и были утомлены экзаменами, но один из них проснувшись возжелал разделить ложе с юной дочерью Профессора. Обнаружив в одной из комнат одинокую голову над одеялом он юркнул к Профессорской дщери.

Профессор, обуреваемый мыслью о лишении девственности дщери студиозусами решил предпринять превентивные меры и обезопасить дщерь своим присутствием под койкой. Обнаружив в одной из комнат одинокую голову над одеялом он юркнул к одинокому студиозусу, который проснувшись также решил удовлетворить свою похоть с Профессорской дщерью. Обнаружив в одной из комнат одинокую голову над одеялом он юркнул к Профессорской супруге.

Утром Профессор проснулся один-одинёшенек и обнаружил одного учащегося комбинаторике спящим с дщерью, а другого с супругой. В сердцах он воскликнул: «Такой блядской комбинаторики у меня никогда не было!!!»

Итак, начав со спасения чести мундира Статистики мы выяснили, что Статистика оказался в знаменитом лживом ряду не совсем справедливо, так как она оказалась жертвой ещё одного анекдота из жизни следователей, в ходе которого изыскивалась потенциальная воровка. Жертвой подозрений была женщина, на которую соответственно было обращено обвинение. Однако в ходе следствия было установлено её железное алиби и обвинение пришлось снять. Однако «хоть украла и не она, но неприятный осадок остался». Точно также произошло и со Статистикой, которой приписали «подвиги» экспертного сообщества и издержек отправления правосудия.

Поэтому Статистике лучше держаться чистой математики.

Заключение

Итак, Статистика сегодня это фундаментальная базовая отрасль научных экономических знаний. На протяжении многих веков теоретические проблемы статистики разрабатывались сначала философами и политическими деятелями, затем галантерейщиками, астрономами и физиками, а ныне это область применения усилий экономистов и математиков.

Возникнув из потребностей практических задач государства, статистика заняла важное место в системе государственного управления. В настоящее время статистические методы применяются для анализа различных социально-экономических явлений; при исследовании рынка; аудиторских проверках; в управлении и прогнозировании; при оценке финансового состояния хозяйствующих субъектов; ценообразовании; страховании.

Статистика сегодня представляет собой практическую деятельность по сбору, обработке и анализу статистических данных.

Поэтому Статистика - это огромный информационно-справочный материал, характеризующий все стороны функционирования и развития того или иного хозяйствующего субъекта: индивидуального предпринимателя, фирмы, предприятия, отрасли, региона, национального хозяйства в целом.

Роль математики в современной статистики огромна. Столь же велико и количество методов математического анализа статистических данных.

Своеобразное положение статистки в системе наук определяет её органическая связь с научными дисциплинами, изучающими основные закономерности и качественные особенности в той или иной области явлений.

Литература

1. Едронова В.Н., Едронова М.В. Общая теория статистики: Учебник - М.: Юристъ, 2001. - 511 с.

2. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. - М.: Наука, 1983.

3. Вальд А., Последовательный анализ, пер. с англ.- М.: Физматгиз, 1960.

4. Ватутин В.А. и др. Теория вероятностей и математическая статистика в задачах: Учеб. пособие для вузов / В.А. Ватутин, Ивченко Г.И., Медведев Ю.И. и др. - 2-е изд., испр. - М.: Дрофа, 2003. - 328 с: ил.

5. Вероятностные разделы математики / Под ред. Максимова Ю.Д.. - Спб.: «Иван Фёдоров», 2001. - С. 400. - 592 с. - ISBN 5-81940-050-X

6. Вероятность и математическая статистика. Энциклопедия/Гл. ред. Прохоров Ю. В. - М.: Изд-во «Большая Российская Энциклопедия», 1999.

7. Виленкин Н.Я., Потапов В.Г. Задачник-практикум по теории вероятностей с элементами комбинаторики и математической статистики. М.: Просвещение, 1979. - Моск. гос. заочн. пед. ин-т.

8. Войнович В., «Жизнь и необычайные приключения солдата Ивана Чонкина», - Москва, «Юность», 1988 г., №12, 1989 г., №1 и №2.

9. Гусаров В.М. Статистика: Учеб. Пособие для вузов. - М.: ЮНИТИ - ДАНА, 2002 - 463 с.

10. Зиновьев А.Ю., Визуализация многомерных данных, Красноярск, Изд. КГТУ, 2000 г.

11. Ниворожкина Л.П., Морозова 3.А., Герасимова И.А., Житников И.В. Основы статистики с элементами теории вероятностей для экономистов: Руководство для решения задач. - Ростов н/Д: Феникс, 1999. - 320 с.

12. Никитина Е.П., Фрейдлина В.Д., Ярхо А.В. Коллекция определений термина «статистика». - Москва: МГУ, 1972 г.

13. Орлов А. И. Прикладная статистика. Учебник. - М.: Экзамен, 2006. - 671 с.

14. Плошко Б.Г., Елисеева И.И. История статистики: Учеб. пособие. - Москва, Ленинград: Финансы и статистика, 1990.

15. Савюк Л.К. Правовая статистика: Учебник - М.: Юристъ, 2002. - 588 с.

16. Теория статистики: Учебник (Под ред. проф. Шмойловой Р.А. - 3-е изд., перераб. - М.: Финансы и статистика, 2002. - 560 с.

17. Харман Г., Современный факторный анализ. - М.: Статистика, 1972. - 486 с.

18. Ширяев А.Н. Статистический последовательный анализ. Оптимальные правила остановки - М.: Наука, 1976

19. Gorban A.N., Kegl B., Wunsch D., Zinovyev A.Y. (Eds.), Principal Manifolds for Data Visualisation and Dimension Reduction, Series: Lecture Notes in Computational Science and Engineering 58, Springer, Berlin - Heidelberg - New York, 2007, XXIV, 340 p. 82 illus. ISBN 978-3-540-73749-0.

20. Диссертация T. Хасти: Hastie T., Principal Curves and Surfaces, Ph.D Dissertation, Stanford Linear Accelerator Center, Stanford University, Stanford, California, US, November 1984. Сайт PCA.

21. Yin H. Learning Nonlinear Principal Manifolds by Self-Organising Maps, In: Gorban A. N. et al (Eds.), LNCSE 58, Springer, 2007 ISBN 978-3-540-73749-0

22. Hyvdrinen A, Karhunen J., and Oja E., Independent Component Analysis, A Volume in the Wiley Series on Adaptive and Learning Systems for Signal Processing, Communications, and Control. - John Wiley & Sons, Inc., 2001. - XVI+481 pp. ISBN 0-471-40540-X

Размещено на Allbest.ru


Подобные документы

  • Предмет, методы и понятия математической статистики, ее взаимосвязь с теорией вероятности. Основные понятия выборочного метода. Характеристика эмпирической функции распределения. Понятие гистограммы, принцип ее построения. Выборочное распределение.

    учебное пособие [279,6 K], добавлен 24.04.2009

  • Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.

    курсовая работа [988,5 K], добавлен 19.01.2011

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Формы, виды и способы статистического наблюдения. Виды группировок, их интервал и частота. Структура ряда динамики. Абсолютные и относительные статистические величины. Представление выборки в виде статистического ряда. Точечное и интервальное оценивание.

    курс лекций [1,1 M], добавлен 29.11.2013

  • Основные методы формализованного описания и анализа случайных явлений, обработки и анализа результатов физических и численных экспериментов теории вероятности. Основные понятия и аксиомы теории вероятности. Базовые понятия математической статистики.

    курс лекций [1,1 M], добавлен 08.04.2011

  • Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.

    курс лекций [759,3 K], добавлен 13.06.2015

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Теорема Бернулли как простейшая форма закона больших чисел. Предельные теоремы теории вероятностей и объяснение природы устойчивости частоты появлений события. Качественные и количественные утверждения закона больших чисел, его практическое применение.

    курсовая работа [75,2 K], добавлен 17.12.2009

  • Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.

    контрольная работа [29,5 K], добавлен 21.09.2009

  • Исторические аспекты развития статистики, ее предмет. Понятие статистической методологии. Организация государственной и международной статистики. Программа и формы статистического наблюдения. Формы вариационного ряда. Средняя арифметическая и ее свойства.

    шпаргалка [37,9 K], добавлен 12.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.