Теория статистики
Предмет статистической науки и ее методология. Содержание курса и методические указания по выполнению контрольной работы. Практикум по теории статистики, вопросы к экзамену (зачету) и тесты. Учебно-методическое обеспечение дисциплины и решение задач.
Рубрика | Экономика и экономическая теория |
Вид | методичка |
Язык | русский |
Дата добавления | 10.08.2009 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
с вероятностью 0,954 предельную ошибку выборочной доли и границы удельного веса рабочих, с дневной выработкой от 40 до 50 изделий.
Задача 4
Производство продукции предприятия характеризуется следующими данными:
Для анализа данного ряда динамики, вычислите:
среднемесячное производство продукции.
базисный темп роста с помощью взаимосвязи цепных темпов роста.
среднемесячный темп роста и прироста. Результаты представьте в таблице.
Месяцы |
Производство продукции, тыс. руб. |
|
Январь |
1100 |
|
Февраль |
1200 |
|
Март |
1300 |
|
Апрель |
1350 |
|
Май |
1500 |
|
Июнь |
1600 |
Изобразите динамику производства продукции на графике. Сделайте выводы.
Задача 5
Имеются следующие данные о товарных запасах непродовольственных товаров
торговой организации, млн. руб.:
На 1 января - 4,5
На 1 апреля - 4,6
На 1 июля - 4,8
На 1 октября - 4,5
На 1 января следующего года - 4,2
Вычислите средние товарные запасы торговой организации:
За 1 полугодие;
за 2 полугодие;
за год.
Поясните, почему методы расчета средних уровней рядов динамики в задачах 4, 5 различны.
Задача 6
Динамика себестоимости и объема производства продукции характеризуется следующими данными:
Вид продукции |
Выработано продукции, тыс.ед. |
Себестоимость единицы продукции, тыс. руб. |
|||
Базисный период |
Отчетный период |
Базисный период |
Отчетный период |
||
Завод №1 |
|||||
ЛР - 34 |
2,7 |
2,7 |
3,2 |
3,1 |
|
АВ - 50 |
4,0 |
4,8 |
1,5 |
1,5 |
|
Завод №2 |
|||||
АВ - 50 |
2,0 |
1,2 |
1,4 |
1,3 |
На основании имеющихся данных вычислите:
Для завода №1 (по двум видам продукции вместе):
а)общий индекс затрат на производство продукции;
б)общий индекс себестоимости продукции;
в)общий индекс физического объема производства продукции.
Определите в отчетном периоде изменение суммы затрат на производство продукции (за счет изменения себестоимости и объема выработанной продукции).
Покажите взаимосвязь между исчисленными индексами:
Для двух заводов вместе (по продукции АВ - 50):
а)индекс себестоимости переменного состава;
б)индекс себестоимости постоянного состава;
в)индекс влияния изменения структуры производства продукции на динамику средней себестоимости.
Объясните разницу между величинами индексов постоянного и переменного состава.
Задача 7
Имеются следующие данные о товарообороте магазина :
Товарная группа |
Продано товаров в фактических ценах, тыс. руб. |
||
Базисный год |
Отчетный год |
||
Картофель |
562,5 |
670,9 |
|
Фрукты и цитрусовые |
348,2 |
451,6 |
В отчетном году по сравнению с базисным годом цены на картофель повысились на 7%, а на фрукты и цитрусовые остались без именения.
Вычислите:
общий индекс товарооборота в фактических ценах;
общий индекс цен и сумму дополнительных расходов населения вследствие изменения цен в отчетном году при покупке товаров в данном магазине;
3)общий индекс физического объема товарооборота, используя взаимосвязь индексов.
Задача 8
Для изучения тесноты связи между выпуском валовой продукции на один завод (результативный признак - y) и оснащенностью заводов основными производственными фондами (факторный признак - х) по данным задачи 1 вычислите коэффициент детерминации и эмпирическое корреляционное отношение. Поясните их значение.
5. ПРАКТИКУМ ПО ТЕОРИИ СТАТИСТИКИ
1. ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ И ЕЕ РОЛЬ В АНАЛИЗЕ ИНФОРМАЦИИ
Одним из основных наиболее распространенных методов обработки и анализа первичной статистической информации является группировка.
Под группировкой понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения структуры и взаимосвязей. Следовательно, с помощью группировок решаются три задачи:
* разделение всей совокупности на качественно однородные группы - выделение социально-экономических типов. Эти группировку называются типологическими (например, группировки хозяйственных объектов по формам собственности, населения по общественным группам и др.);
* характеристика структуры явления и структурных сдвигов. Эти группировки называются структурными (например, определение значения каждого вида транспорта в транспортном балансе страны, изучение состава населения по полу, возрасту и другим признакам и т. д.);
* изучение взаимосвязей между отдельными признаками изучаемого явления. Такие группировки называются аналитическими (например, группировка предприятий определенной отрасли экономики по уровню производительности труда для выявления ее влияния на себестоимость продукции).
Разграничение трех видов группировки является в известной мере условным. Во многих случаях одна и та же группировка дает возможность решать все три задачи.
Признак, на основе которого производится подразделение единиц наблюдения на группы, называется группировочным признаком или основанием группировки. Группировка может выполняться по одному признаку (простая группировка) и по нескольким признакам (комбинированная группировка).
Группировочные признаки могут быть атрибутивными и количественными. Атрибутивные признаки регистрируются в виде текстовой записи (например, профессия рабочих, социальная группа населения). Количественные признаки имеют цифровое выражение (стаж работы, размер дохода).
При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, если число этих наименований не очень велико. Если признак имеет большое количество разновидностей, то при группировке ряд наименований объединяют в одну группу. Для обоснованного объединения их в группы разрабатываются классификации. В отличие от группировок при классификации группировочные признаки установлены заранее на длительный период для решения многих задач, в то время как группировки выполняются для целей конкретного исследования. Примерами могут служить классификации отраслей экономики, автотранспортных предприятий по целевому назначению (грузовые, автобусные, таксомоторные и др.).
При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется прерывно (дискретно), т. е. может принимать только некоторые - чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака.
При непрерывном изменении признак принимает любые значения (например, стаж работы или возраст рабочих), поэтому группы ограничиваются значениями признака в интервале «от - до». Интервалом называется разница между максимальным и минимальным значениями признака в каждой группе. На практике используются три вида интервалов: равные, неравные (постепенно увеличивающиеся) и специализированные.
Равные интервалы используются, если нужно охарактеризовать количественные различия в величине признака внутри групп одинакового качества (например, при группировке рабочих определенной профессии по проценту выполнения норм выработки).
Величина равного интервала исчисляется по формуле:
Xmax и Xmin - соответственно наибольшее и наименьшее значения признака в изучаемой совокупности; т - принятое число групп.
Для расчета величины интервала по этой формуле необходимо заранее установить число групп (при числе наблюдений более 20 используют 4-5 групп).
Возможен и другой способ определения величины интервала, не требующий предварительного установления числа групп. В этом случае используется формула Стерджесса:
Выполняя расчет величины интервала по этой формуле, следует знаменатель предварительно округлить до целого числа, поскольку количество групп не может быть дробным.
где n - число наблюдений
Величину интервала обычно округляют до целого (всегда большего) числа, исключение составляют случаи, когда изучаются малейшие колебания признака.
Неравные интервалы (постепенно увеличивающиеся) часто применяются в аналитических группировках. В этом случае интервалы выбираются так, чтобы число единиц в образованных группах было достаточно велико (т. е. чтобы группы были приблизительно одинаково заполнены).
Специализированные интервалы используются в типологических группировках; границы устанавливаются там, где намечается переход от одного качества к другому. Наметить точки перехода можно только на основе теоретического анализа, используя для выделения типов не отдельные, изолированные признаки, а совокупность признаков, характеризующих различные стороны изучаемого явления.
Интервалы группировки могут быть закрытыми и открытыми. Закрытые интервалы - это обычные интервалы, имеющие как нижние (т. е. «от»), так и верхние (т. е. «до») границы. Открытые интервалы - это интервалы, имеющие какую-либо одну границу - верхнюю илк нижнюю. Они применяются тогда, когда признак изменяется неравномерно в широких пределах, причем большие (или малые) значения признака встречаются нечасто.
Следующей за группировкой ступенью систематизации и обобщения материалов статистического наблюдения является статистическая сводка. Под статистической сводкой в узком смысле слова понимается подсчет числа единиц в подгруппах и группах, выделенных при группировке, и подведение итогов по количественным признакам.
Результаты группировки и сводки материалов оформляются в виде статистических таблиц.
Над таблицей помещается заголовок, отражающий в сжатой форме ее основное содержание, время и место, к которым относятся изложенные в таблице данные.
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
1.1 Имеются следующие данные по заработной плате водителей за сентябрь:
Табельный номер водителя |
Класс водителя |
Процент выполнения норм выработки |
Заработная плата за месяц |
|
1 2 3 4 5 6 7 8 9 10 11 12 |
I II II I II I I II I II I I |
110,2 102,0 111,0 107,9 106,4 109,0 115,0 112,2 105,0 107,4 112,5 108,6 |
2100,3 1600,8 1970,7 2050,2 1740,5 1985,4 2300,8 2015,7 1790,2 1700,7 2280,2 2170,1 |
Для выявления зависимости заработной платы водителей от уровня квалификации и процента выполнения норм выработки произвести аналитическую группировку. Интервалы группировки водителей по проценту выполнения норм выработки разработать самостоятельно. На основе выполненной группировки построить комбинационную таблицу. Сформулировать вывод.
Решение
Для решения задачи необходимо произвести группировку водителей по двум признакам-факторам: сначала - на группы по квалификации, затем внутри каждой группы - на подгруппы по проценту выполнения норм выработки.
По проценту выполнения норм выработки принимаются две подгруппы: 1) водители, выполняющие норму от 100 до 110%; 2) водители, выполняющие норму на 110% и выше.
Результаты группировки представлены во вспомогательной табл. 1.1.
На основе вспомогательной таблицы по каждой подгруппе определяют численность и итог признака (общую сумму заработной платы), результаты оформляют в виде комбинационной таблицы (табл. 1.2).
Таблица 1.1
Вспомогательная таблица
группы водителей по уровню классификации |
водители II класса |
водители I класса |
|||
Подгруппы водителей по проценту выполнения норм выработки |
100 - 110 |
110 и выше |
100 - 110 |
110 и выше |
|
Табельный номер водителя |
2;5;10 |
3;8 |
4;6;9;12 |
1;7;11 |
|
Заработная плата за месяц, руб |
1600,8 1740,5 1700,7 |
1970,7 2015,7 |
2050,2 1985,4 1790,2 2170,1 |
2100,3 2300,8 2280,2 |
Таблица 1.2
Зависимость заработной платы водителей от классификации и процента выполнения норм выработки
группы водителей по уровню классификации |
Подгруппы водителей по проценту выполнения норм выработки |
число водителей |
общая сумма заработной платы, руб. |
средняя заработная плата одного водителя, руб. |
изменение средней заработной платы по сравнению с низшей подгруппой, % |
|
II класс |
100 - 110 110 и выше |
3 2 |
5042,0 3986,4 |
1680,7 1993,2 |
100,0 118,6 |
|
итого по группе |
5 |
9028,4 |
1805,7 |
- |
||
I класс |
100 - 110 110 и выше |
4 3 |
7995,9 6681,3 |
1999,0 2227,1 |
118,9 132,5 |
|
итого по группе |
7 |
14677,2 |
2096,7 |
- |
||
всего |
12 |
23705,6 |
1975,5 |
- |
Из данных табл. 1.2 следует, что с ростом квалификации водителей и процента выполнения норм выработки увеличивается заработная плата. Так, заработная плата водителей I класса, выполняющих норму выработки на 110% и выше, на 32,5% превышает заработную плату водителей II класса, выполняющих нрр-му от 100 до 110%.
2. АБСОЛЮТНЫЕ, ОТНОСИТЕЛЬНЫЕ И СРЕДНИЕ ВЕЛИЧИНЫ
Абсолютные величины характеризуют численность совокупности и объем (размер) изучаемого социально-экономического явления в определенных границах времени и места. Они являются всегда именованными числами, т. е. имеют какую-либо единицу измерения. Единицы измерения могут быть натуральные, условно-натуральные, стоимостные (денежные) и трудовые. Выбор единицы измерения зависит от сущности изучаемого явления и конкретных задач исследования.
Абсолютные величины могут быть получены путем суммирования данных статистического наблюдения или расчетным путем. Например, численность населения страны определяется по результатам сводки данных единовременного наблюдения. При определении стоимостных показателей объема продукции абсолютные величины получают расчетным путем.
Относительные величины исчисляются при выполнении третьего этапа статистического исследования. Относительная величина представляет собой результат сопоставления двух статистических показателей, дает цифровую меру их соотношения. Она получается путем деления сравниваемого показателя на другой показатель, принимаемый за базу сравнения.
Относительные величины делятся на две группы:
* относительные величины, полученные в результате соотношения одноименных статистических показателей;
* относительные величины, представляющие результат сопоставления разноименных статистических показателей.
К относительным величинам первой группы относятся: относительные величины динамики, относительные величины планового задания и выполнения плана, относительные величины структуры, координации и наглядности.
Результат сопоставления одноименных показателей представляет собой краткое отношение (коэффициент), показывающее, во сколько раз сравниваемая величина больше (или меньше) базисной. Результат может быть выражен в процентах, показывая, сколько процентов сравниваемая величина составляет от базы.
Относительные величины динамики характеризуют изменение явления во времени. Они показывают, во сколько раз увеличился (или уменьшился) объем явления за определенный период времени, их называют коэффициентами роста. Коэффициенты роста можно исчислять в процентах, для этого отношения умножают на 100. Их называют темпами роста, которые можно определять с переменной или постоянной базой.
Темпы роста с переменной базой получают при сравнении уровня явления каждого периода с уровнем предшествующего периода. Темпы роста с постоянной базой сравнения получают путем сопоставления уровня явления в каждом отдельном периоде с уровнем одного периода, принятого за базу. Выбор базы сравнения нередко имеет существенное значение. Так, в ряде случаев в качестве базы сравнения принимаются годы, являющиеся исторически обусловленной границей отдельных периодов времени.
у1; у2; у3; у4 ~ уровни явления за одинаковые последовательные периоды (например, выпуск продукции по кварталам года).
Темпы роста в процентах с переменной базой (цепные темпы роста):
Темпы роста с постоянной базой (базисные темпы роста):
где y0 - постоянная база сравнения
Относительная величина планового задания - отношение величины показателя по плану (у^) к его фактической величине в предшествующем периоде (у0), т. е. упл : уо
Относительная величина выполнения плана - отношение фактической (отчетной) величины показателя (у\) к запланированной на тот же период его величине (ут), т. е. у1 : упл.
Относительные величины планового задания, выполнения плана и динамики связаны между собой.
В ряде случаев расчет относительной величины выполнения плана может производиться по методу нарастающего итога. Так, оценка выполнения квартального плана по объему продукции выполняется по данным, взятым нарастающим итогом с начала кваратала.
Относительные величины структуры характеризуют долю отдельных частей в общем объеме совокупности и выражаются в долях единицы или в процентах. Они исчисляются по сгруппированным данным.
относительная число единиц (или объём признака) по группе
величина = ________________________________________
структуры, % общее число единиц (или объём признака)
по всей соокупности
Каждую относительную величину структуры называют удельным весом.
Относительные величины координации отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, на десять или на сто единиц другой группы изучаемой совокупности (например, сколько служащих приходится на 100 рабочих).
Относительные величины наглядности отражают результаты сопоставления одноименных показателей, относящихся к одному и тому же периоду (или моменту) времени, но к разным объектам или территориям (например, сравнивается годовая производительность труда по двум предприятиям).
Вторая группа относительных величин, представляющая собой результат сопоставления разноименных статистических показателей, носит название относительных величин интенсивности.
Они являются именованными числами и показывают итог числителя, приходящийся на одну, на десять, на сто единиц знаменателя.
В эту группу относительных величин включаются показатели производства продукции на душу населения; показатели потребления продуктов питания и непродовольственных товаров на душу населения; показатели, отражающие обеспеченность населения материальными и культурными благами; показатели, характеризующие техническую оснащенность производства, рациональность расходования ресурсов.
показатель производства выпуск определённого вида продукции
продукции на = _______ в натуральном выражении за год________
душу населения среднегодовая численность населения
обеспеченность наличие определённых благ на начало
населения = ________ (или конец) года_____________________
материальными или численность населения на начало
культурными благами (или конец) года
Средние величины.
Средней величиной называется обобщающий показатель, характеризующий типичный уровень варьирующего количественного признака на единицу совокупности в определенных условиях места и времени.
Средняя величина всегда именованная, она имеет ту же размерность, что и признак у отдельных единиц совокупности.
При использовании средних в практической работе и научных исследованиях необходимо иметь в виду, что за средним показателем скрываются особенности различных частей изучаемой совокупности, поэтому общие средние для однородной совокупности должны дополняться групповыми средними, характеризующими части совокупности.
В экономических исследованиях и плановых расчетах применяются две категории средних:
* степенные средние;
* структурные средние.
К категории степенных средних относятся: средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая. Величины, для которых исчисляется средняя, обозначаются буквой хi. Средняя обозначается через x. Такой способ обозначения указывает на происхождение средней из конкретных величин. Черта вверху символизирует процесс осреднения индивидуальных значений. Частота - повторяемость индивидуальных значений признака - обозначается буквой f
Формулы средних величин могут быть получены на основе степенной средней, для которой определяющей функцией является уравнение
откуда
В дальнейшем при написании формул средних подстрочные значки I, п использоваться не будут, но подразумевается, что суммируются все произведения х, /,.
В зависимости от степени 1с получаются различные виды средних величин, их формулы представлены в табл. 2.1.
Как видно из данных табл. 2.1, взвешенные средние учитывают, что отдельные варианты значений признака имеют различную численность, поэтому каждый вариант «взвешивают» по своей частоте, т. е. умножают на нее. Частоты/при этом называются статистическими весами или просто весами средней.
Однако необходимо учитывать, что статистический вес - понятие более широкое, чем частота. В качестве веса могут применяться какие-либо другие величины (в табл. 2.1 они обозначены буквой и'). Например, при расчете средней продолжительности рабочего дня по предприятию единственно правильным будет взвешивание по количеству отработанных человеко-дней. Частоты отдельных вариантов могут быть выражены не только абсолютными величинами, но и относительными - частостямн.
Величины степенных средних, рассчитанных на основе одних и тех же индивидуальных значений признака при различных значениях степени (k), не одинаковы. Чем выше степень k средней, тем больше величина самой средней.
Таблица 2.1 Формулы различных видов степенных средних величин
Значе-ние x |
Наименование средней |
формула средней |
||
простая |
взвешенная |
|||
-1 |
Гармоническая |
|||
0 |
Геометрическая |
|||
1 |
Арифметическая |
|||
2 |
Квадратическая |
Средняя арифметическая и средняя гармоническая наиболее распространенные виды средней, получившие широкое применение в плановых расчетах, при расчете общей средней из средних групповых, а также при выявлении взаимосвязи между признаками с помощью группировок. Выбор средней арифметической и средней гармонической определяется характером имеющейся в распоряжении исследователя информации.
Средняя квадратическая применяется для расчета среднего квадратического отклонения (а), являющегося показателем вариации признаков, а также в технике (например, при сооружении трубопроводов).
Средняя геометрическая (простая) используется при вычислении среднего коэффициента роста (темпа) в рядах динамики.
Структурные средние - мода и медиана - в отличие от степенных средних, которые в значительной степени являются абстрактной характеристикой совокупности, выступают как конкретные величины, совпадающие с вполне определенными вариантами совокупности. Это делает их незаменимыми при решении ряда практических задач.
Модой называется значение признака, которое наиболее часто встречается в совокупности (в статистическом ряду).
Медианой называется значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части.
Ранжированный ряд - ряд, расположенный в порядке возрастания или убывания значений признака.
Для определения медианы сначала определяют ее место в ряду, используя формулу
Если ряд состоит из четного числа членов, то за медиану условно принимают среднюю арифметическую их двух срединных значений.
Применяется мода при экспертных оценках, при определении наиболее ходовых размеров обуви, одежды, что учитывается при планировании их производства. Медиана используется при статистическом контроле качества продукции и технологического процесса на промышленных предприятиях; при изучении распределения семей по величине дохода и др. Мода и медиана имеют преимущество перед средней арифметической для ряда распределения с открытыми интервалами.
3. СТАТИСТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ И ИХ ОСНОВНЫЕ ХАРАКТЕРИСТИКИ
Различия индивидуальных значений признака у единиц совокупности называются вариацией признака. Она возникает в результате того, что индивидуальные значения складываются под совместным влиянием разнообразных условий (факторов), по-разному сочетающихся в каждом отдельном случае.
Изучение вариации в пределах однородной группы предполагает использование следующих приемов: построение вариационного ряда (ряда распределения), его графическое изображение, исчисление основных характеристик распределения.
Вариационный ряд - групповая таблица, построенная по количественному признаку, в сказуемом которой показывается число единиц в каждой группе. Форма построения вариационного ряда зависит от характера изменения изучаемого признака, он может быть построен в форме дискретного ряда или в форме интервального ряда.
По характеру вариации значений признака различают:
* признаки с прерывным изменением (дискретные);
* признаки с непрерывным изменением (непрерывные).
Признаки с прерывным изменением могут принимать лишь конечное число определенных значений (например, тарифный разряд рабочих, число детей в семье, число станков, обслуживаемых одним рабочим). Признаки с непрерывным изменением могут принимать в определенных границах любые значения (например, стаж работы, пробег автомобиля, размер дохода и т. д.).
Для признака, имеющего прерывное изменение и принимающего небольшое количество значений, применяется построение дискретного ряда. В первой графе ряда указываются конкретные значения каждого индивидуального значения признака, во второй графе - численность единиц с определенным значением признака.
Для признака, имеющего непрерывное изменение, строится интервальный вариационный ряд, состоящий, так же как и дискретный ряд, из двух граф (варианты и частоты). При его построении в первой графе отдельные значения признака указываются в интервалах «от - до», во второй графе - число единиц, входящих в интервал. Интервалы образуются, как правило, равные и закрытые.
Величина интервала определяется по формуле
i = R/m
где R - размах колебания (варьирования) признака;
т - число групп.
Число групп приближенно определяется по формуле Стерджесса:
т = 1 +3,322 lg n,
где п - общее число единиц совокупности.
Полученную по этой формуле величину округляют до целого числа, поскольку количество групп не может быть дробным числом.
При небольшом объеме информации (численности единиц в совокупности) число групп может быть установлено исследователем без использования формулы Стерджесса.
Величину интервала обычно округляют до целого (всегда большего) числа, исключение составляют лишь случаи, когда изучаются малейшие колебания признака (например, при группировке деталей по величине размера отклонений от номинала, измеряемого в долях миллиметра).
Нижнюю границу первого интервала принимают равной минимальному значению признака (чаще всего его предварительно округляют до целого числа); верхняя граница первого интервала соответствует значению (дст)п + /). Для последующих групп границы определяются аналогично, т. е. последовательно прибавляется величина интервала. Если единица обладает значением признака, равным величине верхней границы интервала, то ее следует относить к следующей группе.
Примером интервального вариационного ряда служит табл. 3.1.
Таблица 3.1 Выполнение норм выработки рабочими цеха
Частоты ряда (f) могут быть заменены частостями (w), которые представляют собой частоты, выраженные в относительных числах (долях или процентах) и рассчитанные путем деления частоты каждого интервала на их общую сумму, т. е.
Замена частот частостями позволяет сопоставлять вариационные ряды с различным числом наблюдений. В табл. 3.2 по данным табл. 3.1 исчислены частости и накопленные частоты. Частости в долях исчислялись так:
Таблица 3.2 Выполнение норм выработки рабочими цеха
Частости в процентах:
0,022 * 100 = 2,2%; 0,245 * 100 = 24,5% и т. д.
Накопленные частоты:
2+ 22 = 24; 24+ 48 = 72; 72 +16 = 88; 88+2 = 90.
Если вариационный ряд дан с неравными интервалами, то для правильного представления о характере распределения необходимо произвести расчет абсолютной или относительной плотности распределения.
Абсолютная плотность распределения (р) представляет собой величину частоты, приходящейся на единицу размера интервала отдельной группы ряда: р =f/i
Относительная плотность распределения (р') - частное от деления частости (w) отдельной группы на размер ее интервала: р' - w/i
Первым этапом изучения вариационного ряда является его графическое изображение. Дискретный вариационный ряд изображается в виде так называемого полигона, или многоугольника, распределения частот, являющегося разновидностью статистических ломаных. Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот.
Строятся графики в прямоугольной системе координат. При построении полигона частот на оси абсцисс в одинаковом масштабе откладываются направо в порядке возрастания значения признака (для дискретного характера) или центральные значения интервалов (для интервальных рядов); по оси ординат наносится шкала для выражения величин частот. Из точек на оси абсцисс, соответствующих величине признака, восстанавливаются перпендикуляры высотой, соответствующей частоте; вершины перпендикуляров соединяются отрезками прямой. Крайние точки полученной ломаной соединяются с лежащими на оси абсцисс следующими (меньшими и большими) возможными, но фактически не наблюдающимися значениями признака, частота которых, очевидно, равна 0. Замкнутая с осью абсцисс ломаная линия представляет полигон распределения частот.
Для построения гистограммы по оси абсцисс откладывают величины интервалов, а частоты изображаются прямоугольниками, построенными на интервалах с высотой в масштабе оси ординат. В случае неравенства интервалов гистограмма строится не по частотам или частостям, а по плотности распределения.
В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята), она особенно удобна для сравнения вариационных рядов. Накопленные частоты наносятся на чертеж в виде ординат; соединяя вершины отдельных ординат прямыми, получают ломаную линию, которая, начиная с нуля, непрерывно поднимается над осью абсцисс, до тех пор пока не достигнет высоты, соответствующей общей сумме частот.
При построении графических изображений вариационного ряда большое значение имеет соотношение масштабов по оси абсцисс (х) и оси ординат (f). В этом случае следует руководствоваться так называемым «правилом золотого сечения», в соответствии с которым высота графика должна быть примерно в два раза меньше его основания.
Для анализа вариационных рядов используются три группы показателей:
* показатели центра распределения;
* показатели степени вариации;
* показатели формы распределения.
Показатели центра распределения
Для характеристики среднего значения признака в вариационном ряду применяются: средняя арифметическая, медиана, мода.
Средняя арифметическая для дискретного ряда распределения исчисляется по формуле:
где х - варианты значений признака;
f - частота повторения данного варианта.
Средняя арифметическая для интервального ряда распределения:
где х' - середина соответствующего интервала значения признака.
Медиана (Ме) соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером:
где п - число единиц в совокупности.
По накопленным частотам определяют ее численное значение в дискретном вариационном ряду.
В интервальном ряду распределения сначала указывают интервал, в котором находится медиана.
Медианным является первый интервал, в котором сумма накопленных частот превысит половину общего числа наблюдений.
Численное значение медианы определяется по формуле:
где хМе - нижняя граница медианного интервала;
i - величина интервала;
S(-1) - накопленная частота интервала, предшествующего медианному;
f- частота медианного интервала.
Мода (Мо) - наиболее часто встречающееся значение признака. В дискретном ряду - это варианта с наибольшей частотой. В интервальном ряду сначала определяется модальный интервал, т. е. тот интервал, который имеет наибольшую частоту.
Конкретное значение моды определяется по формуле:
Моду и медиану можно определить на основе графического изображения ряда. Медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианной величиной.
Мода определяется по гистограмме распределения. Для этого правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника - с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.
Показатели вариации (колеблемости) признака
Для характеристики размера вариации признака используются абсолютные и относительные показатели. К абсолютным показателям вариации относятся:
* размах колебаний;
* среднее линейное отклонение;
* среднее квадратическое отклонение;
* дисперсия;
* квартильное отклонение.
Размах колебаний (размах вариации)
где Xmax u Xmin - соответственно максимальное и минимальное значения признака. Величина показателя зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членов ряда.
Среднее линейное отклонение и среднее квадратическое отклонение показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения. Среднее линейное отклонение определяется по формулам:
а) для несгруппированных данных (первичного ряда)
б) для п вариационного ряда
Среднее квадратическое отклонение (х) и дисперсия (х2) определяются так:
а) для несгруппированных данных
б) для вариационного ряда
Формула для расчета дисперсии может быть преобразована:
т.е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,
Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.
При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации. Они вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах.
Формулы расчета относительных показателей вариации следующие:
коэффициент осцилляции
относительное линейное отклонение
коэффициент вариации
Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).
Сложение дисперсий изучаемого признака
Изучая дисперсию интересующего нас признака в пределах исследуемой совокупности и опираясь на общую среднюю в расчетах, нельзя оценить влияние отдельных факторов, определяющих колеблемость индивидуальных значений (вариант) признака. Это можно сделать при помощи метода группировок, когда единицы изучаемой совокупности подразделяются на однородные группы по признаку-фактору. При этом кроме общей средней для всей совокупности исчисляются средние по отдельным группам (групповые или частные средние) и три показателя дисперсии:
* общая дисперсия;
* межгрупповая дисперсия;
* средняя внутригрупповая дисперсия.
Величина общей дисперсии (Q02) характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности, и определяется по формуле
где хo - общая средняя арифметическая для всей изучаемой совокупности.
Межгрупповая дисперсия (дисперсия групповых средних д2) отражает систематическую вариацию, т. е. те различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки. Межгрупповая дисперсия определяется по формуле
Средняя внутригрупповая дисперсия характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признака-фактора), положенного в основу группировки.
Средняя внутригрупповая дисперсия определяется по формуле
где хi2 - дисперсия по отдельной группе;
Указанные дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме межгрупповой дисперсии и средней внутригрупповой дисперсии:
Это тождество отражает закон (правило) сложения дисперсий. Опираясь на это правило, можно определить, какая часть (доля) общей дисперсии складывается под влиянием признака-фактора, положенного в основу группировки.
Вариации альтернативного признака
Альтернативный признак - качественный признак, имеющий две взаимоисключающие разновидности (например, работники предприятия подразделяются на мужчин и женщин; продукция - на годную и бракованную и т. д.).
Альтернативный признак принимает всего два значения:
1 - наличие признака;
О - отсутствие признака.
p+q=1
где р - доли единиц, обладающих признаком;
q - доли единиц, не обладающих признаком.
Среднее значение альтернативного признака
Дисперсия альтернативного признака
Предельное значение вариации альтернативного признака равно 0,25; оно получается при p = q = 0,5.
Показатели формы распределения
Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). В практике статистических исследований приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. В этом случае необходима перегруппировка данных с целью выделения более однр-родных групп.
Выяснение общего характера распределения предполагает оценку степени его однородности, а также исчисление показателей асимметрии и эксцесса.
Для сравнительного анализа степени асимметрии нескольких распределений рассчитывается относительный показатель асимметрии (As):
Величина показателя асимметрии Аs может быть положительной и отрицательной. Положительная величина показателя асимметрии указывает на наличие правосторонней асимметрии. Отрицательный знак показателя асимметрии говорит о наличии левосторонней асимметрии. Чем больше абсолютная величина коэффициента, тем больше степень скошенности. Принято считать, что если коэффициент асимметрии меньше 0,25, то асимметрия незначительная, если свыше 0,5, то асимметрия значительная.
Кривые распределения
Наиболее надежный путь выявления закономерностей распределения - увеличение количества наблюдений. По мере увеличения количества наблюдений (в пределах той же однородной совокупности) при одновременном уменьшении величины интервала закономерность, характерная для данного распределения, будет выступать все более и более ясно, а представляющая полигон частот ломаная линия будет приближаться к некоторой плавной линии и в пределе должна превратиться в кривую линию.
Кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде, называется кривой распределения.
В настоящее время изучено значительное число различных форм распределений. В практике статистических исследований часто используется распределение Пуассона, Максвелла, особенно нормальное распределение. Распределения, близкие к нормальному распределению, были обнаружены при изучении самых различных явлений как в природе, так и в развитии общества.
В статистической практике большой интерес представляет решение вопроса о том, в какой мере можно считать полученное в результате статистического наблюдения распределение признака в исследуемой совокупности, соответствующее нормальному распределению.
Для решения этого вопроса следует рассчитать теоретические частоты нормального распределения, т. е. те частоты, которые были бы, если бы данное распределение в точности следовало закону нормального распределения. Для расчета теоретических частот применяется следующая формула:
Следовательно, в зависимости от величины t для каждого интервала эмпирического ряда определяются теоретические частоты.
Для проверки близости теоретического и эмпирического распределений используются специальные показатели, называемые критериями согласия. Наиболее распространенным является критерий согласия
К. Пирсона ч2 («хи- квадрат»), исчисляемый по формуле
где f - эмпирические частоты (частости) в интервале;
f'' - теоретические частоты (частости) в интервале.
Полученное значение критерия (х2 расч) сравнивается с табличным значением (х2табл)- Последнее определяется по специальной таблице (см. приложение 2) в зависимости от принятой вероятности (Р) и числа степеней свободы k (для нормального распределения k равно числу групп в раду распределения минус 3).
Если X2расч <= Х2табл, то гипотеза о близости эмпирического распределения к нормальному не отвергается.
При расчете критерия Пирсона необходимо соблюдать условия: число наблюдений должно быть достаточно велико (п > 50); если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5.
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
3.2. Имеются следующие данные о возрастном составе рабочих цеха (лет): 18; 38; 28; 29; 26; 38; 34; 22; 28; 30; 22; 23; 35; 33; 27; 24; 30; 32; 28; 25; 29; 26; 31; 24; 29; 27; 32; 25; 29; 29.
Для анализа распределения рабочих цеха по возрасту требуется: 1) построить интервальный ряд распределения; 2) дать графическое изображение ряда; 3) исчислить показатели центра распределения, показатели вариации и формы распределения. Сформулировать вывод.
Решение \. Величина интервала группировки определяется по формуле
Интервальный ряд распределения
2. Графически интервальный вариационный ряд может быть представлен в виде гистограммы, полигона, кумуляты.
Гистограмма строится в прямоугольной системе координат. По оси абсцисс откладывают интервалы значений вариационного признака, причем число интервалов целесообразно увеличить на два4ло одному в начале и в конце имеющегося ряда) для удобства преобразования гистограммы в полигон частот. На отрезках (интервалах) строятся прямоугольники, высота которых соответствует частоте.
Для преобразования гистограммы в полигон частот середины верхних сторон прямоугольников соединяют отрезками прямой, и две крайние точки прямоугольников замыкаются по оси абсцисс на середине интервалов, в которых частоты равны нулю.
На рис. 3.2 представлено графическое изображение построенного интервального вариационного ряда в виде гистограммы и полигона частот.
Как видно из графика, треугольники, относящиеся к площади гистограммы и к площади полигона, попарно равны между собой, и, следовательно, площадь гистограммы и площадь полигона данного вариационного ряда также совпадают.
На основе построенной гистограммы графически можно определить значение моды. Для этого правую вершину модального прямоугольника соединяют прямой с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника соединяют с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения. Мо = 28,3 года. На рис. 3.2 эти прямые
Рис. 3.2. Гистограмма и полигон распределения рабочих цеха по возрасту линии, соединяющие вершины прямоугольников, и перпендикуляр из точки их пересечения показаны пунктирной линией.
На рис. 3.3 представлена кумулятивная кривая (кумулята).
Кумулята может быть использована для графического определения медианы. Для этого последнюю ординату кумуляты делят пополам. Через полученную точку проводят прямую, параллельную оси дг, до пересечения ее с кумулятой. Из точки пересечения опускается перпендикуляр до оси абсцисс. Абсцисса точки пересечения является медианой. Линии, определяющие медиану, на рис. 3.3 показаны пунктирными линиями. Ме = 28,6 года.
3. Расчет показателей центра распределения:
Для интервального вариационного ряда порядок расчета структурных средних следующий: сначала находят интервал, содержащий моду или медиану, а затем рассчитывают соответствующие значения названных показателей.
Модальным в данном распределении является интервал 27 -30 лет, так как наибольшее число рабочих {f = 10) находится в этом интервале. Значение моды определяется по формуле
Для расчета показателей вариации составляется вспомогательная таблица (табл. 3.4).
Таблица 3.4 Вспомогательная таблица для расчета показателей
Следовательно, вариация возраста у рабочих данного цеха не является значительной, что подтверждает достаточную однородность совокупности.
Как видно на рис. 3.2, распределение рабочих по возрасту несимметрично, поэтому определяется показатель асимметрии:
Следовательно, асимметрия правосторонняя, незначительная. При правосторонней асимметрии между показателями центра распределения существует соотношение
Для данного распределения это соотношение выполняется, т. е. 28, 33 < 28, 65 < 28, 70. При левосторонней асимметрии (Л, со знаком минус) соотношение между показателями центра распределения будет иметь вид:
Мо > Ме > х.
4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Понятие о выборочном наблюдении
Выборочное наблюдение при строгом соблюдении условий случайности и достаточно большой численности отобранных единиц репрезентативно (представительно); по результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить о всей совокупности. Однако вычисленные по материалам выборочного наблюдения статистические показатели не будут точно совпадать с соответствующими характеристиками для всей совокупности (генеральной совокупности). Величина этих отклонений называется ошибкой наблюдения, которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.
Ошибки репрезентативности свойственны только несплошным наблюдениям. Они характеризуют размер расхождений между величинами показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности единичных наблюдений. Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки возникают при нарушении установленных правил отбора единиц. Случайные ошибки репрезентативности обязаны своим возникновением недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.
Величина случайной ошибки определяет надежность данных выборочного наблюдения, их пригодность для суждения о генеральной совокупности. При помощи формул теории вероятностей можно рассчитать возможную максимальную случайную ошибку - вероятный (стохастический) предел ошибки.
Максимально возможная ошибка - это такая величина отклонения выборочной средней (доли) от генеральной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала.
Величина случайной ошибки репрезентативности зависит от:
* степени колеблемости изучаемого признака в генеральной совокупности;
* способа формирования выборочной совокупности;
* объема выборки.
По степени охвата единиц исследуемой совокупности различают большие и малые выборки.
По способу формирования выборочной совокупности различают следующие виды выборочного наблюдения: простая случайная (собственно случайная) выборка, расслоенная (типическая или районированная), серийная, механическая, комбинированная, ступенчатая, многофазная.
Принятые условные обозначения
Совокупность единиц, из которых производится отбор, принято называть генеральной совокупностью. Совокупность отобранных единиц из генеральной совокупности называется выборочной совокупностью.
N - объем генеральной совокупности (число входящих в нее единиц);
п - объем выборочной совокупности (число единиц, попавших в выборку);
х - генеральная средняя (среднее значение признака в генеральной совокупности);
х - выборочная средняя (среднее значение признака в выборочной совокупности);
р - генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);
w - выборочная доля (доля единиц, обладающих данным признаком в выборочной совокупности);
х2 - генеральная дисперсия (дисперсия признака в генеральной совокупности);
S2 - выборочная дисперсия (дисперсия признака в выборочной совокупности);
х- среднее квадратическое отклонение признака в генеральной совокупности;
S - среднее квадратическое отклонение признака в выборочной совокупности.
Простая случайная выборка
При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при котором каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.
Случайный отбор может быть проведен в двух формах: в форме возвратной (повторной) выборки ив форме безвозвратной (бесповторной) выборки. При повторном отборе вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова может быть выбранной. При бесповторном отборе выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).
Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка.
В табл. 4.1 приведены формулы расчета ошибок простой случайной выборки.
Формулы предельной ошибки позволяют решать задачи трех видов:
1. Определение пределов генеральных характеристик с
заданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки. Доверительные интервалы для генеральной средней -
Доверительные интервалы для генеральной доли -
2. Определение доверительной вероятности того, что генеральная характеристика может отличаться от выборочной не более чем на определенную заданную величину.
Доверительная вероятность является функцией от t, определяемой по формуле
По величине t определяется доверительная вероятность (приложение 3).
3. Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность выборки.
В табл. 4.2 приведены формулы для расчета численности простой случайной выборки.
Таблица 4.2 Формулы для определения численности простой случайной
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
4.1. Из партии электроламп взята 20%-ная случайная бесповторная выборка для определения среднего веса спирали. Результаты выборки следующие:
Определить с вероятностью 0,95 доверительные пределы, в которых лежит средний вес спирали, для всей партии электроламп.
4.2. На заводе электроламп из партии продукции в количестве 16000 шт. ламп взято на выборку 1600 шт. (случайный, бесповторный отбор), из которых 40 шт. оказались бракованными.
Определить с вероятностью 0,997 пределы, в которых будет находиться процент брака для всей продукции
5. ИНДЕКСЫ И ИХ ИСПОЛЬЗОВАНИЕ В ЭКОНОМИКО-СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ
Индекс - относительная величина, характеризующая изменение уровней сложных социально-экономических показателей во времени, в пространстве или по сравнению с планом. Сложный показатель состоит из непосредственно несоизмеримых (несуммируемых) элементов. Например, предприятие выпускает несколько видов продукции, но получить общий итог объема продукции путем суммирования количества различных ее видов в натуральном выражении нельзя.
Подобные документы
Развитие статистической науки. Предмет статистики, задачи и методология. Структура статистической науки. Организация статистики в Российской Федерации. Общегосударственная и ведомственная статистика. Информационный фонд.
реферат [23,4 K], добавлен 09.10.2006Понятие статистики, ее назначение, уровни, предмет и система. Теоретические основы статистики как отрасли экономической науки, ее категории. Особенности статистической методологии. Современная организация статистики в Российской Федерации и её задачи.
реферат [33,2 K], добавлен 27.01.2011Краткая история зарождения и развития статистики как науки. Предмет изучения и характеристика основных задач статистики. Статистические методы сбора и обработки данных для получения достоверных оценок и результатов. Источники статистических данных.
лекция [23,7 K], добавлен 13.02.2011История развития статистики в России. Деятельность видных ученых в развитии статистики как науки. Основные задачи статистики. Общая теория статистики, экономическая статистика, социальная статистика. Отраслевая статистика.
реферат [23,9 K], добавлен 12.12.2006Методические рекомендации для решения задач по общей теории статистики. Формулы для вычисления моды. Расчет медианы для интервального ряда. Определение средней арифметической простой, средней геометрической. Расчет индекса структурных сдвигов.
методичка [101,6 K], добавлен 22.03.2010Понятие и предмет статистики, теоретические основы и категории, взаимосвязь с другими науками. Объект и метод изучения статистики. Основные задачи, принципы организации и функции государственной статистики в РФ. Примеры статистической закономерности.
лекция [17,3 K], добавлен 02.03.2012Цели и задачи изучения дисциплины "Макроэкономика" и ее место в учебном процессе. Содержание основных тем дисциплины. Экзаменационные вопросы по дисциплине "Макроэкономика". Тесты для подготовки к экзамену и промежуточному государственному контролю.
тест [138,4 K], добавлен 25.05.2009Характеристика предмета статистики как общественной науки, статистическое изучение массовых явлений. Понятие статистической совокупности, проведение анкетного опроса покупателей для изучения контингента. Статистические показатели коммерческих банков.
контрольная работа [24,9 K], добавлен 11.08.2015История возникновения и развития статистики. Предмет, основные понятия и категории статистики. Методы сбора, обобщения и анализа статистических данных. Экономическая статистика и ее отрасли. Современная организация статистики в Российской Федерации.
лекция [16,5 K], добавлен 02.05.2012Схемы решений практических заданий по разделам "Теория статистики" и "Статистика предприятия". Правила и требования к составлению статистических таблиц. Критерии оценки контрольной работы. Относительные величины плановой и фактической динамики.
методичка [417,0 K], добавлен 08.02.2011