Анализ признака №32 "Важность качества упаковки" в "Клубе Семейного Досуга": влияние "пола"; "места жительства" и "материального положения"

Суть одномерного (частотного) и двумерного распределение в социологических исследованиях. Анализ зависимости между признаками "важность качества упаковки", "пол", "материальное состояние семьи" и "место жительства". Значимость различий в разных выборках.

Рубрика Социология и обществознание
Вид курсовая работа
Язык русский
Дата добавления 03.12.2011
Размер файла 911,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

ХАРЬКОВСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ имени В. Н. КАРАЗИНА

СОЦИЛОГИЧЕСКИЙ ФАКУЛЬТЕТ

КУРСОВАЯ РАБОТА

по курсу: «Методы анализа социологической информации»

«Анализ признака №32 «Важность качества упаковки» в «Клубе Семейного Досуга»: влияние «пола»; «места жительства» и «материального положения»

Выполнила:

студента III курса

группы СЦ-31

Хазиева Е.Н.

Харьков 2011г.

Содержание

Введение

1. Одномерное (частотное) распределение

2. Двумерные распределения

2.1 Анализ зависимости между признаками «важность качество упаковки» и «пол»

2.2 Анализ зависимости между признаками «важностькачество упаковки» и «материальное состояние семьи»

3. Анализ зависимости между признаками «важность качества упаковки» и «сместо жительства»

3.1 Анализ различий значимости признака

3.2 Значимость различий частот (процентов)

3.3 Значимость различий в разных подвыборках

Вывод

Список литературы

Приложения

Введение

«Книжный Клуб «Клуб Семейного Досуга» объединяет на сегодня 2 000 000 украинских семей, предлагая своим клиентам сервис европейского уровня. Интернет-магазин Клуба предлагает купить книги всех жанров и направлений: лучшие новинки художественной, прикладной, учебной, детской литературы.

Признаки выбранные для написания работы:

- Основной признак (зависимая переменная) который будет исследоваться в данной работе «32. Насколько для Вас важно качество упаковки?». Этот признак является порядковым с пяти переменными: «1. Очень важно»; «2. Скорее важно»; «3. Насколько важно, настолько и не важно»; «4. Скорее не важно»; «5. Совсем не важно».

- Дополнительные признаки: один «1. Ваш пол», который является номинальным с двумя значениями - «1. Мужской» и «2. Женский»; второй признак также номинальный «7. Как вы оценили нынешнее материальное положение вашей семьи?» с пятью значениями: «1. Денег не хватает даже на самые необходимые продукты», «2. Все деньги расходуются на продукты и покупку необходимых недорогих вещей», «3. В основном денег хватает, но приобретение товаров длительного пользования (телевизор, холодильник, мебель и др.) затруднительно», «4. Живем обеспеченно, но осуществить некоторые покупки (квартиру, автомобиль и т.п.) пока не в состоянии», «5. Можем позволить себе практически все, что хотим»; третий «9. Вы проживаете» с пятью значениями (номинальный): «1. В областном центре», «2. В районном центре, городе», «3. В районном центре, поселке городского типа», «4. В поселке городского типа», «5. В селе».

Цель - Изучить теоретические основы работы в программе SPSS Statistics и применить полученные теоретические знания на практическом анализе массива данных ksd.sav, который является результатом опроса клиентов «Клуба Семейного Досуга»;

Задачи:

1. Из массива данных выбрать признаки по которым будет проводится анализ в программе SPSS Statistics

2. Провести частотный анализ выбранного признака и представить результаты анализа графически:

2.1. На основе полученных результатов проанализировать форму распределения, рассчитать меры центральной тенденции и вариации;

2.2. Сделать вывод по проведенному одномерному распределению на основе имеющихся данных;

3. Провести двумерное распределение исследуемых признаков (зависимый и независимый):

3.1. Результат представить в форме таблиц и графиков;

3.2. Рассчитать критерий хи-квадрат и коэффициенты корреляции, оценить их значимость;

3.3. Содержательно проинтерпретировать данные;

4. Провести анализ различий долей:

4.1. Выбрать одно из значений данного признака и оценить его значение в разных подвыборках;

4.2. Построить доверительный интервал;

4.3. Сделать содержательный вывод;

5. Провести анализ значимости различий данного признака признака в разных подвыборках:

5.1. Анализ различий исследуемого признака в двух подвыборках;

5.2. Анализ значимости различий данного признака в трех (или более) подвыборках;

5.3. Сделать содержательные выводы

Гипотезы:

1. Суть гипотезы заключается в том, что качество упаковки важно для женщин и не важно - для мужчин.

2. Людям с высоким материальным положением качество упаковки важнее, чем людям с низким материальным положением.

3. Людям проживающим в городе качество упаковки важнее, чем людям проживающим в селе.

1. Одномерное (частотное) распределение

Этот вид анализа включает описательное представление отдельных переменных. К нему относятся создание частотной таблицы, вычисление статистических характеристик или графическое представление. Частотные таблицы строятся для переменных, относящихся к номинальной шкале и для порядковых переменных, имеющих не слишком много категорий.

С помощью данного подхода решаются задачи выявления закона распределения вероятностей случайной величины и одномерных статистик данного распределения: моды, медианы, среднего арифметического, дисперсии, асимметрии и эксцесса.

Для переменных относящихся к номинальной шкале нельзя вычислить никаких значимых статистических характеристик. Наиболее часто для порядковых переменных и переменных, относящихся к интервальной шкале, но не подчиняющихся нормальному распределению, вычисляются медианы и оба квартиля.

Для переменных, относящихся к интервальной шкале и подчиняющихся нормальному распределению, чаще всего вычисляется среднее значение и стандартное отклонение пли стандартная ошибка. Однако следует выбрать только одну из этих двух характеристик разброса. Для переменных, относящихся ко всем статистическим шкалам, можно построить большое разнообразных графиков, на которых представлены частоты, средние значения или другие характеристики.

Для проведения был выбран зависимый признак: «32. Насколько для Вас важно качество упаковки?». Среднее составляет 2.28 - это означает в среднем ответы респондентов варьируются на пункте 2 (Скорее важно). Медиана равна 2. Большинство респондентов считаю, что качество упаковки «скорее важно» на это указывает мода, которая равна 2. Предложенных вариантов ответа 5, значит, минимум равен 1, а максимум 5. Размах равен 4, поскольку размах -- это разница между наибольшим значением (максимумом) и наименьшим значением (минимумом). Стандартное отклонение составляет 1.23. Стандартное отклонение -- это мера разброса измеренных величин; оно равно квадратному корню из дисперсии. Дисперсии равна 1.518.

Результат показан графически.

Распределение не отвечает нормальному т.к.:

1. Коэффициент асимметрии (Skewness) -- это мера отклонения распределения частоты от симметричного распределения, то есть такого, у которого на одинаковом удалении от среднего значения по обе стороны выборки данных располагается одинаковое количество значений. Если наблюдения подчиняются нормальному распределению, то асимметрия равна нулю. Для проверки на нормальное распределение можно применять следующее правило: Если асимметрия значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть. Если вершина асимметричного распределения сдвинута к меньшим значениям, то говорят о положительной асимметрии, в противоположном случае -- об отрицательной. Асимметрия равна 0,734 (ошбка0,055) т.е. она левостороння, положительная.

2. Коэффициент вариации или эксцесс (Kurtosis) указывает, является ли распределение пологим (при большом значении коэффициента) или крутым. Коэффициент вариации равен нулю, если наблюдения подчиняются нормальному распределению. Эксцесс равен -0,484 (ошибка 0,109). (см. Приложение №1).

3. Это также подтверждает проведенный тест Колмогорова-Смирнова Asymp. Sig. (2-tailed) равна меньше 0,05, а значит распределение есть не нормальным. (см. Приложение №2).

Тест Колмогорова-Смирнова и Шапиро Уилкса, говорят нам о том, что распределение не является нормальным, это значит, что при дальнейшем анализе нужно применять не параметрические тесты.

В процентом содержание ответы респондентов распределились: очень важно - 32,5%; скорее важно - 32,5%; насколько важно, настолько не важно - 15,9%; скорее не важно - 12%; совсем не важно - 7%. (см.Приложение№3)

Тест Колмогорова-Смирнова равняется 0,302, Шапиро-Уилка равняется 0,803, а их уровень значимости 0,000…, что меньше чем 0,05 или 0,01 т.е. критических значений. Мы можем с вероятностью 0,99% утверждать, что наше распределение не является нормальным, т.е. принимаем гипотезу о различии эмпирического распределения от теоретического (принимаем гипотезу).

2. Двумерное распределение

Для вычисления критерия хи-квадрат применяются три различных подхода: формула Пирсона, поправка на правдоподобие и тест Мантеля-Хэнзеля. Если таблица сопряженности имеет четыре поля и ожидаемая вероятность менее 5, дополнительно выполняется точный тест Фишера.

Критерий хи-квадрат по Пирсону. Обычно для вычисления критерия хи-квадрат используется формула Пирсона:

Здесь вычисляется сумма квадратов стандартизованных остатков по всем полям таблицы сопряженности. В рассматриваемом нами примере формула Пирсона дает максимально значимую величину критерия хи-квадрат (р<0,001). Корректность проведения теста хи-квадрат определяется двумя условиями: во-первых, ожидаемые частоты < 5 должны встречаться не более чем в 20 % полей таблицы; во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля.

Критерий хи-квадрат с поправкой на правдоподобие. Альтернативой формуле Пирсона для вычисления критерия хи-квадрат является поправка на правдоподобие:

Тест Мантеля-Хэнзел. Дополнительно в таблице сопряженности под обозначением linear-by-linear ("линейный-по-линейному") выводится значение теста Мантеля-Хэнзеля. Эта форма критерия хи-квадрат с поправкой Мантеля-Хэнзеля -- еще одна мера линейной зависимости между строками и столбцами таблицы сопряженности. Она определяется как произведение коэффициента корреляции Пирсона на количество наблюдений, уменьшенное на единицу:

Далее мы попробуем выяснить, какие заключения можно сделать о силе или слабости этой зависимости, а также о ее виде и направленности. Критерии количественной оценки зависимости между переменными называются коэффициентами корреляции или мерами связанности.

Две переменные коррелируют между собой положительно, если между ними существует прямое, однонаправленное соотношение. При однонаправленном соотношении малые значения одной переменной соответствуют малым значениям другой переменной, большие значения -- большим. Две переменные коррелируют между собой отрицательно, если между ними существует обратное, разнонаправленное соотношение.

При разнонаправленном соотношении малые значения одной переменной соответствуют большим значениям другой переменной и наоборот. Значения коэффициентов корреляции всегда лежат в диапазоне от -1 до +1.

В качестве коэффициента корреляции между переменными, принадлежащими порядковой шкале применяется коэффициент Спирмена, а для переменных, принадлежащих к интервальной шкале -- коэффициент корреляции Пирсона (момент произведений). При этом следует учесть, что каждую дихотомическую переменную, то есть переменную, принадлежащую к номинальной шкале и имеющую две категории, можно рассматривать как порядковую.

2.1 Качество упаковки - пол

Насколько для вас важно качество упаковки?*пол (в %)

Мужщины

Женщины

Очень важно

28,8

34

Скорее важно

30,7

33,3

Насколько важно, натолько не важно

18,3

14,9

Скорее не важно

13,4

11,5

Срвсем не важно

8,9

6,3

Проведенный анализ показал что: упаковка очень важна для мужчин - 28,8%, для женщин - 34%; скорее важно для мужчин - 30,7, для женщин 33,3%; насколько важно, настолько неважно для мужчин - 18,3%, для женщин - 11,5; скорее не важно для мужчин - 13,4, для женщин - 11,5; совсем не важно для мужчин - 8,9, для женщин - 6,3. (см.Приложение№4).

Можно сделать вывод что для женщин качество упаковки имеет большее значение, чем для мужчин => первая гипотеза подтверждается.

Chi-Square Tests

Value

df

Asymp. Sig. (2-sided)

Pearson Chi-Square

12,697a

4

,013

Likelihood Ratio

12,514

4

,014

Linear-by-Linear Association

11,303

1

,001

N of Valid Cases

2017

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 42,03.

Хи-квадрат значим на уровне 1%, ожидаемая встречаемость меньше 5,наличие неправельных ящеек 0. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 12,514; linear-by-linear («линейный-по-линейному») выводится значение теста Мантеля-Хэнзеля (11,303). Т.е между признаками существует корреляционная зависимость.

Кореляция (см. Приложение №7):

a Не подразумевая истинность нулевой гипотезы.

b Используем асимптотическую стандартную ошибку, предполагая истинность нулевой гипотезы.

c На основании нормальной аппроксимации.

Так как здесь нет переменных с интервальной шкалой, мы рассмотрим коэффициент корреляции Спирмена. Он составляет -0,075 и является максимально значимым (р=0,001). Т.е между признаками существует сильная корреляция.

2.2 Качество упаковки - материальное положение

Насколько для вас важно качество упаковки?*материальное положение (в %)

Денег хватает

Денег хватает на самое необходимое

В основном денег хватает

Живем обеспечено

Можем позволить все

1.

Очень важно

34

31,7

33,9

30,3

33,3

2.

Скорее важно

28,9

31,6

33,3

37,7

44,4

3.

Насколько важно, ностолько не важно

16,4

18,2

13

13,7

-

4.

Скорее не важно

7,5

11,9

13,6

10,9

11,1

5.

Совсем не важно

13,2

6,6

6,1

7,4

11,1

Основываясь на проведенном анализе представленном в виде таблицы и графика можно сделать вывод что вторая гипотеза подтверждается (людям с высоким материальным положением качество упаковки важнее, чем людям с низким материальным положением).

Проведенный анализ показал что: качество упаковки «очень важно» для людей которые ответили что денег не хватает на 34%; денег хватает на самое необходимое - 31,7%; в основном денег хватает - 33,9%, живем обеспеченно - 30,3%, можем позволить себе все - 33,3; «скорее важно» для людей которые ответили что денег не хватает на 28,9%; денег хватает на самое необходимое - 31,6%; в основном денег хватает - 33,3%, живем обеспеченно - 37,7%, можем позволить себе все - 44,4%; «насколько важно, настолько не важно» для людей которые ответили, что денег не хватает на 16,4%; денег хватает на самое необходимое - 18,2%; в основном денег хватает - 13%, живем обеспеченно - 13,7%; «скорее не важно» для людей которые ответили что денег не хватает на 7,5%; денег хватает на самое необходимое - 11,9%; в основном денег хватает - 13,6%, живем обеспеченно - 10,9%, можем позволить себе все - 11,1%; «совсем не важно» для людей которые ответили что денег не хватает на 13,2%; денег хватает на самое необходимое - 6,6%; в основном денег хватает - 6,1%, живем обеспеченно - 7,4%, можем позволить себе все - 11,1. (см. Приложение №5)

Chi-Square Tests

Value

df

Asymp. Sig. (2-sided)

Pearson Chi-Square

27,092a

16

,040

Likelihood Ratio

27,141

16

,040

Linear-by-Linear Association

1,175

1

,278

N of Valid Cases

2017

a. 5 cells (20,0%) have expected count less than 5. The minimum expected count is ,63.

Хи-квадрат значим на уровне 5%, 5 ячеек (20%) имеют ожидаемую частоту менее 5. Минимальная ожидаемая частота 0,63. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 27,141; linear-by-linear («линейный-по-линейному») выводится значение теста Мантеля-Хэнзеля - 1,175. Т.е между признаками существует слабая корреляционная зависимость.

Кореляция (см. Приложение №8):

a Не подразумевая истинность нулевой гипотезы.

b Используем асимптотическую стандартную ошибку, предполагая истинность нулевой гипотезы.

c На основании нормальной аппроксимации.

Так как здесь нет переменных с интервальной шкалой, мы рассмотрим коэффициент корреляции Спирмена. Он составляет -0,024 и является значимым (р=0,29).

2.3 Качество упаковки - место проживания

Насколько для вас важно качество упаковки?*место жительства (в %)

В обл. центре

В р-м центре, городе

В р-м центре, поселки гор.типа

В поселке гор. Типа

В селе

1.

Очень важно

25,4

34,4

28,9

32,2

36

2.

Скорее важно

36,7

33,2

31,6

32,2

28,4

3.

Насколько важно, настолько не важно

15,3

15,9

18,4

17,5

15,5

4.

Скорее не важно

15,6

11,5

9,6

9,8

11,2

5.

Совсем не важно

7

5,1

11,4

8,4

8,9

Проведенный анализ показал что: качество упаковки «очень важно» для людей проживающих в областном центре на 24,4%, в районном центре, городе - 34,4%, в районном центре, поселке городского типа - 28,9%, в поселке городского типа - 32,2%, в селе - 36%; «скорее важно» для людей проживающих в областном центре на 36,7%, в районном центре, городе - 33,2%, в районном центре, поселке городского типа - 31,6%, в поселке городского типа - 32,2%, в селе - 28,4%; «насколько важно, настолько не важно» для людей проживающих в областном центре на 15,6%, в районном центре, городе - 11,5%, в районном центре, поселке городского типа - 9,6%, в поселке городского типа - 9,8%, в селе - 11,2%; «совсем не важно» для людей проживающих в областном центре на 7%, в районном центре, городе - 5,1%, в районном центре, поселке городского типа - 11,4%, в поселке городского типа - 8,4%, в селе - 8,9%. (см. Приложение №6)

Основываясь на этих данных можно сделать вывод о том что третья гипотеза не подтвердилась (Гипотеза №3. Людям проживающим в городе качество упаковки важнее, чем людям проживающим в селе).

Далее наглядно представлено графическое изображение проведенного анализа, где можно четко выше описанные тенденции.

Хи-квадрат значим на уровне 1%, 5 ячеек (0%) имеют ожидаемую частоту менее 5. Минимальная ожидаемая частота 8,03. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 31,974; linear-by-linear («линейный-по-линейному») выводится значение теста Мантеля-Хэнзеля - 0,182. Т.е между признаками существует корреляционная зависимость.

Chi-Square Tests

Value

df

Asymp. Sig. (2-sided)

Pearson Chi-Square

32,024a

16

,010

Likelihood Ratio

31,974

16

,010

Linear-by-Linear Association

,182

1

,670

N of Valid Cases

2017

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 8,03.

Кореляция (см. Приложение №9):

a Не подразумевая истинность нулевой гипотезы.

b Используем асимптотическую стандартную ошибку, предполагая истинность нулевой гипотезы.

c На основании нормальной аппроксимации.

Так как здесь нет переменных с интервальной шкалой, мы рассмотрим коэффициент корреляции Спирмена. Он составляет -0,34 и является значимым (р=0,13). Есть слабая корелляция.

3. Анализ различий

3.1 Анализ значимости различий долей (процентов)

Мы установили, что существует слабая связь между признаками «важность кпаковки» и «материальное положение». Следуя гипотезе, выведенной в программе исследования, нам нужно установить, существует ли статистически значимое различие в важности качества упаковки, между такими группами, которым не хватает денежных средств и, теми кому не хватает.

Просто сравнить проценты мы не можем, так как мы сравниваем выборки, которые с ошибками представляют генеральную совокупность, для этого нам нужно убедиться, что данные расхождения не обусловлены случайными факторами, т.е. рассчитать статистическую значимость расхождения. Расчет значимости расхождений процентов являет собой проверку статистической гипотезы о равенстве процентов определенного признака у двух независимых выборках.

Ранее мы выяснили, что распределение нашего признака «32. Важность качества упаковки» не подчиняется закономерностям нормального распределения, поэтому для анализа значимости различий корректнее использовать непараметрические тесты.

Для этого в двумерных распределениях выводим нормированные остатки, которые показывают разницу между ожидаемой и измеряемой частотой.

Таблица сопряженности 32. Насколько для вас важно качество упаковки? * материальное положение

Как бы вы оценили нынешнее материальное положение вашей семьи?

Итого

Денег не хватает

Хватает

32.Насколько для вас важно качества о упаковки?

1, Очень важно

Частота

54

601

665

Ожидаемая частота

51,6

659,3

655,0

Стандарт из. остаток

0,3

0,3

2, Скорее важно

Частота

46

610

656

Ожидаемая частота

51,7

604,2

656,0

Стандарт из. остаток

-0,8

2,1

3, Насколько важно, настолько не важно

Частота

26

295

321

Ожидаемая частота

25,3

295,7

321,0

Стандарт из. остаток

0,1

-1,9

4, Скорее важно

Частота

12

231

243

Ожидаемая частота

19,2

223,9

243,0

Стандарт из. остаток

-1,6

0,6

5, Скорее не важно

Частота

21

121

142

Ожидаемая частота

11,2

130,8

142,

Стандарт из. остаток

2,9

-0,7

Итого

Частота

159

1858

2017

Ожидаемая частота

159,0

1858,0

2017,0

Именно, сравнение ожидаемых и измеряемых частот, позволит нам сделать выводы о статистическом различии процентов. Считается, что о значимом расхождение частот, ожидаемых и рассчитанных, можно судить, если нормированный остаток больше или равняется.

Мы можем увидеть, что статистически значимо отличается только категория «скорее важно», т.е. действительно ответы в двумерном распределении на категорию «скорее важно», значимо разнятся между собой. Можно утверждать, что члены клуба, которым «хватает денежных средств» меньше обращают внимание на упаковку, чем те которым не хватают денежных средств

Сравнение пропорций по столбцам

Как бы вы оценили нынешнее материальное положение вашей семьи?

Денег не хватает

Хватает

(A)

(B)

32.Насколько для вас важнокачестао упаковки?

1, Очень важно

2, Скорее важно

А

3, Насколько важно, настолько не важно

4, Скорее важно

5, Скорее не важно

В

3.2 Анализ значимости различий в разных подвыбоках

Первый дополнительный признак «Пол», следовательно, подвыборки - «женщины» и «мужчины». Второй признак «Материальное положение» с пятью значениями «1. Денег не хватает даже на самые необходимые продукты», «2. Все деньги расходуются на продукты и покупку необходимых недорогих вещей», «3. В основном денег хватает, но приобретение товаров длительного пользования (телевизор, холодильник, мебель и др.) затруднительно», «4. Живем обеспеченно, но осуществить некоторые покупки (квартиру, автомобиль и т.п.) пока не в состоянии», «5. Можем позволить себе практически все, что хотим».

Сначала необходимо провести проверку нормальности распределения основного исследуемого признака «32. Насколько для вас важно качество упаковки?». Данная проверка была проведена в первой части работы: визуальная проверка показала не нормальность распределения, что подтвердил тест Колмогорова-Смирнова (см. Приложение №2), который показал, что Asymp. Sig. (2-tailed) равна меньше 0,05, а значит распределение есть не нормальным. Значит на необходимо использовать не параметрические тести:

а). U-тест за методом Манна-Уитни - Это самый известный и самый распространенный тест непараметрического сравнения двух независимых выборок. Он основан на использовании одной общей последовательности значений обоих выборок;

б). Н-тест за методом Краскела-Уоллиса - Этот тест является модификацией U-теста Манна и Уитни на случай для более двух 1езависимых выборок. Он также базируется на общей ранговой последовательности значений всех выборок.

а). Групповая переменная: пол. Выведенные результаты включают следующие показатели:

- количество наблюдений (N мужчин=597, N женщин=1420), усреднённые ранги (Mean Rank женщин = 982,27, Mean Rank мужчин = 1072,58) и ранговая сумма для двух выборок (Sum of Ranks мужчин =640329, Sum of Ranks женщин = 1394824), причём большим значениям присваиваются низшие ранговые места (см.Приложение№10)

- тестовую величину U, определенную с помощью теста Манна и Уитни = 385914,000;

- наименьшее значение из обоих ранговых сумм (W-тест Уилкоксона)= 1394824,000;

- точное значение вероятности ошибки р при количестве наблюдений менее 30 (р=0,001). Выясняется, что в рассматриваемом примере разница показателей является статистически значимой; (см.Приложение№11)

- тестовую величину z, определенную по тесту Колмогорова-Смирнова, а также относящуюся к ней вероятность ошибки р, которую следует использовать при количестве наблюдений более 30.

Выясняется, что в рассматриваемом примере разница показателей является статистически значимой.

б). В данном случае нам необходимо протестировать пять категории из рассмотренного выше исследования предмет значимости различия значение важности качества упаковки и материальным положением респондентов. вычислили средние значения исходного показателя важности качества упаковки для пяти статусных категорий, то получили бы следующие результаты:

7 КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ СЕМЬИ?

Среднее значение

N

Стандартное отклонение

1, Денег не хватает даже на самые необходимые продукты

2,3711

159

1,36666

2, Все деньги расходуются на продукты и покупку

2,3028

1014

1,21688

3, В основном, денег хватает, но приобретение товаров дл

2,2455

660

1,22582

4, Живем обеспеченно, но осуществить некоторые покупк

2,2743

175

1,21493

5, Можем позволить себе практически все, что хотим

2,2222

9

1,39443

Total

2,2866

2017

1,23209

Далее проводим Н-тест за методом Краскела-Уоллиса. В результаты расчёта входят:

· усреднённые ранги в отдельных группах (где большим значениям отдаются более высокие места);

· величина критерия хи-квадрат (1,5), соответствующее число степеней свободы (df)- 4, и вероятность ошибки р.

В данном примере для которого р = 0,812 граница значимости преодолена значительно, это означает, что наблюдается тенденция к проявлению закономерности. (см. Приложение №13)

Выводы

После построения одномерного распределения, мы увидели, что больше половины респондентов считают, что качество упаковки очень важно. Распределение было не нормальным, что подтвердили тесты Колмогорова-Смирнова и Шапиро-Уилкина, следовательно, необходимо в дальнейшем исследование использовать не параметрические тесты.

Также проведение анализа показало, что первая гипотеза полностью подтверждается. Существует зависимость и корреляционная связь между «важностью упаковки» и «полом». С программы исследования предполагалось, что признак №1 влияет на признак №32, но значения коэффициентов слишком приближены друг к другу.

Мы выяснили, что распределение нашего основного признака не является нормальным, и это было причиной использования в дальнейшем, разных коэффициентов, не основанных на нормальном распределении.

Также мы установили, что существует, предположительно, опосредованная связь, между признаком «важность качества упаковки» и признаками «место проживание» и «материальное положение». При помощи анализа различий выяснили, что проживающих в городах членам клуба, качество упаковки менее важно, чем членам клуба проживающим вне города. Это различие является статистически значимым. Т.е. третья гипотеза о том, что людям проживающим в городе качество упаковки важнее, чем людям проживающим в селе не подтвердилась. Вторая гипотеза о влияние материального положения на важность качества упаковки - подтверждается, это различие имеет статистическую разницу.

Список литературы

1. Бюлль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. - СПб.: ООО «ДиаСофтЮП», 2005. - 608 с.

2. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS. - М.: ГУ ВШЭ, 2007. -281 с.

3. Паніотто В.І., Максименко В.С., Марченко Н.М. Статистичний аналіз соціологічних даних. - К.: КМ Академія, 2004. - 270 с.

Приложения

Приложение 1

Statistics

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ?

N

Valid

2017

Missing

1

Mean

2,2866

Median

2,0000

Mode

2,00

Std. Deviation

1,23209

Variance

1,518

Skewness

,734

Std. Error of Skewness

,055

Kurtosis

-,484

Std. Error of Kurtosis

,109

Range

4,00

Minimum

1,00

Maximum

5,00

Приложение 2

социологический выборка одномерный

One-Sample Kolmogorov-Smirnov Test

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ?

N

2017

Normal Parametersa,,b

Mean

2,2866

Std. Deviation

1,23209

Most Extreme Differences

Absolute

,242

Positive

,242

Negative

-,148

Kolmogorov-Smirnov Z

10,865

Asymp. Sig. (2-tailed)

,000

a. Test distribution is Normal.

b. Calculated from data.

Приложение 3

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ?

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

1, Очень важно

655

32,5

32,5

32,5

2, Скорее, важно

656

32,5

32,5

65,0

3, Насколько важно, настолько и не важно

321

15,9

15,9

80,9

4, Скорее, не важно

243

12,0

12,0

93,0

5, Совсем не важно

142

7,0

7,0

100,0

Total

2017

100,0

100,0

Missing

-99,00

1

,0

Total

2018

100,0

Приложение 4

Crosstab

% within 1 ВАШ ПОЛ:

1 ВАШ ПОЛ:

Total

1 Мужской

2 Женский

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте то

1, Очень важно

28,8%

34,0%

32,5%

2, Скорее, важно

30,7%

33,3%

32,5%

3, Насколько важно, настолько и не важно

18,3%

14,9%

15,9%

4, Скорее, не важно

13,4%

11,5%

12,0%

5, Совсем не важно

8,9%

6,3%

7,0%

Total

100,0%

100,0%

100,0%

Приложение 5

Crosstab

% within 7 КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ

7 КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ

Total

1, Денег не хватает даже на самые необходимые продукты

2, Все деньги расходуются на продукты и покупку

3, В основном, денег хватает, но приобретение товаров дл

4, Живем обеспеченно, но осуществить некоторые покупок

5, Можем позволить себе практически все, что хотим

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ?

1, Очень важно

34,0%

31,7%

33,9%

30,3%

33,3%

32,5%

2, Скорее, важно

28,9%

31,6%

33,3%

37,7%

44,4%

32,5%

3, Насколько важно, настолько и не важно

16,4%

18,2%

13,0%

13,7%

15,9%

4, Скорее, не важно

7,5%

11,9%

13,6%

10,9%

11,1%

12,0%

5, Совсем не важно

13,2%

6,6%

6,1%

7,4%

11,1%

7,0%

Total

100,0%

100,0%

100,0%

100,0%

100,0%

100,0%

Приложение 6

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? * 9 ВЫ ПРОЖИВАЕТЕ Crosstabulation

% within 9 ВЫ ПРОЖИВАЕТЕ: (отметьте только один пункт)

9 ВЫ ПРОЖИВАЕТЕ: (отметьте только один пункт)

Total

1. В обл. центре

2. В районном центре, городе

3. В р-м центре, поселке гор. типа

4. В поселке гор. типа

5. В селе

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте то

1, Очень важно

25,4%

34,4%

28,9%

32,2%

36,0%

32,5%

2, Скорее, важно

36,7%

33,2%

31,6%

32,2%

28,4%

32,5%

3, Насколько важно, настолько и не важно

15,3%

15,9%

18,4%

17,5%

15,5%

15,9%

4, Скорее, не важно

15,6%

11,5%

9,6%

9,8%

11,2%

12,0%

5, Совсем не важно

7,0%

5,1%

11,4%

8,4%

8,9%

7,0%

Total

100,0%

100,0%

100,0%

100,0%

100,0%

100,0%

Приложение 7

Symmetric Measures

Value

Asymp. Std. Errora

Approx. Tb

Approx. Sig.

Nominal by Nominal

Phi

,079

,013

Cramer's V

,079

,013

Contingency Coefficient

,079

,013

Interval by Interval

Pearson's R

-,075

,023

-3,371

,001c

Ordinal by Ordinal

Spearman Correlation

-,074

,022

-3,313

,001c

N of Valid Cases

2017

a. Not assuming the null hypothesis.

b. Using the asymptotic standard error assuming the null hypothesis.

c. Based on normal approximation.

Приложение 8

Symmetric Measures

Value

Asymp. Std. Errora

Approx. Tb

Approx. Sig.

Nominal by Nominal

Phi

,116

,040

Cramer's V

,058

,040

Contingency Coefficient

,115

,040

Interval by Interval

Pearson's R

-,024

,023

-1,084

,279c

Ordinal by Ordinal

Spearman Correlation

-,024

,022

-1,057

,291c

N of Valid Cases

2017

a. Not assuming the null hypothesis.

b. Using the asymptotic standard error assuming the null hypothesis.

c. Based on normal approximation.

Приложение 9

Symmetric Measures

Value

Asymp. Std. Errora

Approx. Tb

Approx. Sig.

Nominal by Nominal

Phi

,126

,010

Cramer's V

,063

,010

Contingency Coefficient

,125

,010

Interval by Interval

Pearson's R

-,009

,023

-,426

,670c

Ordinal by Ordinal

Spearman Correlation

-,034

,023

-1,511

,131c

N of Valid Cases

2017

a. Not assuming the null hypothesis.

b. Using the asymptotic standard error assuming the null hypothesis.

c. Based on normal approximation.

Приложение 10

Ranks

1 ВАШ ПОЛ:

N

Mean Rank

Sum of Ranks

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте то

1 Мужской

597

1072,58

640329,00

2 Женский

1420

982,27

1394824,00

Total

2017

Приложение 11

Test Statisticsa

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ?

Mann-Whitney U

385914,000

Wilcoxon W

1394824,000

Z

-3,305

Asymp. Sig. (2-tailed)

,001

a. Grouping Variable: 1 ВАШ ПОЛ:

Приложение 12

Report

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ?

7 КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ

Mean

N

Std. Deviation

1, Денег не хватает даже на самые необходимые продукты

2,3711

159

1,36666

2, Все деньги расходуются на продукты и покупку

2,3028

1014

1,21688

3, В основном, денег хватает, но приобретение товаров дл

2,2455

660

1,22582

4, Живем обеспеченно, но осуществить некоторые покупки

2,2743

175

1,21493

5, Можем позволить себе практически все, что хотим

2,2222

9

1,39443

Total

2,2866

2017

1,23209

Приложение 13

Test Statisticsa,b

32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте то

Chi-Square

1,585

df

4

Asymp. Sig.

,812

a. Kruskal Wallis Test

b. Grouping Variable: 7 КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.