Анализ признака №32 "Важность качества упаковки" в "Клубе Семейного Досуга": влияние "пола", "места жительства" и "материального положения"
Сущность одномерного распределения как описательного представления отдельных переменных. Вычисление хи-квадрата по формуле Пирсона и при помощи теста Мантеля-Хэнзеля. Установление связи между признаками "важность упаковки" и "материальное положение".
Рубрика | Социология и обществознание |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 19.09.2011 |
Размер файла | 378,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
КУРСОВАЯ РАБОТА
по курсу: "Методы анализа социологической информации"
"Анализ пpизнака №32 "Важность качества упаковки" в "Клубе Семейного Досуга": влияние "пола", "места жительства" и "материального положения"
Содержание
Введение
1. Одномерное (частотное) распределение
2. Двумерные распределения
- 2.1 Анализ зависимости между признаками "важность качества упаковки" и "пол"
- 2.2 Анализ зависимости между признаками "важность качества упаковки" и "материальное состояние семьи"
2.3 Анализ зависимости между признаками "важность качества упаковки" и "место жительства"
2.4 Анализ различий значимости признака
2.5 Значимость различий частот (процентов)
2.6 Значимость различий в разных подвыборках
Вывод
Список литературы
Приложения
Введение
"Книжный Клуб "Клуб Семейного Досуга" объединяет на сегодня 2 000 000 украинских семей, предлагая своим клиентам сервис европейского уровня. Интернет-магазин Клуба предлагает купить книги всех жанров и направлений: лучшие новинки художественной, прикладной, учебной, детской литературы.
Признаки выбранные для написаниия работы:
- Основной признак (зависимая переменная) который будет исследоваться в данной работе "32. Насколько для Вас важно качество упаковки?". Этот признак является порядковым с пяти переменными: "1. Очень важно"; "2. Скорее важно"; "3. Насколько важно, настолько и не важно"; "4. Скорее не важно"; "5. Совсем не важно".
- Дополнительные признаки: один "1. Ваш пол", который является номинальным с двумя значениями - "1. Мужской" и "2. Женский"; второй признак также номинальный "7. Как вы оценили нынешнее материальное положение вашей семьи?" с пятью значениями: "1. Денег не хватает даже на самые необходимые продукты", "2. Все деньги расходуются на продукты и покупку необходимых недорогих вещей", "3. В основном денег хватает, но приобретение товаров длительного пользования (телевизор, холодильник, мебель и др.) затруднительно", "4. Живем обеспеченно, но осуществить некоторые покупки (квартиру, автомобиль и т.п.) пока не в состоянии", "5. Можем позволить себе практически все, что хотим"; третий "9. Вы проживаете" с пятью значениями (номинальный): "1. В областном центре", "2. В районном центре, городе", "3. В районном центре, поселке городского типа", "4. В поселке городского типа", "5. В селе".
Цель - Изучить теоретические основы работы в программе SPSS Statistics и применить полученные теоретические знания на практическом анализе массива данных ksd.sav, который является результатом опроса клиентов "Клуба Семейного Досуга";
Задачи:
1. Из массива данных выбрать признаки по которым будет проводится анализ в программе SPSS Statistics
2. Провести частотный анализ выбранного признака и представить результаты анализа графически:
2.1. На основе полученных результатов проанализировать форму распределения, рассчитать меры центральной тенденции и вариации;
2.2. Сделать вывод по проведенному одномерному распределению на основе имеющихся данных;
3. Провести двумерное распределение исследуемых признаков (зависимый и независимый):
3.1. Результат представить в форме таблиц и графиков;
3.2. Рассчитать критерий хи-квадрат и коэффициенты корреляции, оценить их значимость;
3.3. Содержательно проинтерпретировать данные;
4. Провести анализ различий долей:
4.1. Выбрать одно из значений данного признака и оценить его значение в разных подвыборках;
4.2. Построить доверительный интервал;
4.3. Сделать содержательный вывод;
5. Провести анализ значимости различий данного признака в разных подвыборках:
5.1. Анализ различий исследуемого признака в двух подвыборках;
5.2. Анализ значимости различий данного признака в трех (или более) подвыборках;
5.3. Сделать содержательные выводы
Гипотезы:
1. Суть гипотезы заключается в том, что качество упаковки важно для женщин и не важно - для мужчин.
2. Людям с высоким материальным положением качество упаковки важнее, чем людям с низким материальным положением.
3. Людям проживающим в городе качество упаковки важнее, чем людям проживающим в селе.
1. Одномерное (частотное) распределение
Этот вид анализа включает описательное представление отдельных переменных. К нему относятся создание частотной таблицы, вычисление статистических характеристик или графическое представление. Частотные таблицы строятся для переменных, относящихся к номинальной шкале и для порядковых переменных, имеющих не слишком много категорий.
С помощью данного подхода решаются задачи выявления закона распределения вероятностей случайной величины и одномерных статистик данного распределения: моды, медианы, среднего арифметического, дисперсии, асимметрии и эксцесса. Для переменных относящихся к номинальной шкале нельзя вычислить никаких значимых статистических характеристик. Наиболее часто для порядковых переменных и переменных, относящихся к интервальной шкале, но не подчиняющихся нормальному распределению, вычисляются медианы и оба квартиля. Для переменных, относящихся к интервальной шкале и подчиняющихся нормальному распределению, чаще всего вычисляется среднее значение и стандартное отклонение пли стандартная ошибка. Однако следует выбрать только одну из этих двух характеристик разброса. Для переменных, относящихся ко всем статистическим шкалам, можно построить большое разнообразных графиков, на которых представлены частоты, средние значения или другие характеристики. Для проведения был выбран зависимый признак: "32. Насколько для Вас важно качество упаковки?". Среднее составляет 2.28 - это означает в среднем ответы респондентов варьируются на пункте 2 (Скорее важно). Медиана равна 2. Большинство респондентов считаю, что качество упаковки "скорее важно" на это указывает мода, которая равна 2. Предложенных вариантов ответа 5, значит, минимум равен 1, а максимум 5. Размах равен 4, поскольку размах -- это разница между наибольшим значением (максимумом) и наименьшим значением (минимумом). Стандартное отклонение составляет 1.23. Стандартное отклонение -- это мера разброса измеренных величин; оно равно квадратному корню из дисперсии. Дисперсии равна 1.518.
Результат показан графически.
Распределение не отвечает нормальному т.к.:
1. Коэффициент асимметрии (Skewness) -- это мера отклонения распределения частоты от симметричного распределения, то есть такого, у которого на одинаковом удалении от среднего значения по обе стороны выборки данных располагается одинаковое количество значений. Если наблюдения подчиняются нормальному распределению, то асимметрия равна нулю. Для проверки на нормальное распределение можно применять следующее правило: Если асимметрия значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть. Если вершина асимметричного распределения сдвинута к меньшим значениям, то говорят о положительной асимметрии, в противоположном случае -- об отрицательной. Асимметрия равна 0,734 (ошбка0,055) т.е она левостороння, положительная.
2. Коэффициент вариации или эксцесс (Kurtosis) указывает, является ли распределение пологим (при большом значении коэффициента) или крутым. Коэффициент вариации равен нулю, если наблюдения подчиняются нормальному распределению. Эксцесс равен -0,484 (ошибка 0,109). (см. Приложение №1).
3. Это также подтверждает проведенный тест Колмогорова-Смирнова Asymp. Sig. (2-tailed) равна меньше 0,05, а значит распределение есть не нормальным. (см. Приложение №2).
Тест Колмогорова-Смирнова и Шапиро Уилкса, говорят нам о том, что распределение не является нормальным, это значит, что при дальнейшем анализе нужно применять не параметрические тесты.
В процентом содержание ответы респондентов распределились: очень важно - 32,5%; скорее важно - 32,5%; насколько важно, настолько не важно - 15,9%; скорее не важно - 12%; совсем не важно - 7%. (см.Приложение№3)
Тест Колмогорова-Смирнова равняется 0,302, Шапиро-Уилка равняется 0,803, а их уровень значимости 0,000…, что меньше чем 0,05 или 0,01 т.е. критических значений. Мы можем с вероятностью 0,99% утверждать, что наше распределение не является нормальным, т.е. принимаем гипотезу о различии эмпирического распределения от теоретического (принимаем гипотезу ).
2. Двумерное распределение
Для вычисления критерия хи-квадрат применяются три различных подхода: формула Пирсона, поправка на правдоподобие и тест Мантеля-Хэнзеля. Если таблица сопряженности имеет четыре поля и ожидаемая вероятность менее 5, дополнительно выполняется точный тест Фишера.
Критерий хи-квадрат по Пирсону. Обычно для вычисления критерия хи-квадрат используется формула Пирсона:
Здесь вычисляется сумма квадратов стандартизованных остатков по всем полям таблицы сопряженности. В рассматриваемом нами примере формула Пирсона дает максимально значимую величину критерия хи-квадрат (р<0,001). Корректность проведения теста хи-квадрат определяется двумя условиями: во-первых, ожидаемые частоты < 5 должны встречаться не более чем в 20 % полей таблицы; во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля.
Критерий хи-квадрат с поправкой на правдоподобие. Альтернативой формуле Пирсона для вычисления критерия хи-квадрат является поправка на правдоподобие:
Тест Мантеля-Хэнзел. Дополнительно в таблице сопряженности под обозначением linear-by-linear ("линейный-по-линейному") выводится значение теста Мантеля-Хэнзеля. Эта форма критерия хи-квадрат с поправкой Мантеля-Хэнзеля -- еще одна мера линейной зависимости между строками и столбцами таблицы сопряженности. Она определяется как произведение коэффициента корреляции Пирсона на количество наблюдений, уменьшенное на единицу:
Далее мы попробуем выяснить, какие заключения можно сделать о силе или слабости этой зависимости, а также о ее виде и направленности. Критерии количественной оценки зависимости между переменными называются коэффициентами корреляции или мерами связанности. Две переменные коррелируют между собой положительно, если между ними существует прямое, однонаправленное соотношение. При однонаправленном соотношении малые значения одной переменной соответствуют малым значениям другой переменной, большие значения -- большим. Две переменные коррелируют между собой отрицательно, если между ними существует обратное, разнонаправленное соотношение. При разнонаправленном соотношении малые значения одной переменной соответствуют большим значениям другой переменной и наоборот. Значения коэффициентов корреляции всегда лежат в диапазоне от -1 до +1.
В качестве коэффициента корреляции между переменными, принадлежащими порядковой шкале применяется коэффициент Спирмена, а для переменных, принадлежащих к интервальной шкале -- коэффициент корреляции Пирсона (момент произведений). При этом следует учесть, что каждую дихотомическую переменную, то есть переменную, принадлежащую к номинальной шкале и имеющую две категории, можно рассматривать как порядковую.
2.1 Качество упаковки - пол
Насколько для вас важно качество упаковки?*пол (в %)
Мужщины |
Женщины |
|||
1. |
Очень важно |
28,8 |
34 |
|
2. |
Скорее важно |
30,7 |
33,3 |
|
3. |
Насколько важно, натолько не важно |
18,3 |
14,9 |
|
4. |
Скорее не важно |
13,4 |
11,5 |
|
5. |
Срвсем не важно |
8,9 |
6,3 |
Проведенный анализ показал что: упаковка очень важна для мужчин - 28,8%, для женщин - 34%; скорее важно для мужчин - 30,7, для женщин 33,3%; насколько важно, настолько неважно для мужчин - 18,3%, для женщин - 11,5; скорее не важно для мужчин - 13,4, для женщин - 11,5; совсем не важно для мужчин - 8,9, для женщин - 6,3. (см.Приложение№4).
Можно сделать вывод что для женщин качество упаковки имеет большее значение, чем для мужчин => первая гипотеза подтверждается.
Хи-квадрат значим на уровне 1%, ожидаемая встречаемость меньше 5,наличие неправельных ящеек 0. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 12,514; linear-by-linear ("линейный-по-линейному") выводится значение теста Мантеля-Хэнзеля (11,303). Т.е между признаками существует корреляционная зависимость.
Chi-Square Tests |
||||
Value |
df |
Asymp. Sig. (2-sided) |
||
Pearson Chi-Square |
12,697a |
4 |
,013 |
|
Likelihood Ratio |
12,514 |
4 |
,014 |
|
Linear-by-Linear Association |
11,303 |
1 |
,001 |
|
N of Valid Cases |
2017 |
|||
a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 42,03. |
Кореляция (см. Приложение №7):
a Не подразумевая истинность нулевой гипотезы.
b Используем асимптотическую стандартную ошибку, предполагая истинность нулевой гипотезы.
c На основании нормальной аппроксимации.
Так как здесь нет переменных с интервальной шкалой, мы рассмотрим коэффициент корреляции Спирмена. Он составляет -0,075 и является максимально значимым (р=0,001). Т.е между признаками существует сильная корреляция.
2.2 Качество упаковки - материальное положение
Насколько для вас важно качество упаковки?*материальное положение (в %)
Денег хватает |
Денег хватает на сомое необходимое |
В основном денег хватает |
Живем обеспечено |
Можем позволить все |
|||
1. |
Очень важно |
34 |
31,7 |
33,9 |
30,3 |
33,3 |
|
2. |
Скорее важно |
28,9 |
31,6 |
33,3 |
37,7 |
44,4 |
|
3. |
Насколько важно, настолько не важно |
16,4 |
18,2 |
13 |
13,7 |
- |
|
4. |
Скорее не важно |
7,5 |
11,9 |
13,6 |
10,9 |
11,1 |
|
5. |
Совсем не важно |
13,2 |
6,6 |
6,1 |
7,4 |
11,1 |
Основываясь на проведенном анализе представленном в виде таблицы и графика можно сделать вывод что вторая гипотеза подтверждается (людям с высоким материальным положением качество упаковки важнее, чем людям с низким материальным положением).
Проведенный анализ показал что: качество упаковки "очень важно" для людей которые ответили что денег не хватает на 34%; денег хватает на самое необходимое - 31,7%; в основном денег хватает - 33,9%, живем обеспеченно - 30,3%, можем позволить себе все - 33,3; "скорее важно" для людей которые ответили что денег не хватает на 28,9%; денег хватает на самое необходимое - 31,6%; в основном денег хватает - 33,3%, живем обеспеченно - 37,7%, можем позволить себе все - 44,4%; "насколько важно, настолько не важно" для людей которые ответили, что денег не хватает на 16,4%; денег хватает на самое необходимое - 18,2%; в основном денег хватает - 13%, живем обеспеченно - 13,7%; "скорее не важно" для людей которые ответили что денег не хватает на 7,5%; денег хватает на самое необходимое - 11,9%; в основном денег хватает - 13,6%, живем обеспеченно - 10,9%, можем позволить себе все - 11,1%; "совсем не важно" для людей которые ответили что денег не хватает на 13,2%; денег хватает на самое необходимое - 6,6%; в основном денег хватает - 6,1%, живем обеспеченно - 7,4%, можем позволить себе все - 11,1. (см. Приложение №5)
Chi-Square Tests
Value |
df |
Asymp. Sig. (2-sided) |
||
Pearson Chi-Square |
27,092a |
16 |
,040 |
|
Likelihood Ratio |
27,141 |
16 |
,040 |
|
Linear-by-Linear Association |
1,175 |
1 |
,278 |
|
N of Valid Cases |
2017 |
|||
a. 5 cells (20,0%) have expected count less than 5. The minimum expected count is ,63. |
Хи-квадрат значим на уровне 5%, 5 ячеек (20%) имеют ожидаемую частоту менее 5.
Минимальная ожидаемая частота 0,63.
В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 27,141; linear-by-linear ("линейный-по-линейному") выводится значение теста Мантеля-Хэнзеля - 1,175.
Т.е между признаками существует слабая корреляционная зависимость.
Кореляция (см. Приложение №8):
a Не подразумевая истинность нулевой гипотезы.
b Используем асимптотическую стандартную ошибку, предполагая истинность нулевой гипотезы.
c На основании нормальной аппроксимации.
Так как здесь нет переменных с интервальной шкалой, мы рассмотрим коэффициент корреляции Спирмена.
Он составляет -0,024 и является значимым (р=0,29).
2.3 Качество упаковки - место проживания
Насколько для вас важно качество упаковки?*место жительства
В обл. центре |
В р-м ценре,городе |
В р-м центре, поселки гор.типа |
В поселке гор. Типа |
В селе |
|||
1. |
Очень важно |
25,4 |
34,4 |
28,9 |
32,2 |
36 |
|
2. |
Скорее важно |
36,7 |
33,2 |
31,6 |
32,2 |
28,4 |
|
3. |
Насколько важно, настолько не важно |
15,3 |
15,9 |
18,4 |
17,5 |
15,5 |
|
4. |
Скорее не важно |
15,6 |
11,5 |
9,6 |
9,8 |
11,2 |
|
5. |
Совсем не важно |
7 |
5,1 |
11,4 |
8,4 |
8,9 |
Проведенный анализ показал что: качество упаковки "очень важно" для людей проживающих в областном центре на 24,4%, в районном центре, городе - 34,4%, в районном центре, поселке городского типа - 28,9%, в поселке городского типа - 32,2%, в селе - 36%; "скорее важно" для людей проживающих в областном центре на 36,7%, в районном центре, городе - 33,2%, в районном центре, поселке городского типа - 31,6%, в поселке городского типа - 32,2%, в селе - 28,4%; "насколько важно, настолько не важно" для людей проживающих в областном центре на 15,6%, в районном центре, городе - 11,5%, в районном центре, поселке городского типа - 9,6%, в поселке городского типа - 9,8%, в селе - 11,2%; "совсем не важно" для людей проживающих в областном центре на 7%, в районном центре, городе - 5,1%, в районном центре, поселке городского типа - 11,4%, в поселке городского типа - 8,4%, в селе - 8,9%. (см. Приложение №6)
Основываясь на этих данных можно сделать вывод о том что третья гипотеза не подтвердилась (Гипотеза №3. Людям проживающим в городе качество упаковки важнее, чем людям проживающим в селе).
Далее наглядно представлено графическое изображение проведенного анализа, где можно четко выше описанные тенденции.
Хи-квадрат значим на уровне 1%, 5 ячеек (0%) имеют ожидаемую частоту менее 5. Минимальная ожидаемая частота 8,03. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 31,974; linear-by-linear ("линейный-по-линейному") выводится значение теста Мантеля-Хэнзеля - 0,182. Т.е между признаками существует корреляционная зависимость.
Chi-Square Tests |
||||
Value |
df |
Asymp. Sig. (2-sided) |
||
Pearson Chi-Square |
32,024a |
16 |
,010 |
|
Likelihood Ratio |
31,974 |
16 |
,010 |
|
Linear-by-Linear Association |
,182 |
1 |
,670 |
|
N of Valid Cases |
2017 |
|||
a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 8,03. |
Кореляция (см. Приложение №9):
a Не подразумевая истинность нулевой гипотезы.
b Используем асимптотическую стандартную ошибку, предполагая истинность нулевой гипотезы.
c На основании нормальной аппроксимации.
Так как здесь нет переменных с интервальной шкалой, мы рассмотрим коэффициент корреляции Спирмена. Он составляет -0,34 и является значимым (р=0,13). Есть слабая корелляция.
3. Анализ различий
3.1 Анализ значимости различий долей (процентов)
Мы установили, что существует слабая связь между признаками "важность упаковки" и "материальное положение". Следуя гипотезе, выведенной в программе исследования, нам нужно установить, существует ли статистически значимое различие в важности качества упаковки, между такими группами, которым не хватает денежных средств и, теми кому не хватает.
Просто сравнить проценты мы не можем, так как мы сравниваем выборки, которые с ошибками представляют генеральную совокупность, для этого нам нужно убедиться, что данные расхождения не обусловлены случайными факторами, т.е. рассчитать статистическую значимость расхождения. Расчет значимости расхождений процентов являет собой проверку статистической гипотезы о равенстве процентов определенного признака у двух независимых выборках.
Ранее мы выяснили, что распределение нашего признака "32. Важность качества упаковки" не подчиняется закономерностям нормального распределения, поэтому для анализа значимости различий корректнее использовать непараметрические тесты.
Для этого в двумерных распределениях выводим нормированные остатки, которые показывают разницу между ожидаемой и измеряемой частотой.
Таблица сопряженности 32. Насколько для вас важно качество упаковки? * материальное положение
Как бы вы оценили нынешнее материальное положение вашей семьи? |
Итого |
|||||
Денег не хватает |
Хватает |
|||||
32.Насколько для вас важно качество упаковки? |
1, Очень важно |
Частота |
54 |
601 |
665 |
|
Ожидаемая частота |
51,6 |
659,3 |
655,0 |
|||
Стандартиз. остаток |
0,3 |
0,3 |
||||
2, Скорее важно |
Частота |
46 |
610 |
656 |
||
Ожидаемая частота |
51,7 |
604,2 |
656,0 |
|||
Стандартиз. остаток |
-0,8 |
2,1 |
||||
3, Насколько важно, настолько не важно |
Частота |
26 |
295 |
321 |
||
Ожидаемая частота |
25,3 |
295,7 |
321,0 |
|||
Стандартиз. остаток |
0,1 |
-1,9 |
||||
4, Скорее важно |
Частота |
12 |
231 |
243 |
||
Ожидаемая частота |
19,2 |
223,9 |
243,0 |
|||
Стандартиз. остаток |
-1,6 |
0,6 |
||||
5, Скорее не важно |
Частота |
21 |
121 |
142 |
||
Ожидаемая частота |
11,2 |
130,8 |
142, |
|||
Стандартиз. остаток |
2,9 |
-0,7 |
||||
Итого |
Частота |
159 |
1858 |
2017 |
||
Ожидаемая частота |
159,0 |
1858,0 |
2017,0 |
Именно, сравнение ожидаемых и измеряемых частот, позволит нам сделать выводы о статистическом различии процентов. Считается, что о значимом расхождение частот, ожидаемых и рассчитанных, можно судить, если нормированный остаток больше или равняется.
Мы можем увидеть, что статистически значимо отличается только категория "скорее важно", т.е. действительно ответы в двумерном распределении на категорию "скорее важно", значимо разнятся между собой. Можно утверждать, что члены клуба, которым "хватает денежных средств" меньше обращают внимание на упаковку, чем те которым не хватают денежных средств
Сравнение пропорций по столбцам
Как бы вы оценили нынешнее материальное положение вашей семьи? |
||||
Денег не хватает |
Хватает |
|||
(A) |
(B) |
|||
32.Насколько для вас важно качестао упаковки? |
1, Очень важно |
|||
2, Скорее важно |
А |
|||
3, Насколько важно, настолько не важно |
||||
4, Скорее важно |
||||
5, Скорее не важно |
В |
3.2 Анализ значимости различий в разных подвыбоках
Первый дополнительный признак "Пол", следовательно, подвыборки - "женщины" и "мужчины". Второй признак "Материальное положение" с пятью значениями "1. Денег не хватает даже на самые необходимые продукты", "2. Все деньги расходуются на продукты и покупку необходимых недорогих вещей", "3. В основном денег хватает, но приобретение товаров длительного пользования (телевизор, холодильник, мебель и др.) затруднительно", "4. Живем обеспеченно, но осуществить некоторые покупки (квартиру, автомобиль и т.п.) пока не в состоянии", "5. Можем позволить себе практически все, что хотим".
Сначала необходимо провести проверку нормальности распределения основного исследуемого признака "32. Насколько для вас важно качество упаковки?". Данная проверка была проведена в первой части работы: визуальная проверка показала не нормальность распределения, что подтвердил тест Колмогорова-Смирнова (см. Приложение №2), который показал, что Asymp. Sig. (2-tailed) равна меньше 0,05, а значит распределение есть не нормальным. Значит на необходимо использовать не параметрические тести:
а). U-тест за методом Манна-Уитни - Это самый известный и самый распространенный тест непараметрического сравнения двух независимых выборок. Он основан на использовании одной общей последовательности значений обоих выборок;
б). Н-тест за методом Краскела-Уоллиса - Этот тест является модификацией U-теста Манна и Уитни на случай для более двух 1езависимых выборок. Он также базируется на общей ранговой последовательности значений всех выборок.
а). Групповая переменная: пол. Выведенные результаты включают следующие показатели:
- количество наблюдений (N мужчин=597, N женщин=1420), усреднённые ранги (Mean Rank женщин = 982,27, Mean Rank мужчин = 1072,58) и ранговая сумма для двух выборок (Sum of Ranks мужчин =640329, Sum of Ranks женщин = 1394824), причём большим значениям присваиваются низшие ранговые места (см.Приложение№10)
- тестовую величину U, определенную с помощью теста Манна и Уитни = 385914,000;
- наименьшее значение из обоих ранговых сумм (W-тест Уилкоксона)= 1394824,000;
- точное значение вероятности ошибки р при количестве наблюдений менее 30 (р=0,001). Выясняется, что в рассматриваемом примере разница показателей является статистически значимой; (см.Приложение№11)
- тестовую величину z, определенную по тесту Колмогорова-Смирнова, а также относящуюся к ней вероятность ошибки р, которую следует использовать при количестве наблюдений более 30.
Выясняется, что в рассматриваемом примере разница показателей является статистически значимой.
б). В данном случае нам необходимо протестировать пять категории из рассмотренного выше исследования предмет значимости различия значение важности качества упаковки и материальным положением респондентов. вычислили средние значения исходного показателя важности качества упаковки для пяти статусных категорий, то получили бы следующие результаты:
КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ СЕМЬИ? |
Среднее значение |
N |
Стандартное отклонение |
|
1, Денег не хватает даже на самые необходимые продукты |
2,3711 |
159 |
1,36666 |
|
2, Все деньги расходуются на продукты и покупку |
2,3028 |
1014 |
1,21688 |
|
3, В основном, денег хватает, но приобретение товаров дл |
2,2455 |
660 |
1,22582 |
|
4, Живем обеспеченно, но осуществить некоторые покупки |
2,2743 |
175 |
1,21493 |
|
5, Можем позволить себе практически все, что хотим |
2,2222 |
9 |
1,39443 |
|
Total |
2,2866 |
2017 |
1,23209 |
Далее проводим Н-тест за методом Краскела-Уоллиса. В результаты расчёта входят:
· усреднённые ранги в отдельных группах (где большим значениям отдаются более высокие места);
· величина критерия хи-квадрат (1,5), соответствующее число степеней свободы (df)- 4, и вероятность ошибки р.
В данном примере для которого р = 0,812 граница значимости преодолена значительно, это означает, что наблюдается тенденция к проявлению закономерности. (см. Приложение №13)
Выводы
распределение переменная формула пирсон признак
После построения одномерного распределения, мы увидели, что больше половины респондентов считают, что качество упаковки очень важно. Распределение было не нормальным, что подтвердили тесты Колмогорова-Смирнова и Шапиро-Уилкина, следовательно, необходимо в дальнейшем исследование использовать не параметрические тесты.
Также проведение анализа показало, что первая гипотеза полностью подтверждается. Существует зависимость и корреляционная связь между "важностью упаковки" и "полом". С программы исследования предполагалось, что признак №1 влияет на признак №32, но значения коэффициентов слишком приближены друг к другу.
Мы выяснили, что распределение нашего основного признака не является нормальным, и это было причиной использования в дальнейшем, разных коэффициентов, не основанных на нормальном распределении.
Также мы установили, что существует, предположительно, опосредованная связь, между признаком "важность качества упаковки" и признаками "место проживание" и "материальное положение". При помощи анализа различий выяснили, что проживающих в городах членам клуба, качество упаковки менее важно, чем членам клуба проживающим вне города. Это различие является статистически значимым. Т.е. третья гипотеза о том, что людям проживающим в городе качество упаковки важнее, чем людям проживающим в селе не подтвердилась. Вторая гипотеза о влияние материального положения на важность качества упаковки - подтверждается, это различие имеет статистическую разницу.
Список литературы:
1. Бюлль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. - СПб.: ООО "ДиаСофтЮП", 2005. - 608 с.
2. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS. - М.: ГУ ВШЭ, 2007. -281 с.
3. Паніотто В.І., Максименко В.С., Марченко Н.М. Статистичний аналіз соціологічних даних. - К.: КМ Академія, 2004. - 270 с.
Приложение №1
Statistics |
|||
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? |
|||
N |
Valid |
2017 |
|
Missing |
1 |
||
Mean |
2,2866 |
||
Median |
2,0000 |
||
Mode |
2,00 |
||
Std. Deviation |
1,23209 |
||
Variance |
1,518 |
||
Skewness |
,734 |
||
Std. Error of Skewness |
,055 |
||
Kurtosis |
-,484 |
||
Std. Error of Kurtosis |
,109 |
||
Range |
4,00 |
||
Minimum |
1,00 |
||
Maximum |
5,00 |
Приложение №2
One-Sample Kolmogorov-Smirnov Test |
|||
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? |
|||
N |
2017 |
||
Normal Parametersa,,b |
Mean |
2,2866 |
|
Std. Deviation |
1,23209 |
||
Most Extreme Differences |
Absolute |
,242 |
|
Positive |
,242 |
||
Negative |
-,148 |
||
Kolmogorov-Smirnov Z |
10,865 |
||
Asymp. Sig. (2-tailed) |
,000 |
||
a. Test distribution is Normal. |
|||
b. Calculated from data. |
Приложение №3
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? |
||||||
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
|||
Valid |
1, Очень важно |
655 |
32,5 |
32,5 |
32,5 |
|
2, Скорее, важно |
656 |
32,5 |
32,5 |
65,0 |
||
3, Насколько важно, настолько и не важно |
321 |
15,9 |
15,9 |
80,9 |
||
4, Скорее, не важно |
243 |
12,0 |
12,0 |
93,0 |
||
5, Совсем не важно |
142 |
7,0 |
7,0 |
100,0 |
||
Total |
2017 |
100,0 |
100,0 |
|||
Missing |
-99,00 |
1 |
,0 |
|||
Total |
2018 |
100,0 |
Приложение №4
ВАШ ПОЛ: |
|||||
1 ВАШ ПОЛ: |
Total |
||||
1 Мужской |
2 Женский |
||||
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте только один пункт) |
1, Очень важно |
28,8% |
34,0% |
32,5% |
|
2, Скорее, важно |
30,7% |
33,3% |
32,5% |
||
3, Насколько важно, настолько и не важно |
18,3% |
14,9% |
15,9% |
||
4, Скорее, не важно |
13,4% |
11,5% |
12,0% |
||
5, Совсем не важно |
8,9% |
6,3% |
7,0% |
||
Total |
100,0% |
100,0% |
100,0% |
Приложение №5
КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ |
||||||||
КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ |
Total |
|||||||
1, Денег не хватает даже на самые необходимые продукты |
2, Все деньги расходуются на продукты и покупку |
3, В основном, денег хватает, но приобретение товаров дл |
4, Живем обеспеченно, но осуществить некоторые покупк |
5, Можем позволить себе практически все, что хотим |
||||
32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? |
1, Очень важно |
34,0% |
31,7% |
33,9% |
30,3% |
33,3% |
32,5% |
|
2, Скорее, важно |
28,9% |
31,6% |
33,3% |
37,7% |
44,4% |
32,5% |
||
3, Насколько важно, настолько и не важно |
16,4% |
18,2% |
13,0% |
13,7% |
15,9% |
|||
4, Скорее, не важно |
7,5% |
11,9% |
13,6% |
10,9% |
11,1% |
12,0% |
||
5, Совсем не важно |
13,2% |
6,6% |
6,1% |
7,4% |
11,1% |
7,0% |
||
Total |
100,0% |
100,0% |
100,0% |
100,0% |
100,0% |
100,0% |
Приложение №6
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? |
||||||||
(отметьте только один пункт) |
||||||||
9 ВЫ ПРОЖИВАЕТЕ: (отметьте только один пункт) |
Total |
|||||||
1. В обл. центре |
2. В районном центре, городе |
3. В р-м центре, поселке гор. типа |
4. В поселке гор. типа |
5. В селе |
||||
32, НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте то |
1, Очень важно |
25,4% |
34,4% |
28,9% |
32,2% |
36,0% |
32,5% |
|
2, Скорее, важно |
36,7% |
33,2% |
31,6% |
32,2% |
28,4% |
32,5% |
||
3, Насколько важно, настолько и не важно |
15,3% |
15,9% |
18,4% |
17,5% |
15,5% |
15,9% |
||
4, Скорее, не важно |
15,6% |
11,5% |
9,6% |
9,8% |
11,2% |
12,0% |
||
5, Совсем не важно |
7,0% |
5,1% |
11,4% |
8,4% |
8,9% |
7,0% |
||
Total |
100,0% |
100,0% |
100,0% |
100,0% |
100,0% |
100,0% |
Приложение №7
Symmetric Measures |
||||||
Value |
Asymp. Std. Errora |
Approx. Tb |
Approx. Sig. |
|||
Nominal by Nominal |
Phi |
,079 |
,013 |
|||
Cramer's V |
,079 |
,013 |
||||
Contingency Coefficient |
,079 |
,013 |
||||
Interval by Interval |
Pearson's R |
-,075 |
,023 |
-3,371 |
,001c |
|
Ordinal by Ordinal |
Spearman Correlation |
-,074 |
,022 |
-3,313 |
,001c |
|
N of Valid Cases |
2017 |
|||||
a. Not assuming the null hypothesis. |
||||||
b. Using the asymptotic standard error assuming the null hypothesis. |
||||||
c. Based on normal approximation. |
Приложение№8
Symmetric Measures |
||||||
Value |
Asymp. Std. Errora |
Approx. Tb |
Approx. Sig. |
|||
Nominal by Nominal |
Phi |
,116 |
,040 |
|||
Cramer's V |
,058 |
,040 |
||||
Contingency Coefficient |
,115 |
,040 |
||||
Interval by Interval |
Pearson's R |
-,024 |
,023 |
-1,084 |
,279c |
|
Ordinal by Ordinal |
Spearman Correlation |
-,024 |
,022 |
-1,057 |
,291c |
|
N of Valid Cases |
2017 |
|||||
a. Not assuming the null hypothesis. |
||||||
b. Using the asymptotic standard error assuming the null hypothesis. |
||||||
c. Based on normal approximation. |
Приложение №9
Symmetric Measures |
||||||
Value |
Asymp. Std. Errora |
Approx. Tb |
Approx. Sig. |
|||
Nominal by Nominal |
Phi |
,126 |
,010 |
|||
Cramer's V |
,063 |
,010 |
||||
Contingency Coefficient |
,125 |
,010 |
||||
Interval by Interval |
Pearson's R |
-,009 |
,023 |
-,426 |
,670c |
|
Ordinal by Ordinal |
Spearman Correlation |
-,034 |
,023 |
-1,511 |
,131c |
|
N of Valid Cases |
2017 |
|||||
a. Not assuming the null hypothesis. |
||||||
b. Using the asymptotic standard error assuming the null hypothesis. |
||||||
c. Based on normal approximation. |
Приложение №10
Ranks |
|||||
1 ВАШ ПОЛ: |
N |
Mean Rank |
Sum of Ranks |
||
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте только один пункт) |
1 Мужской |
597 |
1072,58 |
640329,00 |
|
2 Женский |
1420 |
982,27 |
1394824,00 |
||
Total |
2017 |
Приложение№11
Test Statisticsa |
||
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? |
||
Mann-Whitney U |
385914,000 |
|
Wilcoxon W |
1394824,000 |
|
Z |
-3,305 |
|
Asymp. Sig. (2-tailed) |
,001 |
|
a. Grouping Variable: 1 ВАШ ПОЛ: |
Приложение №12
Report |
||||
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? |
||||
КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ |
Mean |
N |
Std. Deviation |
|
1, Денег не хватает даже на самые необходимые продукты |
2,3711 |
159 |
1,36666 |
|
2, Все деньги расходуются на продукты и покупку |
2,3028 |
1014 |
1,21688 |
|
3, В основном, денег хватает, но приобретение товаров дл |
2,2455 |
660 |
1,22582 |
|
4, Живем обеспеченно, но осуществить некоторые покупк |
2,2743 |
175 |
1,21493 |
|
5, Можем позволить себе практически все, что хотим |
2,2222 |
9 |
1,39443 |
|
Total |
2,2866 |
2017 |
1,23209 |
Приложение №13
Test Statisticsa,b |
||
НАСКОЛЬКО ДЛЯ ВАС ВАЖНО КАЧЕСТВО УПАКОВКИ? (отметьте только один пункт) |
||
Chi-Square |
1,585 |
|
df |
4 |
|
Asymp. Sig. |
,812 |
|
a. Kruskal Wallis Test |
||
b. Grouping Variable: КАК БЫ ВЫ ОЦЕНИЛИ НЫНЕШНЕЕ МАТЕРИАЛЬНОЕ ПОЛОЖЕНИЕ ВАШЕЙ |
Размещено на Allbest.ru
Подобные документы
Суть одномерного (частотного) и двумерного распределение в социологических исследованиях. Анализ зависимости между признаками "важность качества упаковки", "пол", "материальное состояние семьи" и "место жительства". Значимость различий в разных выборках.
курсовая работа [911,4 K], добавлен 03.12.2011Анализ уровня организации семейного досуга в городе Камышине. Роль социально-культурных учреждений в подготовке семейного досуга. Воспитание как реализация определённой системы. Характеристика социальной формы отношений между женщиной и мужчиной.
курсовая работа [35,6 K], добавлен 24.03.2015Лица без определенного места жительства как клиенты социальной работы. Сущность бродяжничества и бездомности. Организация социальной адаптации для лиц без определенного места жительства в государственное автономное учреждение социального обслуживания.
курсовая работа [461,4 K], добавлен 30.03.2015Проблемы социальной помощи. Учет граждан без определенного мета жительства. Определение понятий "бомж", "социальная работа". Причины появления лиц, оказавшихся без определенного места жительства. Механизм социальной защиты бомжей в Башкортостане.
контрольная работа [23,0 K], добавлен 21.01.2011Составная часть обработки данных статистического наблюдения-построение рядов распределения. Характеристики, графические изображения вариационного ряда. Оценка тесноты связи между количественными признаками, ранговые коэффициенты К.Спирмэна и М.Кендэла.
контрольная работа [72,9 K], добавлен 24.09.2008Проблемы и причины бездомности и бродяжничества в России. Формы предоставления социальной помощи. Понятие социальных центров, их задачи и признаки. Организация работы социальных центров для граждан без определенного места жительства и ее регулирование.
курсовая работа [30,3 K], добавлен 02.05.2017- Художественно творческое развитие детей дошкольного возраста в практике организации семейного досуга
Проект по реализации потенциала семейного досуга в практике художественно-творческого развития детей дошкольного возраста в условиях семейного клуба. Особенности детского продуктивного творчества. Формирование мировосприятия ребёнка средствами искусства.
дипломная работа [356,8 K], добавлен 18.11.2013 Понятие бездомности в контексте инвалидности и пожилого возраста. Причины появления и группы проблем бездомных. Комплексное изучение содержания социальной работы с лицами без определенного места жительства, а также определение путей ее совершенствования.
дипломная работа [86,6 K], добавлен 03.12.2015Важность и особенности социально-культурной деятельности. Популярные виды комплексных досуговых программ. Современное состояние и перспективы развития социально-культурной деятельности в Государственном учреждении "Дом народного творчества и досуга".
курсовая работа [44,2 K], добавлен 12.07.2013Культурно-досуговая деятельность молодых семей. Современное состояние организации социокультурной деятельности молодых семей и факторы его обуславливающие. Внедрение педагогической модели развития семейного досуга. Анализ семейного досуга молодых семей.
курсовая работа [129,5 K], добавлен 13.07.2014