Корреляционные исследования и их особенности

Планирование эксперимента как математико-статистическая дисциплина. Поиск оптимальных условий и правил проведения опытов с целью получения информации об объекте с наименьшей затратой труда. Теория корреляционного исследования, меры корреляционной связи.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 03.08.2014
Размер файла 1,8 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Пензенский Филиал НОУ ВПО

" Академия Международного Независимого Эколого-Политологического Университета"

Факультет: Экологии, управления и права

Специальность: Психология

Дисциплина: Экспериментальная психология.

КУРСОВАЯ РАБОТА

На тему: "Корреляционные исследования и их особенности"

Работу выполнила: студентка группы ПЗ-3

Садырова Марина

Научный руководитель: преподаватель

кандидат психологических

наук, доцент Бочкарева Л.П.

Пенза, 2013г.

Содержание

  • Глава 1. Корреляционное исследование
  • Глава 2. Планирование корреляционного исследования
  • Заключение
  • Библиографический список
  • Приложение

Введение

Планирование эксперимента - математико-статистическая дисциплина, которая изучает методы рациональной организации экспериментальных исследований - от оптимального выбора исследуемых факторов, определения собственно плана эксперимента в соответствии с его целью до методов анализа результатов. Английский статистик Р. Фишер (1935) положил начало планирования эксперимента. Современная теория планирования эксперимента сложилась в 60-х годах 20 века. Методы ее были тесно связаны с теорией приближения функций и математическим программированием. Оптимальные планы построены, и исследованы их свойства для широкого класса моделей. Планировать эксперимента это значит выбор плана эксперимента, удовлетворяющего заданным требованиям.

В ходе измерений, последующей обработки данных и формализации результатов в виде математической модели, возникают погрешности и происходят потери частей информации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными затратами.

Цель планирования эксперимента заключается - нахождение таких условий и правил проведения опытов, при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда. Предоставить эту информацию в компактной и удобной форме с количественной оценкой точности. Среди основных методов планирования, применяемых на разных этапах исследования, применяются:

планирование отсеивающего эксперимента, заключается в выделение из всей совокупности факторов группы существенных факторов, подлежащих дальнейшему детальному изучению;

планирование эксперимента для дисперсионного анализа (составление планов для объектов с качественными факторами);

планирование регрессионного эксперимента, с помощью которого получаются регрессионные модели (полиномиальные и иные);

планирование экстремального эксперимента, в котором главная задача - экспериментальная оптимизация объекта исследования;

планирование при изучении динамических процессов и т.д.

Глава 1. Корреляционное исследование

Детальная характеристика особенностей психологического измерения и тестирования необходима для того, чтобы можно было подойти к выяснению особенностей наиболее распространенной схемы современного психологического эмпирического исследования - корреляционного.

Теория корреляционного исследования, основанная на представлениях о мерах корреляционной связи, разработана К. Пирсоном. Подробно излагается в учебниках по математической статистике. Здесь рассматриваются лишь методические аспекты корреляционного психологического исследования [6].

Стратегия проведения корреляционного исследования сходна с квазиэкспериментом. Отличие от квазиэксперимента то, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследователь выдвигает гипотезу о наличии статистической связи между несколькими психическими свойствами индивида или между определенными внешними уровнями и психическими состояниями. Предположения о причинной зависимости не обсуждаются.

Корреляционным исследованием называется такое исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными. В психологии в качестве переменных могут выступать психические свойства, процессы, состояния и др. Роберт Готтсданкер говорил, что в данных исследованиях не производилось активных действий с целью вызвать различия в поведении, а лишь отыскивалась корреляция между существующими различиями [5]

В прямом переводе "Корреляция" означает "соотношение". Если изменение одной переменной сопровождается изменением другой, то можно сказать о корреляции этих переменных. Обнаружение корреляции двух переменных ничего не говорит о причинно-следственных зависимостях между ними, но дает возможность задавать такую гипотезу. Отсутствие корреляции позволяет отвергнуть гипотезу о причинно-следственной связи переменных [9].

В принципе корреляционные исследования могли бы быть проведены, как и активный эксперимент. В связи с тем, что это практически неосуществимо, так как возникают проблемы с внутренней валидности. Корреляционное исследование, так же как и активный эксперимент, внутренне валидно в зависимости от того, насколько оно близко к идеальному.

1. Особенности корреляционного исследования:

1. Не производится активных действий с целью вызвать различия в поведении, а лишь отыскивается корреляция между существующими различиями;

2. Не ведет к установлению причинно-следственных связей - речь идет о взаимосвязи переменных;

3. Предметом корреляционных исследований обычно являются различия между людьми: по интеллекту, способностям или отдельным чертами личности, а не сходные реакции испытуемых;

4. Угроза внутренней валидности, так как всегда присутствует смешение;

5. Проводится уравнивание групп по переменным смешения:

ь Подбор пар испытуемых,

ь Составление однородных групп;

6. Следует помнить, что контроль в корреляционном исследовании никогда не будет таким же адекватным, как это возможно в активном эксперименте.

7. Возможность проверки гипотез о соотношении и взаимодействии факторов без их активного изменения [4].

2. Контроль в корреляционных исследованиях

корреляционное исследование связь

Общая проблема контроля в корреляционных исследованиях та же, что и в активных экспериментах, - систематическое смешение с побочной переменной. Но в корреляционном исследовании мы не можем активно организовать контрольные условия, а вместо этого должны воспользоваться статистическим контролем смешения. Уравнивание групп в корреляционных исследованиях производится двумя способами [8].

Подбор пар испытуемых. В случае если число испытуемых невелико, применяется индивидуальный подбор пар. В исследовании психологической приспособленности - подбор пар хорошо и плохо приспособленных испытуемых, которые были бы сходны по интеллекту родителей и социально-экономическому положению. Допустим, что удалось бы найти 50 таких пар. В этом случае между группами уже не было бы различий по названным двум побочным переменным.

Этот метод связан с двумя трудностями. Во-первых, если побочная переменная и в самом деле существенна, то при подборе групп должна обнаружиться диспропорция в количестве хорошо и плохо приспособленных. Большинство хорошо приспособленных испытуемых могут происходить из семей с высоким социально-экономическим положением. Это создаст трудности для нахождения большого числа уравненных пар: среди испытуемых с высоким социально-экономическим положением будет слишком мало тех, у кого плохая психологическая приспособленность. Эта трудность станет особенно серьезной, если мы попытаемся уравнять индивидов не по одной, а по нескольким побочным переменным. При этом число соответствующих пар очень резко сократится. Теоретически никогда нельзя быть уверенным, что проконтролированы все значимые побочные переменные. Практически мы крайне ограничены в числе переменных, которые действительно можем проконтролировать [5].

Во-вторых, вторая трудность тесно связана с первой - это непредставительность выделенных для исследования испытуемых. Предположим, что для высоко приспособленного индивида характерно иметь родителей интеллигентных, с высоким социально-экономическим положением, а также с хорошей собственной психологической приспособленностью. Однако большая часть таких испытуемых будет отвергнута в процессе составления пар. В то же время это будут те самые испытуемые, чьи родители применяли хорошие способы воспитания. Таким образом, процедура уравнивания может нивелировать влияние процессов воспитания.

Делаем вывод, метод подбора пар несет в себе две опасности: мы можем осуществить недостаточный контроль и мы можем переусердствовать с контролем. Недостаточный контроль приведет к тому, что будет упущена значимая побочная переменная, а избыточный контроль - к тому, что диапазон изменений действительной независимой переменной будет ограничен [5].

Составление однородных подгрупп

В связи с тем, что исследование влияния порядка рождения на интеллект проводилось на очень большом числе испытуемых, в нем не было необходимости составлять индивидуально уравненные пары. Вместо этого были составлены однородные подгруппы, которые были уравнены по всем переменным, кроме одной, интересующей исследователей. Так, различие между вторыми пятым ребенком могло сравниваться внутри однородных подгрупп семей, содержащих пять детей, шесть детей, семь детей и т.д. Если бы этого не делалось, сравнивались бы все дети, родившиеся вторыми, со всеми пятыми детьми, то произошло бы смешение с величиной семьи. Так как пятые дети есть только в больших семьях, тогда как второй ребенок есть и в большой, и в маленькой семье.

Основанием для образования подгрупп могли быть также и другие переменные, имеющие шанс оказаться значимыми, но опущенные в данном исследовании, например возраст матери и др. Это лучше всего было бы сделать после распределения испытуемых по группам на основании численности семьи. Например, в семьях с пятью детьми можно было сравнить между собой детей - от первого до пятого включительно - только таких, матери которых достигли к моменту их рождения 23 лет. Точно также сравнение могло быть сделано между детьми для 24-летних матерей и т.д. И если влияние порядка рождения на интеллект исчезло бы при сохранении постоянным возраста матери, то мы бы признали, что имели дело с эффектом непорядка рождения, а возраста матери. Более вероятно, конечно, что порядок рождения скажется на различиях между испытуемыми, даже если возраст матери, и обнаружит свой самостоятельный вклад [5].

Переменную брачного стажа тоже можно "проконтролировать с помощью однородных подгрупп. Такие подгруппы можно было бы образовать для одно-, двух-, трехлетнего стажа и т.д. к моменту рождения исследуемого ребенка.

Если для различных однородны подгрупп обнаруживается различное влияние, интересующей нас переменной. То это может привести к более глубокому пониманию механизмов действия, данной переменной. Возьмем влияние только очередности рождения как таковое вне связи с возрастом матери или брачным стажем. Существует взаимодействие между влиянием социального положения и влиянием порядка рождения на показатель интеллекта (см. Приложение таблица 1). Взаимодействия обнаруживается в корреляционных исследованиях так же, как и в активных экспериментах. Для вычисления основного результата действия и взаимодействий мы можем использовать тот же самый тип таблиц.

Возможно, что сельская жизнь менее изматывает, чем городская. Горожанин, в общем, более утомлен, и поскольку с появлением ребенка связаны новые заботы и новые усилия, понятно его нежелание нового ребенка. Здоровый фермер не чувствует этих опасений. Поздний ребенок в городской семье будет страдать от недостатка энергии у родителей, а в сельской семье этого не произойдет. Таким образом, основу эффекта порядка рождения составят не различия в желательности-нежелательности, а скорее величина энергии родителей, которая лишь коррелирует с желанием завести нового ребенка [5].

Итак, благодаря методу составления однородных подгрупп в корреляционных исследованиях оказывается возможным многосторонний контроль. Тем не менее, мы никогда не можем знать, действительно ли данный фактор-предпосылка влияет на выбранный поведенческий показатель. Как и в случае подбора пар испытуемых, у нас нет способа узнать, учтены ли все значимые побочные переменные. Более того, когда мы наконец свели наблюдаемый эффект к той переменной, которая кажется решающей, у нее еще остается возможность, что реальным детерминантом поведения была какая-то другая коррелирующая с ней переменная. Эта трудность и породила известное высказывание, что корреляцию не следует путать с причинностью.

Исследование с целью отбора контролеров

Рассмотрим искусственный пример, как можно применить корреляционное исследование в практических целях. Существует предприятие, которое сталкивается с серьезной проблемой контроля за качеством сложных механических агрегатов. Большинство контролеров, принимающих агрегаты, пропускают дефекты. Когда их просят работать тщательнее, они теряют уверенность в себе и начинают отбраковывать агрегаты, которые при последующей проверке оказываются вполне удовлетворительными. Эти контролеры неглупы и хорошо мотивированы, но кажется, что им не хватает какой-то специфической способности.

Решить эту проблему, просто нанимая много контролеров и оставляя только тех, которые работают удовлетворительно, нельзя. Так как, во-первых, это слишком невыгодно с экономической точки зрения - ибо многие окажутся непригодными для работы. Во-вторых, отвергнутые контролеры будут лишены ценного опыта, который за это время они могли бы приобрести на какой-нибудь другой работе. Проблема исчезла бы, если бы 80 процентов принятых на работу контролеров оправлялись с ней успешно [5].

Такая задача поставлена перед начальником отдела кадров, который имеет опыт обращения с тестами на способности. Он узнает, что может за плату приобрести подходящий тест. Последний состоит из чертежей, на которых детали соединены различным образом. В каждом наборе есть один чертеж, на котором какой-нибудь угол между деталями или узел соединения отличается от стандартного чертежа. Задача состоит в том, чтобы найти ошибку в неверном чертеже. Оценки могут распределяться от 0до 85. Фактически лишь немногие получают оценку ниже 40 или выше 80.

Методика

Людям, которые согласны на любую работу, сообщают, что они могут получить желаемую работу контролера; если они не справятся, то перейдут на другую работу. В целом через тест на способности проводится 60 кандидатов. Потом все они половину времени работают контролерами, а оставшуюся половину - на другой должности. После того как они проработали в таком режиме 3 месяца, в течение четвертого месяца производится оценка их работы в качестве контролеров. Для этого регистрируется число блоков, которые они проверили, и процент сделанных ими ошибок. Возможны два типа ошибок. Во-первых, пропуск дефекта на любой из 40 дефектных деталей агрегата. Во-вторых, обнаружение дефекта на других 40 исправных деталях. Все испытуемые знают, что их работа будет оцениваться. Итоговая оценка каждого испытуемого означала число деталей, проверенных в течение последних 20 дней, минус учетверенное количество ошибок. Так, контролер, который проверил 800 деталей с 5% ошибок, получает оценку 640, т.е. 800-4*800*0,05. Удовлетворительными считаются оценки выше 675.

Результаты

Оценки каждого испытуемого по тесту на способности и по качеству работы могут быть представлены на диаграмме разброса. Каждое число на диаграмме обозначает количество испытуемых, которые имеют данную комбинацию тестовой оценки (ось абсцисс) и оценки работы (ось ординат).

Все оценки охватываются овалом, который вытянут слева направо и вверх. Это значит, что оценки положительно коррелируют. Величину корреляции можно вычислить. Для диаграммы разброса, приведенной, величина коэффициента корреляции, характеризующего степень связи тестовых и рабочих оценок, равна 0,60, или, если быть пунктуальным, +0,60. В практических задачах мы не должны серьезно рассматривать возможность отрицательной корреляции. Отрицательные корреляции, когда они обнаруживаются, чаше всего настолько невелики, что могут считаться следствием случайной флюктуации "истинного" нулевого значения. Когда же они достаточно велики, они чаще всего связаны с характером шкалы на одной из осей. Так, например, число правильных ответов по одному тесту может иметь отрицательную корреляцию с числом ошибок по другому тесту. Некоторые испытуемые, имеющие высокую тестовую оценку, оказались в качестве контролеров хуже, чем те, у которых тестовая оценка была ниже [5].

Вывод

Используя найденный коэффициент корреляции, можно делать довольно точные предсказания. Из корреляции между тестовой оценкой и рабочей оценкой можно вывести секущую оценку, которая должна обеспечить заданный процент удовлетворительно работающих лиц. Мы можем также установить для каждой тестовой оценки будущих претендентов наиболее вероятную рабочую оценку, а также величину ошибки предсказания.

В данном примере один вид поведения использовался для предсказания другого вида поведения. Возможно, что в основе корреляции лежало то, что измерявшиеся способности, как и предполагалось, были существенны для данного вида работы. Однако возможно и многое другое. Например, может быть, все дело было во внимательности или в количестве усилий, которое данный человек готов был затратить. В практических ситуациях нас не интересуют объяснения: нужны только результаты. При высокой корреляции предсказание будет хорошим, при низкой корреляции - плохим.

3. Надежность и валидность тестов

Тест называется надежным, если мы можем рассчитывать, что одно и то же лицо каждый раз, при повторных испытаниях, получит примерно ту же самую оценку (относительно других) [9]. Как известно, существует много причин непоследовательности поведения, включая факторы времени, которые мы не можем контролировать. Однако влияние этого непостоянства можно уменьшить, используя достаточно продолжительный тест, конечно, соответствующего уровня трудности. Один из способов выявления надежности теста заключается в том, чтобы дать один и тот же тест (или очень близкие варианты, если это необходимо) дважды той же самой группе испытуемых. Если коэффициент корреляции между результатами двух применений теста высокий (например, 0,90), то тест считается надежным. Однако все еще остается вопрос о надежности самого исследования. Это означает, что через тест нужно провести большое число испытуемых. Иными словами, надежность теста должна основываться на достаточной надежности самого исследования.

Тест называется валидным всегда по отношению к некоторой другой оценке, например оценке качества работы, - если он высоко коррелирует с этой оценкой (например, 0,60). И снова, чтобы узнать, является ли данное заключение валидным, т.е. следует ли оно из надежного исследования, нужно использовать достаточное число испытуемых [2].

4. Типы корреляционных исследований

В корреляционных исследованиях отсутствуют планируемые изменения независимой переменной.

Исследователи, изучавшие опыт воспитания детей, не убеждали одних родителей использовать хорошие методы воспитания, а других - плохие. Эти различия в методах уже существовали. Порядок рождения ребенка тоже не зависел от экспериментатора. Он тоже уже существовал. Точно так же индивидуальные различия по тесту на способности не задавались экспериментатором. Таким образом, корреляционное исследование - это такое исследование, в котором одни поведенческие различия соотносятся с другими, уже существующими. Параметры, по которым различаются корреляционные исследования. [5]

Степень приближения к независимой переменной

Как уже говорилось, в принципе можно было бы спланировать такой эксперимент, в котором экспериментатор решал бы сам, какие родители будут применять хорошие методы воспитания детей, а какие - плохие. Но вследствие практической неосуществимости такого эксперимента было предпринято корреляционное исследование. Еще большую проблему представляет порядок рождения. Каким активным вмешательством можно добиться, чтобы данный ребенок родился, например, четвертым? И все же порядок рождения - это нечто, похожее па независимую переменную. Ведь это - переменная, предшествующая во времени, следовательно, она может стать причиной различий в поведении. Такого совсем нельзя сказать отесте на способности, который использовался для предсказания качества работы контролера. Одна и та же причина (какой бы она ни была) обеспечивала данному лицу и высокую оценку по тесту, и возможность стать хорошим контролером. В различиях тестовых оценок нет ничего от независимой переменной. Фактически мы могли бы точно так же из работы испытуемого в качестве контролера вывести, насколько успешно он будет справляться с тестом на способности. И если этого не делаем, то только потому, что это не имеет практического смысла [5].

Описание корреляции

Все три исследования были названы корреляционными, но только в случае отбора контролеров вычислялся коэффициент корреляции. Этот показатель наиболее значим в том случае, если каждая из двух сопоставляемых переменных имеет непрерывное колоколообразное распределение. Это справедливо для оценок почти любого теста. Оценки распределяются от низшей к высшей непрерывно и имеют максимум в области среднего значения. Поэтому в исследовании контролеров коэффициент корреляции хорошо подходит для описания корреляции между двумя переменными. Его можно было бы использовать также и в исследовании приспособленности. Каждый испытуемый имеет оценку приспособленности на почти непрерывной шкале. Почти наверняка эти оценки можно было бы аппроксимировать колоколообразным распределением. Факторы-предпосылки распределялись примерно таким же образом, хотя, в общем, были ступенчатыми, а не постепенно меняющимися. Доход семьи прямо мог бы использоваться как континуальный показатель, хотя распределение оказалось бы отрезанным со стороны высоких доходов. Однако вместо коэффициента корреляции здесь было использована сравнение групп с высокими и низкими показателями, поскольку не совсем ясно, что значит средняя величина приспособленности.

Цель

Исследования приспособленности и порядка рождения проводились для того, чтобы понять, чем определяются различия в поведении. Это не значит, что результаты исследования приспособленности не могут быть использованы в практических целях. Труднее представить сиюминутное практическое использование результатов исследования порядка рождения. И, конечно же, исследование по отбору контролеров преследует явную практическую цель. Так что давайте не будем "смешивать" тип исследования и его цель. Если в исследовании вычисляется коэффициент корреляции или соотносятся две оценки поведения, это еще не значит, что оно имеет практический характер. Такое делается во многих чисто теоретических исследованиях. Коэффициенты корреляции находятся между тестовыми оценками детей и родителей, между оценками идентичных близнецов и т.д. Все это - теоретические исследования, в которых пытаются разделить влияние наследственности и среды. Предпринимаются также теоретические исследования, в которых члены одной и той же группы испытуемых проводятся через разные тесты - точно так же, как это делалось при исследовании контролеров. Иногда даже используется 40 или 50 различных тестов, и между каждой парой тестов вычисляются коэффициенты корреляции. Для выявления значительно меньшего числа базисных переменных, адекватно описывающих различия между индивидами, применяется техника, называемая факторным анализом [5].

5. Корреляционные связи. Виды

Корреляционные связи - это вероятностные изменения, которые можно изучать только на представительных выборках как методами математической статистики [9]. Термина: Корреляционная связь и Корреляционная зависимость - часто используются как синонимы. Зависимость подразумевает влияние, связь - любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не рассматриваются как свидетельство причинно-следственной зависимости, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого.

Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака [9].

Итак, задача корреляционного анализа сводится к установлению формы (линейная, нелинейная) и направления (положительное или отрицательное) связи между варьирующими признаками, измерению ее тесноты, и к проверке уровня значимости полученных коэффициентов корреляции.

Корреляционные связи могут различать по форме, направлению и степени (силе).

По форме корреляционная связь бывает - прямолинейной или криволинейной. Прямолинейная, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной, например, связь между уровнем мотивации и эффективностью выполнения задачи. (см. Приложение рисунок 1) Когда повышается мотивация, то эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.

По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака - низкие значения другого (см. Приложение рисунок 2). При отрицательной корреляции соотношения обратные (см. приложение рисунок 3). При положительной корреляции коэффициент корреляции имеет положительный знак, при отрицательной корреляции - отрицательный знак [10]. Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции. Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Выделяют несколько интерпретаций наличия корреляционной связи между двумя измерениями:

1. Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой. Например закон Хика: скорость переработки информации пропорциональна логарифму от числа альтернатив. Другой пример: корреляция высокой личностной пластичности и склонности к смене социальных установок.

2. Корреляция, обусловленная 3-й переменной. Две переменные (а, с) связаны одна с другой через третью (в), неизмеренную в ходе исследования. По правилу транзитивности, если есть R (а, b) и R (b, с), то R (а, с). Примером такой корреляции является установленный американскими психологами факт связи уровня интеллекта с уровнем доходов. Если бы такое исследование проводилось в сегодняшней России, то результаты были бы иными. Очевидно, все дело в структуре общества. Скорость опознания изображения при быстром (тахистоскопическом) предъявлении и словарный запас испытуемых также положительно коррелируют. Скрытой переменной, обусловливающей эту корреляцию, является общий интеллект.

3. Случайная корреляция, не обусловленная никакой переменной.

4. Корреляция, обусловленная неоднородностью выборки. Вообразим себе, что выборка, которую будем обследовать, состоит из двух однородных групп. Пример, хотим выяснить, связана ли принадлежность к определенному полу с уровнем экстраверсии. Считаем, что "измерение" пола трудностей не вызывает, экстраверсию же измеряем с помощью опросника Айзенка ETI-1.2 группы: мужчины-математики и женщины-журналистки. Неудивительно, если мы получим линейную зависимость между полом и уровнем экстраверсии-интроверсии: большинство мужчин будут интровертами, большинство женщин - экстравертами. А также, корреляционные связи различаются по своему виду. Если повышение уровня одной переменной сопровождается повышением уровня другой, то речь идет о положительной корреляции. Чем выше личностная тревожность, тем больше риск заболеть язвой желудка. Возрастание громкости звука сопровождается ощущением повышения его тона. Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией. По данным Зайонца, число детей в семье отрицательно коррелирует с уровнем их интеллекта. Чем боязливей особь, тем меньше у нее шансов занять доминирующее положение в группе [6].

Нулевой называется корреляция при отсутствии связи переменных. Примеров строго линейных связей (положительных или отрицательных) в психологии практически нет. Большинство связей - нелинейные. Классический пример нелинейной зависимости - закон Йеркса-Додсона: возрастание мотивации первоначально повышает эффективность научения, а затем наступает снижение продуктивности (эффект "перемотивации"). Другим примером является связь между уровнем мотивации достижений и выбором задач различной трудности. Лица, мотивированные надеждой на успех, предпочитают задания среднего диапазона трудности - частота выборов на шкале трудности описывается колоколообразной кривой.

Математическую теорию линейных корреляций разработал Пирсон. Основания и приложения теории изложены в учебниках и справочниках по математической статистике. Вспомним, что коэффициент линейной корреляции Пирсона r варьируется от - 1 до +1. Его вычисляют путем нормирования ковариации переменных на произведение их среднеквадратических отклонений.

Значимость коэффициента корреляции зависит от принятого уровня значимости, а и от величины выборки. Чем больше модуль коэффициента корреляции, тем ближе связь переменных к линейной функциональной зависимости.

Общая классификация корреляционных связей

В зависимости от коэффициента корреляции выделяют следующие корреляционные связи:

сильная или тесная связь при коэффициенте корреляции r>0,70;

средняя связь (при 0,50<r<0,69);

умеренная связь (при 0,30<r<0,49);

слабая связь (при 0, 20<r<0,29);

очень слабая связь (при r<0, 19) [10].

6. Корреляционные поля и цель их построения

Корреляцию изучают на основании экспериментальных данных, которые представляют собой измеренные значения (xi, yi) двух признаков. Допустим, экспериментальных данных немного, то двумерное эмпирическое распределение представляется в виде двойного ряда значений xi и yi. Но при этом корреляционную зависимость между признаками можно описывать разными способами. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т.д.[8].

Как и другие статистические методы, корреляционный анализ основан на использовании вероятностных моделей, описывающих поведение исследуемых признаков в некоторой генеральной совокупности, из которой получены экспериментальные значения xi и yi. Когда исследуется корреляция между количественными признаками, значения которых можно точно измерить в единицах метрических шкал (метры, секунды, килограммы и т.д.), то очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Такая модель отображает зависимость между переменными величинами xi и yi графически в виде геометрического места точек в системе прямоугольных координат. Такую графическую зависимость называются также диаграммой рассеивания или корреляционным полем.

Данная модель двумерного нормального распределения (корреляционное поле) дает наглядную графическую интерпретацию коэффициента корреляции, т.к. распределение в совокупности зависит от пяти параметров: мx, мy - средние значения (математические ожидания); уx,уy - стандартные отклонения случайных величин Х и Y и р - коэффициент корреляции, который является мерой связи между случайными величинами Х и Y.

Если р = 0, то значения, xi, yi, полученные из двумерной нормальной совокупности, располагаются на графике в координатах х, у в пределах области, ограниченной окружностью (см. Приложение рисунок 5. а). В этом случае между случайными величинами Х и Y отсутствует корреляция и они называются некоррелированными. Для двумерного нормального распределения некоррелированность означает одновременно и независимость случайных величин Х и Y [8].

Если р = 1 или р = - 1, то между случайными величинами Х и Y существует линейная функциональная зависимость (Y = c + dX). В этом случае говорят о полной корреляции. При р = 1 значения xi, yi определяют точки, лежащие на прямой линии, имеющей положительный наклон (с увеличением xi значения yi также увеличиваются), при р = - 1 прямая имеет отрицательный наклон. (рисунок 5. б) В промежуточных случаях (-1 < p < 1) точки, соответствующие значениям xi, yi, попадают в область, ограниченную некоторым эллипсом (рисунок 5. в, г), причем при p > 0 имеет место положительная корреляция (с увеличением xi значения yi имеют тенденцию к возрастанию), при p < 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Обратим внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, но и иметь любую другую форму: парабола, гипербола и т.д. В этих случаях рассматривается - нелинейная (или криволинейная) корреляция (Рисунок 5д).

Таким образом, визуальный анализ корреляционного поля помогает выявить не только наличия статистической зависимости (линейную или нелинейную) между исследуемыми признаками, но и ее тесноту и форму. И это имеет существенное значение для следующего шага в анализе ѕ выбора и вычисления соответствующего коэффициента корреляции [3].

Корреляционную зависимость между признаками можно описывать разными способами. Любая форма связи может быть выражена уравнением общего вида Y = f (X), где признак Y - зависимая переменная, или функция от независимой переменной X, называемой аргументом. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т.д.

7. Этапы корреляционного анализа

Корреляционного анализа включает в себя следующие этапы:

1) постановка задачи и выбор признаков;

2) сбор информации, ее первичная обработка (группировки, исключение аномальных наблюдений, проверка нормальности одномерного распределения);

3) предварительная характеристика взаимосвязей (аналитические группировки, графики);

4) устранение мультиколлинеарности (взаимозависимости факторов) и уточнение набора показателей путем расчета парных коэффициентов корреляции;

5) исследование факторной зависимости и проверка ее значимости;

6) оценка результатов анализа и подготовка рекомендаций по их практическому использованию [8].

Глава 2. Планирование корреляционного исследования

План корреляционного исследования является разновидностью квазиэкспериментального плана, в котором отсутствует воздействия независимой переменной на зависимые. Тестируемые группы должны быть в эквивалентных неизменных условиях. При корреляционном исследовании все измеряемые переменные - зависимые. Фактором, определяющим эту зависимость, может быть одна из переменных или скрытая, не измеряемая переменная [6].

Корреляционное исследование разбивается - на серию независимых друг от друга измерений в группе испытуемых Р. Различают простое и сравнительное корреляционные исследования. В первом случае группа испытуемых однородна. Во втором случае, несколько рандомизированных групп, различающихся по одному или нескольким определенным критериям. В общем виде план такого исследования описывается матрицей вида: Р х О (испытуемые х измерения). Результатом исследования является матрица корреляций. Обработку данных можно вести, сравнивая строки исходной матрицы или столбцы. Коррелируя между собой строки, мы сопоставляем друг с другом испытуемых; корреляции же интерпретируются как коэффициенты сходства-различия людей между собой. Р-корреляции можно вычислятся лишь в том случае, если данные приведены к одной шкальной размерности, в частности с помощью Z-преобразования:

Когда коррелируем между собой столбцы, то проверяем гипотезу о статистической связи измеряемых переменных. В этом случае их размерность не имеет никакого значения. Такое исследование называется структурным, так как мы получаем матрицу корреляции измеренных переменных, которая выявляет структуру связей между ним [6].

Часто возникает задача выявить временные корреляции параметров или же обнаружить изменение структуры корреляций параметров во времени. Примером таких исследований являются лонгитюды.

План лонгитюдного исследования представляет серию отдельных замеров одной или нескольких переменных через определенные промежутки времени. Лонгитюдное исследование - это промежуточный вариант между квазиэкспериментом и корреляционным исследованием, так как время интерпретируется исследователем как независимая переменная, определяющая уровень зависимых (например, личностных черт) [9].

Полный план корреляционного исследования представляет собой параллелепипед Р х О х Р, грани которого обозначаются как "испытуемые", "операции", "временные этапы".

Результаты исследования можно анализировать по-разному. Помимо вычисления Р - и О-корреляций возникает возможность сравнения матриц Р х О, полученных в разные периоды времени, путем подсчета двухмерной корреляции - связи двух переменных с третьей. Чаще исследователи ограничиваются обработкой другого типа, проверяя гипотезы об изменении переменных во времени, анализируя матрицы Р х Т по отдельным измерениям.

1. Основные типы корреляционного исследования

1. Сравнение двух групп. План лишь условно относится к корреляционным исследованиям. Применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного психологического свойства или состояния. Допустим, у вас есть желание выяснить, отличаются ли мужчины и женщины по уровню экстраверсии. Для этого вы должны создать две репрезентативные выборки, уравненные по прочим значимым для экстраверсии-интроверсии параметрам (по параметрам, влияющим на уровень экстраверсии-интроверсии), и провести измерение с помощью теста EPQ. Средние результаты у 2 групп сравниваются с помощью t-критерия Стьюдента. При необходимости сравниваются дисперсии показателя экстраверсии по критерию.

Простейшее сопоставление 2 групп содержит в себе источники ряда артефактов, характерных для корреляционного исследования. Во-первых, возникает проблема рандомизации групп - они должны четко разделяться по выбранному критерию. Во-вторых, реальные измерения происходят не одновременно, а разновременно:

R' О1 -

R" - О2

В-третьих, хорошо, если тестирование внутри группы проводят одновременно. Если же отдельных испытуемых тестируют в разное время, то на результате может сказаться влияние временного фактора на величину переменной.

Если исследователь задался целью сравнить две учебные группы по уровню успеваемости, он должен позаботиться о том, чтобы не произошло их "перемешивания" в ходе исследования [6].

Эффект неодновременности измерении в двух группах (в случае предположения о значимости этого фактора) можно было бы "убрать" введением двух контрольных групп, но ведь тестировать их тоже придется в другое время. Удобнее разделить первоначальные группы пополам и тестирование (по возможности) провести по следующему плану:

R' О1 -

R" - О2

__________________

R' О3 -

R" - О4

Обработка результатов для выявления эффекта последовательности осуществляется методом двухфакторного анализа 2 х 2. Сравнение естественных (нерандомизированных) групп ведется по тому же плану.

2. Одномерное исследование одной группы, в разных условиях. План этого исследования аналогичен. Но по своей сути он близок к эксперименту, так как условия, в которых находится группа, различаются. В случае корреляционного исследования мы не управляем уровнем независимой переменной, а лишь констатируем изменение поведения индивида в новых условиях. Примером может служить изменение уровня тревожности детей при переходе из детского сада в 1-й класс школы: группа одна и та же, а условия различные.

Главные артефакты этого плана - кумуляция эффектов последовательности и тестирования. Кроме того, искажающее влияние на результаты может оказывать временной фактор (эффект естественного развития).

Схема этого плана выглядит очень просто: А О1 В О2, где А и В - разные условия. Испытуемые могут отбираться из генеральной популяции случайным образом или представлять собой естественную группу.

Обработка данных сводится к оценке сходства между результатами тестирования в условиях А и В. Для контроля эффекта последовательности можно произвести контрбалансировку и перейти к корреляционному плану для двух групп:

А О1 В О2

В О3 А О4

В этом случае мы можем рассматривать А и В как воздействия, а план - как квазиэксперимент [6].

3. Корреляционное исследование попарно эквивалентных групп. Этот план используется при исследовании близнецов методом внутрипарных корреляций. Дизиготные или монозиготные близнецы разбиваются на две группы: в каждой - один близнец из пары. У близнецов обеих групп измеряют интересующие исследователя психические параметры. Затем вычисляется корреляция между параметрами (О-корреляция) или близнецами (Р-корреляция). Существует множество более сложных вариантов планов психогенетических исследований близнецов.

4. Для проверки гипотезы о статистической связи нескольких переменных, характеризующих поведение, проводится многомерное корреляционное исследование. Отбирается группа, которая представляет собой либо генеральную совокупность, либо интересующую нас популяцию. Отбираются тесты, проверенные на надежность и внутреннюю валидность. Затем группа тестируется по определенной программе.

R А (О1) В (О2) С (О3) D (О4). N (Оn),

где А, В, С. N - тесты, Оi - операция тестирования.

Данные представлены в форме матрицы: т х п, где т - количество испытуемых, п - тесты. Матрица "сырых" данных обрабатывается, подсчитываются коэффициенты линейной корреляции. Получается матрица вида т х п, где п - число тестов. В клеточках матрицы - коэффициенты корреляции, по ее диагонали - единицы (корреляция теста с самим собой). Матрица симметрична относительно этой диагонали. Корреляции оцениваются на статистические различия следующим образом: сначала r переводится в Z-оценки, затем для сравнения r применяется t-критерий Стьюдента. Значимость корреляции оценивается при ее сопоставлении с табличным значением. При сравнении rэксп. и rтеор. принимается гипотеза о значимом отличии корреляции от случайной при заданном значении точности (ц= 0,05 или ц= 0,001). В некоторых случаях возникает необходимость вычисления множественных корреляций, частных корреляций, корреляционных отношений или редукции размерности - уменьшения числа параметров [7].

Главной причиной артефактов, возникающих при проведении многомерного психологического тестирования, является реальное физическое время. При анализе данных корреляционного исследования мы отвлекаемся от неодновременности проводимых измерений. Кроме того, считается, что не существует эффекта переноса.

Дружинин В.Н. описывает основные артефакты, которые возникают в ходе применения этого плана:

· Эффект последовательности - предшествующее выполнение одного теста может повлиять на результат выполнения другого (симметричный или асимметричный перенос).

· Эффект научения - при выполнении серии различных тестовых испытаний у участника эксперимента может повышаться компетентность в тестировании.

· Эффекты фоновых воздействий и "естественного" развития приводят к неконтролируемой динамике состояния испытуемого в ходе исследования.

· Взаимодействие процедуры тестирования и состава группы проявляется при исследовании неоднородной группы: интроверты хуже сдают экзамены, чем экстраверты, "тревожные" хуже справляются со скоростными тестами интеллекта. Для контроля эффектов последовательности и переноса следует пользоваться тем же приемом, что и при планировании экспериментов, а именно - контрбалансировкой. Только вместо воздействий меняется порядок проведения тестов [6]. Для 3 тестов полный план корреляционного исследования с контрбалансировкой выглядит следующим образом:

1-я группа: А В С

2-я группа: С А В

3-я группа: В С А

где А, В, С - различные тесты. Однако я не знаю ни одного случая, когда бы в отечественных корреляционных исследованиях контролировались эффекты тестирования и переноса.

Пример. Нам необходимо было выявить, как влияет вид задания на успешность выполнения сменяющих одна другую задач. Мы предположили, что для испытуемых не безразлично, в какой последовательности им даются тесты. Были выбраны задания на креативность (из теста Торренса) и на общий интеллект (из теста Айзенка). Задачи давались испытуемым в случайном порядке. Оказалось, что если задание на креативность выполняется первым, то скорость и точность решения задачи на интеллект снижается. Обратного эффекта не наблюдалось. Не вдаваясь в объяснения этого явления (это сложная проблема), заметим, что здесь столкнулись с классическим эффектом асимметричного переноса.

5. Структурное корреляционное исследование. эта схема отличается от остальных тем, что исследователь выявляет не отсутствие или наличие значимых корреляций, а различие в уровне значимых корреляционных зависимостей между одними и теми же показателями, измеренными у представителей различных групп.

Примером. Допустим, нам необходимо проверить гипотезу о том, влияет ли пол родителя и пол ребенка на сходство или различие их личностных черт, например уровня нейротизма по Айзенку. Для этого мы должны провести исследование реальных групп - семей. Затем вычисляются коэффициенты корреляции уровней тревожности родителей и детей. Получаются 4 основных коэффициента корреляции:

1) мать-дочь;

2) мать-сын;

3) отец-дочь;

4) отец-сын, и два дополнительных: 5) сын-дочь;

6) мать-отец. Корреляции подвергаются Z-преобразованию и сравниваются по t-критерию Стьюдента.

Здесь приведен простейший пример структурного корреляционного исследования. В исследовательской практике встречаются более сложные версии структурных корреляционных исследований (см. Приложение рисунок 7). Чаще всего они проводятся в психологии индивидуальности (Б.Г. Ананьев и его школа), психологии труда и обучения (В.Д. Шадриков), психофизиологии индивидуальных различий (Б.М. Теплов, В.Д. Небылицын, В.М. Русалов и др.), психосемантике (В.Ф. Петренко, А.Г. Шмелев и др.).

6. Лонгитюдное корреляционное исследование. Лонгитюдное исследование - вариант квазиэкспериментальных исследовательских планов. Воздействующей переменной психолог, проводящий лонгитюдное исследование, считает время. Оно является аналогом плана тестирования одной группы в разных условиях. Только условия считаются константными. Результатом любого временного исследования (в том числе и лонгитюдного) является построение временного тренда измеряемых переменных, которые могут быть аналитически описаны теми или иными функциональными зависимостями.

Лонгитюдное корреляционное исследование строится по плану временных серий с тестированием группы через заданные промежутки времени. Помимо эффектов обучения, последовательности и т.д. в лонгитюдном исследовании следует учитывать эффект выбывания: не всех испытуемых, первоначально принимавших участие в эксперименте, удается обследовать через какое-то определенное время. Возможно взаимодействие эффектов выбывания и тестирования (отказ от участия в последующем обследовании) и т.д.

Структурное лонгитюдное исследование отличается от простого лонгитюда тем, что нас интересует, сколько изменение связей между переменными. Такого рода исследования широко распространены в психогенетике.

Обработка и интерпретация данных корреляционного исследования. Данные структурного корреляционного исследования представляют собой одну или несколько матриц "испытуемые" х "тесты". Первичная обработка заключается в подсчете коэффициентов статистической связи между двумя и более переменными. Выбор меры связи определяется шкалой, с помощью которой произведены измерения.

1. Если измерения произведены по дихотомической шкале (то для подсчета тесноты связи признаков) применяется коэффициент ц. Дихотомическую шкалу иногда путают со шкалой наименований (даже в пособиях по статистике., например, Дж. Гласс и Дж. Стенли Статистические методы в педагогике и психологии, 1976). Дихотомическая шкала - вырожденный вариант шкалы интервалов. Для нее применимы - все статистические методы шкалы интервалов. Данные для вычисления коэффициента:

2. Данные представлены в порядковой шкале. Мерой связи, которая соответствует шкале порядка, является коэффициент Кэнделла. Он основан на подсчете несовпадений в порядке следования ранжировок Х и Y. Есть ряд испытуемых: сначала мы выстраиваем этот ряд в порядке убывания массы тела, а затем - в порядке убывания роста. Для каждой пары подсчитывается число совпадений и инверсий: совпадение, если их порядок по Х и Y одинаков; инверсия, если порядок различен. Разница числа "совпадений" и числа "инверсий", деленная на п (п-1) /2, дает коэффициент t. Алгоритм подсчета приведен в пособиях по статистике [Дж. Гласс и Дж. Стенли, 1976] и в любом статпакете для персональных компьютеров.

Часто для обработки данных, полученных с помощью шкалы порядка, используют коэффициент ранговой корреляции Спирмена, который является модификацией коэффициента Пирсона для натурального ряда чисел (рангов). Никакого отношения к порядковой шкале он не имеет. Но его рекомендуют применять в том случае, если одно измерение произведено по шкале порядков, а другое - по шкале интервалов.

3. Данные получены по шкале интервалов, или отношений. В этом случае применяется стандартный коэффициент корреляции Пирсона или коэффициент ранговой корреляции Спирмена. В том случае, если одна переменная является дихотомической, а другая - интервальной, используется так называемый бисериальный коэффициент корреляции.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.