Метод тестирования в системе педагогических измерений

Педагогическое тестирование в России и за рубежом. Исторические предпосылки современного тестирования в отечественном образовании. Классификация видов педагогических тестов, предтестовых заданий и требования к ним. Инновационные формы тестовых заданий.

Рубрика Педагогика
Вид курсовая работа
Язык русский
Дата добавления 28.10.2008
Размер файла 110,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Разработка заданий со свободно конструируемым ответом может показаться неоправданно легкой. На самом деле сформулировать задание просто, а вот предложить эталон оптимального ответа вместе со стандартизованными правилами оценки результатов его выполнения достаточно сложно. Так, формулировка задания по истории с развернутым ответом достаточно кратка.

Задание 5

Назовите основные задачи, которые решались во внешней политике России в XVII в. (укажите не менее двух задач). Приведите примеры войн, походов и экспедиций XVII в., предпринимавшихся для решения этих задач (не менее трех примеров).

Но для того чтобы задание попало в тест, его автору необходимо стандартизовать процедуру проверки, а это объемная работа, вызывающая подчас много нареканий из-за неоднозначности результатов ее выполнения. Проверка заданий с развернутыми ответами проводится экспертами в соответствии со стандартизированными инструкциями, содержащими эталон оптимального ответа с описывающими его характеристиками и признаками качества, как в приведенном примере. К эталону должны прилагаться оценочные категории для выставления политомической оценки, нуждающиеся в апробации и статистическом обосновании качества, поскольку среди них могут быть как не «работающие», так и снижающие дифференцирующий эффект теста.

Оценивание результатов выполнения предтестовых заданий со свободно конструируемыми ответами. Задания типа эссе можно оценивать в соответствии: с простыми схемами оценивания, когда при выборе критериев ориентируются на содержание ответов учащихся;

с усложненными схемами оценивания, учитывающими при экспертизе содержание ответов, характеристики качества представления текста, его полноту и стиль или любые другие факторы, кажущиеся важными разработчику задания;

- с рейтинговым методом, предполагающим накопительную оценку, которая получается путем сложения отдельных оценок в соответствии с общим впечатлением экспертов от полного ответа на задание.

При любой схеме оценивания задания со свободно конструируемыми ответами нуждаются в политомической оценке, что иногда неоправданно завышает их общий вес в балле по тесту. Для того чтобы избежать такой ситуации и уменьшить влияние субъектив-ного компонента, число критериев оценивания обычно старают-ся ограничить, например от «О» до «3» или от «О» до «4».

В целом задания с развернутыми ответами требуют значительных затрат преподавательского труда при проверке, так как экспертам приходится анализировать множество в разной степени правильных ответов и сравнивать их с эталоном. При этом не принимаются во внимание полнота, внешнее оформление ответов, орфографические ошибки и то, что не входит в критерии для выставления политомической оценки, хотя сейчас для проверки существуют специальные программы ПК. Обычно в силу низкой технологичности такие задания занимают не более 10--15% от всех заданий теста. Правда, в последнее время в связи с тенденцией к проверке творческих аспектов подготовленности учащихся число заданий с развернутыми ответами может составлять 50 % от общей длины теста.

3.3. Предтестовые задания на установление соответствия

Общая характеристика. Задания на соответствие имеют специфический вид: под инструкцией располагаются элементы двух множеств, соответствие между которыми предлагается установить учащемуся [4]; слева обычно приводятся элементы задающего множества, содержащего постановку проблемы; справа -- элементы, подлежащие выбору.

Соответствие между элементами двух столбцов может быть взаимно однозначным, когда каждому элементу слева соответствует только один элемент справа. Если число элементов в двух столбцах одинаковое, то для последнего элемента задающего множества выбора не произойдет, поэтому в множество для выбора стараются включить несколько дистракторов.

Задание6

Установите соответствие между датами и внешнеполитическими событиями. К каждому из 4 элементов (1,2,3,4) подбирается один соответствующий элемент (а, б, в, г, д).

Даты События

1) 1922г. а)подписание Рапалльского договора с Германией

2) 1924г. б)заключение договора о ненападении с Германией

3) 1934г. в)заключение Брестского мира с Германией

4) 1939г. г)вступление в Лигу Наций

д)«полосадипломатическогопризнания»СССР

Задания на установление соответствия по алгоритму выполнения близки к заданиям с выбором ответа, поскольку ученик выбирает из числа ответов, предложенных преподавателем, правильный ответ. За рубежом задания на соответствие не выделяют в отдельный вид, а считают одной из разновидностей заданий с выбором ответов. Как и в заданиях с выбором ответов, наибольшие трудности при разработке связаны с подбором правдоподобных избыточных элементов в правом множестве. Мера правдоподобности каждого дистрактора устанавливается эмпирически. В итоговом контроле задания на соответствие малоэффективны в силу их громоздкости, не позволяющей охватить большой объем содержания.

Оценивание результатов выполнения заданий на соответствие. Результаты выполнения заданий на соответствие оцениваются либо дихотомической, либо политомической оценкой. При дихотомическом оценивании за все правильно установленные соответствия в задании теста ставится «1». Если хотя бы одно соответствие неверно, то за частично правильно выполненное задание на соответствие учащийся получает «О».

При политомическом оценивании за каждое правильное соответствие ставится «1». В этом случае при проверке заданий на соответствие используется политомическая оценка, и общее количество баллов за задание равно числу правильно установленных соответствий.

3.4. Задания на установление правильной последовательности

Общая характеристика. Тестовые задания четвертой формы пред-назначены для оценки уровня владения последовательностью действий, процессов и т.п. Элементы, связанные с определенной задачей, приводятся в заданиях в произвольном порядке, а ученик должен установить правильный порядок предложенных элементов и указать его заданным способом в специально отведенном для этого месте [4].

Стандартная инструкция к заданиям четвертой формы имеет следующий вид: «Установите правильную последовательность». Иногда инструкцию включают в текст задания.

Задание7

Расположите имена русских полководцев в хронологической последовательности их деятельности. Запишите буквы, которыми обозначены имена в правильной последовательности :

А) Дмитрий Пожарский

Б) Алексей Ермолов

В) Михаил Скобелев

Г) Алексей Орлов

Во многих случаях задания на установление правильной последовательности крайне нетехнологичны или неприменимы в силу специфики содержания предмета. Они громоздки и нередко до-пускают неоднозначную последовательность ответов.

3.5. Сравнительная характеристика форм предтестовых заданий

В процессе разработки теста у автора всегда возникает вопрос,остановиться на какой-нибудь одной форме заданий или совместить различные формы в одном тесте? Выбор автора во многом должен определяться спецификой содержания учебной дисциплины, целями создания и применения теста. Немало в данном случае зависит от технологии проверки, сбора и обработки эмпирических данных, от технического и материального обеспечения процесса применения теста.

Организовать компьютеризованный сбор и анализ результатов выполнения теста легко, если тест состоит лишь из заданий с выбором ответов. Результаты выполнения заданий с конструируемыми ответами требуют ручной обработки и привлечения экспертов,а следовательно - дополнительных материальных затрат и времени на проверку. Обилие форм в тесте затрудняет работу ученика и значительно усложняет статистическую обработку эмпирических результатов выполнения теста.

К сожалению, требование моноформности не всегда выполнимо, поскольку не все знания и умения ученика можно проверить с помощью моноформного теста. В связи с этим часто приходится идти на совмещение форм, что при прочих равных условиях всегда негативно отражается на точности измерений, обеспечиваемой тестом. Выбор оптимальной формы предтестовых заданий обычно бывает связан со спецификой содержания теста. При этом приходится учитывать достоинства и недостатки каждой из форм (табл. 1) и принимать определенное компромиссное решение в процессе такого выбора.

4. КОМПЬЮТЕРНОЕ ТЕСТИРОВАНИЕ В ОБРАЗОВАНИИ.

4.1. Специфика компьютерного тестирования и его формы

Общие представления о компьютерном тестировании. С начала XXI в, в образовании при проведении тестирования стали широко применяться компьютеры. В педагогических инновациях появилось отдельное направление -- компьютерное тестирование, при котором предъявление тестов, оценивание результатов учащихся и выдача им результатов осуществляется с помощью ПК.

Этап генерации тестов технологически может протекать по-разному, в том числе путем ввода в компьютер бланковых тестов. На сегодняшний день по компьютерному тестированию имеются многочисленные публикации, разработаны программно-инструментальные средства для генерации и предъявления тестов.

Когда необходимо обращаться к компьютерному тестированию. Хотя компьютерное тестирование значительно облегчает работу учителя при предъявлении и оценивании результатов выполнения тестов, его распространение во многом не более чем дань моде, все негативные последствия которого до сих пор не выявлены в полной мере. Выбор компьютерного формата экзамена должен основываться на более важных и обоснованных предпосылках, чем просто увлечение инновациями, поскольку он порождает множество проблем и ставит учащихся в неравные условия. Обращаться к компьютерному тестированию следует в тех случаях, когда есть настоятельная потребность в отказе от традиционных бланковых тестов.

Например, компьютерное тестирование необходимо при проведении ЕГЭ в труднодоступных районах России. Сбор выпускников школ отдаленных районов в обозначенное время проведения ЕГЭ становится настолько сложным и дорогостоящим мероприятием, что обойтись без компьютерного тестирования и современных средств коммуникации просто невозможно. Компьютерное тестирование целесообразно также применять при проведении экзаменов для детей с ограниченными возможностями, имеющих серьезные нарушения зрения или слуха. С помощью ПК можно использовать большие по размерам шрифты, аудиозаписи, дополнительные устройства для ввода данных тестирования и другие приспособления, компенсирующие на экзаменах потенциальное отставание детей с ограниченными возможностями.

Формы осуществления компьютерного тестирования. Компьютерное тестирование может проводиться в различных формах, различающихся по технологии объединения заданий в тест . Часть из них пока не получили специального названия в литературе по тестовой проблематике.

Первая форма-- самая простая. Готовый тест, стандартизованный или предназначенный для текущего контроля, вводится в специальную оболочку, функции которой могут различаться по степени полноты. Обычно при итоговом тестировании оболочка позволяет предъявлять задания на экране, оценивать результаты их выполнения, формировать матрицу результатов тестирования, обрабатывать ее и шкалировать первичные баллы испытуемых путем перевода в одну из стандартных шкал для выдачи каждому испытуемому тестового балла и протокола его оценок по заданиям теста.

Вторая форма компьютерного тестирования предполагает автоматизированную генерацию вариантов теста, осуществляемую с помощью инструментальных средств. Варианты создаются перед экзаменом или непосредственно во время его проведения из банка калиброванных тестовых заданий с устойчивыми статистическими характеристиками. Калибровка достигается благодаря длительной предварительной работе по формированию банка, параметры заданий которого получают на репрезентативной выборке учащихся, как правило, на протяжении 3 -- 4 лет с помощью бланковых тестов. Содержательная валидность и параллельность вариантов обеспечиваются за счет строго регламентированного отбора заданий каждого варианта в соответствии со спецификацией теста.

Третья форма -- компьютерное адаптивное тестирование -- базируется на специальных адаптивных тестах. В основе идей адаптивности лежат соображения о том, что учащемуся бесполезно давать задания теста, которые он выполнит наверняка правильно без малейших затруднений или гарантированно не справится с ними в силу высокой трудности. Поэтому предлагается оптимизировать трудность заданий, адаптируя ее к уровню подготовленности каждого испытуемого, и сократить за счет исключения части заданий длину теста.

Достоинства и недостатки компьютерного тестирования. Компьютерное тестирование имеет определенные преимущества по сравнению с традиционным бланковым тестированием, которые проявляются особенно заметно при массовых проверках, например при проведении национальных экзаменов типа ЕГЭ, Предъявление вариантов теста на компьютере позволяет сэкономить средства, расходуемые обычно на печать и транспортировку бланковых тестов.

Благодаря компьютерному тестированию можно повысить информационную безопасность и предотвратить рассекречивание теста за счет высокой скорости передачи информации и специальной защиты электронных файлов. Упрощается также процедура подсчета результирующих баллов в тех случаях, когда тест содержит только задания с выбором ответов.

Другие преимущества компьютерного тестирования проявляются в текущем контроле, при самоконтроле и самоподготовке учащихся; благодаря компьютеру можно незамедлительно выдать тестовый балл и принять неотложные меры по коррекции усвоения нового материала на основе анализа протоколов по результатам выполнения корректирующих и диагностических тестов. Возможности педагогического контроля при компьютерном тестировании значительно увеличиваются за счет расширения спектра измеряемых умений и навыков в инновационных типах тестовых заданий, использующих многообразные возможности компьютера при включении аудио- и видеофайлов, интерактивности, динамической динамической постановки проблем с помощью мультимедийных средств и др.

Благодаря компьютерному тестированию повышаются информационные возможности процесса контроля, появляется возможность сбора дополнительных данных о динамике прохождения теста отдельными учащимися и для осуществления дифференциации пропущенных и не достигнутых заданий теста.

Помимо неоспоримых достоинств компьютерное тестирование имеет ряд недостатков:

Типичные психологические и эмоциональные реакции учащихся на компьютерное тестирование. Обычно психологические и эмоциональные реакции учащихся на компьютерное тестирование носят позитивный характер. Учащимся нравится незамедлительная выдача тестовых баллов, протокола тестирования с результатам по каждому заданию, а также сам инновационный характер контроля в том случае, когда привлекаются современные гипермедийные технологии для выдачи теста. Динамическое мультимедийное сопровождение заданий на компьютере, объединенное программными средствами для представления в интерактивном режиме, по мнению учащихся, обеспечивает более точную оценку знаний и умений, сильнее мотивирует к выполнению заданий по сравнению с бланковыми тестами. Удобно также то, что вместо заполнения специальных форм для ответов можно просто выбрать ответ мышью. Если тестирование проходит в адаптивном режиме, то сокращаются время проведения экзамена и длина теста.

Негативные реакции обычно вызывают различные ограничения, которые иногда накладываются при выдаче заданий в компьютерном тестировании. Например, фиксируется либо порядок предъявления заданий, либо максимально возможное время выполнения каждого задания, после истечения которого независимо от желания испытуемого появляется следующее задание теста. В адаптивном тестировании учащиеся бывают недовольны тем, что они не имеют возможности пропустить очередное задание, просмотреть весь тест до начала работы над ним и изменить ответы на предыдущие задания. Иногда школьники возражают против ком-пьютерного тестирования из-за трудностей, которые возникают при выполнении и записи математических вычислений и т.д.

Воздействие на выполнение теста предшествующего уровня компьютерного опыта. Результаты зарубежных исследований показали, что опыт работы на компьютерах, имеющийся у школьников, во многих случаях значительно влияет на валидность результатов выполнения теста. Если в тест включены задания без инноваций с выбором ответов, то влияние опыта работы с компьютером на результаты тестирования незначительно, поскольку от учащихся в таких заданиях не требуется никаких сложных действий при выполнении теста. При предъявлении на экране инновацион-ных типов заданий, широко использующих средства компьютерной графики и другие новшества, влияние предшествующего ком- пьюгерного опыта на тестовый балл становится очень значительным. Таким образом, при компьютерном тестировании необходимо учитывать уровень компьютерного опыта учащихся, для которых предназначается тест.

Для снижения влияния опыта работы с компьютером на тестовые баллы рекомендуется включать в оболочки для компьютерного тестирования специальные инструкции и тренировочные упражнения для каждой инновационной формы заданий. Необходимо также предварительно ознакомить учащихся с интерфейсом, провести репетиционное тестирование и выделить в самостоятельные группы учащихся, не имеющих достаточного опыта работы с ПК, для того чтобы дополнительно обучить их или дать им бланковый тест.

Влияние интерфейса пользователя на результаты компьютерного тестирования. Интерфейс пользователя включает доступные учащемуся функции и возможности движения по заданиям теста, элементы размещения информации на экране, а также общий визуальный стиль представления информации. Хороший интерфейс пользователя должен обладать ясностью и корректностью логической последовательности взаимодействия с экзаменуемым, от-ражая общие принципы дизайна графической информации. Чем более продуман интерфейс, тем меньше внимания учащийся на него обращает, сосредоточивая все свои усилия на выполнении заданий теста.

4.2. Инновационные формы тестовых заданий при компьютерном тестировании.

Цели разработки инновационных заданий в компьютерном тестировании. Инновационные задания, использующие возможности компьютерного тестирования, на сегодняшний день являются наиболее перспективным направлением развития автоматизации педагогических измерений. Основной причиной этого является большой потенциал инновационных заданий для повышения информативности педагогических измерений и увеличения содержательной валидности тестов.

Основная цель разработки инновационных заданий для компьютерного тестирования состоит в оценивании тех когнитивных умений, функциональной грамотности и коммуникативных умений, которые остаются не выявленными при традиционном контроле иди использовании бланковых тестов.

Предметом оценивания при инновациях может быть уровень аналитико-синтетической деятельности обучаемого, скорость обобщения новой информации, гибкость мыслительного процесса и многие другие показатели умственной деятельности, сформировавшиеся в процессе обучения и не поддающиеся оцениванию с помощью обычных тестов.

Возможности инновационных заданий в компьютерном тестировании. В использовании инновационных заданий можно выделить два аспекта: дидактический и психолого-педагогический. Первый предполагает развернутую содержательную интерпретацию результатов тестирования в контексте освоенных на момент предъявления теста когнитивных, учебных и общеучебных умений, а второй позволяет оценить уровень развития мыслительных процессов у учащегося и выявить особенности усвоения им новых знаний. Большинство инновационных заданий, разработанных к настоящему времени, обеспечивают совершенствование измерений в обоих направлениях. Таким образом, инновационные задания позволяют расширить возможности самого педагог ического измерения за счет получения результатов в новых, недоступных ранее направлениях оценивания качества подготовленности учащихся. Например, для оценивания уровня сформированности функциональной грамотности экзаменующимся можно предложить отрывок текста, в котором есть ошибки, а затем попросить идентифицировать их и исправить путем перепечатывания разделов текста.

Инновационные задания способствуют сокращению влияния случайного угадывания за счет увеличения тисла возможных ответов без нарастания громоздкости заданий теста. Например, при оценивании понимания прочитанного текста можно попросить учащегося выбрать ключевое предложение в тексте и указать на него щелчком мыши. Таким образом, каждое предложение в текстовом отрывке становится опцией для выбора вместо 4 -- 5 ответов в традиционных заданиях с готовыми ответами. Для совершенствования формы заданий используют сложный рисунок, динамические элементы, включая изображения, мультипликацию или видео; тем самым сокращается время чтения условия. Расширение возможностей тестирования происходит при включении звука, что позволяет вести диалог с учащимся, оценивать фонетические особенности его произношения при тестировании по иностранному языку, проверять правильность интерпретации различных звуков.

Основные направления инноваций при разработке заданий. Инновации при разработке заданий для компьютерного тестирования охватывают пять связанных между собой направлений. К ним относятся: форма задания, действия испытуемою при ответе, уровень использования мультимедийных технологий, уровень интерактивности и методика подсчета баллов.

Нововведения в форме задания включают визуальный и звуковой информационные ряды или их сочетание. Визуальная информация может носить реалистический (фото, кино) и синтезированный (рисунок, анимация) характер. Тип информации в сочетании с тестовой формой определяет формат ответа, выбираемого или создаваемого экзаменующимся. Мри использовании фотографий или рисунков информации, содержащаяся в тестовых заданиях, носит статический характер. Кино, отражающее реальный мир, и анимация вносят динамику в выполнение теста.

Действия учащегося при ответе на задания зависят от тех ин-новационных средств, которые включены в тест. При включении в задания звуковой информации, предполагающей голосовой ответ учащегося, для ответа используются клавиатура, мышь или микрофон. Значительное место при ответах отводится интерактивным процессам. Интерактивный режим работы учащихся при компьютерном тестировании означает поочередную выдачу аудиовизуальной информации, при которой каждое новое высказывание со стороны учащегося или компьютера строится с учетом предыдущей информации с той и другой стороны. При организации интерактивного режима в компьютерном тестировании используется в основном экранное меню, в котором учащийся для ответа на тестовые задания выбирает, создает или перемещает объекты -- компоненты ответа. Реже в интерактивном режиме применяют голосовой ввод ответа.

В целом уровень интерактивности, обеспеченный в компьютерном тестировании, характеризует степень, в которой определенная форма задания реагирует или отвечает на ввод информации со стороны экзаменующегося. Этот уровень варьируется от простейшего случая, когда совершается один шаг, до сложных, многошаговых заданий с разветвлением после каждого очередного ответа ученика.

Проблемы, возникающие при использовании заданий повышенной трудности в компьютерном тестировании. Задания повышенной трудности всегда требуют больше времени для ответов вне зависимости от того, предъявляются ли они с помощью компьютерного моделирования виртуальной реальности, имеют ли форму лабораторной работы, эссе или используют мультимедийные технологии. Из-за временных затрат число сложных заданий должно быть незначительно -- не более 10-- 15 %, в отдельных случаях -- 20 -- 25%. Многообразие звуковых и зрительных образов в компьютерном тестировании приводит к возникновению у школьников усталости, поэтому при включении в тест даже небольшого количества трудных инновационных заданий приходится значительно уменьшать длину теста, что негативно сказывается на содержательной валидности, надежности и информационной безопасности педагогического измерения.

Несмотря на преимущества инновационных форм заданий, предъявляемых с помощью компьютера, к ним нужно относиться с осторожностью, тщательно анализировать их адекватность целям измерения и уместность в тесте. Обычно инновационные задания высокой трудности выделяют в отдельный блок и помещают в конце теста.

Подсчет баллов учащихся. Если в компьютерном тестировании не используются мультимедийные и интерактивные технологии, то подсчет первичных баллов учащихся проводится традиционно путем суммирования оценок по отдельным заданиям. Привлечение мультимедийных технологий приводит к многомерности результатов выполнения теста, поскольку оценивание целого спектра творческих, коммуникативных, общепредметных и других умений с помощью инновационных форм заданий всегда связано с несколькими переменными измерения. Появление интерактивности еще больше усложняет процедуру подсчета баллов учащихся, она становится зависимой от ответа экзаменующегося на каждом шаге выполнения заданий теста и требует полигамических оценок.

Проверка результатов выполнения заданий с конструируемым регламентированным ответом осуществляется путем сравнения ответа экзаменующегося с эталоном, хранящимся в памяти компьютера, и включает различные синонимы правильного ответа с приемлемыми орфографическими ошибками.

Намного сложнее автоматизированный подсчет баллов в заданиях со свободно конструируемым ответом (типа эссе) в гуманитарных дисциплинах. На сегодняшний день зарубежными тестологами разработаны специальные программы для автоматизированной проверки эссе. Критерии оценивания в этих программах довольно разнообразны: от рассмотрения поверхностных характеристик эссе типа длины и степени полноты ответа до сложных случаев анализа с использованием достижений компьютерной лингвистики. Обычно все эти различные автоматизированные программы подсчета баллов требуют участия экспертов только на момент начала работы, когда квалифицированным педагогам необходимо «обучить» компьютерную программу оцениванию любых развернутых ответов.

4.3. Тесты фиксированной длины, компьютерная генерация параллельных вариантов теста.

Основные компоненты процесса автоматизированной компоновки теста для компьютерного предъявления. Процесс автоматизированной компоновки теста в том случае, когда он происходит заранее и не в адаптивном режиме, включает сборку (генерацию) параллельных вариантов, выбор правила подсчета баллов тестируемых учащихся и коррекцию вариантов для выполнения требований теории педагогических измерений.

Неизбежные различия по трудности вариантов, возникающие вследствие существования ошибок измерения, устраняются после тестирования путем выравнивания шкал, получаемых при подсчете тестовых баллов по отдельным вариантам теста. К числу сопутствующих вопросов, решение которых также необходимо при автоматизированной компоновке теста, относится работа по наполнению банка тестовых заданий и оцениванию информационной безопасности тестирования.

Компьютерная генерация параллельных вариантов теста фиксированной длины. Автоматизированная сборка теста с фиксированным числом заданий предполагает наличие установленной длины теста, его спецификации и банка калиброванных заданий. В работоспособный банк, поддерживающий генерацию многовариантного теста, должны входить фреймы заданий различной трудности по каждому содержательному элементу с устойчивыми оценками параметров. С помощью специального программно-инструментального обеспечения получается аналог традиционного блан-кового теста, готовый к предъявлению спустя несколько минут от начала генерации и обеспечивающий высокое качество педагогических измерений.

Метод автоматизированной компоновки теста для компьютерного предъявления в режиме offline (без использования локальных компьютерных сетей или Интернета) или в режиме online (с использованием локальных компьютерных сетей или Интернета) называют автоматизированным тестовым дизайном. Целью дизайна является формирование вариантов теста, удовлетворяющих целому ряду условий, к которым относятся: число заданий, структура содержания, частота выбора заданий в варианты, а также ряд требований, обеспечивающих генерацию параллельных вариантов теста.

Технология компоновки вариантов должна поддерживать систематический контроль за частотой включения каждого задания из банка в тест. Количество одинаковых заданий в параллельных вариантах, используемых для выравнивания шкал по вариантам, не должно превышать 15 -- 20 %. Для контроля частоты включения задания в варианты в качестве ограничения вводится максимально возможный процент выбора каждого задания из банка. При его до-стижении задание перестает использоваться в дальнейших проце-дурах генерации теста.

Обычно многочисленные параллельные или квазипараллельные варианты теста создаются в режиме offline для последующего предъявления в режиме online, в том числе при интерактивном взаимодействии с обучающимися [5]. Для расширения коммуникативных возможностей компьютерного контроля в геаl time рекомендуется использование адаптивного тестирования, обеспечивающего пошаговую оптимизацию подбора трудности заданий при генерации адаптивного теста .

4.4. Компьютерное адаптивное тестирование

Адаптивное тестирование и его возможности. Появление адаптивного тестирования было вызвано стремлением к повышению эффективности педагогических измерений, которая, как правило, связывалась с уменьшением числа заданий, времени, стоимости тестирования, а также с повышением точности оценок учащихся. В основе адаптивного подхода лежит индивидуализация процедуры отбора заданий теста, которая за счет оптимизации трудности заданий применительно к уровню подготовленности обучаемых обеспечивает генерацию эффективных тестов [6].

Оптимизация трудности заданий обычно проводится пошагово. Если учащийся выполняет задание верно, то затем ему дается более трудное задание. При неправильном выполнении задания совершается отход назад к более легким заданиям банка. При невыполнении трех заданий подряд процесс останавливается и специальными методами (чаше всего с помощью теории IRТ) определяется балл учащегося за выполненные задания по сформированному специально для него адаптивному тесту. Таким образом, в компьютерном адаптивном предъявлении число тестовых заданий и их трудность индивидуально подбираются для каждого экзаменующегося на основании его ответов, а индивидуальная совокупность заданий образует адаптивный тест. Адаптивные тесты в группе испытуемых состоят в основном из разных заданий и различаются по количеству и трудности заданий тем сильнее, чем больше разброс среди испытуемых тестируемой группы по подготовленности.

Получить одновременный прирост эффективности измерений по всем критериям невозможно, поэтому обычно при организации адаптивного тестирования на первый план выходит один, в лучшем случае, два критерия. Например, в одних случаях при экспресс-диагностике в адаптивном режиме наибольшее внима-ние уделяется минимизации времени испытания и количеству предъявляемых заданий, а вопросы точности оценок отходят на второй план. В других случаях приоритетной может быть точность измерения и тестирование каждого испытуемого продолжается до тех пор, пока не достигается запланированная минимальная ошибка измерения.

На длине адаптивного теста существенно сказывается качество структуры знаний учащихся. Обычно испытуемые с четкой структурой знаний выполняют задания нарастающей трудности, уточняя с каждым очередным верно выполненным заданием оценку подготовленности. Они выполняют небольшое число заданий адаптивного теста и быстро доходят до порога своей компетентности. Учащиеся с нечеткой структурой знаний, у которых чередуются верные и неверные ответы, получают колеблющиеся по трудности задания. Процесс тестирования затягивается, поскольку при скачкообразном изменении трудности заданий не происходит пошагового нарастания точности измерения и число заданий, адаптированных по трудности, нередко оказывается даже большим, чем в обычном, традиционном тесте.

Преимущества адаптивного тестирования. К числу важных преимуществ компьютеризованного адаптивного тестирования можно отнести:

высокую эффективность;

высокий уровень секретности;

индивидуализацию темпа выполнения теста;

высокий уровень мотивации к тестированию у наиболее слабых обучающихся за счет исключения из процесса предъявления излишне трудных заданий;

- сообщение результата в интервальной шкале тестовых баллов каждому испытуемому незамедлительно, сразу после окончания его работы над индивидуально подобранным набором заданий в адаптивном тесте.

Стратегии адаптивного тестирования. Стратегии предъявления тестовых заданий в адаптивном тестировании можно разделить на двухшаговые и многошаговые, сообразно которым используется различная технология формирования адаптивных тестов. Двухша-говая стратегия предполагает наличие двух этапов. На первом этапе всем испытуемым выдается одинаковый входной тест, цель которого -- осуществление предварительной дифференциации учащихся вдоль оси переменной измерения. По результатам дифференциации на втором этапе организуется адаптивный режим и строятся адаптивные тесты.

В результате развития теории IRТ, обеспечивающей единую интервальную шкалу для оценок параметров испытуемых и трудности заданий теста, появилась возможность по-новому осуществить оптимизацию процедуры отбора заданий для моделирования эффективных адаптивных тестов. Стали развиваться многошаговые стратегии адаптивного тестирования, в рамках которых в процессе выполнения наборов заданий каждый испытуемый движется по своей индивидуальной траектории.

Многошаговые стратегии адаптивного тестирования подразделяются на фиксировано-ветвящиеся и варьирующе-ветвящиеся в зависимости от того, как конструируются многошаговые адаптивные тесты. Если один и тот же набор заданий с их фиксированным расположением на оси трудности используется для всех испытуемых, но каждый учащийся движется по набору заданий индивидуальным путем в зависимости от результатов выполнения очередного задания, то стратегия адаптивного тестирования является фиксировано-ветвящейся.

Задания по трудности в наборе заданий обычно располагают на равном расстоянии друг от друга или выбирают убывающий шаг сообразно нарастанию трудности, что позволяет подстроить темп тестирования под испытуемого, поскольку по мере выполнения заданий у него нарастает утомление и снижается мотивация к выполнению заданий теста.

Варьирующе-ветвящаяся стратегия адаптивного тестирования предполагает отбор заданий непосредственно из банка по определенным алгоритмам, которые прогнозируют оптимальную трудность последующего задания по результатам выполнения испытуемым предыдущего задания адаптивного теста. Таким образом, шаг за шагом из отдельных заданий получается адаптивный тест. В нем варьирует не только трудность, но и шаг, определяемый разностью трудностей двух соседних заданий адаптивного теста. Отличительной особенностью варьирующей-ветвящейся стратегии адаптивного тестирования является пошаговая переоценка уровня под-готовленности испытуемого, предпринимаемая после каждого выполнения очередного задания теста.

Вход и выход из адаптивного тестирования. Выбор начальных оценок для входа в адаптивное тестирование осуществляется по-разному, в зависимости от вида стратегии и имеющихся технологических возможностей при генерации адаптивных тестов. Один из методов определения начальных оценок основан на выдаче испытуемым перед началом адаптивного тестирования входного претеста. В претест обычно включают 5-- 10 заданий из различных разделов содержания, охватывающих по трудности весь диапазон предполагаемого расположения тестируемой выборки учащихся на оси переменной измерения.

Для выхода из режима тестирования либо вводят ограничения по времени или по числу заданий, либо задаются планируемой точностью измерений.

Надежность, валидность и длина теста при адаптивном тестировании. Так же как и при традиционном тестировании, стбор заданий в адаптивные тесты осуществляется в соответствии со спецификой теста. Оптимизируя трудность,можно лишь уменьшить число предъявляемых заданий по каждому разделу и сохранить при этом для каждого истпытуемого содержательный план теста. Таким образом, адаптивное тестирование вне зависимости от стратнгии предъявления заданий и их числа должно обеспечивать высокую содержательную валидность каждого генерируемого адаптивного теста.

Надежность в адаптивном тестировании зависит от совокупности факторов. К ним стносятся: число заданий , наличие систематического контроля за частотой выбора заданий банка при генерации адаптивного теста. На надежность также влияют характеристики банка тестовых заданий, связанные с качеством измерений и качеством входного контроля.

Заключение. Тесты и учителя.

Причины затруднений учителей при работе с тестами. Использование тестовых методик предполагает наличие определенных условий, которые имеются далеко не во всякой школе. Прежде всею требуются сами тестовые задания, разработка которых не может быть инициативной работой одного учителя в ущерб своему свободному времени. Желательно, чтобы в создании тестов принимали участие почти все преподаватели школы, чтобы они обменивались своими достижениями, совместно преодолевали трудности. Необходимо также иметь программно-инструментальное обеспечение для ведения баз данных тестирования, хранения банков заданий, выдачи заданий учащимся в компьютерной форме или распечатки заданий на бланках и обработки данных тестирования. Как уже отмечалось, перечисленные условия есть далеко не во всех учебных заведениях, поэтому нередки случаи, когда по возвращении в школу после очередного повышения квалификации по тестовым методикам учитель сразу забывает все, чему научился, и включается в повседневный учебный процесс.

Считается, что педагогам с гуманитарной базовой подготовкой трудно освоить содержание курса по педагогическим измерениям, в котором используется математико-статистическое обоснование качества тестов. Если вы недостаточно сильны в математике и боитесь не освоить методики разработки и применения тестов, то ваши опасения необоснованны. Многолетний опыт преподавания курса по теории и практике конструирования тестов, накопленный авторами этой книги при работе с преподавателями средней и высшей школы, свидетельствует о том, что отсутствие специальных знаний по математике не является препятствием в освоении этого курса.

При изложении материала в нем используется основной набор математических действий -- сложение, вычитание, умножение и деление, а простейшие понятия математической статистики легко усваиваются всеми педагогами вне зависимости от базового образования по мере изложения методик разработки и примене-ния тестов.

Какие тесты необходимо разрабатывать и применять всем учителям? Без сомнения, математико-статистический аппарат, используемый профессионалами в полном объеме при разработке тестов для алминистративно-управленческих решений, довольно сложен, но он учителям и не нужен. В основном в учебном процессе используются тесты для входного и текущего контроля, не нуждающиевя в серьезном статистическом обосновании. От разработчиков таких тестов требуется лишь владение методикой отбора содержания, знания требований к тестовым формам и простейших показателей дескриптивной статистики, необходимых для выполнения основных требований к качеству теста. Поскольку на тесты для текущего контроля приходится основная доля по времени и объему использования. То будет верным считать, что учитель - ключевая фигура в разработке и применении педагогических тестов.

Факторы, влияющие на интерпретацию результатов тестирования. Помимо разработки тестов для текущего контроля учителю также нужно обязательно овладеть методикой применения педагогических тестов, интерпретацией их результатов, в первую очередь, для разъяснения родителям учеников проблем и трудностей, с которыми сталкиваются их дети. Такая интерпретация не может иметь изолированный, полностью беспристрастный характер. На нее оказывают влияние многочисленные факторы и сопутствующие элементы социально-экономической среды, окружающей учащихся, учителя, класс и в целом школу (см. рис. 1).

Результаты тестирования влияют на отношения педагога с учащимися и их родителями и на его статус в профессиональном сообществе. Поэтому умения применять педагогические тесты, шкалировать и интерпретировать результаты их выполнения необходимы каждому учителю для самооценки эффективности своей работы, выявления в ней слабых мест и поиска факторов профессионального роста. Игнорирование или отрицание потребности в тестировании не отменят эту потребность, поэтому, учитывая, что педагог работает в условиях ограниченного времени, правильнее было бы начать осваивать разработку и применение тестов еще в студенческие годы, до начала педагогической деятельности.

Приложение.

рис.1 Важнейшие факторы, влияющие на интерпретацию результатов педагогического тестирования.

РОУОРУ- Руководители органов управления образованием районного уровня;

СУМ -- сообщество учителей микрорайона;

ФОУО -- федеральные органы управления образованием

Таблица 1. Достоинства и недостатки различных форм предтестовых заданий.

Формы предтестовых заданий

Достоинства

Недостатки

Задания с двумя ответами

Благодаря краткости поз-воляют охватить большой объем материала, легко разрабатываются (только один дистрактор), резуль-таты выполнения обраба-тываются быстро с высо-кой объективностью.

Стимулируют механиче-ское запоминание, по-ощряют угадывание, тре-буют увеличения количе-ства заданий и, соответ-ственно, времени тести-рования для компенса-ции эффекта угадывания.

Задания с выбором из четырех-пяти ответов

Годятся для самых раз-личных предметов, в силу краткости формулировок в тесте можно охватить большой объем содержа-ния, обеспечивают воз-можность автоматизиро-ванной проверки и высо-кую объективность оце-нок учащихся, позволяют провести развернутый статистический анализ своих характеристик, скорректировать их и значительно повысить надежность пе-дагогических измерений.

Требуют значительной работы авторов при подборе дистракторов, не годятся для проверки родуктовного уровня деятельности и когнитивных умений.

Задания с конструируемыми регламентированными ответами

Просты в разработке, ис-ключено угадывание, час-тично годятся для автома-тизированной проверки.

Проверяют в основном знание фактологического материала или понятий-ного аппарата, иногда (в гуманитарных предмета х)приводят к неоднознач-ным правильным и час-тично правильным ответам

Задания со свободно конструируемыми ответами

Позволяют оценивать сложные учебные дости-жения, в том числе твор-ческий уровень деятель-ности, легко формулиру-ются, исключают угады-вание.

Требуют длительной до-рогостоящей процедуры проверки, значительного времени выполнения, не позволяют охватить зна-чительный объем содер-жания предмета, снижа-ют надежность педагоги-ческих измерений.

Задания на соответствие

Просты в разработке, идеально подходят для оценивания ассоциатив-ных знаний и проведения текущего контроля, умень-шают эффект угадывания.

В основном используются лишь для проверки ре-продуктивного уровня деятельности и алгорит-мических умений, гро-моздки по форме пред-ставления.

Анастази А. Психологическое тестирование./ - М., 1982.

2. Самылкина Н.Н. Современные средства оценивания результатов обучения /- М.,2007

3. Звонников В.И. Современные средства оценивания результатов обучения / - М., 2007

4. Челышкова М.Б. Теория и практика конструирования педагогических тестов /- М., 2001

5. Гутгарц Р.Д. Особенности дистанционного тестирования в Интернете / - Иркутск, 2001

6. Шмелев Г.А., Бельцер А.И. Адаптивгное тестирование знаний в системе « Телетестинг» / - М., 2001

7. Зимняя И.А. Педагогическая психология /- М., 2005

8. Балыхина Т.М. Словарь терминов и понятий тестологии /- М., 2000

9. Андреев А.Б. Компьютерное тестирование : системный подход к оценке качества знаний студентов /- М., 2001

10. Родионов Б.У., Татур А.О. Стандарты и тесты в образовании /- М.,1995


Подобные документы

  • История возникновения тестирования. Понятие теста, тестовых заданий. Классификация тестов, основные формы тестирования. Закрытые и открытые тестовые задания. Задания на соответствие и установление правильной последовательности. Анализ систем тестирования.

    презентация [873,3 K], добавлен 07.04.2014

  • Основные виды педагогических тестов и формы тестовых заданий. Эмпирическая проверка и статистическая обработка результатов. Принципы отбора и критерии оценки содержания теста. Соотношение формы задания и вида проверяемых знаний, умений, навыков.

    лекция [79,8 K], добавлен 10.05.2009

  • Особенности организации тестирования знаний. Рекомендации по использованию тестовых заданий на разных этапах обучения и в различных видах занятий, оценка их результатов. Анализ роли и места тестовых заданий по истории в проверке знаний и умений учащихся.

    курсовая работа [160,8 K], добавлен 30.08.2010

  • История проверки знаний и способностей с помощью различных заданий. Опыт централизованного абитуриентского и репетиционного тестирования в России. Тесты в американской системе образования. Характерные черты тестовых методов, используемых в Америке.

    реферат [32,5 K], добавлен 05.02.2008

  • Основные комплексы педагогических методов исследования. Основные требования при проведении наблюдения, его недостатки. Классификация педагогических экспериментов, их значение. Понятие и разновидности тестирования. Социологические методы исследования.

    реферат [15,5 K], добавлен 25.04.2009

  • Разработка проблемы тестирования в отечественной методике. Типы тестов в общеобразовательной практике и обучении иностранному языку. Эволюция подходов и тестовых методик в зарубежной системе образования.

    реферат [39,4 K], добавлен 18.06.2007

  • Использование электронных систем управления обучением. Формирование банка тестовых заданий всех основных форм. Матрица результатов тестовых заданий. Индекс легкости заданий для тестируемой группы. Средства анализа результатов тестовых заданий системы.

    реферат [1,4 M], добавлен 31.03.2011

  • Контроль знаний школьников с помощью педагогических тестов. Мотивация и готовность к деятельности как основные причины, влияющие на тестирование и его результаты. Перспективность и преимущества метода тестов. Основные этапы проведения тестирования.

    статья [21,9 K], добавлен 01.02.2012

  • История возникновения тестирования. Система испытаний и отбора учеников в Древней Греции, Риме, Спарте, Китае. Испытпние интеллектуальных способностей в Индии. Первые педагогические тесты. Развитие тестирования в России. Современная теория тестов (IRT).

    лекция [46,0 K], добавлен 10.05.2009

  • Качественные экспертно-ориентированные методы оценки знаний и умений учащихся. Цель и основные задачи тестирования. Основные виды тестовых заданий. Функции теста и основные этапы его разработки. Сквозное применение педагогами метода тестирования.

    курсовая работа [46,2 K], добавлен 27.12.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.