Автоматизация контроля результатов обучения учащихся

Введение тестового контроля учащихся. Основные преимущества и недоставки применения тестового контроля знаний. Типы компьютерных тестов. Формирование оценочной шкалы тестового контроля. Инструментальные тестовые оболочки. Обзор тестирующих комплексов.

Рубрика Педагогика
Вид реферат
Язык русский
Дата добавления 05.01.2012
Размер файла 506,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Обзор существующих решений

В последние годы в России в сфере образования наблюдается стремительное усиление интереса к автоматизации промежуточного и финального контроля результатов обучения учащихся самых различных учебных заведений, начиная от школ и заканчивая коммерческими курсами. Самым популярным видом такого контроля является тестирование, основанное на диалоге вычислительной системы с пользователем. Стремительный рост быстродействия компьютерных систем, уменьшение цен на вычислительную технику, появление качественных и мощных систем программирования увеличило потребность в системах, позволяющих объективно, быстро и надежно оценивать знания учащихся, предлагая интересные формы взаимодействия с ними.

Но вопрос создания таких систем является не однозначным, и авторы существующих разработок иногда отходят от педагогической и психологической стороны вопроса, пытаясь максимально увеличить привлекательность своих программных продуктов за счет средств мультимедиа. Иногда программисты просто игнорируют процесс взаимодействия с непосредственно носителями знаний (преподавателями), что отражается на существующих приложениях. Очень часто сами преподаватели не владеют в должной мере методами оценки качества создаваемых тестов.

Необходимо отметить, что первые концепции компьютеризации обучения возникли более 30 лет назад под лозунгом “техническое перевооружение педагога, механизация его труда”, “обучающей машины”, имитирующей процесс индивидуальной работы преподавателя с обучаемым. Со временем росло понимание их ограниченности. Определенное распространение получили попытки использовать в учебном процессе системы искусственного интеллекта. Именно применение методов искусственного интеллекта и инженерии знаний, на мой взгляд, поможет превозмочь субъективность и прямолинейность процесса тестирования, поднимая уровень оценивания знаний машинными системами. Дело в том, что применение традиционных методов компьютерного обучения и контроля (прямое тестирование, бальная система, и т.д.) неприемлемо: для того, чтобы оценить знания обучаемого, преподавателю приходится переработать огромное количество информации, и процесс взаимодействия оценивающего и оцениваемого не поддается строгой формализации, поэтому три основные алгоритмические структуры (последовательная, ветвление, цикл) при реализации машинных систем не смогут описать в полной мере данную предметную область. Т.е. осуществление автоматизированного контроля знаний, умений обучаемых, в первую очередь, включает решение проблемы определения совокупности требуемых качеств знаний, без которых критерии оценки знаний и способы определения уровня их усвоения выявить нельзя.

1.1 Введение тестового контроля

Введение тестового контроля существенно повышает мотивацию обучения и заинтересованность обучаемого.

Внедрение тестовой формы контроля по предмету осуществлялось поэтапно.

На первом этапе в тестовой форме проводился только входной контроль и заключительной целью проведения входного теста является получение сведений об исходном уровне знаний студентов. Успех изучения любого курса зависит от степени усвоения тех понятий, терминов, положений, которые изучались на предшествующих этапах обучения. Поэтому входной тест, включает задания, проверяющие уровень усвоения основных учебных элементов данного курса. При проверке определяются прежде всего пробелы в знаниях, что очень важно для продуктивного самообразования.

Итоговый тест (экзаменационный) систематизирует, обобщает учебный материал, проверяет сформированные знания и умения. Результаты первых проверок показали, что студентов необходимо готовить к экзаменационному тесту, используя тестовые задания при проведении текущего и рубежного контроля. Задания с выбором ответа особенно ценны тем, что каждому учащемуся дается возможность четко представить себе объем обязательных требований и овладению знаниями курса, объективно оценить свои успехи , получить конкретные указания для дополнительной , индивидуальной работы. Тестовые задания удобно использовать при организации самостоятельной работы учащихся в режиме самоконтроля, при повторении учебного материала.Тесты с успехом можно использовать наряду с другими формами контроля, обеспечивая информацию по ряду качественных характеристик знаний и умений учащегося.

Работа по созданию тестов и оценка их эффективности достаточно сложная и долгая.

Во-первых, необходимо оценивать качество каждого теста - соответствие программе и реальным возможностям учащихся, учитывая при этом сильно действующие временные ограничения на выполнение ими тестовых заданий. Если соответствие программе можно проверить, анализируя только литературу, то проверка «посильности» каждого теста и даже каждого задания в одном отдельно взятом тесте возможна только после проверки в реальном эксперименте.

Во-вторых, желательна оценка «представительности» всей батареи тестов насколько она захватывает весь программный материал или хотя бы наиболее существенную его часть (из конъюнктурных соображений).

И, наконец, главное - составленные тесты необходимо «прокрутить» несколько раз, чтобы отобрать из них наиболее представительные, наиболее информативные с точки зрения диагностики «готовности». Системное внедрение тестов затрудняется в связи с относительной сложностью создания качественного теста.

1.2 Тест, как форма контроля знаний

Управлять, и корректировать каким бы то ни было процессом возможно лишь на основании данных контроля над его течением, не составляет исключения и процесс учебной деятельности. Эффективность применения стандартов возможна только в условиях объективного контроля знаний и умений учащихся.

Различают два метода контроля - субъективный и объективный. Субъективный метод контроля означает выявление, измерение и оценку знаний, умений, навыков, исходящую из личных представлений экзаменатора. Этот метод оценки знаний пригоден для итогового контроля, так как не обладает необходимой точностью и воспроизводимостью результатов.

Под объективным контролем подразумевают контроль, который обладает необходимой точностью, воспроизводимостью результатов.

Инструментом, который позволяет объективно оценивать качество усвоения, является критериально-ориентировочный тест, сочетающий в себе контрольное задание и эталон, по которому можно судить по качеству усвоения.

Однако, как свидетельствует реальная практика, не всегда удается достичь достаточной степени объективности и оперативности контроля в обучении. В следствии этого часто снижается представление об учебной деятельности учащихся.

Тест тем принципиально отличается от привычного контроля знаний, что к нему (заданию) заранее приготовить эталон, с которым сравнивают ответ студента. Эталон необходим для точного определения степени усвоения студентом содержания обучения, которая характеризуется коэффициентом усвоения, подсчитываемым по формуле:

где е - число операций теста, выполненных студентом правильно, р - общее число операций в тесте.

На Западе, особенно в США, тесты используются достаточно давно, и что любопытно: мы движемся к тестовой проверке знаний, а там - в противоположном направлении.

Тесты - это задание, состоящее из ряда вопросов и нескольких вариантов ответа на них для выбора в каждом случае одного верного. С их помощью можно получить, например, информацию об уровне усвоения элементов знаний, о сформированности умений и навыков учащихся по применению знаний в различных ситуациях.

Достоинство:

Главное достоинство тестовой проверки в скорости, а традиционной проверки посредством дидактических материалов- в ее основательности.

Недостатки:

Если результаты своей работы учащийся представляет только номера ответа, тут учитель не видит характера хода решения - мыслительная деятельность учащегося и результат может быть только вероятностным. Гарантии наличия знаний у учащегося нет;

К недостаткам тестов также относят возможность угадывания. Если, например, тестовое задание содержит только два ответа, один из которых правильный, то половину ответов на такие тестовые задания можно угадать.

Для диагностики успешности обучения разрабатываются специальные методы, которые разными авторами называются тестами учебных достижений, тестами успешности, дидактическими тестами и даже тестами учителя (под последними могут также подразумеваться тесты, предназначенные для диагностики профессиональных качеств педагогов). Как утверждает А.Анастази, по численности этот тип тестов занимает первое место.

Тесты - это достаточно краткие, стандартизированные или не стандартизированные пробы, испытания, позволяющие за сравнительно короткие промежутки времени оценить преподавателями и студентами результативность познавательной деятельности студентов, т.е. оценить степень и качество достижения каждым студентом целей обучения (целей изучения).

Тесты достижений предназначены для того, чтобы оценить успешность овладения конкретными знаниями и даже отдельными разделами учебных дисциплин, и являются более объективным показателем обученности, чем оценка.

Тесты достижений отличаются от собственно психологических тестов (способностей, интеллекта). Их отличие от тестов способностей состоит, во-первых, в том, что с их помощью изучают успешность овладения конкретным, ограниченным определенными рамками, учебным материалом, например, разделом математики или курсом английского языка. На формирование способностей (например, пространственных) влияние обучения также сказывается, но оно не является единственным фактором, определяющим уровень их развития.

Во-вторых, различие между тестами определяются целями их применения. Тесты достижений применяются для оценки успешности овладения конкретными знаниями с целью определения эффективности программ, учебников и методов обучения, особенностей работы отдельных учителей, педагогических коллективов и т.д., т.е. с помощью этих тестов диагностируют прошлый опыт, результат усвоения тех или иных дисциплин или их разделов.

Вместе с тем нельзя отрицать, что тесты достижений также могут в определенной степени предсказывать темпы продвижения учащегося в той или иной дисциплине, поскольку имеющийся на момент тестирования высокий или невысокий уровень овладения знаниями не может не отразиться на дальнейшем процессе обучения.

Для того чтобы, правильно ответить на вопросы, входящие в тест достижений, необходимы знания конкретных фактов, дат и др. Старательный студент, обладающий хорошей памятью, без труда может найти правильные ответы в заданиях теста достижений.

Наряду с тестами достижений, предназначенными для оценки усвоения знаний по конкретным дисциплинам или их циклам, разрабатываются и более широко ориентированные тесты. Это, например, тесты на оценку отдельных навыков. Еще более широко ориентированными являются тесты для изучения умений, которые могут пригодиться при овладении рядом дисциплин, например, навыки работы с учебником, математическими таблицами, энциклопедиями и словарями.

Существуют также тесты, направленные на оценку влияния обучения на формирование логического мышления, способности рассуждать, строить выводы на основе анализа определенного круга данных и т.д. Эти тесты в наибольшей степени приближаются по своему содержанию к тестам интеллекта и высоко коррелируют с последними. Поскольку тесты достижений предназначены для оценки эффективности обучения по конкретным предметам, то обязательным участником формулирования отдельных заданий должен стать преподаватель.

Отдельные тесты достижений можно объединять в тестовые батареи, что позволяет получать профили показателей успешности обучения по разным дисциплинам. Обычно тестовые батареи предназначаются для разных образовательно-возрастных уровней и не всегда дают результаты, которые можно сопоставлять друг с другом для получения целостной картины успешности обучения от курса к курсу. Однако в последнее время созданы батареи, позволяющие получать и такие данные.

По форме проведения тесты могут быть индивидуальными и групповыми, устными и письменными, бланковыми, предметными, аппаратурными и компьютерными, вербальными и невербальными. При этом каждый тест имеет несколько составных частей: руководство по работе с тестом, тестовую тетрадь с заданиями и, если необходимо, стимульный материал или аппаратуру, лист ответов (для бланковых методик), шаблоны для обработки данных.

В руководстве приводятся данные о целях тестирования, выборке, для которой тест предназначен, результатах проверки на надежность, способах обработки и оценки результатов. Задания теста, сгруппированные в субтесты (группы заданий, объединенные одной инструкцией), помещены в специальной тестовой тетради (тестовые тетради могут быть использованы многократно, поскольку правильные ответы отмечаются на отдельных бланках). Если тестирование проводится с одним испытуемым, то такие тесты носят название индивидуальных, если с несколькими - групповых. Каждый тип тестов имеет свои достоинства и недостатки. Преимуществом групповых тестов является возможность охвата больших групп испытуемых одновременно (до нескольких сот человек), упрощение функций экспериментатора (чтение инструкций, точное соблюдение времени), более единообразные условия проведения, возможность обработки данных на ЭВМ и др.

Основным недостатком групповых тестов является снижение возможностей у экспериментатора добиться взаимопонимания с испытуемыми, заинтересовать их. Кроме того, при групповом тестировании затруднен контроль за функциональным состоянием испытуемых, таким, как тревожность, утомление и др. Иногда для того, чтобы понять причины низких результатов по тесту какого-либо студента, следует провести дополнительное индивидуальное собеседование. Индивидуальные тесты лишены этих недостатков.

Тестирование широко используется в учебных заведениях для тренировочного, промежуточного и итогового контроля знаний, а также для обучения и самоподготовки учащихся.

Как уже указывалось, результаты тестирования могут выступать и как оценка качества преподавания, а также как оценка самих испытательных материалов.

Не меньший интерес представляет изучение результатов тестирования для определения качества лекции или семинара. Например, пусть в потоке у лектора несколько групп, и во всех проведено тестирование по заданному разделу курса. В тесте имеется определенное количество теоретических вопросов и практических задач. Каждый вопрос соответствует какой-либо теме. По этой же теме в тесте прилагается практическая задача. Если студенты во всех группах плохо справились с каким-либо теоретическим заданием и практической задачей к этому вопросу, следовательно, на лекции и на семинарах не уделено достаточного внимания этой теме (хотя необходимо учитывать, что группы неравномерны по контингенту).

В настоящее время наиболее часто используются следующие варианты тестовых контрольных мероприятий :

"автоматический", когда обучаемый выполняет задание в непосредственном диалоге с ЭВМ, результаты сразу переносятся в блок обработки;

“полуавтоматический”, когда задания выполняются письменно, а ответы со специальных бланков вводятся в ЭВМ (решения не проверяются);

“автоматизированный”, когда задания выполняются письменно, решения проверяются преподавателем, а в ЭВМ вводятся результаты проверки.

Особенностью первых двух является отстраненность преподавателя от проверки результатов испытаний. В этом случае, казалось бы, их объективность повышается. Однако, при этом утрачивается значительная часть информации, которую можно было бы получить при анализе результатов тестирования с использованием человеческого фактора.

В “автоматическом” режиме такой потери можно избежать. Но при использовании такого метода на сегодняшний день возможно появление некоторых специфических проблем.

Отсутствие достаточного парка ЭВМ. Не все учебные заведения могут позволить себе оснастить классы дорогостоящим компьютерным оборудованием в достаточном количестве.

Отсутствие навыков пользователя ЭВМ у обучаемых. Иногда приходится работать со студентами, у которых по каким-то причинам нет достаточной компьютерной подготовки, или же они вообще никогда не общались с компьютером.

Сложность и дороговизна разработки программного обеспечения.

Существует проблема распознания ответов произвольной формы в открытых текстовых заданиях.

“Автоматический” вариант применяется на кафедре “ВТ и САПР” в СибАДИ при изучении таких дисциплин, как “Информатика” и “Теории вероятности и математической статистики”. По подробней об этом будет сказано дальше.

В “автоматизированном” варианте система тестирования включает в себя испытательный материал - в качестве инструмента измерений, преподавателя-проверяющего - в качестве независимого эксперта и компьютерную оболочку, выполняющую функции обработки результатов и учета ошибок измерения, выявления статистических закономерностей, сравнения результатов испытаний с прогнозируемыми, среднестатистическими, а также между собой.

Одним из наиболее актуальных направлений развития компьютерных технологий в образовании является разработка специализированных систем проверки знаний студентов. Их активное использование помогает поддерживать нужный образовательный уровень студентов, предоставляет преподавателю возможность уделять больше внимания индивидуальной работе со студентами.

В порядке эксперимента в Московском Государственном Университете Экономики, Статистики и Информатики по некоторым дисциплинам было введено сетевое тестирование в качестве итогового контроля знаний. Сетевое тестирование там дало хорошие результаты. Как форма контрольных мероприятий, она особенно удобна при наличии доступа в систему с личного компьютера. В сравнении с традиционным опросом или экзаменом сетевое тестирование экономит время, активизирует процесс изучения материала. Также к достоинствам можно отнести простоту входа-выхода в систему; удобный интерфейс; минимальность информации, необходимой для регистрации студента (Ф.И.О., группа, № зачетной книжки, пароль); возможность автоматической (ручной) проверки правильности данных студентами ответов преподавателем в любое время; сохранность данных в системе (в течении любого необходимого периода времени); индивидуальность тестирования (студент вводит свой пароль, без которого никто другой войти и выполнить тестирование за него не сможет).

Положительной стороной данного опыта является то, что студенты находятся в одинаковых условиях, исключаются жалобы на необъективность экзаменатора.

В настоящее время компьютерное тестирование успешно используется также в СибАДИ на кафедре “ВТ и САПР” при изучении курса “Информатика”. После определенного цикла лабораторных работ студенту предлагаются тесты по определенной теме данного курса. Тесты включают в себя вопросы по правильному написанию и оформлению пройденных программных операторов или конструкций. Так, например, в одной из предлагаемых задач теста необходимо указать правильное написание оператора ввода простой переменной. На экране представлено несколько вариантов ответов, среди которых может быть несколько правильных, а не только один.

Также тесты включают в себя небольшие фрагменты программ, просмотрев которые, студенты должны определить, что выполняет данный фрагмент, и вычислить значение, полученное в результате решения данной задачи. Для выполнения таких тестов студент должен знать не только конструкции программных операторов, но и уметь логически мыслить, а также анализировать ответы.

В разработанных тестах содержится по 10 вопросов. Для обработки тестов была написана контролирующая программа.

Во время контрольных мероприятий студент за компьютером отвечает на вопросы, высвечивающиеся на экране, и в конце тестирования получает оценку по пятибалльной шкале.

Раньше при старой системе проведения экзамена по курсу “Информатика” требовалось довольно много времени для опроса всех студентов. В настоящее время теоретической частью экзамена является тестирование. Для охвата всей темы в тесте предлагается 30-40 вопросов. По окончании проведения контроля оценку ставит сама машина.

На этой же кафедре (“ВТ и САПР”) метод компьютерного тестирования вот уже несколько лет применяется в курсе “Теории вероятности и математической статистики”. На практическом занятии после обсуждения определений, формул и типовых задач студенты начинают самостоятельную работу с тестами. Тестирование рассчитано на 40 минут. При такой организации работы преподаватель выступает в роли консультанта, имеет возможность обсудить практически с каждым наиболее трудные моменты и ошибки. За отведенное время студент успевает разобрать 10-15 задач вместо обычных 3-4.

Рассмотрим еще один пример использования тестирования для контроля успеваемости студентов на примере кафедры общей и неорганической химии ГАНГ им. Губкина. В данном случае без применения ЭВМ.

После проведения статистических исследований по изучению тестирования как метода педагогического контроля было выявлено, что в тесте должно быть 15-20 заданий. Они помогают определить, владеет ли студент основными понятиями, закономерностями, умеет ли правильно записать формулы, а также как полученные знания помогают ему при решении практических задач.

Задания предлагаются, как правило, с ответами в “закрытой форме”, когда нужно выбрать один из нескольких предложенных ответов или в “открытой форме”, когда нужно вставить пропущенное слово. В этом случае, когда ответ однозначен, он оценивается по двухбалльной системе - 1 или 0, если задание имеет несколько правильных ответов, возможны три оценки -0, 0.5 и 1. Введение в тест заданий с многовариантными ответами развивает у студента потребность в поиске разных путей решения задачи, что необходимо для достижения основной цели обучения в вузе - умения самостоятельно выбирать способ выполнения поставленной задачи.

Анализ полученных результатов показал, что в течение семестра у студентов, способных к обучению от теста к тесту увеличивается число полных ответов на задания с многовариантными ответами. Можно, конечно, вместо одного задания с многовариантным ответом дать несколько с альтернативным, но это значительно увеличит число заданий в тесте и позволит проверить только уровень знаний, но не будет способствовать использованию тестов для развития навыков.

По мнению исследователей такой методики раздел курса считается проработанным, если выполнено 70% заданий.

Необходимо заметить, что тесты, создаваемые с привлечением компьютерных технологий или же без них, должны быть максимально просты в использовании (особенно на ЭВМ), и не требовали специальной подготовки для работы на компьютере.

1.3 Типы компьютерных тестов

В соответствии с моделью знаний, выделим три класса компьютерных тестов на знания, умения и навыки. Отметим, что типы компьютерных тестовых заданий определяются способами однозначного распознавания ответных действий тестируемого.

1. Типы тестовых заданий по блоку «знания» -- вопросы альтернативные (требуют ответа да - нет);

* вопросы с выбором (ответ из набора вариантов);

* вопросы информативные на знание фактов (где, когда, сколько);

* вопросы на знание фактов, имеющих формализованную структуру (в виде информационной модели или схемы знаний);

* вопросы по темам, где имеются однозначные общепринятые знаковые модели:

* математические формулы, законы, предикатные представления, таблицы;

* вопросы, ответы на которые можно контролировать по набору ключевых слов;

* вопросы, ответы на которые можно распознавать каким-либо методом однозначно.

2. Типы тестовых заданий по блоку «навыки» (распознание деятельности: манипуляции с клавиатурой; по конечному результату):

* задания на стандартные алгоритмы (альтернативные да - нет, выбор из набора вариантов);

* выполнение действия.

3. Типы тестовых заданий по блоку «умения». Те же самые, что для навыков, но используют нестандартные алгоритмы и задачи предметной области при контроле времени их решения:

* задания на нестандартные алгоритмы (альтернативные да - нет, выбор из набора вариантов);

* выполнение действия.

Выбор типов тестов определяется:

* особенностями инструментальных тестовых программ (тестовыми оболочками);

* особенностями предметной области;

* опытом и мастерством экспертов.

В отечественной и иностранной литературе нет особого единства по вопросу классификации видов тестов. На фоне других наиболее привлекательным выглядит дифференцированный подход. В нем в качестве признака демаркации видов выбирается характер задач, решаемых преподавателем с помощью тестов в процессе обучения.

При этом подходе выделяются:

1) задачи, стоящие перед преподавателем на входе в обучение;

текущие задачи;

задачи, соответствующие концу определенного периода учебного процесса. (рис.1.)

Рис.1 Классификация видов педагогических тестов

Анализ классификационной таблицы позволяет выделить в качестве основополагающих четыре вида педагогических тестов. Среди них некоторые имеют подвиды и могут отличаться подходом к их разработке. Несомненно, все они достаточно важны для повышения качества подготовки студентов и требуют самого серьезного ознакомления с ними преподавателей и широкого внедрения в учебный процесс.

1.4 Формирование оценочной шкалы тестового контроля

Шкала--средство фиксации результатов измерения свойств объектов путем упорядочения их в определенную систему чисел, в которой отношение между отдельными результатами выражено в соответствующих числах. В процессе упорядочения каждому элементу совокупности наблюдаемых эмпирических данных -- результату выполнения теста -- ставится в соответствие определенный балл (шкальный индекс), устанавливающий положение результата на шкале.

В педагогических измерениях шкалы различаются в зависимости от характера свойств, лежащих в основе их построения. В качестве таких свойств выделяют: идентичность, позволяющую однозначно относить объекты к одной из выделяемых категорий; транзитивность, способствующую ранжированию объектов в определенном порядке; метричность, обеспечивающую единую единицу измерения; наличие абсолютного нуля.

При создании тестов возникают определенные трудности, в части формирования шкалы оценок правильности выполнения заданий студентами.

Оценка знаний - один из существенных показателей, определяющих степень усвоения студентами учебного материала, развития мышления, самостоятельности. Кроме того, оценка служит одним из оснований для решения вопроса о назначении стипендии, и ее размере (повышении за высокие учебные достижения), переводе с курса на курс, выдаче диплома. Оценка должна побуждать студента к повышению качества учебной деятельности.

В существующих системах тестирования предполагается, что преподаватель-экзаменатор заранее выбирает определенную шкалу оценок, т.е. устанавливает, например, что, если испытуемый набирает от 31 до 50 баллов, то он получает оценку “отлично”, от 25 до 30 баллов -”хорошо”, от 20 до 24 - “удовлетворительно”, менее 20 - “неудовлетворительно”.

Очевидно, что при формировании такой шкалы оценок велика доля субъективизма, поскольку здесь многое будет зависеть от опыта, интуиции, компетентности, профессионализма преподавателя. Кроме того, требования, предъявляемые разными преподавателями к уровню знаний студентов, колеблются в очень широких пределах.

На сегодня еще часто встречается метод “проб и ошибок” при формировании шкалы оценок. Поэтому реальные знания учащегося не получают объективного отражения - как негативные последствия - снижается стимулирующее воздействие экзаменационной оценки на познавательную деятельность студента, на качество учебного процесса в целом.

В некоторых тестовых системах оценивание результатов производится только по факту правильности ответа, т.е. ход решения в задачах не проверяется и не оценивается. Таковы, например, закрытые задания с однозначным числовым ответом или бинарные тесты. Для таких заданий в машину вводится ответ, который и сравнивается с эталоном. В данном случае, как показали исследования, наиболее удобной является десятибалльная шкала. Ее преимущества состоят в том, что она более “подробна”, чем пятибалльная, а также легко осуществляется психологическая адаптация, так как на практике многие преподаватели неформально расширяют пятибалльную шкалу до десятибалльной, используя дробные оценки (с минусом и плюсом).

Чтобы определить положение испытуемого относительно выборки стандартизации, его первичный результат (количество правильно выполненных заданий) переводят в некую относительную меру. В основе такого преобразования лежит стремление повысить уровень измерений, перейти, если это возможно, от порядковой к интервальной шкале, допускающей упорядочение испытуемых с учетом различия в их уровне подготовки путем введения фиксированной единицы измерения. Правда, далеко не всегда преобразование первичных результатов приводит к интервальной или хотя бы к квазиинтервальной шкале. В отдельных случаях факт перехода считается довольно спорным и опровергается аргументированной критикой на основании результатов экспертизы качества шкалы и самого измерителя.

Следует отметить, что попытки повышения уровня измерений путем шкалирования направлены целиком на расширение возможностей интерпретации и сопоставимости тестовых баллов, но ни в коей мере не связаны с повышением точности измерений. Не нарушая общности, можно считать, что преобразованные (производные) показатели служат двум целям. Во-первых, они позволяют уточнить место, занимаемое испытуемым в нормативной выборке, и, во-вторых, сравнить результаты испытуемых, полученные по различным тестам.

Изучив различные информационные источники, можно судить о том, что не существует четких рекомендаций по составлению шкал оценок, т.к. обучение студентов происходит по множеству дисциплин и невозможно по каждому разделу данной дисциплины рекомендовать однотипные шкалы оценок, а также по причине того, что по каждому предмету существует свое определенное количество часов для прохождения данного курса.

1.5 Инструментальные тестовые оболочки

Для создания тестов по предметной области разрабатываются специальные инструментальные программы-оболочки, позволяющие создавать компьютерные тесты путем формирования базы данных из набора тестовых заданий.

Инструментальные программы, позволяющие разрабатывать компьютерные тесты, можно разделить на два класса: универсальные и специализированные. Универсальные программы содержат тестовую оболочку как составную часть. Среди них Адонис (Москва), Linkway (Microsoft), Фея (Томск), Радуга (Москва) и т.п. Специализированные тестовые оболочки предназначены лишь для формирования тестов. Это - Аист (Москва), I_now (Иркутск), Тест (Красноярск) и др.

Для того, чтобы разработать компьютерный вариант теста с помощью одной из названных выше программ, необходимо уяснить, какие формы тестовых заданий они допускают.

Как правило, компьютерные формы представления тестовых заданий могут выглядеть следующим образом.

1. Вопросы с фасетом. Задание вопроса, в котором меняются признаки.

Пример.

Назовите столицу страны АНГЛИЯ : ? _____.

2. Вопросы с шаблоном ответа.

Пример.

В каком году произошла Октябрьская революция? В ___ году.

3. Вопросы с набором ключевых слов (изображений, обозначений), из которых можно конструировать ответ.

Пример.

Какие силы действуют на тело, движущееся по наклонной плоскости? (сила трения, сила упругости, сила тяжести, сила реакции опоры).

4. Закрытая форма вопроса: номер правильного ответа.

Пример.

Какой климат в Красноярском крае?

1. Континентальный.

2. Субтропики.

3. Умеренный.

4. Резко-континентальный.

5. Задание на соответствие: несколько вопросов и несколько ответов.

Пример.

а) Кто автор планетарной модели? а) Лермонтов М.Ю.

б) Кто автор закона тяготения? б) Резерфорд

в) Кто автор поэмы «Мцыри»? в) Ньютон

6. Конструирование ответа (шаблонный и безшаблонный варианты): ответ формируется путем последовательного выбора элементов из инструментария по типу меню.

Пример.

Чему равна производная функции у = Sin(х) + Cos(х)?

y' = (Sin(х), Cos(х), tg(х), +, -, /,*, log(х), 1, 2,3,5 и т.д.)

7. Задание на конструирование изображений: с помощью графредактора, меню изображении (аналогично предыдущему примеру).

8. Задание на демонстрацию с движущимися объектами. Ответ в виде действий тестируемого (определенный набор клавиш).

Пример.

Клавиатурный тренажер на время.

Перечисленные формы компьютерного представления тестовых заданий не исчерпывают их многообразия. Многое зависит от мастерства и изобретательности эксперта по тестированию. При создании тестов важно учитывать многие обстоятельства, например, личность тестируемого, вид контроля, методику использования тестов в учебном процессе и т.п.

Хорошим считается тест если

* он восприимчив к угадыванию тестируемым;

* он восприимчив к невнимательности и ошибочным действиям тестируемого;

* он положительно влияет на тестируемого и педагога.

При этом тест используется обучаемым как тренажер и орудие самоконтроля. Для учителя тест служит для корректировки учебного процесса, используется как вспомогательное средство текущего контроля знании, как дидактические средства обучения, для дистанционного обучения.

1.6 Обзор тестирующих комплексов

Тестирующие комплексы (электронные тестеры) являются наиболее распространенными электронными ресурсами проверки знаний. Легкость и простота их использования позволяют быстро оценить способности либо уровень знаний тестируемого.

Классические тестеры представляют собой перечень вопросов по какой-либо теме или дисциплине. Каждый вопрос выводится на экран с предложением выбрать один вариантов ответов, предлагаемых здесь же. После каждого ответа предлагается следующий вопрос, а по окончании теста (обычно довольно короткого) студенту в краткой словесной форме дается характеристика, например: «Вы заслуживаете доверия в умеренной степени». Кроме этого, автоматически подсчитывается количество набранных баллов по оцениваемому параметру. Результаты сохраняются в оперативной памяти, могут быть сохранены в файловом виде и распечатаны.

1.6.1 FK - тест

Программа FK-тест разработана, на базе Межвузовского центра контроля качества знаний (Центр тестирования Уссурийского государственного педагогического института), реализующая классическое тестирование.

Задания формулируются в закрытой форме, к ним 3-5 альтернативных вариантов ответов. Результаты тестирования представляют собой три строки: первая - количество правильных ответов; вторая - количество неправильных ответов; третья - доля правильных ответов, выраженная в процентах. Преподаватели самостоятельно определяют, какой процент правильных ответов можно интерпретировать как зачет.

Работа, предваряющая тестирование, заключается в подготовке заданий в тестовой форме, формулирование к ним вариантов ответов, редактирование заданий, сканирование и редактирование рисунков. Затем запускаются тестеры, считывающие информацию из текстовых файлов. В конце проверяется работа тестирующих программ.

За время существования Центра были проведены зачеты в форме тестирования по таким дисциплинам: 1) Этнология; 2) Методика преподавания физики (7 - 8 кл. ср. школы); 3) Введение в педагогическую деятельность; 4) Анатомия человека (Кости нижнего пояса конечностей; Внутренние органы); 5) Возрастная психология; 6) Земноводные. Студенты оперативно и без лишней эмоциональной нагрузки могут проверить свои знания.

Центр тестирования УГПИ совместно с Московским государственным университетом под эгидой Министерства Образования Российской Федерации проводит с 2000 года репетиционные туры телекоммуникационной компьютеризированной общеобразовательной олимпиады (Телетестинг) для старшеклассников. Это соревновательное тестирование, направленное на выявление способных и подготовленных молодых людей, достойных приглашения обучаться в лучших вузах страны. Тестирование проводится по 9 предметам: словесность, география, биология, история, английский язык, математика, физика, информатика, химия. Десятый - тест интеллектуального потенциала. Обработка результатов тестирования велась через Интернет Московским Центром тестирования "Гуманитарные технологии" МГУ.

Кроме того, Центр тестирования УГПИ проводит репетиционное тестирование для выпускников 11-х и 9-х классов по компьютерным технологиям Центра Тестирования МО РФ в течение учебного года.

1.6.2 REWARD

REWARD - уникальное сочетание средств мультимедиа и идеи дистанционного обучения в одном программном продукте, созданном для изучения английского языка, разработанного оксфордским издательством Macmillan Heinemann ELT, - и современного мультимедийного приложения от признанного производителя образовательного программного обеспечения - компании YDP Multimedia. REWARD InterN@tive устанавливает новый стандарт в обучении иностранному языку при помощи компьютера. Эта программа успешно используется во многих ВУЗах, а в частности с Современной Гуманитарной академии г. Москва.

Тест на определение уровня знаний языка для REWARD, разработан для того чтобы помочь выбрать уровень курса, с которого следует начинать.
Существует четыре уровня: Elementary, Pre-intermediate, Intermediate и Upper-intermediate. Результаты теста дадут приблизительное указание на уровень, оптимально отвечающий потребностям пользователя.

Тест состоит из двух секций: грамматической и словарной. У тестирующегося есть девяносто пять минут для прохождения теста. Это означает, что есть достаточно времени для выполнения упражнений и проверки ответов.

"Журнал Успеваемости" представляет различные типы отчетов по результатам работы ученика с курсом. Он содержит подробные отчеты по уроку, секции или уровню. В отчетах представлены результаты в процентах для уровня в целом, для каждой из секций, любого из уроков и для каждого упражнения. Также, программа заносит в "Журнал Успеваемости" результаты по категориям (языковым навыкам и умениям): грамматике, словарному запасу, чтению, восприятию речи на слух и произношению. Навыки и умения оцениваются для уровня, секций, уроков и упражнений. Все отчеты могут быть распечатаны на принтере.
В отчете по категориям пользователь может отметить любой из языковых навыков, чтобы программа автоматически отобрала все страницы с упражнениями, относящимися к отмеченным категориям. Соответствующие страницы курса могут выбираться из отдельного урока, секции или из учебных материалов всего уровня.

1.6.3 WinTest

В настоящий момент особо важное значение имеет методическое обеспечение самостоятельной работы студентов в связи с тем, что на такой вид работы отводится значительная часть часов при изучении дисциплин.

Одним из важных направлений при разработке программного обеспечения для подготовки специалистов в любой отрасли знаний сегодня продолжает оставаться задача внедрения новых информационных технологий для осуществления обучения и проведения контроля полученных знаний. Современные специалисты не только должны обладать определенным багажом теоретических знаний, но и уметь творчески использовать полученные знания при решении практических задач.

Крымским экономическим институтом разработан программный комплекс WINTest, представляющий собой программную оболочку, которая может быть адаптирована к любой дисциплине. Комплекс WINTest обеспечивает подачу теоретического материала и связанного с ним блока вопросов. Теоретический материал имеет модульную структуру, представленную в виде связанного графа. WINTest соединяет в себе следующие элементы:

- краткий теоретический курс по темам дисциплины;

- практикум решения практических задач для проверки полученных знаний (тестовый модуль), связанный с изученным теоретическим материалом.

Данный комплекс может использоваться в качестве удобного средства обучения и контроля знаний. При разработке WINTest использовалась среда программирования Microsoft Visual Basic 6.0. При работе с программным комплексом WINTest перед преподавателем стоит задача создания теоретической базы, составления практических заданий и подготовка необходимых ответов средствами встроенного редактора. В системе также предусмотрен анализ и разбор неправильных решений и допущенных типичных ошибок. Пользователям (обучаемым) при работе с WINTest доступны теоретический блок, при необходимости сопровождаемый иллюстрациями по теме, блок примеров решения задач и непосредственно задания для выполнения (режим тестирования).

Отличительными особенностями комплекса WINTest являются:

- удобный и практичный интерфейс;

- гибкость при выборе оценки уровня знаний;

- отсутствие ограничений на количество обучаемых в списках учебных групп;

- возможность ограничения времени для выполнения практических заданий

- наличие справочной системы пользования;

- при выполнении практических заданий автоматическое включение приложения Калькулятор.

Результаты выполнения заданий сохраняются в отдельный файл, доступный только для преподавателей.

В дальнейшем планируется разработка сетевой версии данной программы и использование данного комплекса при проведении занятий на кафедрах института.

1.6.3 Тестум

Тестирующий комплекс «Тестум» разработана Новгородским государственным университетом. Она расширяет возможности Виртуального практикума по физике для ВУЗов и позволяет преподавателям обеспечить компьютеризированный допуск к лабораторной работе, а студентам - подготовиться к ней и проверить свои знания.

База данных комплекса содержит более 400 тестовых заданий по всем разделам физики. Выполнение заданий осуществляется по современной эффективной технологии «конструирования ответа», когда студент заполняет пропуски в ответе словами и терминами из предлагаемого перечня. Такой подход обеспечивает практически стопроцентную достоверность контроля при многократном использовании одних и тех же заданий.

При контроле знаний в компьютерном классе преподаватель может организовать процедуру автоматического допуска к одной или нескольким лабораторным работам, которые проводятся с помощью «Виртуального практикума по физике для ВУЗов». В базе данных для каждого раздела (лабораторной работы) содержится набор заданий (вопросов). Преподаватель может указать количество заданий в тесте и алгоритм автоматического выбора заданий - либо в фиксированном, либо в произвольном порядке, при этом Тестирующий комплекс обеспечивает автоматическое формирование необходимого преподавателю содержания теста.

Таким образом, в настоящее времени в России есть условия для активного использования дистанционных технологий во всех образовательных направлениях деятельности: в довузовской подготовке, в очном и заочном образовании, в системе повышения квалификации и переподготовке кадров. Своеобразная «тестовая культура», уже сложившаяся в мире и России, приносит свои плоды, как позитивные, так и негативные. Как позитивным следует отнести, например, ушедшее в прошлое «глухое» сопротивление внедрению тестовых технологий. К негативным - стремление облегчить процедуру тестирования, превратить ее в «легкую прогулку» для учащегося.

Сегодня тестология - развивающаяся наука. В ее развитии принимают участие и ученые, и преподаватели, и учащиеся. Студенты педагогических направлений изучают методы составления тестовых заданий, пишут самостоятельные работы, высказывая свое мнение о негативных и позитивных сторонах процедур компьютерного тестирования. Описанные выше комплексы давно приобрели популярность среди студентов и учителей. На их основе ежегодно проводится более предметные олимпиады региональных уровней (в том числе и в среде Internet), ведется тестирование знаний школьников в школах, учителей в Центрах повышения квалификации. Студенческий вариант тренажера «Дидактор» широко используется в ДВГУ для тестирования знаний студентов (более 10 тыс. студентов, более 100 дисциплин ежегодно) очной, заочной форм обучения.

1.7 Требования, предъявляемые к тестам

Тесты должны удовлетворять определенным требованиям, так как случайно подобранный набор заданий нельзя назвать тестом.

1. Надежность контрольного задания - это его способность с достаточной для практики одинаковостью характеризовать, исследуемый в дидактических экспериментах, показатель, как заданий в целом, так и его частями, или по другому, тот же показатель одним и тем же заданиям, но в разные моменты времени.

Для пояснения понятия надежности контрольного задания обратимся к таблице умножения, убрав в ней правые части всех равенств и рассматривая оставшиеся выражения, как перечень контрольных заданий. Если группе испытуемых выдать некоторое число этих заданий и оценить их знания дважды: по ответам на задания из четных строк, то очевидно, у каждого из испытуемых получается приблизительно одни и те же оценки.

Также очевидно, что одинаковые оценки у каждого из испытуемых получатся и в том случае, если контроль знания таблицы умножения будет проведен по некоторой совокупности заданий дважды, но в разные моменты времени (например, через два дня). Приблизительное совпадение рядов оценок в обоих случаях как раз и говорит о надежности комплекта рассматриваемых контрольных заданий, то есть таблицы умножения.

2. Валидность (или адекватность целям проверки)

а) содержательная валидность теста, т.е. задание теста построено на основе только технических учебных элементах, которые изучались студентами и на той степени абстракции, на которой они излагались. По содержанию тест соответствует образовательному стандарту.

б) функциональная валидность теста, т.е. задания теста соответствуют выявленному уровню усвоения -уровню заданному образовательным стандартом. При составлении задания выделяются существенные и несущественные признаки элементов знаний. Существенные признаки закладываются в эталонный ответ. В другие ответы закладываются несущественные признаки с учетом характерных ошибок. Если учащиеся при работе с заданием знают и выделяют существенные признаки, а не формальные, то задание отвечает критерию валидности. Другими словами валидностью контрольного задания называется степенью соответствия своему назначению.

К критериям валидности относятся ответы на вопросы типа: "Соответствует ли задание программы курса или его раздела?"; "Охватывает ли задание достаточно полно весь курс или его раздел?"; "Достаточна ли вероятность того, что если испытуемый успешно справился рассматриваемым контрольным заданием, то он наверняка знает соответствующий материал в целом?"

Другими словами, показатель валидности отвечает на вопрос: "а то ли, что сформулировано в назначении контрольного задания, измеряется с его помощью?"

Очевидно задание может быть надежным , но невалидным. Также очевидно, что имеется прямая связь между надежным и валидным : задание с низкой надежностью не может быть валидным.

Например, если с целью проверки знания таблицы умножения, воспользоваться заданиями, составленными из произведений только одинаковых цифр (2*2, 3*3 ….) , то оно, конечно, будет достаточно надежным: при проведении с ним серии экспериментов, описанных выше, будут получаться одинаковые оценки у большинства испытуемых. Но, очевидно, зарегистрированные при этом успехи не говорят о знании всей таблицы умножения. Следовательно, если целью контроля является проверка знаний всей таблицы умножения, то валидность задания, составленного из произведений только одинаковых цифр, явно недостаточна.

С использованием понятий надежности и валидности контрольных задания можно дать следующие определение:

Дидактическим тестом называется совокупность задания, которые составлены в собирательной форме, предназначены для сравнительной оценки знаний, умений, навыков, способностей, умственного развития и удовлетворяют заданным требованиям надежности и валидности.

3.Определенность.

После прочтения заданий каждый учащийся понимает, какие действия он должен выполнить, какие знания продемонстрировать. Если учащийся после прочтения задания правильно действует и отвечает менее 70% учащихся, то его необходимо проверить на определенность.

4.Простота.

Формулировка заданий и ответы должны быть четкими и краткими. Показателем простоты является скорость выполнения задания.

5.Однозначность.

Задание должно иметь единственный правильный ответ - эталон.

6.Равнотрудность.

При составлении тестов в нескольких вариантах равнотрудность определяется стабильностью результатов по вопросам во всех вариантах одного и того же задания.

Общедидактические требования к контролю знаний включают: систематичность, углубленность, всесторонность, объективность, индивидуализацию, гласность, дифференцируемость оценок.

С этой точки зрения традиционные средства контроля знаний имеют достаточно много недостатков. К ним относятся, например, следующие:

1. Использование грубой четырех бальной школы оценок;

2. Большие затраты труда и времени на успешные опросы (на коллоквиумах, экзаменах), проверку письменных контрольных и расчетно-графических работ;

3. Низкая оперативность в использовании результатов контроля для управления ходом учебного процесса;

4. Абсолютно неудовлетворительная объективность оценки знаний обучающихся, невозможность сопоставления оценок, полученных или разных обучающих или, тем более, в разных учебных заведениях.

1.8 Достоинства и недостатки тестирования

тестовый контроль учащийся

Одним из недостатков тестового метода контроля знаний студентов является то, что создание тестов, их унификация и анализ - это большая кропотливая работа.

Чтобы довести тест до полной готовности к применению необходимо несколько лет собирать статистические данные, хотя бы с потоком студентов 100-120 человек.

Возможно возникновение и других трудностей. Довольно часто встречается значительный субъективизм в формировании содержания самих тестов, в отборе и формулировке тестовых вопросов, многое также зависит от конкретной тестовой системы, от того, сколько времени отводится на контроль знаний, от структуры включенных в тестовое задание вопросов и т.д.

Но не смотря на указанные недостатки тестирования, как метода педагогического контроля, его положительные качества во многом говорят о целесообразности использования такой технологии в учебных заведениях.

К достоинствам следует отнести:

- как было сказано, большая объективность и, как следствие, большее позитивное стимулирующее воздействие на познавательную деятельность студента, учащегося;

- исключается воздействие негативного влияния на результаты тестирования таких факторов как настроение, уровень квалификации и др. характеристики конкретного преподавателя;

- ориентированность на современные технические средства на использование в среде компьютерных (автоматизированных) обучающих систем;

- универсальность, охват всех стадий процесса обучения.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.