Конструирование психологических тестов. Этапы стандартизации Основные этапы конструирования теста

Читайте также:
  1. I. Вспомните основные модальные глаголы и их эквиваленты. Чем они отличаются? Как спрягаются? (Заполните табличку).
  2. I. При каких условиях эта психологическая информация может стать психодиагностической?
  3. II. Основные принципы и правила служебного поведения государственных гражданских служащих Федеральной налоговой службы
  4. II. Основные цели и задачи Программы, срок и этапы ее реализации, целевые индикаторы и показатели
  5. II. Основные этапы развития физики Становление физики (до 17 в.).
  6. III.2.1) Понятие преступления, его основные характеристики.

Создание психодиагностической методики – сложный, многошаговый процесс. Не претендуя в рамках данной статьи на полноту изложения этого вопроса, выделю основные этапы с кратким описанием их содержания. Сразу нужно заметить, что объектом внимания будет диагностическая методика (тест-опросник), так как для другого класса методик – исследовательских, проективных, клинических – существуют другие требования по созданию и апробации.

Создание психодиагностической методики не сводится только к проверке отдельных психометрических свойств – репрезентативности, надежности, валидности, достоверности и т.д. Первичная работа в этом направлении начинается с глубокой теоретической проработки оснований предмета, с выяснения методологических, концептуальных подходов к его исследованию. Прежде чем разрабатывать процедуру измерения, необходимо создать концепцию измеряемого психического свойства , построить его модель. Именно глубокая теоретическая подготовка является условием успешной работы по созданию методики, отвечающей всем критериям качества. Можно сказать, что прежде чем перейти к технологии разработки методики необходимо провести фундаментальное теоретическое исследование.

Если следовать логике исследования, то начинать его необходимо с определения проблемы . Это и будет первым этапом по созданию методики. Проблема – это задача, не имеющая решения, либо предполагающая неоднозначные решения. Проблемы могут порождаться как объективными условиями, реальной ситуацией, так и быть результатом собственной активности исследователя. Проблемы диагностики являются, как правило, прикладными и ориентированы на практическое решение возникших в реальной социальной ситуации задач. Исследователю необходимо помнить, что не все проблемы подлежат решению. Кроме реальных проблем, являющихся объектом непосредственного приложения усилий исследователя, существует категория проблем, неразрешимых средствами современной науки, а также «псевдопроблемы». Как уже было отмечено, проблемы диагностики – это реальные задачи, требующие своего прикладного решения. Скажем, в качестве примера можно привести проблему школьной тревожности. Данная проблема – пример уже операционализированной проблемы, переведенной, оформленной в терминах определенной научной отрасли. Иногда исследователю еще предстоит эта задача.



Следующим этапом по созданию психодиагностической методики будет определение предмета диагностики . Предмет имплицитно присутствует в операционализированной проблеме. Предмет – это то, что станет непосредственным объектом измерения, то, что будет измерять созданная методика. Предмет традиционно определяется как зафиксированные в опыте стороны, свойства и отношения объекта, исследуемые с определенной целью в данных условиях. Предмет существует в виде понятия. В нашем случае предметом диагностики будет феномен тревожности, представленный психологическим понятием «тревожность».

На следующем этапе необходимо определить границы понятия (этап уточнения предмета). Данная процедура осуществляется через проведение дифференциального анализа рассматриваемого понятия с близкими и противоположными по значению понятиями. Одним из способов определения понятия является принятое в логике сравнение с помощью кругов Эйлера – изображений посредством кругов отношений между объемами понятий. Круг, в данной процедуре, изображает объем конкретного понятия. В нашем случае, кроме понятий тревога и тревожность, необходимо рассматривать такие понятия, как страх, беспокойство и т.д.



Следующий шаг по конструированию методики связан с уточнением феноменального поля понятия . Для этого необходимо как можно более подробно описать тот феномен, который представлен в понятии, создать по возможности полную картину данного феномена. Как правило, это производится через операциональное определение понятия. Операциональное определение – это подробное указание операций, необходимых для представления и измерения понятия. В психологии часто используются абстрактные понятия, такие как интеллект, самооценка, память, научение, креативность и т.д. Необходимо их операционализировать, то есть описать все возможные объективные способы проявления рассматриваемого понятия. В объективной диагностике, какой является тест-опросник, используются лишь те способы проявления понятия, которые можно реально фиксировать как минимум в наблюдении с помощью наших органов чувств.

На следующем этапе из выделенных объективных способов проявления понятия необходимо отобрать наиболее значимые, которые будут выполнять роль критериев для распознавания (диагностики) предмета . Критерий (средство для суждения) – признак, на основании которого производится оценка, определение или классификация чего-либо, мерило оценки. Критерии измеряемого понятия должны представлять собой существенные, надежные и объективные признаки его проявления. Именно они найдут свое отражение в вопросах либо утверждениях, которые составят содержание стимульного материала методики. Таким образом, данный этап будет связан с выбором критериев, по которым будет диагностироваться предмет.

На следующем этапе создания методики производится выбор формы методики . Форма методики определяется спецификой предмета диагностики и исследовательскими целями. Методика может быть сконструирована в форме тест-опросника (как в нашем случае), проективной методики, клинической методики и др. Каждая из представленных форм имеет свою специфику, отличительные требования по критериям качества. На этом же этапе происходит выбор стимульного материала. В нашем случае стимульный материал может быть представлен в форме вопросов либо утверждений. Утверждения, в свою очередь, могут быть личные и безличные.

После определения формы стимульного материала производится его подбор. Выбор содержания стимульного материала осуществляется из того феноменального поля понятия, которое явилось результатом предшествующей работы с учетом выделенных критериев предмета диагностики. Качество отдельных заданий (вопросов, утверждений) является определяющим для всего тест-опросника, поэтому при разработке заданий теста необходимо учитывать наиболее часто встречающиеся проблемы, которые могут привести к его низкой валидности.

При отборе отдельных заданий (вопросов, утверждений) необходимо определить индекс эффективности каждого из них. Для этого можно прибегнуть к методу экспертов. Суть данного метода заключается в том, что нескольким специалистам в данной предметной области (5–7 человек) предлагают оценить список предполагаемых заданий из стимульного материала на предмет их валидности, то есть адекватности измеряемому предмету по рейтинговой шкале (3-, 5-, 7-бальной). Те из заданий, которые получат высокие оценки у всех или большинства экспертов будут обладать экспертной валидностью и их можно рекомендовать для включения в опросник. В качестве еще одной из стратегий отбора стимульного материала можно воспользоваться пилотажным исследованием. Проведение пилотажного исследования предполагает выполнение заданий теста лицами, которые имеют сходные особенности с теми, для диагностики которых он разрабатывается. Анализ полученных данных позволит разработчику теста отобрать лучшие задания для окончательной версии опросника. На репрезентативной выборке проводится пробное тестирование. Минимальный объем выборки должен быть в два раза больше, чем количество заданий. Далее рассматривается каждое из заданий стимульного материала с точки зрения того, как на него отвечали все испытуемые. При отборе разработчики руководствуются следующим правилом: не проходят те из заданий (вопросов, утверждений), которые получают у большинства испытуемых однозначные оценки. К примеру, если все испытуемые ответили «да» на какой-то из вопросов, то его не включают в будущий опросник, так как он не отражает индивидуальные особенности испытуемого, а направлен на некое общее для всех свойство. Индекс эффективности для каждого задания должен располагаться в интервале от 0,25 до 0,75, приближаясь в среднем к 0,5 для всего опросника. Кроме индекса эффективности, необходимо также определять дискриминативность задания – проверка того, измеряют ли отдельные задания (вопросы, утверждения) те же самые свойства, что и другие. Для определения дискриминативности заданий используется коэффициент корреляции каждого задания с общим баллом всего теста. Чем выше коэффициент корреляции, тем выше дискриминативность задания, тем оно лучше. Минимальный коэффициент корреляции должен составлять 0,2. Для расчета этого показателя чаще всего применяется коэффициент произведения моментов Пирсона.

Важным моментом в разработке стимульного материала является выбор формы вопросов .

После того как задания для тест-опросника отобраны, необходимо позаботиться о его достоверности . Данное свойство методики (в случае опросников) представляется достаточно важным и является одним из критериев ее качества. Чаще всего достоверность обеспечивается благодаря включению в содержание стимульного материала корректурной шкалы (шкалы лжи).

Важным этапом в создании психодиагностической методики является разработка инструкции . Инструкция составляется в письменной форме, так как на устную инструкцию влияют паралингвистические компоненты исследователя: мимика, жесты, интонации, паузы и т.д. Кроме того, устная инструкция забывается, к письменной же испытуемый может, в случае надобности, возвращаться по ходу выполнения заданий теста. Инструкция должна быть простой и понятной испытуемому, не должна содержать в себе специальных профессиональных терминов, непонятных тестируемому, неоднозначно трактуемых слов и выражений. В ней должно быть указано, как выбирать ответ и каким образом отмечать его в опроснике. В инструкции следует выделить ту информацию, которая может способствовать эффективной работе испытуемого, например о соблюдении конфиденциальности исследования. Основные функции, которые должна выполнять инструкция: информирующая и мотивирующая.

Разработкой инструкции завершается этап создания теста. Следующий этап будет посвящен его проверке соответствию критериям качества, а также его стандартизации и адаптации.

Основными критериями качества диагностической методики считаются валидность и надежность . Названные свойства теста являются необходимым атрибутом диагностического теста. Методика, которая не прошла испытания на валидность и надежность либо которая не отвечает требованиям по этим качествам, не может применяться как диагностический инструмент, хотя при этом ее можно использовать для исследовательских целей.

Заключительным этапом в разработке психодиагностической методики является ее стандартизация и адаптация . Диагностическая методика отличается от исследовательской методики тем, что она стандартизирована. Стандартизация методики включает в себя два этапа:

1. Выработка единых требований к процедуре тестирования. Этот этап включает в себя унификацию способов регистрации результатов, условий инструкций, бланков исследования и проведения тестирования.

2. Определение единого критерия для оценки результатов. На этом этапе производится определение тестовых норм.

Применение тестовых норм в психодиагностике основывается на переводе тестовых баллов из «сырой шкалы» в стандартную шкалу. Эта процедура называется стандартизацией тестового балла . Норма теста – это средний уровень выраженности исследуемого качества, установленный на большой выборке людей.

Для тест-опросников разрабатываются статистические тестовые нормы. Для их вычисления обращаются к методам математической статистики. Нормы для каждой группы должны быть представлены в средних величинах и показателе среднего отклонения. Результатом стандартизации теста является создание конверсионной таблицы для перевода «сырых» баллов в стандартные по заданной шкале. В ней приводится полный перечень соответствия между интервалами сырой шкалы и интервалами шкалы стандартной. Норма теста должна пересматриваться раз в 5 лет. В описании теста для каждой включенной в него нормы обязательно должно быть указано: где, когда, как и на ком она была установлена.

В заключение хочется сказать, что в конструировании тестов нельзя ограничиваться математическими расчетами. Математические модели в психодиагностике не смогут заменить разработку теоретических конструктов, фундаментальных принципов исследования. Без полного психологического описания измеряемого конструкта, без формулирования гипотез о его результатах процесс создания теста становится упражнением из математической статистики.

Страница 1

Прежде чем приступать к созданию теста, необходимо четко знать, для чего он нужен. Ясный ответ на этот вопрос - необходимое условие работы. Поэтому первым шагом будет формулирование цели будущего теста. После этого следует обратиться к разработке спецификации будущего теста. Наиболее удобно сделать это в виде таблицы, в котором по горизонтали будут располагаться содержательные области, которые предполагается измерять, а по вертикали - их манифестации, или пути, по которым содержательные области могут проявляться.

Ясное понимание цели будущего теста, естественно, облегчает построение перечня того, что предстоит измерять. При спецификации манифестаций важно обеспечить выделение различных форм их реализации.

В каждом задании может быть задан только один вопрос или сформулировано одно утверждение. Нельзя допускать появления заданий, в которых присутствует формулировки типа: "для этого человека и других людей", "как и другие" и тому подобное. Каждое задание (вопрос) должен быть предельно просто и ясно. Необходимо избегать двусмысленных формулировок и придерживаться, насколько это возможно, наиболее простых вариантов ответов. В то же время необходимо стремиться к тому, чтобы обследуемые не могли догадываться о том, для измерения какой черты предназначено то или иное задание. В противном случае ответы будут отражать их точку зрения на выраженность у себя этой черты, а не реальное положение дел.

Задания должны отражать конкретные, а не общие аспекты изучаемой области поведения.

Везде, где только можно, следует избегать употребления таких слов, как "часто", "редко" и тому подобное. Иначе говоря, в формулировке заданий нужно очень осторожно прибегать к словам, указывающим на частоту действий. Также следует избегать терминов, выражающих чувства. Лучше представить задание в контексте поведения.

Очень важно, чтобы любой из предлагаемых вариантов ответа воспринимался испытуемым как возможный, вероятный. Ответ, воспринимаемый обследуемым как неправильный, будет иметь малую вероятность выбора.

После разработки всех заданий к ним следует вернуться через некоторое время и попытаться еще раз оценить их формулировки, еще раз убедиться в том, что все они легко понимаются и не содержат двусмысленностей. Для этого требуется привлечь хотя бы двух-трех экспертов. В личностных опросниках, как правило, используются три типа заданий: дихотомические, трихотомические и задания с рейтинговыми шкалами. Весьма популярны задания с альтернативным выбором (дихотомические), которые просты для понимания, легки и удобны для обработки. Это задание требует наименьшего времени на ответы. К их недостатком относится то, что обследуемые часто не удовлетворены предполагаемой альтернативой, хотели бы видеть больше вариантов ответа. Задания трихотомитрические (три варианта ответа, например "да", "не знаю", "нет") также распространены в опросниках, и их преимуществом является то, что обследуемые могут более точно выразить себя, нежели в случае альтернативы.

Какие-либо правила, определяющие количество вариантов выбора ответа, отсутствуют. Обычно не рекомендуется использование более семи в опросниках, использующих рейтинговые шкалы. Важно обеспечить достаточное количество градаций ответа, с тем, чтобы обследуемые были в состоянии адекватно выразить самих себя. Следует помнить о том, что в разрабатываемом опроснике желательно использовать только один тип заданий.

Разработчикам тестов хорошо известно, что от оформления, формы представления методики, что определяется как ее очевидная (лицевая) валидность, зависит, насколько серьезно воспринимается она испытуемыми в качестве инструмента обследования. В любом опроснике должен быть представлен блок основной информации, который включает в себя его название, а также вопросы, касающиеся имени, пола, возраста, образования и некоторых других необходимых для исследователя данных. Обязательно указывается дата заполнения опросника.

Инструкция должна быть ясной, доступной для понимания. В ней должно быть указано, как выбрать ответ и каким образом отмечать его в отроснике. Здесь же содержится дополнительная информация, которую разработчик считает необходимым сообщить обследуемому.

Для компоновки текста опросника следует руководствоваться такими рекомендациями.

а) Нумеруется каждое задание.

б) Каждая строка на странице болжна быть короткой и содержать не более 10-12 слов.

в) Все задания располагаются по прямой вертикальной полосе сверху вниз в левом углу страницы.


Ранняя юность
Юность не так давно выделилась в самостоятельный период жизни человека, исторически относясь к «переходному этапу» возмужания, взросления. Если у животных наступление взрослости достаточно тесно связано с возможностью самостоятельного существования и произведения потомства, то в человеческом обществе критерием взросления становится не п...

Возможные признаки пограничного расстройства личности
При предъявлении проблем и симптомов: 1) разнообразный набор проблем и симптомов, которые могут меняться каждую неделю; 2) необычные симптомы или необычные комбинации симптомов; 3) интенсивные эмоциональные реакции, которые непропорциональны ситуации; 4) саморазрушительное поведение и склонность наказывать себя; 5) импульсивное, пл...

Социальный интеллект
Социальный интеллект рассматривает интеллект как проявление социально-полезной адаптации. Подобное определение интеллекта имеет давнюю традицию. В. Штерн давал определение интеллекта как "некоторую общую способность к новым жизненным условиям". Приспособительный акт - решение жизненной задачи с помощью интеллекта - осуществляе...

Первый этап разработки тестовой методики может быть условно обозначен как этап формирования информационной базы исследования (термин В.М.Мельникова и Л.Г.Ямпольского).

Он включает выбор об"екта и цели исследования, разработку концепции теста, определения области его применения.

Об"ект исследования предполагает то, что какое-либо свойство должно быть удовлетворительно описано через систему определяющих его приз­наков или внешних проявлений . Например, создавая тест для исс­ледования общительности психолог должен выяснить, в чем прояв­ляется эта характеристика - разговорчивость, наличие множества знакомых, экспрессивность и т.д. Иными словами объект психодиагностического исследования – это тот психический феномен, для диагностики которого мы разрабатываем тест.

Цель определяется прежде всего кругом практических за­дач, для решения которых создается будущая тестовая методика. Развивая пример с таким феноменом как общительность, мы должны определиться с какой целью ее собираемся диагностировать: относительно возраста, той или иной профессии, успешности в какой-либо деятельности.

Область применения теста.

Традиционно область применения теста рассматривается как характеристика методики, указывающая на особенности контингента испытуемых, для которых предназначен тест. Для этой группы устанавливаются нормы, оптимальная трудность заданий теста, определяются характеристики валидности, надежности и т.д. Это область применения теста с точки зрения популяции.

Говоря о широте популяции людей, к ко­торым применен данный тест, в пример можно привести такие ме­тодики, как, так называемые, "свободные от культуры" интеллек­туальные тесты (которые, как мы будем говорить в свое время являются утопией, но очень долгое время занимали умы исследователей), тест Люшера. Или методики, направленные на диагностику, скажем, профессиональной деформации в нашей уголовно-исполнительной системе (гораздо более узкий круг популяции).

Различаю так же область применения теста с точки зрения его содержания. Нап ример, такие универсальные характерологические опросни­ки, как 16 PF Кэттела, СМИЛ по замыслу создателей должны охватывать всю, или, по крайней мере, большую часть структуры личности. Тогда как шкалы личностной тревожности, агрессивности затрагивают отдельный ее аспект. То есть тот спектр психических феноменов, который охватывается диагностикой данного теста.



Первый этап завершается описанием концепции теста, основное внимание в котором должно быть уделено признакам, определяющим базовое понятие. На их основе в дальнейшем строится интерпретация результатов готового теста. Первый этап, помимо всего прочего, отражает теоретический подход автора теста к исследуемой психологической реальности. Например, говоря о создании методики диагностики личности, речь идет прежде всего о том, придерживается ли создатель теста теории черт (как автор 16 PF опросника Кэттелла) или теории типов (ММPI, опросник Смишека, ИТО).

Второй этап касается непосредственного конструирования теста как системы заданий. Данный этап включает выбор тестовых шкал, определение типов задач, в зависимости от характера ответов, составления и формулировку задач, и их размещение, группировку и нумерацию, составление ключей к задачам, написание инструкции.

Вообще, данный этап начинается с разработки стимульного материала. Л.Ф.Бурлачук так определяет понятие стимульного материала:

Объекты живой и неживой природы, искусственно созданные объекты, их изображения разной степени точности, цвета, звуки и символы, выступающие в качестве заданий психологических тестов.

Особую роль играет степень структурированности стимульного материала. Слабоструктурированные, неоднозначные стимулы за счет запуска механизмов проекции несут в себе очень интересный, глубинный и не подверженный сознательным искажениям материал, однако связан с рядом трудностей при интерпретации.

В вербальных тестовых методиках, на примере которых мы с вами сегодня рассматриваем тему конструирования тестов, используются вербальные стимулы в виде вопросов, утверждений.

На семинарском занятии наши докладчики более развернуто расскажут нам о подходах к разработке стимульного материала.

Добавим только, что он определяется направленностью методики и закладывается в нее на этапе разработки (валидность по содержанию).

В подборе тестовых заданий в наибольшей степени проявляются творческие способности и изобретательность разработчика.

Требования, которым должны удовлетворять задания:

Легко пониматься испытуемым;

Быть достаточно новыми для них;

Быть компактными, кратко изложенными, не содержать излишней информации;

Не вызывать дополнительных вопросов со стороны испытуемого;

Требовать сравнительного малого времени для ответа (решения);

Вероятность случайных ответов должна быть минимальной.

В тест-опросниках и большинстве интеллектуальных тестах применяются задания закрытого типа (т.е. задания имеющие ряд возможных ответов, среди которых необходимо выбрать один верный). Наиболее простыми являются задачи, предполагающие выбор одного из двух альтернативных вариантов решений (дихотомию выбора, или задачи типа "да" - "нет"). Недостатком такого рода задач является большая вероятность случайных ответов.

В личностных опросниках иногда используются промежуточные ответы типа ("нечто среднее", "трудно сказать"), причем оговаривается, что их использование не должно быть слишком частным (такие ответы в следствие недискриминативности дают мало информации). (Пример с ответом «не знаю» в СМИЛе: до 40 по мнению авторов не влияют на результат, но психодиагносты стараются ориентировать тестирующихся на меньшее количество таких ответов).

Задачи с множественным выбором наиболее характерны для батарей интеллектуальных тестов (Айзенк, Амтхауэр, Векслер) из нескольких ответов выбирается один, правильный по мнению испытуемого. Часто среди множества (обычно не более 6 -8) вариантов ответа наряду с правильными имеются и 2 - 3 правдоподобных. Ответы должны подбираться таким образом, чтобы каждый выбирался с одинаковой вероятностью. Положение правильных ответов должно изменяться.

При диагностике состояний в качестве вариантов ответов часто используется выбор определенной точки на шкале. Такая шкала означает градацию выраженности того или иного состояния. Как правило, используется четное число градаций (например, 4) с тем, чтобы избежать концентрации ответов около середины. (например: в УСК многие диагносты стараются опускаю), т.к. его частое использование ведет к усреднению полученых результатов.

Особый случай представляет составление заданий для проективных методик. Особенностью таких задач является их неструктурированность, неопределенность, которая допускает почти неограниченное разнообразие возможных ответов. Анализ ответов по преимуществу качественный, а не количественный, поэтому нормирование по отношению к проективным методикам является затруднительным.

Необходимости этапом подготовки первичной формы теста является составление инструкции .

Основные требования к ней:

1) должна быть полной, т.е. содержать по возможности всю информацию для выполнения тестовых заданий;

2) не должна быть слишком длинной. Возможности челове­ческой памяти ограничены, поэтому, упустив какую-либо часть инструкции, испытуемый может не понять ее в целом. Кроме того, у испытуемого может создаться впечатление, что тест слишком сложный;

3) должна быть однозначной, не допускать двусмысленного толкования;

4) должна быть рассчитана на слабейшего;

5) желательно сопроводить инструкцию наглядными примерами и пробами, особенно, если материал малознаком.

О том, что размещения отдельных пунктов в тесте может повлиять на результат испытуемого, мы упоминали в теме "досто­верность". Это касается не только шкал "лжи". Трудные, легкие и средние по трудности задачи в общем массиве теста располагаются, как правило, в случайном порядке. Исключение составляют методики, сложность заданий в которых постепенно нарастает (среди бланковых методик в качестве примера можно привести прогрессивные матрицы Равена).

Выполнение вышеуказанных процедур имеет целью создание первичной формы теста, которая предполагает:

1) стимульный материал;

2) инструкцию для испытуемого по его выполнению;

3) ключи для обработки полученных данных;

4) подходы к интерпретации.

Третий этап включает пилотажные исследования этой формы на репрезентативной выборке. Он включает проверку надежности, валидности и (для личностных тест-опросников) достоверности теста.

Как известно, психологический тест может быть охарактеризован как эффективный в том случае, если он удовлетворяет следующим основным условиям:

1) использование шкалы интервалов;

2) надежность;

3) валидность;

4) дискриминативность;

5) наличие нормативных данных.

Коротко проанализируем каждый пункт:

1. Использование шкалы интервалов. Шкала интервалов это первая метрическая шкала, которая позволяет вводить понятие меры на множестве объектов. Другими словами она определяет величину различий между объектами в проявлении свойства. Именно с помощью шкалы интервалов можно сравнивать 2 объекта. Классический пример шкалы интервалов это шкала измерения температуры по Цельсию. Шкала интервалов всегда имеет масштабную единицу, но положение нуля на ней произвольно. Большинство специалистов по теории психологических измерений полагает, что тесты измеряют психические свойства с помощью шкалы интервалов.

2. Надежность – т.е. точность психодиагностических измерений, а так же устойчивость результатов теста к действию посторонних, случайных факторов. Посторонние, случайные факторы – источники ошибки измерения – это: сам обследуемый (его состояние, настроение, отношение к тестированию, способность концентрировать внимание и т.д.); окружающая среда, т.е. условия тестирования (бланки, посадочные места, освещенность и проветренность помещения, исправность аппаратуры т др.); психодиагност (его настроение, умение установить психологический контакт с аудиторией, точность при обработке данных и подсчете баллов по ключам и др.).

3. Валидность – пригодность; комплексная характеристика теста, включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним (Бурлачук Л.Ф.); характеристика, указывающая нам, что тест измеряет и насколько хорошо он это делает (А.Анастази).

4. Дискриминативность – способность отдельных заданий (пунктов) теста дифференцировать обследуемых относительно «максимального» или «минимального» результата теста. Любой ответ испытуемого на конкретное задание теста можно оценить по двухбалльной шкале – «верно (1 балл) – неверно (0 баллов)».

Если все испытуемые один и тот же ответ, то это означает, что данное задание не обладает дискриминативностью.

5. Наличие нормативных данных – т.е. данных, получаемых путем сравнения индивидуальных результатов со статистическими значениями нормативной выборки (т.е. выборки стандартизации). См. нормальное распределение, нормализация данных.

Помимо этого в тестах интеллекта, способностей, достижений производится анализ трудности тестовых заданий. Чаще всего трудность задания определяется процентом испытуемых, давших правильный ответ. Чем легче задание - тем, естественно, выше этот процент.

В заключение можно сказать, что в нашей стране технологния создания и адаптация тестовых методик понимались несколько упрощенно. Весь вше указанный процесс сводился к простому переводу той или иной зарубежной методики, в лучшем случае ограничиваясь построением нормативного распределения тестовых показателей. Теоретические концепции авторов тестов не анализировались, данные об их надежности и валидности принимали за истинные.

Затем в 80-е годы, вопросы адаптации различных зарубежных тестов все чаще становятвся предметом обсуждения советских психологов, а позднее - психологов СНГ.

Требования, предъявляемые к разработке и адаптации тес­тов, предполагают высокую профессиональную культуру психолога, широкое использование специальных технических приемов, в том числе на основе современной вычислительной техники.

Как известно, психологический тест может быть охарактеризован как эффективный в том случае, если он удовлетворяет следующим основным условиям:

а) использование шкалы интервалов;

б) надежность;

в) валидность;

г) дискриминативность;

д) наличие норматичных данных.

Разумеется, конструирование тестов, относящихся к разумным диагностическим подходам, имеет, несмотря на необходимость соблюдения общих требований к этому процессу, определенную специфику.

Обычно выделяют три главные стратегии в конструировании личностных опросников: дедуктивная, индуктивная и экстернальная. Дедуктивная или содержательная стратегия базируется на теоретических представлениях о личности, ее структуре и функционировании. Вторая стратегия - индуктивная, предполагает использование факторного анализа или других статистических процедур, основанных на корреляционных связях. Главная особенность индуктивной стратегии заключается в том, что исследователь как бы позволяет данным говорить самим за себя. Экстернальная стратегия эмпирична по своей сути и основывается на сравнении контрастных групп. Ни одна из названных групп не может быть названа как предпочтительная.

Основные этапы конструирования теста

Прежде чем приступать к созданию теста, необходимо четко знать, для чего он нужен. Ясный ответ на этот вопрос - необходимое условие работы. Поэтому первым шагом будет формулирование цели будущего теста. После этого следует обратиться к разработке спецификации будущего теста. Наиболее удобно сделать это в виде таблицы, в котором по горизонтали будут располагаться содержательные области, которые предполагается измерять, а по вертикали - их манифестации, или пути, по которым содержательные области могут проявляться.

Ясное понимание цели будущего теста, естественно, облегчает построение перечня того, что предстоит измерять. При спецификации манифестаций важно обеспечить выделение различных форм их реализации.

В каждом задании может быть задан только один вопрос или сформулировано одно утверждение. Нельзя допускать появления заданий, в которых присутствует формулировки типа: "для этого человека и других людей", "как и другие" и тому подобное. Каждое задание (вопрос) должен быть предельно просто и ясно. Необходимо избегать двусмысленных формулировок и придерживаться, насколько это возможно, наиболее простых вариантов ответов. В то же время необходимо стремиться к тому, чтобы обследуемые не могли догадываться о том, для измерения какой черты предназначено то или иное задание. В противном случае ответы будут отражать их точку зрения на выраженность у себя этой черты, а не реальное положение дел.

Задания должны отражать конкретные, а не общие аспекты изучаемой области поведения.

Везде, где только можно, следует избегать употребления таких слов, как "часто", "редко" и тому подобное. Иначе говоря, в формулировке заданий нужно очень осторожно прибегать к словам, указывающим на частоту действий. Также следует избегать терминов, выражающих чувства. Лучше представить задание в контексте поведения.

Очень важно, чтобы любой из предлагаемых вариантов ответа воспринимался испытуемым как возможный, вероятный. Ответ, воспринимаемый обследуемым как неправильный, будет иметь малую вероятность выбора.

После разработки всех заданий к ним следует вернуться через некоторое время и попытаться еще раз оценить их формулировки, еще раз убедиться в том, что все они легко понимаются и не содержат двусмысленностей. Для этого требуется привлечь хотя бы двух-трех экспертов. В личностных опросниках, как правило, используются три типа заданий: дихотомические, трихотомические и задания с рейтинговыми шкалами. Весьма популярны задания с альтернативным выбором (дихотомические), которые просты для понимания, легки и удобны для обработки. Это задание требует наименьшего времени на ответы. К их недостатком относится то, что обследуемые часто не удовлетворены предполагаемой альтернативой, хотели бы видеть больше вариантов ответа. Задания трихотомитрические (три варианта ответа, например "да", "не знаю", "нет") также распространены в опросниках, и их преимуществом является то, что обследуемые могут более точно выразить себя, нежели в случае альтернативы.

Какие-либо правила, определяющие количество вариантов выбора ответа, отсутствуют. Обычно не рекомендуется использование более семи в опросниках, использующих рейтинговые шкалы. Важно обеспечить достаточное количество градаций ответа, с тем, чтобы обследуемые были в состоянии адекватно выразить самих себя. Следует помнить о том, что в разрабатываемом опроснике желательно использовать только один тип заданий.

Разработчикам тестов хорошо известно, что от оформления, формы представления методики, что определяется как ее очевидная (лицевая) валидность, зависит, насколько серьезно воспринимается она испытуемыми в качестве инструмента обследования. В любом опроснике должен быть представлен блок основной информации, который включает в себя его название, а также вопросы, касающиеся имени, пола, возраста, образования и некоторых других необходимых для исследователя данных. Обязательно указывается дата заполнения опросника.

Инструкция должна быть ясной, доступной для понимания. В ней должно быть указано, как выбрать ответ и каким образом отмечать его в отроснике. Здесь же содержится дополнительная информация, которую разработчик считает необходимым сообщить обследуемому.

Для компоновки текста опросника следует руководствоваться такими рекомендациями.

а) Нумеруется каждое задание.

б) Каждая строка на странице болжна быть короткой и содержать не более 10-12 слов.

в) Все задания располагаются по прямой вертикальной полосе сверху вниз в левом углу страницы.

Варианты ответов должны быть представлены так, чтобы получилась прямая вертикальная полоса сверху вниз в правом углу страницы.

г)Каждое задание нужно отделить друг от друга, лучше это сделать используя свободное пространство, а не горизонтальную линию.

д) Если используется более чем один тип заданий, одинаковые задания группируются вместе. Каждый тип задания требует разных инструкций и своих вариантов ответов.

е) Опросник печатается так, чтобы он имел эстетически привлекательный вид.

Анализ заданий по результатам, полученным в пилотажном исследовании, имеет своей целью отбор наилучших заданий для окончательной версии опросника и включает в себя определенные доли ответивших правильно и дискриминантности каждого анализа. Первый шаг состоит в том, чтобы составить таблицу анализа заданий, в котором каждая колонка представляет задание, а каждая строка - обследуемого. Когда речь идет о разработке личностных опросников, в таблицу вписывается соответствующий балл по каждому заданию, а при этом имеется в виду, что обратные задания (с противоположным содержанием) оцениваются так же, как и прямые задания, но в противоположном направлении континуума оценок. Затем суммируются баллы по каждой клетке для получения общего балла по каждому ряду (испытуемые) и общего балла по каждой колонке (задания).

Следующим шагом будет вычисление показателя, определяющего долю испытуемых, ответивших в соответствии с "ключом" опросника или индекса эффективности задания.

Также нужно удостовериться, посмотрев на результаты в таблице анализа заданий, в том, что хороший индекс эффективности, то есть лежащий где-то посередине между крайними оценками, не просто означает выбор средних оценок в оценочном континууме каждым испытуемым, а представляет собой вариацию различных оценок.

Задания только тогда следует включать в окончательную версию опросника, когда они измеряют те же самые личностные особенности, что и другие, предназначенные для этого задания. Это основной критерий.

Тест обычно считается надежным, если с его помощью получаются одни и те же показатели для каждого исследуемого при повторном тестировании.

В психометрике слова надежность имеет два значения. На одном из них - надежности по внутренней согласованности. Вполне естественно считать, что если некоторая переменная измеряется частью теста, то другие его части, не будучи согласованными с первой, измеряют нечто другое. Для того чтобы быть валидным, тест должен быть согласованным. Существует несколько способов определения надежности.

Надежность ретестовая - предполагает повторное предъявление того же самого теста тем же испытуемым и примерно в тех же условиях, что первоначальное, а затем установление корреляции между двумя рядами данных. При использовании этого метода определения надежности нужно отдавать себе отчет в том, что испытуемые могут запомнить свои ответы и воспроизвести их во второй раз, поэтому повторное тестирование должно быть отделено от первого более-менее значительным временным интервалом, обычно не менее месяца.

Надежность параллельных форм предусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами. Основная проблема, препятствующая широкому распространению этого способа определения надежности, - необходимость подготовки двух наборов знаний, что чрезвычайно сложно, поскольку требуются убедительные доказательства их эквивалентности.

Надежность частей тела определяется путем деления опросника на две части (обычно на четные и нечетные задания), после чего и рассчитывается корреляция между этими частями. Обычно к этому способу определения надежности рекомендуется прибегать только в тех случаях, когда необходимо быстро получить результаты.

Во многих случаях перед разработчиком теста встает задача "сжатия" информации или, иначе говоря, компактного описания изучаемых явлений при наличии множества наблюдений или переменных. Факторный анализ как раз является методом снижения размерности изучаемого многомерного явления.

Как хорошо известно, одной из типичных форм представления экспериментальных данных является матрица, столбцы которой соответствуют результатам (значениям), полученным в результате их применения. Визуальный анализ сколь-нибудь значительной по величине матрицы невозможен, а поэтому требуется исходную информацию сжать, извлечь из нее наиболее важное, существенное. Прежде всего исследователю необходимо получить корреляционную матрицу (подсчет коэффициентов корреляции).

В психологическом тестировании цель факторного анализа заключается в том, чтобы найти несколько фундаментальных факторов, которые объяснили бы большую часть дисперсии в группе оценок по различным тестам или другим психометрическим измерениям. Существует несколько процедур факторного анализа, но не все они предполагают две стадии: 1) факторизацию матрицы корреляций, с тем, чтобы получилась первоначальная факторная матрица; 2) вращение факторной матрицы, с тем, чтобы обнаружить наиболее простую конфигурацию факторных нагрузок.

Стадия факторизации в этом процессе призвана определить количество факторов, необходимых для объяснения связей между различными тестами, и обеспечивает получение первичных оценок нагрузки (веса) каждого теста по каждому фактору. Вращение факторов необходимо для того, чтобы сделать их более понятными (интерпретируемыми) с помощью создания конфигурации факторов, в которой совсем немного тестов имеют высокие нагрузки, тогда как большая часть тестов имеют низкие нагрузки по любому фактору.

Факторно-аналитический подход позволяет также оценить надежность теста. Как известно, полная дисперсия теста равна сумме дисперсий для общих факторов, плюс дисперсии специфических факторов, плюс дисперсия погрешности. Следовательно, мы осуществим факторный анализ теста, возведем в квадрат и суммируем нагрузки его факторов, то мы получим его надежность, поскольку нагрузки факторов представляют корреляцию теста с общими или специфическими факторами. Однако следует помнить, что такой способ установления надежности более всего подходит для уже факторизованного теста, нежели для тестов, которые могут измерять широкий набор разных факторов, часть которых могут не входить в батарею изучаемых исследователем.

Одним из важных отличий психометрических тестов является то, что они стандартизированы, а это позволяет сравнить показатели, полученные одним испытуемым, с таковыми в генеральной совокупности или соответствующих группах. Тем самым достигается адекватная интерпретация показателя определенного испытуемого. Таким образом, стандартизация теста наиболее важна в тех случаях, когда осуществляется сравнение показателей обследуемых. При этом вводится понятие нормы, или нормативных показателей. Для получения стандартных норм нужно тщательно отобрать большее количество испытуемых в соответствии с ясно обозначенным критерием. При формировании выборки стандартизации следует учитывать ее объем и репрезентативность. В руководствах по тестам чаще всего указывают то, что для простого уменьшения стандартизированной погрешности достаточно будет выборка из 500 испытуемых. Однако репрезентативность выборки зависит не от ее объема.

Сегодня на практике все больше используется такой тип производной оценки, как стандартные показатели, удовлетворяющий большинству требований, предъявляемых к психологическому измерению. Такие показатели выражают отличие индивидуального результата испытуемого от среднего в единицах стандартного отклонения соответствующего распределения. Стандартные показатели получают двумя путями: линейным и нелинейным преобразованием первичных ("сырых") оценок.

Созданием стандартизированного теста и его публикацией обычно завершается работа психолога, однако следует помнить о том, что с течением времени необходим пересмотр (ревизия) теста.

На этапе разработки теста, а также любого другого метода проводится процедура стандартизации, которая включает три этапа.

Первый этап

стандартизации психологического теста состоит в создании единообразной процедуры тестирования. Она включает определение следующих моментов диагностической ситуации:

1. условия тестирования (помещение, освещение и др. внешние факторы).

3. Наличие стандартного стимульного материала. Временные ограничения выполнения данного теста. Стандартный бланк для выполнения, данного теста. Использование стандартного бланка облегчает процедуру обработки.

4. Учет влияния ситуационных переменных на процесс и результат тестирования. Под переменными подразумевается состояние испытуемого (усталость, перенапряжение и т.д.), нестандартные условия тестирования (плохое освещение, отсутствие вентиляции и др.), прерывание тестирования.

5. Учет влияния поведения диагноста на процесс и результат тестирования. Например, одобрительно-поощряющее поведение экспериментатора во время тестирования может восприниматься респондентом как подсказка «правильного ответа» и др.

6. Учет влияния опыта респондента в тестировании. Естественно, что респондент, который уже не в первый раз проходит процедуру тестирования, преодолел чувство неизвестности и выработал определенное отношение к тестовой ситуации.

7. Второй этап

стандартизации психологического теста состоит в создании единообразной оценки выполнения теста: стандартной интерпретации полученных результатов и стандартной предварительной обработки. Этот этап предполагает также сравнение полученных показателей с нормой выполнения этого теста для данного возраста

8. Третий этап

стандартизации психологического теста состоит в определении норм выполнения теста .

Нормы разрабатываются для различных возрастов, профессий, полов и др.

Наличие нормативных данных (норм) в стандартизованных методах психодиагностики является их существенной характеристикой.

Нормы необходимы при интерпретации тестовых результатов (первичных показателей) в качестве эталона, с которым сравниваются результаты тестирования.

На этапе создания теста формируется некоторая группа испытуемых, на которой проводится данный тест. Средний результат выполнения этого теста в данной группе принято считать нормой. Средний результат – это не единственное число, а диапазон значений. Существуют определенные правила формирования такой группы испытуемых, или, как ее иначе называют, выборки стандартизации.

Правила формирования выборки стандартизации:

1. выборка стандартизации должна состоять из респондентов, на которых в принципе ориентирован данный тест,

2. выборка стандартизации должна быть репрезентативной, то есть представлять собой уменьшенную модель популяции по таким параметрам, как возраст, пол, профессия, географическое распределение и т.д.,

Распределение результатов, полученных при тестировании испытуемых выборки стандартизации, можно изобразить с помощью графика – кривой нормального распределения.

Этот график показывает, какие значения первичных показателей входят в зону средних значений (в зону нормы), а какие выше и ниже нормы.

Производные показатели получаются путем математической обработки первичных показателей.

Первичные показатели по разным тестам нельзя сравнивать между собой по причине того, что тесты имеют различное внутреннее строение

Важно помнить, что, как писала А.Анастази, «Любая норма, в чем бы она ни выражалась, ограничивается конкретной совокупностью людей, для которых она вырабатывалась. Применительно к психологическим тестам они (нормы) никоим образом не абсолютны, не универсальны и не постоянны. Они просто выражают выполнение теста испытуемыми из выборки стандартизации»


Клинические задачи
Задача 1 На приеме у врача больной в ясном сознании, правильно ориентирован в окружающей обстановке и собственной личности. Рассказывает, что уже около года ощущает на себе постороннее влияние. Предполагает, что с ним "работает какая-то организация", члены которой с помощью «телепатических аппаратов» действуют на его мысли, чув...

Методология психологии
Задачи социальной психологии: 1) исследование проблем социальной психологии, которые взаимодействуют с другими науками; 2) необходимость пересмотра социально-психологических проблем в связи с произошедшими социальными изменениями в нашей стране; 3) исследование этнических, экономических, классовых, политических, идеологических явлений; 4 ...

Признаки самоактуализирующейся личности
Маслоу отмечает, что нехватка благ, блокада базовых и физиологических потребностей в еде, отдыхе, безопасности приводит к тому, что эти потребности могут стать для обычного человека ведущими ("Человек может жить хлебом единым, когда не хватает хлеба"). Но если базовые, первичные потребности удовлетворены, то у человека проявляю...