Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно "узкую" переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.
Для проверки внутренней согласованности применяются:
1. Метод расщепления или метод автономных частей
2. Метод эквивалентных бланков
3. Альфа Кронбаха
Метод расщепления
Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.
Метод эквивалентных бланков
МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине) Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.
Альфа Кронбаха
В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же признака, свойства или явления. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.
α Кронбаха определяется как
,
где N - число элементов в шкале,
- дисперсия общего тестового балла, и
- дисперсия элемента i.
Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.
Помимо надежности тестов, есть так же надежность наблюдения – межнаблюдательская надежность. МН – это процент совпадения результатов наблюдения экспертов друг с другом.
Статьи по теме:
Оценка как междисциплинарная проблема
Самым первым вопросом, с которого в данном случае приходится начать анализ является терминологический вопрос. Дело в том, что «оценка» является не только широко распространенным в разговорном языке, но и многозначным словом. При его употр ...
Выработка временных связей с помощью неосознаваемых раздражителей.
Определяющая роль эмоций в действии неосознаваемых раздражителей на высшие корковые функции человека была показана в ряде исследований. Так, например, оказалось, что остаются в памяти и влияют на функцию воспроизведения только те неосозна ...
Взаимодействие как организация совместной деятельности
Единственным условием, при котором этот содержательный момент может быть уловлен, является рассмотрение взаимодействия как формы организации какой-то конкретной деятельности людей. Общепсихологическая теория деятельности, принятая в отече ...

Актуально о психологии