Главная Учет ОС и НМА Факторный анализ раньше использовался в психологии для выявления ментальных и интеллектуальных способностей человека. Тестовые данные в психологии обрабатываются при помощи факторного анализа

Факторный анализ раньше использовался в психологии для выявления ментальных и интеллектуальных способностей человека. Тестовые данные в психологии обрабатываются при помощи факторного анализа

Факторный анализ принадлежит к числу таких методов, которые, будучи разработанными в рамках запросов одной науки, впоследствии приобрели более широкое междисциплинарное значение. Заслугой психологии можно считать разработку именно такого метода.

Основные идеи факторного анализа были заложены в трудах известного английского психолога Ф. Гальтона (1822-1911), основателя евгеники, внесшего большой вклад в исследование индивидуальных различий. Дальнейшая разработка и внедрение факторного анализа (ФА) в психологию связаны с именами Ч. Спирмена, Р. Кеттелла, Л. Терстоуна.

Необходимость применения ФА в психологии как одного из методов многомерного количественного описания наблюдаемых переменных в первую очередь следует из многомерности объектов, изучаемых данной наукой. Под многомерным представлением объекта понимается результат его оценивания по нескольким различным и существенным для его описания характеристикам - измерениям, т. е. присвоение ему сразу нескольких числовых значений.

Информативность многомерного описания объекта изучения возрастает с увеличением количества используемых признаков или измерительных шкал. Однако очень трудно выбрать сразу и существенные, и независимые друг от друга характеристики. Как правило, исследователь начинает с заведомо избыточного количества признаков и в процессе работы сталкивается с необходимостью адекватной интерпретации большого объема полученных данных и их компактной визуализации. Анализируя полученные данные, исследователь замечает тот факт, что оценки изучаемого объекта, полученные по некоторым шкалам, сходны между собой. Другими словами, возникает вопрос о том, что многие характеристики, по которым производилось измерение нашего объекта, вероятно, в некоторой степени дублируют друг друга, а вся полученная информация в целом избыточна. За связанными друг с другом переменными, по-видимому, стоит влияние некоторой скрытой, латентной переменной, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Очень часто эту переменную называют фактором.

Таким образом, метод научного познания - обобщение - приводит нас к возможности и необходимости выделения факторов как переменных более общего, более высокого порядка. Обобщение позволяет заметить те связи между исходными характеристиками, которые ранее не были очевидными, а после этого выйти на более высокий уровень понимания сущности измеряемого объекта.

Существует несколько статистических методов, которые позволяют исследовать отношения между переменными, не определяя, какие из них являются зависимыми, а какие - независимыми. Для этих методов все переменные оказываются в равном положении - ни одна из них не является более важной, чем другая. Первый метод, который мы рассмотрим, метод главных компонент, объясняет наибольшую вариативность в терминах наименьшего количества линейных комбинаций переменных. Второй метод, факторный анализ, объясняет отношения между переменными с помощью нескольких факторов, которые не могут быть прямо измерены. Оба метода равного количеству исходных переменных. Однако факторы, определяемые в результате факторизации, как правило, не равноценны по своему значению.

Коэффициенты, определяющие новую переменную, выбираются таким образом, чтобы новые переменные (главные компоненты, факторы) описывали максимальное количество вариативности данных и не коррелировали между собой. Они представляют собой коэффициент корреляции между исходной переменной и новой переменной (фактором). Коэффициенты называются факторными нагрузками. Обычно они представляются в виде таблицы, где факторы располагаются в виде

Факторный анализ - статистический метод, который используется при обработке больших массивов экспериментальных данных. Задачами факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е.

Классификация переменных, поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.

Важное отличие факторного анализа от всех описанных выше методов заключается в том, что его нельзя применять для обработки первичных, или, как говорят, «сырых», экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее - коэффициенты корреляции Пирсона, которые вычисляются между переменными (т.е. психологическими признаками), включенными в обследование.

Факторный анализ имеет три основных применения в психологии. Во-первых, он может быть использован для конструирования тестов. Например, можно написать 50 заданий для измерения каких-либо способностей, личностной черты или аттитюда (такого, например, как консерватизм). Затем задания будут предъявлены репрезентативной выборке из нескольких сотен индивидуумов и обработаны (в случае тестов способностей) таким образом, что правильный ответ будет кодироваться «1», а неправильный - «О». Ответы, которые получают при использовании ранговых шкал (как в большинстве опросников личности и аттитюдов), просто вводятся в их сыром виде: один балл, если выбирается вариант ответа (а), два балла, если выбирается вариант ответа (б), и т.д. Ответы на эти 50 заданий затем коррелируют между собой и подвергают факторному анализу. Задания, которые имеют высокие нагрузки по каждому фактору, измеряют один и тот же лежащий в их основе психологический конструкт и таким образом формируют шкалу. Это позволяет определить, как обрабатывать опросники в будущем, просто взглянув на факторную матрицу: если задания 1, 2, 10 и 12 - единственные, которые имеют существенные нагрузки по одному фактору, тогда одна шкала теста будет состоять только из этих четырех заданий.

Кроме того, каждая из шкал нуждается в валидизации, например, путем подсчета баллов, полученных каждым человеком по каждому фактору, и оценки конструктной и(или) прогностической валидности этих шкал. Например, баллы, полученные по факторам, можно прокоррелировать с баллами, полученными из других опросников, используемых для прогноза успешности обучения, и т.д. Вторая задача, которую может решить факторный анализ, заключается в редукции данных, или в «концептуальной чистке». Было разработано огромное количество тестов для измерения личности, основывающихся на различных теоретических позициях, и далеко не всегда очевидно, в какой степени они перекрываются.

В-третьих, факторный анализ применяется при проверке психометрических свойств опросников, особенно когда они используются в новых культурах или популяциях. Например, предположим, что, в соответствии с руководством по использованию австралийского личностного теста, его следует обрабатывать путем сложения баллов, полученных по всем нечетным заданиям, которые формируют одну шкалу, в то время как сумма баллов, полученных по всем четным заданиям, образует другую шкалу.

Главное понятие факторного анализа - фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы интеркорреляций. Процедура извлечения факторов из матрицы интеркорреляцийназыв-ся факторизацией матрицы. В результате факторизации из корреляционной матрицы м.б. извлечено разное кол-во факторов вплоть до числа, равного кол-ву исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению. Формальным критерием качества проведения процедуры факторного анализа является процент объединенной дисперсии исходных признаков.

В настоящее время факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик.

Вы также можете найти интересующую информацию в научном поисковике Otvety.Online. Воспользуйтесь формой поиска:

Еще по теме 31. Применение факторного анализа в психологии.:

1. Способы факторного анализа, их виды, особенности применения.
Факторный анализ, полный и дробный факторный эксперимент и математическая модель.
62. Планирования экспериментов. Факторный анализ, полный и дробный факторный эксперимент и математическая модель.

2.4 Использование факторного анализа в психологии

Факторный анализ широко используется в психологии в разных направлениях, связанных с решением как теоретических, так и практических проблем.

В теоретическом плане использование факторного анализа связано с разработкой так называемого факторно-аналитического подхода к изучению структуры личности, темперамента и способностей. Использование факторного анализа в этих сферах основано на широко принятом допущении, согласно которому наблюдаемые и доступные для прямого измерения показатели являются лишь косвенными и/или частными внешними проявлениями более общих характеристик. Эти характеристики, в отличие от первых, являются скрытыми, так называемыми латентными переменными, поскольку они представляют собой понятия или конструкты, которые не доступны для прямого измерения. Однако они могут быть установлены путем факторизации корреляционных связей между наблюдаемыми чертами и выделением факторов, которые (при условии хорошей структуры) можно интерпретировать как статистическое выражение искомой латентной переменной.

Хотя факторы имеют чисто математический характер, предполагается, что они репрезентируют скрытые переменные (теоретически постулируемые конструкты или понятия), поэтому названия факторов нередко отражают сущность изучаемого гипотетического конструкта.

В настоящее время факторный анализ широко используется в дифференциальной психологии и психодиагностике. С его помощью можно разрабатывать тесты, устанавливать структуру связей между отдельными психологическими характеристиками, измеряемыми набором тестов или заданиями теста.

Факторный анализ используется также для стандартизации тестовых методик, которая проводится на репрезентативной выборке испытуемых.

Для более подробного ознакомления с различными вариантами применения факторного анализа в психологии рекомендуем следующую литературу:

Благуш П. Факторный анализ с обобщениями. М.: Финансы и статистика, 1989.

Иберла К. Факторный анализ. М.: Статистика, 1980.

Ким Дж.О., Мьюллер Ч.У. Факторный анализ: статистические методы и практические вопросы // Факторный, дискриминационный и кластерный анализ. М.: Финансы и статистика, 1989.

Окунь Я. Факторный анализ. М.: Статистика, 1974.

Харман Г. Современный факторный анализ. М.: Статистика, 1972. (5)

Заключение

Если данные, полученные в эксперименте, качественного характера, то правильность делаемых на основе их выводов полностью зависит от интуиции, эрудиции и профессионализма исследователя, а также от логики его рассуждений. Если же эти данные количественного типа, то сначала проводят их первичную, а затем вторичную статистическую обработку. Первичная статистическая обработка заключается в определении необходимого числа элементарных математических статистик. Такая обработка почти всегда предполагает как минимум определение выборочного среднего значения. В тех случаях, когда информативным показателем для экспериментальной проверки предложенных гипотез является разброс данных относительного среднего, вычисляется дисперсия или квадратическое отклонение. Значение медианы рекомендуется вычислять тогда, когда предполагается использовать методы вторичной статистической обработки, рассчитанные на нормальное распределение, Для такого рода распределения выборочных данных медиана, а также мода совпадают или достаточно близки к средней величине. Этим критерием можно воспользоваться для того, чтобы приблизительно судить о характере полученного распределения первичных данных.

Вторичная статистическая обработка (сравнение средних, дисперсий, распределений данных, регрессионный анализ, корреляционный анализ, факторный анализ и др.) проводится в том случае, если для решения задач или доказательства предложенных гипотез необходимо определить статистические закономерности, скрытые в первичных экспериментальных данных. Приступая к вторичной статистической обработке, исследователь прежде всего должен решить, какие из различных вторичных статистик ему следует применить для обработки первичных экспериментальных данных. Решение принимается на основе учета характера проверяемой гипотезы и природы первичного материала, полученного в результате проведения эксперимента. Приведем несколько рекомендаций на этот счет.

Рекомендация 1. Если экспериментальная гипотеза содержит предположение о том, что в результате проводимого психолого-педагогического исследования возрастут (или уменьшатся) показатели какого-либо качества, то для сравнения до - и постэкспериментальных данных рекомендуется использовать критерий Стъюдента или χ 2 -критерий. К последнему обращаются в том случае, если первичные экспериментальные данные относительны и выражены, например, в процентах.

Рекомендация 2. Если экспериментально проверяемая гипотеза включает в себя утверждение о причинно-следственной зависимости между некоторыми переменными, то её целесообразно проверять, обращаясь к коэффициентам линейной или ранговой корреляции. Линейная корреляция используется в том случае, когда измерения независимой и зависимой переменных производятся при помощи интервальной шкалы, а изменения этих переменных до и после эксперимента небольшие. К ранговой корреляции обращаются тогда, когда достаточно оценить изменения, касающиеся порядка следования друг за другом по величине независимых и зависимых переменных, или когда их изменения достаточно велики, или когда измерительный инструмент был порядковым, а не интервальным.

Рекомендация 3. Иногда гипотеза включает предположение о том, что в результате эксперимента возрастут или уменьшатся индивидуальные различия между испытуемыми. Такое предположение хорошо проверяется с помощью критерия Фишера, позволяющего сравнить дисперсии до и после эксперимента. Заметим, что, пользуясь критерием Фишера, можно работать только с абсолютными значениями показателей, но не с их рангами.

Результаты количественного и качественного анализа материала, полученного в ходе проведения эксперимента, первичной и вторичной статистической обработки этого материала, используются для доказательства правильности предложенных гипотез. Выводы об их истинности являются логическим следствием доказательства, в процессе которого в качестве основного аргумента выступает безупречность логики самого доказательства, а в качестве фактов - то, что установлено в результате количественного и качественного анализа экспериментальных данных.

Факты в ходе доказательства обязательно должны соотноситься с гипотезами. В процессе такого соотнесения выясняется, насколько полно имеющиеся факты доказывают, подтверждают предложенные гипотезы. (7)

Литература

1. Годфруа Ж. Что такое психология: В 2-х т. Т.2: Пер. с франц. - М.: Мир, 1992. - 376 с.

2. Горбатов Д.С. Практикум по психологическому исследованию: Учеб. пособие. - Самара: "БАХРАХ - М", 2003. - 272 с.

3. Дружинин В.Н. Экспериментальная психология: Учебное пособие - М.: ИНФРА-М, 1997. - 256 с.

4. Дружинин В.Н. Экспериментальная психология - СПб: Питер, 2000. - 320с.

5. Ермолаев А.Ю. Математическая статистика для психологов. - М.: Московский психолого-социальный институт: Флинта, 2003.336с.

6. Корнилова Т.В. Введение в психологический эксперимент. Учебник для ВУЗов. М.: Изд-во ЧеРо, 2001.

7. Немов Р.С. Психология. Кн.3: Психодиагностика. Введение в научное психологическое исследование с элементами математической статистики. - М.: ВЛАДОС, 1998. – 632 с.

Проведении физического эксперимента. Простота же общения дала возможность неквалифицированному исследователю принимать участие в серьёзных научных проектах. Именно для него, по-видимому, и были созданы пакеты обработки экспериментальных данных SABR и BOOTSTRAP, позволяющие находить зависимость физических величин по экспериментальным данным с большой достоверностью не только при неизвестном законе...

Как видно, с ростом числа измерений различие между результатами, вычислениями по распределению Стьюдента и по нормальному распределению уменьшается. Контрольные вопросы Цель математической обработки результатов эксперимента; Виды измерений; Типы ошибок измерения; Свойства случайных ошибок; Почему среднеарифметическое значение случайной величины при нормальном законе ее распределения является...

Данных, можно достоверно судить о статистических связях, существующих между переменными величинами, которые исследуют в данном эксперименте. Все методы математико-статистического анализа условно делятся на первичные и вторичные. Первичными называют методы, с помощью которых можно получить показатели, непосредственно отражающие результаты производимых в эксперименте измерений. Соответственно под...

В отличие от представителей естественных наук (физиков, химиков, биологов, медиков), озабоченных измерением веса (молекулы, атома, планеты, живой клетки, человека), давления (газа, пара или крови), температуры (в атомном реакторе или у больного), использующих для этого приборы (линейку, тонометр, термометр) и получающих данные в соответствующих единицах (граммах, миллиметрах или градусах), психологи чаще всего должны осмысливать (понимать, описывать, измерять) какие-то более общие, абстрактные характеристики, часто ими самими придуманные, существующие гипотетически: интроверсия, альтруизм, интеллект. Как, например, можно измерить степень любви одного человека к другому? С помощью какого прибора? По какой шкале? В каких единицах?

С точки зрения психолога-психометрика любовь - это латентная (глубинная) характеристика, которую нельзя увидеть как таковую, но можно оценить на основе измерения явно выраженных (наблюдаемых) переменных. Например, можно выделить некоторые акты поведения и интерпретировать их как проявления любви. Если кто-то кому-то дарит цветы, интересуется его проблемами, читает его записки, смеется над его шутками, жертвует чем-то ради него и т.д., то можно допустить, что в данном случае переменную «любовь» следует «оценить со знаком плюс». Точно так же можно подобрать простые наблюдаемые характеристики для изучения альтруизма, понимания и т.д. Вообще идентификация глубинных измерений по наблюдаемым характеристикам (поступкам) происходит в психологических исследованиях любого уровня: индивида (например, выраженность нейротизма), личности (/Q), межличностного взаимодействия (лидерство), общества в целом (идеология, моральные нормы).

При этом исходят из гипотезы, что абстрактные понятия можно описать через более простые (наблюдаемые), поскольку эти абстрактные понятия объясняют наблюдаемые корреляции между простыми переменными. Например, постулат о существовании чего-то такого, называемого «любовью», определяет корреляции между поступками в различных ситуациях, связываемых с проявлениями любви. Стоит обратить внимание на выделенное слово «связываемых»: кем, где, когда, как? Задумав измерить какую-либо латентную переменную, исследователь (психолог-экспериментатор) составляет список характеристик (наблюдаемых переменных), свидетельствующих о проявлениях латентной переменной. Этот список чаще всего составляется на основании его гипотезы (например, о том, что чувство любви проявляется в каких-то очевидных и общепринятых поступках). Тут необходимо, конечно же, учитывать социокультурный контекст, ибо «узаконенные» (нормативные) способы проявления тех или иных чувств в разных обществах совершенно различны (достаточно вспомнить до сих пор бытующую русскую поговорку: «Бьет, значит любит»). Поскольку для оценки используются измерения по нескольким переменным-параметрам, то говорят о латентном конструкте - факторе.

Понятие «конструкт» ввел Дж.Келли (1955), рассматривавший персональные (личностные) конструкты не только как форму упорядочения опыта, но и как образование, опосредствующее восприятие и осознание действительности. Этот термин применяется и к общественному сознанию, впитавшему в себя личностные конструкты (например, на уровне идеологии, морали, общественных норм, определяющих функционирование и развитие всего общества в целом). Можно говорить о групповых конструктах, присущих представителям какой-то специальности и связанных с определенной профессиональной картиной мира.

Для обработки данных, полученных в ходе эксперимента, широко используются различные методы многомерной статистики. Наиболее распространенный из них - факторный анализ - статистическая процедура, используемая для выявления относительно небольшого количества глубинных (явно не наблюдаемых) конструктов, которые можно использовать для представления отношений между многочисленными наблюдаемыми переменными.

Точный момент возникновения метода факторного анализа определить достаточно трудно. Если отсчитывать его историю от изобретения Ф.Гальтоном коэффициента корреляции, то это середина 1880-х гг. Работая с антропометрическими данными, Пирсон в 1901 г. выдвинул идею «главных осей», но рождение факторного анализа как метода исследования связывают с публикацией в 1904 г. статьи Спирмэна «Объективное определение и измерение общего интеллекта». На основе статистического анализа тестов Спирмэн выдвинул двухфакторную теорию интеллекта, описываемого в терминах одного общего (генерального) фактора, присущего всем измерениям интеллекта, и целой серии специфических факторов, привносимых каждым из используемых тестов. Однако концепция одного генерального фактора оказалась несостоятельной, и дальнейшее развитие теории привело к появлению многофакторного анализа Тэрстоуна, т.е. к тому, что мы называем факторным анализом сегодня. Теперь общепринято рассматривать баллы в батареях тестов способностей (наблюдаемые переменные) как линейные комбинации факторов, выражающих вербальные навыки, математические способности и скорость восприятия.

Во время Второй мировой войны факторный анализ широко применялся различными военными службами США в связи с решением проблем квалификационных проверок, классификации и распределения личного состава. Довольно скоро появились работы, посвященные применению факторного анализа в исследовании темперамента (Guilford, Zimmerman, 1956), должностной морали (Roebuck, 1958), в разработке методик клинической терапии (Lorr, McNair, 1964; McNair, 1964), при выявлении психологических особенностей «public relations» (Schubert, 1962; Thurstone, Began, 1951; Voiers, 1964; подробнее об этом см.: Харман, 1972).

Факторный анализ довольно быстро превратился в достаточно сложную математическую систему, сочетающую методы теории вероятности и математической статистики, линейной алгебры и функционального анализа, развиваемую американскими математиками и статистиками для американских психологов и этими американскими психологами главным образом используемую. Практически все книги по факторному анализу, доступные русскоязычному читателю, - это переводы. И ссылки в них, иллюстрирующие применение этого метода в психологии, относятся исключительно к англоязычной литературе.

В нашей стране обсуждение основ факторного анализа началось еще в 1930-х гг. Однако в основном это были критические выступления, соответствующие духу эпохи и приведшие к тезису о «крайнем упрощенчестве метафизического характера, возникающем при разложении свойства на сумму составляющих» (Мандрыка, 1931). Такая позиция существенно затормозила дальнейшее распространение и использование факторного анализа во всех областях советской науки.

Новый этап развития этого метода в СССР начался в 1950-х гг. в антропологии (Игнатьев, 1957). В работе В.П.Чтецова (1960) была изложена общая схема факторного анализа и рассмотрены некоторые работы зарубежных антропологов. Необходимость использования факторного анализа в физкультурной антропологии была показана в статье П.Н.Башкирова (1960), послужившей «мостиком» между антропологией и науками о спорте, тесно соприкасающимися с наукой о высшей нервной деятельности человека - областью интересов Б.М. Теплова и В.Д. Небылицина (подробнее об этом см.: Небылицын, 1960; Докторов, 1969).

Статья Небылицына (1960) по тем временам была достаточно смелой (не будем забывать про активную борьбу с буржуазными веяниями в советской биологии, генетике, математике и т.д.). Осторожно называя факторный анализ скорее искусством, предоставляющим немалый простор для субъективных интерпретаций и выводов, автор все же предлагает психологам познакомиться с теорией, основными предпосылками, логикой и техникой этого метода, а также выражает надежду на скорое превращение его в строгую логическую схему, дающую единственное решение.

Теплов (1967) обращает внимание на две различные, но не противоречащие друг другу задачи факторного анализа: формально-математическую (статистическую, связанную с экономным описанием полученных данных) и научно-содержательную (интерпретационную, позволяющую подтвердить или отбросить гипотезы, касающиеся природы изучаемых процессов). Эти две задачи тесно взаимосвязаны: для решения второй (научно-содержательной) задачи надо прежде всего решить первую - математическую. Описывая математическую модель факторного анализа и приводя примеры из исследований руководимой им лаборатории, Теплов говорит о том, что факторный анализ будет ценным орудием в любой области, где можно предположить наличие некоторых основных параметров, функций, свойств, образующих структуру. В настоящее время во всех монографиях по факторному анализу указываются области применения его в психологии. Стоит отметить, что свое окончательное название на русском языке метод факторного анализа получил именно в этой работе Теплова (ранее наряду с термином «факторный» использовался термин «факториальный»).

Если попросить любого отечественного психолога назвать имена коллег, наиболее часто использующих факторный анализ сегодня, то бесспорными лидерами такого рейтинга станут «отцы-основатели» психосемантического направления - В.Ф.Петренко (1983, 1988, 1997) и А.Г.Шмелев (1983). Это действительно так. Факторный анализ (наряду с другими методами многомерной статистики - кластерным и дискриминантным анализом, многомерным шкалированием) входит в рабочий арсенал психосемантики. И если Е.Ю.Артемьева (1980, 1999), развивая психосемантический подход, пыталась избежать обработки данных, связанной с громоздкими вычислениями, из-за определенных трудностей использования больших ЭВМ и отсутствия персональных (отсюда ее семантические коды и пр.), то в настоящее время снятие этих барьеров позволяет «выжать» из полученных данных гораздо больше информации методами многомерной статистики. Конечно же, использование факторного анализа не ограничивается областью одной только психосемантики, хотя развитие последней в значительной степени способствует развитию общей математической культуры отечественных психологов. Достаточно просмотреть психологические журналы за последние два-три года, чтобы убедиться, что практически не осталось областей общей или прикладной психологии, где бы не проводились исследования с помощью метода факторного анализа.

Если на первых этапах факторно-аналитические процедуры выполнялись в основном «вручную», что требовало от исследователя владения теорией и методами расчета, то в настоящее время подавляющее большинство психологов, использующих факторный анализ для обработки своих данных, имеет очень туманное представление о сложных конструкциях, обосновывающих вычисления, а соответствующие компьютерные программы (как правило, созданные американскими программистами) воспринимает как «черный ящик», в который можно ввести свою матрицу данных, а на выходе получить матрицу факторов или какие-то графики. Конечно же, некоторые знания в области теории факторного анализа позволят исследователю более свободно чувствовать себя не только при обработке данных (выбор методов, статистических критериев, математического обоснования оптимального решения), но и на этапе планирования эксперимента (какие переменные включить, какого математического решения ожидать), а также при интерпретации полученного результата и осознании того, почему получилось именно это решение и можно ли его улучшить, выбрав другие методы факторного анализа. Все это повышает уровень исследований.

Однако все мы знаем, что ездить на автомобиле вполне можно и без знания его внутреннего устройства: выучил правила дорожного движения, познакомился с принципами движения машины, вспомнил школьные уроки физики - ив дорогу. Если что-то сломалось в пути, вовсе не обязательно лезть под капот, а можно обратиться за помощью к специалисту. Наверное, то же самое должно происходить, когда психолог садится за компьютер, включает программу факторного анализа и начинает обрабатывать свои данные. Здесь в качестве помощников выступают «Руководство пользователя» по применению программы факторного анализа и общая математическая культура, полученная в школе, а потом в институте (не случайно же курс математики считается необходимым для студента-психолога). Главная цель предлагаемого пособия - по возможности просто объяснить психологу (или студенту), как использовать мощь факторного анализа в своих целях. Однако, вспоминая аналогию с вождением автомобиля и учитывая то, что автосервис в настоящий момент развит гораздо лучше, чем обслуживание ученых-психологов специалистами по теории факторного анализа (последних просто очень мало), а также вероятность того, что психолог сам захочет (или будет вынужден) разбираться в формулах и теоремах этой теории, мы даем некоторые математические основы факторного анализа, а более продвинутому читателю рекомендуем дополнительную литературу.

Переменные	Фактор 1	Фактор 2	Фактор 3






Объяснимая
дисперсия

гументация содержания, фактически угадываемого в том или ином факторе - самая сложная и противоречивая задача. Например, если с большими положительными весами в один из выделившихся факторов вошли такие переменные, как высокий рост, грубый голос, большая мышечная масса, склонность к риску, широкие плечи, агрессивное поведение, то вероятнее всего подобная комбинация антропологом будет трактоваться как фактор мужского пола, эндокринолог увидит влияние какого-то гормона, а психолог попытается найти некие аналоги в типологии личности. Особо широко в психологии приемы факторного анализа представлены при попытках произвести упорядочение (объединение в шкалы) многочисленных пунктов в объемных личностных опросниках.

Большинство программ факторного анализа построено таким образом, что первый выделившийся фактор обладает самым большим влиянием на разброс показателей в группе (объяснимая дисперсия), а значение остальных факторов последовательно убывает.

Существует несколько основных форм факторного анализа, дающих в итоге различные результаты. Выбор необходимого варианта диктуется конкретными задачами дипломного исследования.

❖ Кластерный анализ

Если вам необходимо разбить множество ваших переменных (объектов) на заданное или неизвестное число классов, то целесообразно использовать кластерный анализ (cluster - гроздь, пучок, скопление, группа элементов, характеризуемых каким-либо общим свойством). Это не слишком часто используемая в дипломных работах форма математической обработки эмпирических материалов, представляющая интерес в тех случаях, когда переменных достаточно мно-

Рис. 3. Пример одного из вариантов графического представления результатов кластерного анализа шести переменных.

го и хочется наглядно увидеть их упорядоченность - в каких иерархических отношениях находятся переменные более высокого уровня обобщенности к более конкретным, частным (рис. 3).

Весьма любопытные результаты, тяготеющие к сфере психолингвистики, с помощью кластерного анализа можно получить при применении его к пунктам психологических тестов, вопросам опросников и анкет.

Существует точка зрения, что в отличие от многих других статистических процедур, методы кластерного анализа используются в большинстве случаев тогда, когда еще не имеется каких-либо гипотез относительно классов, т. е. когда вы все еще находитесь в описательной стадии исследования.

Пользоваться результатами кластерного анализа нужно осторожно, поскольку он может навязывать экспериментатору гипотезу об отношениях переменных, построенную на внешних, формальных критериях и не учитывать их качественную специфику. Для того, чтобы избежать подобной ошибки, предпочтительно применять несколько разных алгоритмов расчета (их много, техники группировки отличаются) и выбрать из результатов тот, который лучше всего объясняется с позиции здравого смысла. Следует понимать, что кластерный анализ определяет «наиболее возможно значимое решение».

❖ Дискримииантный анализ

Еще один из методов статистической обработки, который может оказаться полезным в дипломной работе, называется дискриминант- ним анализом. Суть его состоит в том, что он позволяет делить обладающие какими-то признаками объекты или состояния, относя их к како- му-либо классу или оценивать близость конкретного состояния к одному из классов. Сама исследовательская процедура дискриминан- тного анализа состоит из нескольких шагов:

определяются группы, которые в дальнейшем нужно различать (например, больных истерическим неврозом от больных неврозом навязчивых состояний) - это так называемая обучающая выборка;

эти группы, каждый член которых уже имеет точный (верифицированный) диагноз, исследуются по максимальному числу признаков (текущая симптоматика, личностная предрасположенность, специфика семейного воспитания, характер психотравмирующих ситуаций и т. п.);

по каждому из исследованных признаков вся обучающая выборка (и тех и других больных) дискриминируется и отслеживается - насколько точно данный признак разделил группу по диагнозам по сравнению с фактическим положением дел;

из всех просмотренных признаков отбираются наиболее информативные (те, которые наиболее точно делят обучающую выборку) и в дальнейшем они начинают использоваться для улучшения точности диагноза у тех, кому он еще не поставлен;

Попутно, при необходимости, можно отследить, насколько близко или далеко находится каждый из обследованных индивидов к тому или другому состоянию.

В итоге дискриминантного анализа для каждой переменной вы получите стандартизованный коэффициент (Т - лямбда Уилк- са), интерпретируемый следующим образом: чем он больше, тем меньше вклад соответствующей переменной в различение совокупностей.

Другими словами, основная идея дискриминантного анализа заключается в том, чтобы определить, отличаются ли совокупности по среднему какой-либо переменной (или их комбинации), и затем использовать эту переменную, чтобы предсказать для новых членов их принадлежность к той или иной группе (это задача прогноза). Более простой пример: показатель роста может служить дискриминирующим признаком для отнесения неизвестного нам человека к мужскому или женскому полу, поскольку уже точно известно, что средний рост мужчины выше среднего роста женщины.

Один подобный признак, как можно догадаться из представленного примера, не гарантирует надежности прогноза, но совокупность характеристик может сделать его достаточно уверенным.

Ниже приводится иллюстрация графического представления дискриминантного анализа (рис. 4).

Root 1 vs. Root2

Рис. 4. Графический пример разделения носителей признака на три группы, полученный в результате дискриминантного анализа.

❖ Непараметрические методы

Еще раз хотелось бы подчеркнуть, что все рассмотренные процедуры статистического анализа могут быть корректно использованы только в том случае, если ваши экспериментальные данные подчиняются т. н. нормальному закону распределения или хотя бы приближаются к нему. Это значит, что в имеющемся у вас распределении крайние значения признака - и наименьшие и наибольшие - появляются редко, а чем ближе значение признака к средней арифметической, тем чаще оно встречается (см. рис. 1).

Если такого соответствия нет, что, как правило, объясняется либо малыми размерами выборки (менее 20-30), либо измерениями в порядковых шкалах (типа «высокий», «средний», «низкий»), либо тем, что переменные объективно распределены «ненормально», то для обработки эмпирических материалов диплома нужно использовать так называемые непараметрические критерии, хотя они и имеют меньшую мощность и обладают меньшей гибкостью (для их расчета не рассматриваются и не учитываются значения среднего и стандартного отклонения). Но у них есть и ряд преимуществ. Они малочувствительны к неточным измерениям и эти методы могут применяться для обработки данных, имеющих полуколичественную природу (ранги, баллы и т. д.). Кроме того, с их помощью можно получить ответы на такие вопросы, которые неразрешимы с использованием методов, основанных на нормальном распределении. Следовательно, они иногда оказываются уместны и для обработки нормально распределенных результатов исследования.

Не вдаваясь в подробности, укажем лишь на названия непараметрических процедур, позволяющих получить показатели, аналогичные нормально распределенным.

Для выяснения достоверности различий между двумя независимыми выборками (например, при сравнении мальчиков и девочек) непараметрическими альтернативами t-критерия являются серийный критерий В альд а-Вольфович a, U критерий Манна-Уитни и двухвы- бор очный критерий типа Колмогорова-Смирнова.

Если в дипломе выясняются различия между зависимыми выборками (например, показателями одной группы до коррекционной работы и после нее), то нужно использовать Т-критерий Уилкоксона для разностей пар, который может быть применен также и к ранжированным данным. По сравнению сt-критерием Стъюдента, он требует значительно меньшего объема вычислений и почти также строго проверяет нормально распределенные выборки. Его эффективность для больших и малых выборок составляет около 95%.

Если две рассматриваемые переменные имеют альтернативное распределение (включают только две градации, как например, показатели теста в группе ниже или выше некой избранной величины до и после тренировок, либо количество справившихся с контрольной по математике среди мальчиков и девочек), то подходящими непараметрическими критериями достоверности различий будут % 2 (хи-квадратен не рекомендован к применению, если число опытов в каждом из сравниваемых распределений меньше 10) и точный критерий Фишера для четырехпольной таблицы. Внимание: не путайте алгоритм расчета упомянутого непараметрического критерия % 2 с имеющим много общего алгоритмом расчета критерия согласия х 2 Пирсона, полезного при сравнении эмпирического и теоретического распределений, как правило используемого для установления соответствия реально полученного распределения нормальному закону.

Для выяснения связей между признаками (корреляции) можно рассчитать уже упоминавшийся тетрахорический показатель (г),ранговые коэффициенты корреляции Спирмена (R или р) и may (т)Кендалла. Последние два могут быть использованы для определения тесноты связей как между количественными, так и между качественными признаками при условии, если их значения упорядочить или проранжировать по степени убывания или возрастания признака.

❖ Компьютерная обработка и графические иллюстрации

Пускай вас не смущает некоторая перегруженность статистических процедур, рекомендуемых для использования в дипломной работе. В большинстве случаев вам не обязательно (хотя и желательно) быть знакомыми с их математическим аппаратом. К сегодняшнему дню для нужд науки разработаны многочисленные компьютерные программы, позволяющие даже не сведущему в математике человеку довольно легко рассчитывать большинство желаемых показателей. Самыми известными и популярными из них являются пакеты Statistica (табличные и графические примеры с ее использованием приведены выше) иSPSS. Обе программы снабжены справочным материалом в формеHelp-ов и специальным информационным сопровождением с обзором основных расчетных алгоритмов. При выведении показателей различия, в корреляционных матрицах и в других таблицах автоматически выделяются цветом и жирностью числовые значения, представляющие для исследователя особый интерес (по достоверности, важности, приоритетности и т. д.).

Эти же пакеты позволяют существенно улучшить внешний вид дипломной работы за счет внесения в нее большей наглядности. Это достигается заменой некоторых трудно читаемых таблиц и цифровых данных на графики, гистограммы, и другие формы иллюстраций, хорошо вписывающихся в смысловую канву предъявленных результатов (но ничего лишнего!).

Выбор формы графика не должен быть случаен. Например, изменения во времени лучше воспринимаются в линейном представлении, сопоставление показателей двух групп - в столбчатом, пропорции - в круговых гистограммах, а рассеяние - в точечном (рис. 5-8).

Бухгалтеру о налогах и кадрах. Налоги, бухгалтерия, отчетность, ККМ

Еще по теме 31. Применение факторного анализа в психологии.: