Между рассматриваемыми переменными.

Исходным элементом для дальнейших расчётов является корреляционная матрица. Для понимания отдельных шагов этих расчётов потребуются хорошие знания, прежде всего, в области операций над матрицами. Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения диагональных элементов матрицы (так называемые относительные дисперсии простых факторов).

Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу. Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки. Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы, наиболее часто употребляемым из которых является метод определения главных факторов (компонентов).

Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является ортогональное вращение по так называемому методу варимакса . Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа. Кроме того на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам.

Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения. Таким образом для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

Факторный анализ - это статистический инструмент, довольно часто используемый в психологии при создании многофакторных тестов, а также при систематизации и обобщении комплексных наблюдений. Многочисленные варианты его использования включают конструирование тестов, выявление основных параметров личности и способностей, установление того, сколько отдельных психологических характеристик (т.е. черт) измеряется набором тестов или заданиями теста.

Термин «факторный анализ» может относиться к двум довольно разным статистическим методикам:

    Исследовательский факторный анализ (эксплораторный факторный анализ) - более старая и более простая методика.

    Конфирматорный факторный анализ и его разновидности (известные как «анализ путей», «анализ латентных переменных» или «модели LJSREL») полезны во многих областях за пределами изучения индивидуальных различий и особенно популярны в социальной психологии. Авторы не всегда четко указывают, какой из видов факторного анализа использовался - исследовательский или конфирматорный. Если вы увидите термин «факторный анализ» в журнале, следует допустить, что имеется и виду исследовательский факторный анализ.

Часто при создании психологического теста важно, чтобы все задания шкалы измеряли одну (и только одну) психологическую переменную. Коэффициент альфа Кронбаха может служить показателем надежности шкалы. Эта техника исходит из того, что все задания в тесте формируют одну шкалу и коэффициент надежности, в сущности, проверяет, насколько это допущение обоснованно.

Однако рассмотрим более простой пример. В интересах науки планируете собрать следующие данные у случайно сформированной выборки, например, у 200 студентов:

V 1 - вес тела (в кг);
V 2 - степень невнятности речи (ранжируется по шкале от 1 до 5);
V 3 - длина ноги (в см);
V 4 - разговорчивость (ранжируется по шкале от 1 до 5);
V 5 - длина руки (в см);
V 6 - степень шатания при попытках пройти по прямой линии (ранжируется по шкале от 1 до 5).

Кажется вероятным, что V1 ,V3 и V5 будут варьировать совместно, поскольку крупные люди будут склонны иметь длинные руки и ноги и больше весить. Все эти три пункта измеряют некоторое фундаментальное свойство индивидуумов вашей выборки: их размеры. Точно так же вероятно, что V2, V4 и V6 будут варьировать совместно, так как количество употребленного алкоголя, вероятно, будет связано с четкостью речи, разговорчивостью и с осложнениями при попытках пройти по прямой линии. Таким образом, хотя мы собрали шесть фрагментарных данных, эти переменные измеряют только 2 конструкта: размеры тела и степень опьянения. В факторном анализе вместо слова «конструкт» обычно используется слово «фактор», и далее мы будем следовать этой традиции.

Исследовательский факторный анализ, по существу, выполняет две функции:

    Он показывает, сколько отдельных психологических конструктов (факторов) измеряется данным набором переменных. В приведенном выше примере такими двумя факторами являются размеры тела и степень опьянения.

    Он показывает, какие именно конструкты измеряют использованные переменные. В приведенном выше примере было показано, что VI , V 3 и V 5 измеряют один фактор и V2, V4 и V6 измеряют другой, совершенно отличный фактор.

В некоторых формах факторного анализа дополнительно можно прокоррелировать факторы между собой, и затем вычислить для каждого испытуемого индивидуальную оценку по каждому фактору в целом («факторные оценки»).

Оценки по полным тестам (а не по его отдельным заданиям) также могут подвергаться факторному анализу - на самом деле именно так эта методика и используется. Факторный анализ в этом случае может показать, действительно ли тесты, которые, предположительно, измеряют один и тот же конструкт (например, шесть тестов, которые претендуют на измерение тревожности), продуцируют один фактор, или же в этом случае будут выделены несколько факторов (указывая на то, что тесты на самом деле измеряют несколько разных характеристик). Факторный анализ оценок, полученных на основе полных тестов, может быть чрезвычайно полезен для установления того, что именно измеряется группой тестов, поскольку многозначность языка допускает, что одному и тому же конструкту разными исследователями могут быть даны различные наименования. «Тревога» у одного автора может обозначать то же самое, что «нейротизм» - у другого или «негативный аффект» - у третьего. Число терминов, используемых в психологии индивидуальных различий, потенциально безгранично, и без факторного анализа нет надежного способа установить, действительно ли несколько шкал измеряют один и тот же базисный психологический феномен. Например, если в издательском каталоге указано, что имеются психологические средства измерения «нейротизма», «тревоги», «истерии», «силы Эго», «нервозности», «низкой самоактуализации» и «боязливости», кажется разумным задать вопрос: действительно ли это шесть отдельных понятий или это одна и та же характеристика, которой исследователи, имеющие разные теоретические воззрения, дали различные названия? Факторный анализ может точно ответить на этот вопрос, и поэтому он чрезвычайно полезен для упрощения структуры личности и способностей.

Возможности факторного анализа не ограничиваются анализом заданий или оценок теста. Можно факторизовать, например, показатели времени реакции, взятые из когнитивных тестов различного типа, чтобы определить, какие из них (если такие есть) связаны между собой. Возможен и иной подход. Предположим, что группу школьников, которые не имели специальной спортивной подготовки или спортивной практики, оценивали с точки зрения их успешности в соревнованиях по 30 видам спорта с помощью комплекса оценок, включавшего рейтинги тренеров, регистрацию времени, среднюю длину броска, процент отсутствия очков при игре в крикет, забитые голы и любые другие измерения показателей успешности, наиболее подходящие для каждого вида спорта. Единственное условие состоит в том, что каждый ребенок должен участвовать в каждом виде соревнования. Факторный анализ обнаружит много интересных фактов; например, он покажет, будут ли индивидуумы, успешные в одной игре с мячом, демонстрировать тенденцию к успешности во всех остальных играх, будут ли соревнования по бегу на длинные и короткие дистанции образовывать две различные группы (и какой вид соревнования будет входить в какую группу) и т.д. Таким образом, вместо того чтобы обсуждать происходящее в терминах успешности в 30 различных областях, будет возможно суммировать эту информацию, обсуждая ее в категориях шести основных спортивных способностей (или стольких способностей, сколько выявит факторный анализ).


Факторный анализ (англ. factor analysis) - совокупность математических методов снижения размерности пространства наблюдаемых переменных с помощью линейного проектирования. Исходным материалом для применения Ф. а. служат матрицы расстояний между наблюдаемыми переменными (показателями разных тестов, показателями отдельных шкал тестов, измерениями к.-л. характеристик испытуемых); в классических вариантах Факторный анализ - это матрицы парных корреляций, в поздних модификациях - ненормированные аналоги корреляций или даже топологические меры расстояния. Основные алгоритмы факторного анализа: метод главных компонент и центроидный метод. Наибольшую сложность представляет интерпретация результатов Ф. а. Многие методы психодиагностики создавались с помощью факторного анализа.

О некоторых применениях Факторный анализ - см .: Большая пятерка , Метод семантического дифференциала , Первичные интеллектуальные способности .

Большая энциклопедия по психиатрии. Жмуров В.А.

Факторный анализ - общее название ряда статистических процедур, которые направлены на определение места меньшего числа измерений, кластеров или факторов в большем наборе независимых переменных или пунктов.

Психомоторика: cловарь-справочник. Дудьев В.П.

Факторный анализ (от лат. factor - делающий, производящий и греч. analysis - разложение, расчленение) - метод многомерной математической статистики, применяемый при исследовании статистически связанных признаков с целью выявления определенного числа скрытых от непосредственного наблюдения факторов

Неврология. Полный толковый словарь. Никифоров А.С.

нет значения и толкования слова

Оксфордский толковый словарь по психологии

Факторный анализ - этот термин в действительности не представляет собой единого понятия, скорее он служит общим названием для ряда статистических процедур, которые направлены на определение места меньшего числа измерений, кластеров или факторов в большем наборе независимых переменных или пунктов. Основной отличительный элемент факторного анализа – репозиция данных. Начиная с массива коэффициентов корреляций между всеми первичными переменными базы данных (число которых может быть очень велико, особенно если это пункты личностного опросника или теста интеллекта) с помощью методики факторного анализа выделяется малое число основных компонентов, которые могут рассматриваться как исходные переменные, объясняющие взаимосвязи, наблюдаемые в данных. Переменные, которые коррелируют друг с другом на высоком уровне, будут определяться как представляющие один фактор; переменные, которые не коррелируют друг с другом, определяются как представляющие ортогональные (или независимые) факторы. Идеальный факторный анализ выделил бы малое число факторов, каждый из которых был бы ортогональным друг другу; то есть в пространственных понятиях, которые располагались бы под прямым углом Друг к другу в графическом изображении. Обратите внимание , что все эти процедуры – строго статистические; факторы, которые выявляются в ходе анализа, еще должны быть субъективно исследованы, чтобы определить, представляют ли они наиболее яркие психологические измерения.

Например, в тестах на Ю значения по ряду пунктов могут оказаться высоко коррелирующими друг с другом и определяться как статистический фактор, например, исследование этих пунктов может показать, что все они содержат математические элементы, и таким образом это может привести к предположению о существовании математического фактора. Имеется тенденция, особенно когда методы факторного анализа применяются к личностным опросникам, определять выявляемые факторы как черты. Строго говоря, фактор – не черта; черта выводится из фактора, он представляет регулярность, лежащую в основе базы данных, и эти два термина не должны рассматриваться как синонимы. Установление валидной черты требует дополнительных выводов; для обсуждения использования и сопутствующих проблем см. черта.

Факторный анализ является важным инструментом в тех областях психологии, в которых основные компоненты предполагаются, но трудно различимы, например, тестирование интеллекта, оценки личности, Семантика и т.п. Сами эти процедуры довольно сложны, и для того чтобы понимать и использовать их, требуется владение в некоторой степени математическими знаниями. Во многих последующих статьях даются основные понятия концептуальной базы факторного анализа; для того чтобы познакомиться с математическими основами и методами применения, читателю следует обратиться к книгам по факторному анализу.

предметная область термина

ОБРАТНЫЙ ФАКТОРНЫЙ АНАЛИЗ - см. факторный анализ, обратный.

ФАКТОРНЫЙ АНАЛИЗ (FACTOR ANALYSIS) - набор техник, предназначенных для выявления переменных, которые могли бы частично описывать связи внутри большого числа переменных.

ИНВЕРТИРОВАННЫЙ ФАКТОРНЫЙ АНАЛИЗ - см. обратный факторный анализ.


Федеральное агентство по образованию

«Новосибирский Государственный Педагогический Университет»

Факультет психологии

Кафедра общей психологии и истории психологии

Специальность: 030301

Курс: 3, 32гр.

Отделение: дневное

Факторный анализ

Выполнила: Китаева Р.С.

Проверила: Шамшикова Е.О.

Новосибирск, 2010 г.

Введение……………………………………………………………….…………..3

Глава 1. История развития и области применения факторного анализа………4

1.1. Области применения факторного анализа………...……………......7

Глава 2. Факторная матрица. Интерпретация факторов…. ………....……....11

2.1. Косоугольная система координат и факторы 2-го порядка……...17

Глава 3. Основные теории факторного анализа………...……………………18

Заключение……………………………………………………………………....21

Список литературы……………………………………………………………....23

Введение

“Факторный анализ – (от лат. faktor– действующий, производящий и греч. analysis - разложение, расчленение) – метод многомерной математической статистики, применяемый при исследовании статистически связанных признаков с целью выявления определенного числа скрытых от непосредственного наблюдения факторов” .

Созданный в начале века для нужд психологии (предпринимались попытки выделить основной фактор, определяющий интеллект), факторный анализ впоследствии получил большое распространение в экономике, медицине, социологии и других науках, располагающих огромным количеством переменных, из которых обычно необходимо выделить ведущие. С помощью факторного анализа не просто устанавливается связь изменения одной переменной с изменением другой переменной, а определяется мера этой связи, и обнаруживаются основные факторы, лежащие в основе указанных изменений. Факторный анализ особенно продуктивен на начальных этапах научных исследований, когда необходимо выделить какие-либо предварительные закономерности в исследуемой области. Это позволяет последующий эксперимент сделать более совершенным по сравнению с экспериментом на переменных, выбранных произвольно или случайно. Как метод факторный анализ имеет определенные слабые стороны, в частности отсутствует однозначное математическое решение проблемы факторных нагрузок, т.е. влияния отдельных факторов на изменения различных переменных.

Актуальность применения факторного анализа в психологических исследованиях на современном этапе связана с широким внедрением компьютеров, что делает возможным проведение сложных факторно-аналитических вычислений с обработкой больших массивов данных.

Глава 1. История развития и факторного анализа

Факторный анализ представляет собой ветвь математической статистики. Часто встречающееся ошибочное представление о факторном анализе как о психологической теории имеет свою причину: факторный анализ зародился и всегда интенсивно применялся в психологической науке. Первоначальная цель его состояла в построении математических моделей способностей и поведения человека. Наиболее известные из психологических теорий подобного рода принадлежат Ч.Спирмену, С.Барту, Т.Келли, Л.Терстоуну, К.Холзингеру и Г.Томсону .

Появление факторного анализа обычно связывают с именем Ч.Спирмена. Началом его монументального труда, развившего психологическую теорию единственного генерального и некоторого числа характерных факторов, следует считать статью “Общий интеллект, объективно определенный и измеренный”, опубликованную в 1904 г. в “Американском психологическом журнале”. Конечно, эта работа была лишь началом его двухфакторной теории и излагалась еще не в терминах “факторов”. Возможно, более важной работой, особенно в статистическом плане, была статья К.Пирсона “On lines and planes of closest fit to systems of points in space”, опубликованная в 1901 г., в которой выдвигалась идея “метода главных осей”. Тем не менее, отцом факторного анализа заслуженно считается Ч.Спирмен, посвятивший последние 40 лет жизни развитию этой дисциплины .

В последующие 20 лет были достигнуты значительные успехи в разработке как психологических теорий, так и математического обоснования факторного анализа. Основной вклад принадлежит здесь С.Спирмену, С.Барту, К.Пирсону, Г.Томсону, Д.Максвеллу, Д.Гарнету и К.Холзингеру. Основные усилия ученых в это время были направлены на доказательства существования (или, наоборот, отсутствия) общей (неспецифической) одаренности (general ability), изучение ошибок от непредставительности выборки при оценке тетрадных разностей и разработку вычислительных процедур для поиска генерального фактора .

Началом современного периода в развитии факторного анализа, характерного подъемом творческой активности и оживленной дискуссией на страницах научных публикаций можно считать 1925 г.; реальные результаты относятся к 1930 г. К этому времени становится ясным, что факторы, получаемые с помощью двухфакторной теории Спирмена, не всегда адекватно описывают набор психологических тестов; впрочем, первое время экспериментаторы упорно отрицали наличие отклонений от теории и максимально сокращали число рассматриваемых групповых факторов. Теория генерального и специфических факторов Спирмена постепенно вытеснялась теорией групповых факторов, но методы этой последней были еще слишком трудоемкими, что затрудняло их практическое применение. Именно поэтому ряд исследователей направили свои усилия на поиск методов непосредственного извлечения набора факторов из матрицы корреляций между тестами; результатом этого явилось создание многофакторного анализа, понятие о котором ввел впервые Гарнетт.

Хотя термин “многофакторный анализ” был впервые введен Л.Терстоуном и хотя Терстоун, несомненно, больше, чем кто-либо другой, сделал для популяризации многофакторного анализа, не он тем не менее был

первым, кто “сверг” двухфакторную теорию Спирмена, и не он открыл теорию многих факторов. И даже не центроидный метод позволил Терстоуну занять выдающееся место в истории факторного анализа. Терстоун ясно сознавал, что центроидный метод является лишь вычислительным компромиссом по отношению к методу главных компонент. Заслуга этого ученого состоит в том, что он обобщил критерий разности тетрад Спирмена и указал, что основой для определения числа общих факторов является ранг корреляционной матрицы. Проблема весьма упростилась в математическом аспекте, что способствовало дальнейшему развитию факторного анализа.

Приложения математических результатов, полученных в рамках факторного анализа, не ограничивались психологической наукой. Задача факторного анализа состоит в замене набора параметров меньшим числом некоторых категорий (“факторов”), являющихся линейной комбинацией исходных параметров. Удовлетворительным решением служит такая система факторов, которая достаточно адекватно передает информацию, имеющуюся в наборе параметров. Таким образом, главная цель факторного анализа– сжатие информации, экономное описание .

Одна и та же матрица корреляций может быть факторизована бесчисленным количеством способов. Возможно, именно неосведомленность об этом факте послужила причиной бурных дискуссий о “правильном”, “наилучшем” или “инвариантном” решении для данного набора параметров. Раз возможно бесконечное число одинаково “правильных” решений, то естественно возникает вопрос: как произвести выбор? Выбор типа нужного факторного решения производится на основании двух принципов: 1) статистической простоты; 2) содержательного психологического смысла (если речь идет о психологии). В свою очередь, каждый из этих принципов может быть по-разному интерпретирован; доказательством тому служит неоднозначное их применение различными школами факторного анализа.

Если иметь в виду чисто статистический поход, то естественно заменить исходный набор параметров несколькими факторами, определяемыми последовательно и таким образом, чтобы каждый из последующих факторов “отбирал на себя” максимум из оставшейся суммарной дисперсии параметров. Этот статистический оптимальный подход и соответствующий метод главных осей был впервые предложен Пирсоном в начале столетия и досконально разработан Хотеллингом в 1930-х годах. Алгоритмы метода главных компонент весьма эффективны с точки зрения результатов, но очень трудоемки: вычислить вручную главные компоненты для матрицы 10-го и более высокого порядка практически невозможно. В последние годы, однако, эта трудность была преодолена благодаря быстродействующим ЭВМ .

Другим методом, основанным на статистическом подходе, является центроидный метод. Этот метод был введен в употребление как вычислительный паллиатив (мера, не обеспечивающая полного, коренного решения задачи), после того как стала ясна практическая нереализуемость метода главных факторов. Это означает, что цетроидный метод позволяет достаточно легко из многих систем координат выбрать такую, которая в смысле распределения дисперсии приближается к оптимальной системе.

Вообще говоря, конечный результат обоих методов, центроидного и главных факторов, еще не может устроить психологов. В поисках содержательно значимых методов психологи создали различные теории, надеясь найти такой единственный метод, который был бы одинаково хорош при исследовании интеллекта, личности, физических экспериментов и любых параметров, с которыми приходится сталкиваться психологу.

1.1. Области применения факторного анализа.

Методы факторного анализа нашли применение главным образом в психологии. Причиной этому был тот факт, что факторный анализ зародился в психологии и формализм этой дисциплины тесно “… связан с психологической концепцией ментальных факторов; даже специалисту-статистику трудно заметить и установить связь между методами факторного анализа и методами обычной математической статистики” .

Решение, полученное методами факторного анализа, может послужить основой при формулировании некоторой научной гипотезы; возможно и обратное: методами факторного анализа ищется подтверждение существующей гипотезы. Теория Спирмена является иллюстрацией второго подхода. Спирмен показал, что если между парными корреляциями имеются определенные взаимосвязи, то может быть выписана система линейных уравнений, связывающих все рассматриваемые параметры, генеральный фактор и по одному дополнительному характерному фактору на каждый параметр. Эти взаимосвязи и позволяют дать статистическое обоснование двухфакторной теории. Если набор психологических параметров не удовлетворяет условиям существования указанных взаимосвязей, то может быть постулирована более сложная гипотеза, требующая уже несколько генеральных факторов для адекватного статистического описания системы параметров.

Одна из наиболее ранних работ, связанных с расширением сферы приложения факторного анализа, была проделана в 1950 г. Т.Келли; в ней предлагался метод достижения максимальной социальной полезности каждого индивидуума при сохранении индивидуальных свобод и прав. Во время второй мировой войны факторный анализ широко применялся различными военными службами США в связи с решением проблем классификационных проверок, классификации и распределения личного состава. Разумеется, психологи и по сей день продолжают развивать и применять методы факторного анализа .

Многие психологи предприняли интенсивные исследования, пытаясь методами факторного анализа выделить небольшое число тестов, возможно более полно описывающих умственную деятельность человека. Обычно работы такого рода включают факторизацию большого набора тестов, результатом которой являются несколько общих факторов. Далее от набора тестов отбираются те, которые наилучшим образом описывают факторы (возможен и синтез “наилучших” тестов из исходных); отобранные тесты считаются прямыми измерителями “факторов мозга”. Конечно, эти тесты лишь в той мере являются действительными измерителями факторов, в какой их считают “правильными” психологи. Факторные тесты должны быть “чистыми” тестами и сильно отличаться друг от друга, покрывая своей системой весь спектр умственной деятельности.

Извлечению факторов из большого набора тестов было посвящено несколько крупных работ. Из наиболее ранних исследований подобного рода следует отметить работу Спирмена и Холзингера о выявлении отдельных черт характера и работу Терстоуна, посвященную изучению умственных способностей. Из большого потока исследований последующих лет, касающихся выделения специфических психологических факторов, следует упомянуть отдельно работы Д.Гилфорда (исследование интеллекта) и Р.Кэттелла (теория личностных черт).

Столь же широкое применение, как и при исследовании интеллекта, факторный анализ получил и в других областях психологии, в частности при изучении темперамента, создании клинической терапии и т.д.

За последние годы факторный анализ все более широко начал применяться и в других областях знания: в социологии, метеорологии, медицине, географии, экономике и др.

В факторном анализе при исследовании конкретных массивов информации существует возможность использовать различные модели, или, иначе, различные виды факторных решений. На основании этой неопределенности факторного анализа некоторые ученые ставили под сомнение его полезность как орудия научного исследования. Очевидно, однако, что точно также подобного обвинения заслуживают и другие прикладные науки, поскольку и в них имеются теоретические альтернативы .

За всю историю развития факторного анализа психологи и статистики разработали несколько типов факторных решений. Сторонник очередной теории аргументировал обычно ее полезность возможностью интерпретации психологических экспериментов. Сильнейшие эмоции, характерные для одного периода развития факторного анализа, остроумно выразил Куртон: “Факторную теорию можно определить как математически разумную гипотезу. Специалист в области факторного анализа – это субъект, одержимый некой навязчивой идеей о природе умственных способностей или личности. Применяя высшую математику к исследуемому предмету, он доказывает, что его оригинальная точка зрения верна и неизбежна. Обычно он доказывает также, что все другие специалисты в факторном анализе – опасные сумасшедшие и единственное их спасение состоит в том, чтобы принять его теорию; только в этом случае выяснится истина об их болезни. Поскольку противники никогда не поддерживают такое обвинение, то он обзывает их безнадежными и устремляется в области математики, наверняка им не известные; тем самым доказывается не только необходимость, но и достаточность неизлечимости оппонентов” .

Глава 2. Факторная матрица. Интерпретация факторов.

Факторный анализ – это ветвь математической статистики. Его цели, как и цель других разделов математической статистики, заключается в разработке моделей, понятий и методов, позволяющих анализировать и интерпретировать массивы экспериментальных или наблюдаемых данных вне зависимости от их физической формы.

Одной из наиболее типичных форм представления экспериментальных данных является матрица, столбцы которой соответствуют различным параметрам, свойствам, тестам и т.п., а строки – отдельным объектам, явлениям, режимам, описываемым набором конкретных значений параметров. На практике размеры матрицы оказываются достаточно большими: так, число строк этой матрицы может колебаться от нескольких десятков до нескольких сотен тысяч (например, при социологических обследованиях), а число столбцов – от одного – двух до нескольких сотен. Непосредственный, “визуальный”, анализ матриц такого размера невозможен, поэтому в математической статистике возникло много подходов и методов, предназначенных для того, чтобы “сжать” исходную информацию, заключенную в матрице, до обозримых размеров, извлечь из исходной информации наиболее “существенное”, отбросив “второстепенное”, “случайное” .

При анализе данных, представленных в форме матрицы, возникают два типа задач. Задачи первого типа имеют целью получить “короткое описание” распределения объектов, а задачи второго – выявить взаимоотношения между параметрами.

Следует иметь в виду, что основной стимул для появления указанных задач заключается не только и не столько в желании коротко закодировать большой массив чисел, а в значительно более принципиальном обстоятельстве, имеющем методологический характер: коль скоро удалось коротко описать большой массив чисел, то можно верить, что вскрыта некая объективная закономерность, обусловившая возможность короткого описания; а ведь именно поиск объективных закономерностей и является основной целью, ради которой, как правило, и собираются данные.

Упомянутые подходы и методы обработки матрицы данных отличаются тем, какого типа задачи обработки данных они предназначены решать, и тем, к матрицам какого размера они применимы.

Что же касается проблемы короткого описания связей между параметрами при среднем числе этих параметров, то в данном случае соответствующая корреляционная матрица содержит несколько десятков или сотен чисел и сама по себе она еще не может служить “коротким описанием” существующих связей между параметрами, а должна с этой целью подвергнуться дальнейшей обработке.

Факторный анализ как раз и представляет собой набор моделей и методов, предназначенных для “сжатия” информации, содержащейся в корреляционной матрице. В основе различных моделей факторного анализа лежит следующая гипотеза: наблюдаемые или измеряемые параметры являются лишь косвенными характеристиками изучаемого объекта или явления, на самом же деле существуют внутренние (скрытые, не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения наблюдаемых параметров. Эти внутренние параметры принято называть факторами. Задача факторного анализа – представить наблюдаемые параметры в виде линейных комбинаций факторов и, может быть, некоторых дополнительных, “не существенных” величин – “помех”. Замечательным является тот факт, что, хотя сами факторы не известны, такое разложение может быть получено и, более того, такие факторы могут быть определены, т.е. для каждого объекта могут быть указаны значения каждого фактора .

Факторный анализ, независимо от используемых методов, начинается с обработки таблицы интеркорреляций, полученных на множестве тестов, известной как корреляционная матрица, а заканчивается получением факторной матрицы, т.е. таблицы, показывающей вес или нагрузку каждого из факторов по каждому тесту. Таблица 1 представляет собой гипотетическую факторную матрицу, включающую всего два фактора.

Факторы перечисляются в верхней строке таблицы от более значимого к менее значимому, а их веса в каждом из 10 тестов даны в соответствующих столбцах.

Таблица 1

Гипотетическая факторная матрица

Фактор II

1.Словарный

2.Аналогии

3.Завершение предложений

5.Понимание прочитанного

6.Сложение

7.Умножение

8.Арифметические задачи

9.Составление уравнений

10.Завершение числовых рядов

Оси координат. Принято представлять факторы геометрически в виде осей координат, относительно которых каждый тест может быть изображен в виде точки. Рис. 1 поясняет эту процедуру. На этом графике каждый из 10 тестов, приведенных в табл.1, отображен в виде точки относительно двух факторов, которые соответствуют осям I и II. Так, тест 1 представлен точкой с координатами 0,74 по оси I и 0,54 по оси II. Точки, представляющие остальные 9 тестов, построены аналогичным способом, с использованием значений весов из табл. 1.

Следует заметить, что положение осей координат не фиксировано данными. Исходная таблица корреляций определяет лишь положение тестов (т.е. точек на рис. 1) относительно друг друга. Те же точки можно нанести на плоскость с любым положением координатных осей. По этой причине при проведении факторного анализа обычно вращают оси до тех пор, пока не получают наиболее приемлемого и легко интерпретируемого отображения.

Рис. 1. Гипотетическое факторное отображение, показывающее веса двух групповых факторов по каждому из 10 тестов.

На рис. 1 полученные после вращения оси I’ и II’ показаны пунктирными линиями. Это вращение выполнено в соответствии с предложенными Терстоуном критериями положительного многообразия и простой структуры. Первый предполагает вращение осей до положения, при котором исключаются все значимые отрицательные веса. Большинство психологов считают отрицательные факторные нагрузки логически несоответствующими тестам способностей, так как такая нагрузка означает, что чем выше оценка индивидуума по специфическому фактору, тем ниже будет его результат по соответствующему тесту. Критерий простой структуры, в сущности, означает, что каждый тест должен иметь нагрузки по как можно меньшему числу факторов .

Выполнение обоих критериев дает факторы, которые можно наиболее легко и однозначно интерпретировать. Если тест имеет высокую нагрузку по одному фактору и не имеет значимых нагрузок по другим факторам, мы можем кое-что узнать о природе этого фактора, изучив содержание данного теста. Напротив, если тест имеет средние или низкие нагрузки по шести факторам, то он мало что скажет нам о природе любого из них.

На рис. 1 хорошо видно, что после вращения осей координат все вербальные тесты (1-5) располагаются вдоль или очень близко к оси I’, а числовые тесты (6-10) тесно группируются вокруг оси II’. Новые факторные нагрузки, измеренные относительно повернутых осей, приведены в табл. 2. Факторные нагрузки в табл. 2 не имеют отрицательных значений, за исключением пренебрежительно малых величин, явно относимых к ошибкам выборки. Все вербальные тесты имеют высокие нагрузки по фактору I’ и практически нулевые – по фактору II’. Числовые тесты, напротив, имеют высокие нагрузки по фактору II’ и пренебрежимо низкие – по фактору I’. Таким образом, вращение координатных осей существенно упростило идентификацию и называние обоих факторов, а также описание факторного состава каждого теста. На практике число факторов часто оказывается больше двух, что, разумеется, усложняет их геометрическое представление и статистический анализ, но не изменяет существа рассмотренной процедуры.

Таблица 2

Факторная матрица после вращения

Фактор I’

Фактор II’

1.Словарный

2.Аналогии

3.Завершение предложений

4.Восстановление порядка слов в предложении

5.Понимание прочитанного

6.Сложение

7.Умножение

8.Арифметические задачи

9.Составление уравнений

10.Завершение числовых рядов

Некоторые исследователи руководствуются теоретической моделью как принципом вращения осей. Кроме того, принимается в расчет неизменность, или подтверждение одних и тех же факторов в независимо выполненных, но сравнимых исследованиях.

Интерпретация факторов. Получив после процедуры вращения факторное решение (или, проще говоря, факторную матрицу), мы можем переходить к интерпретации и наименованию факторов. Этот этап работы скорее требует психологической интуиции, нежели статистической подготовки. Чтобы понять природу конкретного фактора, нам ничего не остается, как изучить тесты, имеющие высокие нагрузки по этому фактору, и попытаться обнаружить общие для них психологические процессы. Чем больше оказывается тестов с высокими нагрузками по данному фактору, тем легче раскрыть его природу. Из табл. 2, к примеру, сразу видно, что фактор I’ вербальный, а фактор II’ числовой. Приведенные в табл. 2 факторные нагрузки отображают к тому же корреляцию каждого теста с фактором .

2.1. Косоугольная система координат и факторы 2-го порядка.

Изображенные на рис. 1 оси называются ортогональными, так как они строго перпендикулярны друг другу. Иногда кластеры тестов располагаются таким образом, что лучшего соответствия используемым критериям удается достичь при использовании облических (косоугольных) осей. В таком случае уже сами факторы коррелируют друг с другом. Одни исследователи утверж-дали, что использование ортогональных (некоррелирующих) факторов всегда предпочтительнее, поскольку такие факторы дают более простую и четкую картину взаимосвязи черт. Другие настаивают на том, что косоугольную систему координат следует использовать всякий раз, когда она лучше соответствует изучаемым данным, поскольку большинство имеющих ясный физический смысл категорий и не должны быть независимыми. Очевидный пример – рост и вес. Несмотря на высокую корреляцию между собой, они оказались весьма полезными категориями при оценке телосложения.

Когда факторы коррелируют между собой, существующие между ними интеркорреляции можно подвергнуть тому же статистическому анализу, который мы применяем к интеркорреляциям между тестами. Иными словами, у нас есть возможность “факторизовать факторы” и получить факторы второго порядка. Этот способ обработки данных был использован в ряде исследований таких переменных, как способности и черты личности. В некоторых исследованиях с использованием тестов способностей был получен единственный общий фактор второго порядка. Как правило, американские исследователи, применяющие факторный анализ, начинают с объяснения как можно большей части общей дисперсии групповыми факторами и только затем выявляют общий фактор как фактор второго порядка, если данные подтверждают его наличие. У английских психологов, напротив, принято начинать с общего фактора, которому приписывается основная доля общей дисперсии, а затем возвращаться к групповым факторам для объяснения остаточной корреляции. Эта разница в методиках является следствием теоретических различий.

Глава 3. Основные теории факторного анализа.

На протяжении более полувека предпринимались многочисленные попытки с помощью статистических методов факторного анализа понять природу и организацию способностей, связанных с разнообразной человеческой деятельностью. Тем не менее эти методы до сих пор остаются наиболее тесно связанными с изучением когнитивных способностей, или “интеллекта”, направлением, в рамках которого и зародился факторный анализ. Рассмотрим лишь некоторые широко известные теории интеллекта, выбор которых обусловлен их воздействием на конструирование и использование тестов.

Двухфакторная теория. Первой теорией организации черт, основанной на статистическом анализе показателей тестов, была двухфакторная теория, развитая английским психологом Чарльзом Спирменом (Spearman, 1904; 1927). В своем первоначальном виде эта теория утверждала, что все виды интеллектуальной активности используют долю единого общего фактора, названного генеральным, или фактором g (от англ. general - общий). Кроме того, в теории Спирмена постулировалось наличие многочисленных специфических, или s-факторов (от англ. specific), каждый из которых сказывается на выполнении только одной из интеллектуальных функций. Положительная корреляция между любыми двумя функциями приписывалась, таким образом, действию фактора g. Чем больше эти две функции были “насыщены” (saturated) фактором g, тем выше должна бы быть корреляция между ними. Напротив, присутствие специфических факторов вело к снижению корреляции между функциями .

Несмотря на постулирование Спирменом двух типов факторов – генерального и специфических, фактор g рассматривается в его теории как единственная причина корреляции. Поэтому, в отличие от других теорий связи черт, эту теорию было бы точнее называть однофакторной, однако она сохранила свое первоначальное название. Рис. 2 иллюстрирует основополагающий принцип корреляций тестов согласно этой теории. Из этой схемы видно, что, в соответствии с теорией Спирмена, тесты 1 и 2 должны высоко коррелировать между собой, поскольку каждый сильно насыщен фактором g, о чем свидетельствуют заштрихованные участки. Незаштрихованным частям каждого теста соответствуют специфический фактор и дисперсия ошибок. Тест 3 должен слабо коррелировать с каждым из двух других тестов, поскольку включает очень малую долю фактора g.

Рис. 2. Принципиальная модель корреляции в двухфакторной теории

Согласно двухфакторной теории, целью психологического тестирования должно быть измерение величины фактора g у каждого индивидуума. Если этот фактор пронизывает все способности, тогда он дает нам единственную основу для предсказания результатов деятельности индивидуума в разных ситуациях. Специфические факторы измерять бесполезно, так как каждый из них, по определению, сказывается только на какой-то одной функции. Вот почему Ч.Спирмен предложил заменить разнородную совокупность заданий, встречаемых в тестах интеллекта, единственным, пусть односторонним, тестом, но при этом высоко насыщенным фактором g. Он полагал, что тесты на абстрактные отношения, по всей вероятности, лучше всех других измеряют g и поэтому могут быть использованы для этой цели. Примерами тестов, разработанных для измерения g, являются Прогрессивные матрицы Равена и Культурно-свободный тест интеллекта Кэттелла (Cattell’s Culture Fair Intelligence Test).

С самого начала Спирмен понимал, что двухфакторная теория нуждается в уточнении. Когда сравниваемые деятельности достаточно похожи, корреляция между ними может достигать величины, превышающей степень связи между переменными, объяснимую действием фактора g. Поэтому в добавление к генеральному и специфическим факторам, вероятно, существует промежуточный класс факторов, не столь универсальных, как g, но и не столь специфичных, как s-факторы. Такой фактор, общий только для группы (а не для всех вообще) интеллектуальных функций, был назван групповым фактором. В первых вариантах своей теории Спирмен допускал возможность весьма узких и пренебрежительно малых групповых факторов. Позднее, под давлением фактов, полученных в исследованиях некоторых его учеников, он стал использовать в своих теоретических построениях гораздо более широкие групповые факторы, такие как арифметические, технические и лингвистические способности .

Заключение

В настоящее время методы факторного анализа составляют сложную специальную область математической статистики. В психологической диагностике факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик.

Факторный анализ является эффективным средством получения короткого описания взаимоотношений между параметрами при среднем числе параметров и, кроме того, в несколько модифицированном виде служит одной из основных составляющих лингвистических методов обработки экспериментальных данных с большим числом параметров.

Многочисленные экспериментальные исследования, в частности по обработке психологических, социологических, экономических и других данных, показали, что определяемые факторы, как правило, хорошо интерпретируются как некоторые существенные внутренние характеристики изучаемых объектов. Таким образом, факторный анализ оказался эффективным формальным средством генерации новых понятий и гипотез в самых различных науках.

В настоящее время факторный анализ все чаще используется в роли подтверждающего, чем исследовательского метода. Нередко его сочетают с моделированием структурными уравнениями для оценивания теоретически сформулированной модели вклада различных переменных в выполнение задачи.

Слабое место традиционного факторного анализа – в недостаточном внимании к выбору анализируемых переменных.

Поскольку конечным результатом методов факторного анализа является, как правило, получение содержательно интерпретируемых факторов, то при решении практических задач факторный анализ в настоящее время является еще в большой мере искусством, овладение которым требует некоторого опыта.

Как указывалось выше, основная задача факторного анализа состоит в экономном описании экспериментальных данных. Это вовсе не означает, что всегда методами факторного анализа ищут “фундаментальные”, “базисные” категории (факторы) в данной области, например, в психологии. Иногда бывает необходимо по возможности наиболее полно проанализировать набор параметров, характеризующих умственные способности некоторой популяции. Но даже и в этом случае факторы не могут полностью описать ситуацию хотя бы потому, что некоторые важные параметры попросту еще не придуманы. Теоретически задача исчерпывающе полного описания неразрешима; однако в практическом исследовании с ограниченным кругом решаемых вопросов и небольшим числом рассматриваемых параметров она разрешима вполне. Нужно только помнить, что факторный анализ дает всегда интерпретацию лишь данного экспериментального материала и, следовательно, сокращенное описание лишь данного набора параметров.

Главную цель факторного анализа хорошо выразил Келли: “Факторный анализ не пытается искать истину в бесконечном времени, бесконечном пространстве или для бесконечной выборки; наоборот, он стремится дать простое описание конечной группы объектов, функционирующих конечным числом способов, в терминах некоторого пространства небольшого числа измерений. Разочарован будет тот, кто пожелает найти в факторном анализе более туманные цели и истины” .

Список использованной литературы

    Анастази, А. Психологическое тестирование / А. Анастази, С.Урбина. – СПб.: Питер, 2001. – 401 с.

    Бурлачук, Л.Ф.Словарь-справочник по психодиагностике / Л.Ф.Бурлачук, С.М. Морозов. – СПб.: Питер, 2000. –409 с.

    Горбатов, Д.С. Практикум по психологическому исследованию / Д.С. Горбатов. – Самара: Бахрах, 2000. – 212 с.

    Данилова, Н.Н. Психофизиология / Н.Н. Данилова. – М.: АспектПресс, 1998. – 351 с.

    Дюк, В.А. Компьютерная психодиагностика / В.А.Дюк. – СПб.: Братство, 1994. – 178 с.

    Забродин, Ю.М. Статистические и семантические проблемы конструирования и адаптации многофакторных личностных тест-опросников // Ю.М. Забродин, В.И. Похилько. - Психологический журнал. - т.8. - №6. - 1987. - С.79-89.

    Иберла, К. Факторный анализ / К. Иберла. – М.: Статистика, 1980. – 308 с.

    Кимбл, Г. Как правильно пользоваться статистикой / Г. Кимбл. – М.: Статистика, 1982. – 212 с.

    Краткий психологический словарь / под ред. А.В.Петровского, М.Г.Ярошевского. – Ростов-на-Дону: Феникс, 1999. – 412 с.

    Куликов, Л.В. Психологическое исследование: методические рекомендации по проведению / Л.В. Куликов. – СПб.: Речь, 2001. – 102 с.

    Левандовский, Н.Г. О корректированном применении факторного анализа и критериях факторизации // Н.Г. Левандовский. - Вопросы психологии. - 1980. - № 5. – С.138-142.

    Лоули, Д. Факторный анализ как статистический метод / Д.Лоули, А.Максвелл. – М.: Мир, 1967. – 144 с.

    Митина, О.В. Факторный анализ для психологов / О.В. Митина. – М.: УМК, 2001. – 169 с.

    Райгородский, Д.Я. Практическая психодиагностика / Д.Я.Райгородский. – Самара: Бахрах, 1998. – 260 с.

    Смирнов, Н.В., Курс теории вероятностей и математической статистики / Н.В.Смирнов. – М.: Наука, 1969.- 312 с.

    Современная психология: Справочное руководство. – М.: ИНФРА- М, 1999. – 599 с.

    Столяренко, Л.Д. Основы психологии / Л.Д.Столяренко. – Ростов-на-Дону: Феникс, 1999. – 309 с.

    Суходольский, Г.В. Основы математической статистики для психологов / Г.В. Суходольский. – М.: Академия, 1972. – 345 с.

    Теплов, Б.М. Простейшие способы факторного анализа // Б.М.Теплов. - Типологические особенности высшей нервной деятельности человека. – Т.5. – М.: Просвещение, 1967. – 435 с.

  1. Факторный анализ прибыли (2)Реферат >> Финансы

    Факторный анализ прибыли Факторный анализ общей, валовой (балансовой) ... абсолютную эффективность хозяйствования предприятия. Факторный анализ прибыли от реализации продукции (... хозяйственной дисциплины (Р7). Сумма факторных отклонений дает общее изменение...

  2. Факторный анализ себестоимости и прибыли предприятия

    Курсовая работа >> Экономика

    ФАКТОРНЫЙ АНАЛИЗ СЕБЕСТОИМОСТИ И ПРИБЫЛИ ПРЕДПРИЯТИЯ... Расчет себестоимости и прибыли Анализ варианта снижения цены Анализ взаимосвязи себестоимости, объема... выполнения курсовой работы на тему «Факторный анализ себестоимости и прибыли предприятия» является...

  3. Факторный анализ компании

    Реферат >> Менеджмент

    Математическому аппарату методы - компонентный анализ , канонический анализ и др.). Факторный анализ впервые возник в психометрике и в... на величину результативных показателей. Назначение факторного анализа Факторный анализ – определение влияния факторов на...

Факторный анализ - статистический метод, который используется при обработке больших массивов экспериментальных данных. Задачами факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е.

Классификация переменных, поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.

Важное отличие факторного анализа от всех описанных выше методов заключается в том, что его нельзя применять для обработки первичных, или, как говорят, «сырых», экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее - коэффициенты корреляции Пирсона, которые вычисляются между переменными (т.е. психологическими признаками), включенными в обследование.

Факторный анализ имеет три основных применения в психологии. Во-первых, он может быть использован для конструирования тестов. Например, можно написать 50 заданий для измерения каких-либо способностей, личностной черты или аттитюда (такого, например, как консерватизм). Затем задания будут предъявлены репрезентативной выборке из нескольких сотен индивидуумов и обработаны (в случае тестов способностей) таким образом, что правильный ответ будет кодироваться «1», а неправильный - «О». Ответы, которые получают при использовании ранговых шкал (как в большинстве опросников личности и аттитюдов), просто вводятся в их сыром виде: один балл, если выбирается вариант ответа (а), два балла, если выбирается вариант ответа (б), и т.д. Ответы на эти 50 заданий затем коррелируют между собой и подвергают факторному анализу. Задания, которые имеют высокие нагрузки по каждому фактору, измеряют один и тот же лежащий в их основе психологический конструкт и таким образом формируют шкалу. Это позволяет определить, как обрабатывать опросники в будущем, просто взглянув на факторную матрицу: если задания 1, 2, 10 и 12 - единственные, которые имеют существенные нагрузки по одному фактору, тогда одна шкала теста будет состоять только из этих четырех заданий.

Кроме того, каждая из шкал нуждается в валидизации, например, путем подсчета баллов, полученных каждым человеком по каждому фактору, и оценки конструктной и(или) прогностической валидности этих шкал. Например, баллы, полученные по факторам, можно прокоррелировать с баллами, полученными из других опросников, используемых для прогноза успешности обучения, и т.д. Вторая задача, которую может решить факторный анализ, заключается в редукции данных, или в «концептуальной чистке». Было разработано огромное количество тестов для измерения личности, основывающихся на различных теоретических позициях, и далеко не всегда очевидно, в какой степени они перекрываются.

В-третьих, факторный анализ применяется при проверке психометрических свойств опросников, особенно когда они используются в новых культурах или популяциях. Например, предположим, что, в соответствии с руководством по использованию австралийского личностного теста, его следует обрабатывать путем сложения баллов, полученных по всем нечетным заданиям, которые формируют одну шкалу, в то время как сумма баллов, полученных по всем четным заданиям, образует другую шкалу.

Главное понятие факторного анализа - фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы интеркорреляций. Процедура извлечения факторов из матрицы интеркорреляцийназыв-ся факторизацией матрицы. В результате факторизации из корреляционной матрицы м.б. извлечено разное кол-во факторов вплоть до числа, равного кол-ву исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению. Формальным критерием качества проведения процедуры факторного анализа является процент объединенной дисперсии исходных признаков.

В настоящее время факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик.

Вы также можете найти интересующую информацию в научном поисковике Otvety.Online. Воспользуйтесь формой поиска:

Еще по теме 31. Применение факторного анализа в психологии.:

  1. 1. Способы факторного анализа, их виды, особенности применения.
  2. Факторный анализ, полный и дробный факторный эксперимент и математическая модель.
  3. 62. Планирования экспериментов. Факторный анализ, полный и дробный факторный эксперимент и математическая модель.

Переменные

Фактор 1

Фактор 2

Фактор 3

Объяснимая

дисперсия

гументация содержания, фактически угадываемого в том или ином факторе - самая сложная и противоречивая задача. Например, если с большими положительными весами в один из выделившихся факто­ров вошли такие переменные, как высокий рост, грубый голос, боль­шая мышечная масса, склонность к риску, широкие плечи, агрессив­ное поведение, то вероятнее всего подобная комбинация антропологом будет трактоваться как фактор мужского пола, эндок­ринолог увидит влияние какого-то гормона, а психолог попытается найти некие аналоги в типологии личности. Особо широко в психоло­гии приемы факторного анализа представлены при попытках произ­вести упорядочение (объединение в шкалы) многочисленных пунк­тов в объемных личностных опросниках.

Большинство программ факторного анализа построено таким об­разом, что первый выделившийся фактор обладает самым большим влиянием на разброс показателей в группе (объяснимая дисперсия), а значение остальных факторов последовательно убывает.

Существует несколько основных форм факторного анализа, даю­щих в итоге различные результаты. Выбор необходимого варианта дик­туется конкретными задачами дипломного исследования.

❖ Кластерный анализ

Если вам необходимо разбить множество ваших переменных (объектов) на заданное или неизвестное число классов, то целесооб­разно использовать кластерный анализ (cluster - гроздь, пучок, скоп­ление, группа элементов, характеризуемых каким-либо общим свой­ством). Это не слишком часто используемая в дипломных работах форма математической обработки эмпирических материалов, пред­ставляющая интерес в тех случаях, когда переменных достаточно мно-

Рис. 3. Пример одного из вариантов графического представления результа­тов кластерного анализа шести переменных.

го и хочется наглядно увидеть их упорядоченность - в каких иерархи­ческих отношениях находятся переменные более высокого уровня обоб­щенности к более конкретным, частным (рис. 3).

Весьма любопытные результаты, тяготеющие к сфере психолингвис­тики, с помощью кластерного анализа можно получить при применении его к пунктам психологических тестов, вопросам опросников и анкет.

Существует точка зрения, что в отличие от многих других статисти­ческих процедур, методы кластерного анализа используются в боль­шинстве случаев тогда, когда еще не имеется каких-либо гипотез отно­сительно классов, т. е. когда вы все еще находитесь в описательной стадии исследования.

Пользоваться результатами кластерного анализа нужно осторож­но, поскольку он может навязывать экспериментатору гипотезу об отношениях переменных, построенную на внешних, формальных критериях и не учитывать их качественную специфику. Для того, чтобы избежать подобной ошибки, предпочтительно применять несколько разных алгоритмов расчета (их много, техники группи­ровки отличаются) и выбрать из результатов тот, который лучше всего объясняется с позиции здравого смысла. Следует понимать, что кластерный анализ определяет «наиболее возможно значимое решение».

❖ Дискримииантный анализ

Еще один из методов статистической обработки, который может оказаться полезным в дипломной работе, называется дискриминант- ним анализом. Суть его состоит в том, что он позволяет делить облада­ющие какими-то признаками объекты или состояния, относя их к како- му-либо классу или оценивать близость конкретного состояния к одному из классов. Сама исследовательская процедура дискриминан- тного анализа состоит из нескольких шагов:

    определяются группы, которые в дальнейшем нужно разли­чать (например, больных истерическим неврозом от больных не­врозом навязчивых состояний) - это так называемая обучающая выборка;

    эти группы, каждый член которых уже имеет точный (верифи­цированный) диагноз, исследуются по максимальному числу при­знаков (текущая симптоматика, личностная предрасположенность, специфика семейного воспитания, характер психотравмирующих ситуаций и т. п.);

    по каждому из исследованных признаков вся обучающая выбор­ка (и тех и других больных) дискриминируется и отслеживается - на­сколько точно данный признак разделил группу по диагнозам по срав­нению с фактическим положением дел;

    из всех просмотренных признаков отбираются наиболее инфор­мативные (те, которые наиболее точно делят обучающую выборку) и в дальнейшем они начинают использоваться для улучшения точности диагноза у тех, кому он еще не поставлен;

Попутно, при необходимости, можно отследить, насколько близ­ко или далеко находится каждый из обследованных индивидов к тому или другому состоянию.

В итоге дискриминантного анализа для каждой переменной вы получите стандартизованный коэффициент (Т - лямбда Уилк- са), интерпретируемый следующим образом: чем он больше, тем меньше вклад соответствующей переменной в различение сово­купностей.

Другими словами, основная идея дискриминантного анализа зак­лючается в том, чтобы определить, отличаются ли совокупности по среднему какой-либо переменной (или их комбинации), и затем ис­пользовать эту переменную, чтобы предсказать для новых членов их принадлежность к той или иной группе (это задача прогноза). Более простой пример: показатель роста может служить дискриминирую­щим признаком для отнесения неизвестного нам человека к мужскому или женскому полу, поскольку уже точно известно, что средний рост мужчины выше среднего роста женщины.

Один подобный признак, как можно догадаться из представленно­го примера, не гарантирует надежности прогноза, но совокупность характеристик может сделать его достаточно уверенным.

Ниже приводится иллюстрация графического представления диск­риминантного анализа (рис. 4).

Root 1 vs. Root2

Рис. 4. Графический пример разделения носителей признака на три группы, полученный в результате дискриминантного анализа.

❖ Непараметрические методы

Еще раз хотелось бы подчеркнуть, что все рассмотренные проце­дуры статистического анализа могут быть корректно использованы только в том случае, если ваши экспериментальные данные подчиня­ются т. н. нормальному закону распределения или хотя бы приближа­ются к нему. Это значит, что в имеющемся у вас распределении край­ние значения признака - и наименьшие и наибольшие - появляются редко, а чем ближе значение признака к средней арифметической, тем чаще оно встречается (см. рис. 1).

Если такого соответствия нет, что, как правило, объясняется либо малыми размерами выборки (менее 20-30), либо измерениями в по­рядковых шкалах (типа «высокий», «средний», «низкий»), либо тем, что переменные объективно распределены «ненормально», то для обработки эмпирических материалов диплома нужно использовать так называемые непараметрические критерии, хотя они и имеют мень­шую мощность и обладают меньшей гибкостью (для их расчета не рас­сматриваются и не учитываются значения среднего и стандартного отклонения). Но у них есть и ряд преимуществ. Они малочувствитель­ны к неточным измерениям и эти методы могут применяться для обра­ботки данных, имеющих полуколичественную природу (ранги, баллы и т. д.). Кроме того, с их помощью можно получить ответы на такие вопросы, которые неразрешимы с использованием методов, основан­ных на нормальном распределении. Следовательно, они иногда оказы­ваются уместны и для обработки нормально распределенных резуль­татов исследования.

Не вдаваясь в подробности, укажем лишь на названия непарамет­рических процедур, позволяющих получить показатели, аналогичные нормально распределенным.

Для выяснения достоверности различий между двумя независи­мыми выборками (например, при сравнении мальчиков и девочек) непараметрическими альтернативами t-критерия являются серийный критерий В альд а-Вольфович a, U критерий Манна-Уитни и двухвы- бор очный критерий типа Колмогорова-Смирнова.

Если в дипломе выясняются различия между зависимыми выбор­ками (например, показателями одной группы до коррекционной рабо­ты и после нее), то нужно использовать Т-критерий Уилкоксона для разностей пар, который может быть применен также и к ранжирован­ным данным. По сравнению сt-критерием Стъюдента, он требует зна­чительно меньшего объема вычислений и почти также строго прове­ряет нормально распределенные выборки. Его эффективность для больших и малых выборок составляет около 95%.

Если две рассматриваемые переменные имеют альтернативное распределение (включают только две градации, как например, показа­тели теста в группе ниже или выше некой избранной величины до и после тренировок, либо количество справившихся с контрольной по математике среди мальчиков и девочек), то подходящими непарамет­рическими критериями достоверности различий будут % 2 (хи-квадрат­ен не рекомендован к применению, если число опытов в каждом из сравниваемых распределений меньше 10) и точный критерий Фише­ра для четырехпольной таблицы. Внимание: не путайте алгоритм рас­чета упомянутого непараметрического критерия % 2 с имеющим много общего алгоритмом расчета критерия согласия х 2 Пирсона, полезного при сравнении эмпирического и теоретического распределений, как правило используемого для установления соответствия реально полу­ченного распределения нормальному закону.

Для выяснения связей между признаками (корреляции) можно рассчитать уже упоминавшийся тетрахорический показатель (г),ранговые коэффициенты корреляции Спирмена (R или р) и may (т)Кендалла. Последние два могут быть использованы для определения тесноты связей как между количественными, так и между качествен­ными признаками при условии, если их значения упорядочить или проранжировать по степени убывания или возрастания признака.

❖ Компьютерная обработка и графические иллюстрации

Пускай вас не смущает некоторая перегруженность статистичес­ких процедур, рекомендуемых для использования в дипломной работе. В большинстве случаев вам не обязательно (хотя и желательно) быть знакомыми с их математическим аппаратом. К сегодняшнему дню для нужд науки разработаны многочисленные компьютерные програм­мы, позволяющие даже не сведущему в математике человеку доволь­но легко рассчитывать большинство желаемых показателей. Самыми известными и популярными из них являются пакеты Statistica (таблич­ные и графические примеры с ее использованием приведены выше) иSPSS. Обе программы снабжены справочным материалом в формеHelp-ов и специальным информационным сопровождением с обзо­ром основных расчетных алгоритмов. При выведении показателей раз­личия, в корреляционных матрицах и в других таблицах автоматически выделяются цветом и жирностью числовые значения, представляющие для исследователя особый интерес (по достоверности, важности, при­оритетности и т. д.).

Эти же пакеты позволяют существенно улучшить внешний вид дипломной работы за счет внесения в нее большей наглядности. Это достигается заменой некоторых трудно читаемых таблиц и цифровых данных на графики, гистограммы, и другие формы иллюстраций, хо­рошо вписывающихся в смысловую канву предъявленных результатов (но ничего лишнего!).

Выбор формы графика не должен быть случаен. Например, изме­нения во времени лучше воспринимаются в линейном представлении, сопоставление показателей двух групп - в столбчатом, пропорции - в круговых гистограммах, а рассеяние - в точечном (рис. 5-8).