Знаменитый IQ. Коэффициент интеллекта, оценка умственных способностей, сравнение показателей интеллектуального развития по сравнению со среднестатистическим … Кто же придумал эту страшную штуку, которая одних выставляет высокоразвитыми интеллектуалами, а других – умственно отсталыми и недалекими личностями? Кто придумал этот «великий и ужасный» тест на IQ?

Как и истории всех великих изобретений и открытий, история создания теста на IQ имеет несколько действующих лиц, вложивших свой вклад в эту системы оценки интеллекта.

Большинство современных психологов будут утверждать, что придумал этот тест и начал применять на практике в 50-е годы прошлого столетия известный английский психолог Ганс Айзенк. И отчасти будут правы. Действительно, тест Айзенка (вернее его восемь вариантов) пользуется наибольшей популярностью и известностью в мире. Американскую систему оценки кандидатов при приеме на работу уже невозможно представить без прохождения теста Айзенка на IQ.

Однако, сам термин – коэффициент интеллекта придумал и ввел в обращение немецкий психолог и философ Уильям Штерн в 1912 году. А впервые использован на практике термин IQ и сам коэффициент IQ был в 1916 году.

Но, первым психологом, который в 1905 году предложил использовать для оценки интеллектуальных способностей тестирование на основе определения уровня образования, был французский юрист и психолог Альфред Бине. Кстати, эта идея пришла ему в голову из гуманных и практических соображений. Во Франции, в начале прошлого века, умственное развитие детей определялось исключительно измерениями параметров черепа и субъективными оценками преподавателей. Бине предложил отбросить эти устаревшие методы и, совместно с коллегой Теодором Симоном, разработал первую в мире «шкалу умственного развития Бине-Симона». Которая была усовершенствована в 1916 году Уильямом Штерном и получила название "коэффициент интеллекта" или IQ (Intellect Quota).

Альфред Бине - французский юрист, увлекшийся психологией ребенка. С 1891 года он, работая в психологической лаборатории Сорбонны, серьезно изучает психологию и интеллектуальное развитие детей. Основу этой работы составляют экспериментальные наблюдения за учащимися начальной школы и … собственными дочерьми - Маргаритой (13-ти лет) и Армандой (12-ти лет). В 1905 году, для привлечения внимания к детской психологии, он основал свободное общество изучения ребенка. И в этом же году опубликовал статью «По поводу измерения интеллекта» в которой впервые предложил использовать систему тестирования интеллекта ребенка в зависимости от его возраста и уровня образования.

Уильям Льюис Штерн считается одним из первых психологов, который начал изучать развитие детей с точки зрения развития личностей. Следует отметить, что то время (а это всего лишь около ста лет назад) большинство психологов изучали только познавательные способности ребенка. Штерн первым из психологов признал первостепенную роль игр в развитии интеллекта и психики ребенка. И первым указал, что развитие ребенка идет индивидуально и может на некоторых этапах существенно отличаться от общепринятого уровня. Основы и этапы речевого развития детей так же предложены Штерном и являются базой современной психологической науки о развитии детей.

Ганс Юрген Айзенк. На самом деле родился и учился в Германии, причем во времена становления фашизма. Психологом стал почти случайно - после эмиграции в Великобританию не попал на выбранный физический факультет. Поэтому махнул рукой и … пошел на психологию. Известен своими гороскопами для руководства Третьего рейха, исследованиями психологических различий между представителями различных рас, статьями об избранных во главе человечества, жесткой до неприличия критикой Зигмунда Фрейда и прозвищем «человек-термометр». Именно желание все измерить и привело Айзенка к гениальной идее использовать систему тестирования детей Альфреда Бине и Уильяма Штерна для оценки интеллекта взрослых. Несмотря на то, что существует много различных вариантов измерения IQ, тесты Айзенка и сейчас остаются самыми известными и эффективными для взрослых.

Так кто же придумал тест на IQ? Каждый из вышеперечисленных ученых имеет право носить титул изобретателя этого теста. Альфред Бине придумал систему тестирования детей, Уильям Штерн усовершенствовал ее и дал официальное название, Ганс Айзенк разработал и применил тестирование интеллекта для взрослых и сделал тест на IQ одним из самых популярных в мире.

Словосочетание «тест Тьюринга» правильнее использовать для обозначения предложения, которое касается вопроса о том, могут ли машины мыслить. По мнению автора, такая постановка «слишком бессмысленна», чтобы заслуживать обсуждения. Однако если рассмотреть более конкретный вопрос о том, способен ли цифровой компьютер справиться с некоего рода игрой в имитацию, то появляется возможность точного обсуждения. Более того, сам автор считал, что пройдет не слишком много времени - и появятся вычислительные устройства, которые будут в этом очень «хороши».

Выражение «тест Тьюринга» иногда используется в более общем смысле для обозначения некоторых поведенческих исследований присутствия разума, мысли или интеллекта у предположительно разумных субъектов. Так, например, иногда высказывается мнение, что прообраз теста описан в «Дискурсе о методе» Декарта.

Кто придумал тест Тьюринга?

В 1950-м увидела свет работа «Вычислительные машины и интеллект», в которой впервые была предложена идея игры в имитацию. Тот, кто придумал тест Тьюринга, - английский ученый в области информатики, математик, логик, криптоаналитик и биолог-теоретик Алан Мэтисон Тьюринг. Его модели позволили формализовать концепции алгоритма и вычислений, а также внесли вклад в теории искусственного интеллекта.

Игра в имитацию

Тьюринг описывает следующий вид игры. Предположим, есть человек, машина и лицо, задающее вопросы. Интервьюер находится в комнате, отделенной от остальных участников, которые проходят тест Тьюринга. Цель теста состоит в том, чтобы задающий вопросы определил, кто является человеком, а кто машиной. Интервьюеру оба испытуемых известны под метками X и Y, но по крайней мере в начале ему неизвестно, кто скрывается за меткой Х. В конце игры он должен сказать, что Х - это человек, а Y - это машина, или наоборот. Интервьюеру разрешено задавать испытуемым вопросы теста Тьюринга следующего вида: «Ну будет ли Х любезен сказать мне, играет ли Х в шахматы?» Тот, кто является Х, должен отвечать на вопросы, адресованные Х. Цель машины состоит в том, чтобы ввести в заблуждение спрашивающего, и тот ошибочно сделал вывод о том, что она - человек. Человек же должен помочь установить истину. Об этой игре Алан Тьюринг в 1950 году сказал: «Я считаю, через 50 лет можно будет запрограммировать компьютеры с объемом памяти около 10 9 таким образом, что они успешно смогут играть в имитацию, и средний интервьюер с вероятностью, превышающей 70%, за пять минут не будет в состоянии угадать, кто является машиной».

Эмпирический и концептуальный аспекты

Существует как минимум два вида вопросов, которые возникают относительно предсказаний Тьюринга. Во-первых, эмпирический - правда ли, что уже есть или вскоре появятся компьютеры, способные играть в имитацию настолько успешно, что средний интервьюер с вероятностью, не превышающей 70%, сделает правильный выбор в течение пяти минут? Во-вторых, концептуальный - правда ли, что если бы средний интервьюер после пяти минут допроса с вероятностью менее 70% правильно идентифицировал человека и машину, то мы должны сделать вывод, что последняя демонстрирует некоторый уровень мышления, интеллекта или разума?

Конкурс Лебнера

Мало кто сомневается, что Алан Тьюринг был бы разочарован положением дел с игрой в имитацию к концу ХХ века. Участники конкурса Лебнера (ежегодного мероприятия, в ходе которого компьютерные программы подвергаются тесту Тьюринга) далеки от стандарта, представленного основоположником информатики. Беглый взгляд на протоколы участников за последние десятилетия показывает, что машину можно легко обнаружить с помощью не очень изощренных вопросов. Более того, наиболее успешные игроки постоянно заявляют о сложности конкурса Лебнера по причине отсутствия компьютерной программы, которая бы могла вести достойный разговор в течение пяти минут. Общепризнанным является факт, что конкурсные приложения разрабатываются исключительно с целью получения малого приза, присуждаемого лучшему участнику года, и на большее они не рассчитаны.

Тест Тьюринга: прохождение затягивается?

К середине второго десятилетия XXI века ситуация почти не изменилась. Правда, в 2014 г. возникли претензии на то, что компьютерная программа Eugene Goostman прошла тест Тьюринга, когда она обманула 33% судей в соревновании 2014 г. Но были и другие разовые соревнования, в которых были достигнуты аналогичные результаты. Еще в 1991 году PC Therapist ввел в заблуждение 50% судей. И в демонстрации 2011 г. Cleverbot имел даже более высокий показатель успеха. Во всех этих трех случаях продолжительность процесса была очень мала, и результат не был надежен. Ни один из них не дал веских оснований полагать, что средний интервьюер с вероятностью более 70% правильно идентифицирует отвечающего в течение 5-минутного сеанса.

Метод и прогноз

Кроме того, и это гораздо важнее, необходимо различать тест Тьюринга и предсказание, которое он сделал о его прохождении к концу ХХ века. Вероятность правильной идентификации, интервал времени, в течение которого происходит испытание, и количество необходимых вопросов являются регулируемыми параметрами, несмотря на их ограничение конкретным прогнозом. Даже если основоположник информатики был очень далек от истины в предсказании, которое он сделал о ситуации с искусственным интеллектом к концу ХХ века, вполне вероятна справедливость предложенного им метода. Но прежде чем одобрить тест Тьюринга, следует рассмотреть различные возражения, которые необходимо учесть.

Обязательно ли уметь говорить?

Некоторые люди считают тест Тьюринга шовинистическим в том смысле, что он признает разум только в объектах, которые способны поддерживать беседу с нами. Почему не могут существовать разумные объекты, неспособные вести разговор, или, во всяком случае, беседу с людьми? Возможно, мысль, стоящая за этим вопросом, верна. С другой стороны, можно предположить наличие квалифицированных переводчиков для любых двух интеллектуальных агентов, говорящих на разных языках, позволяющих вести любой разговор. Но в любом случае обвинение в шовинизме совершенно к делу не относится. Тьюринг утверждает лишь то, что если что-то может вести беседу с нами, то у нас есть веские основания полагать наличие у него сознания, подобного нашему. Он не говорит, что только способность вести беседу с нами свидетельствует о потенциальном обладании разумом, похожем на наш.

Почему так легко?

Другие считают тест Тьюринга недостаточно требовательным. Существуют анекдотичные доказательства того, что совершенно бестолковые программы (например, ELIZA) могут казаться обычному наблюдателю обладателями интеллекта в течение достаточно продолжительного времени. Кроме того, за такое короткое время, как пять минут, вполне вероятно, что почти все интервьюеры могут быть обмануты хитрыми, но совершенно неразумными приложениями. Однако важно помнить, что программа тест Тьюринга не может пройти, обманув «простых наблюдателей» в иных условиях, чем те, в которых проверка должна происходить. Приложение должно быть в состоянии выдержать допрос того, кто знает, что один из двух других участников беседы является машиной. Кроме того, программа должна выдерживать такой допрос с высокой степенью успешности после многократного числа испытаний. Тьюринг не упоминает о том, какое конкретно количество тестов потребуется. Однако можно смело предположить, что их число должно быть достаточно большим, чтобы можно было говорить о среднем значении.

Если программа способна на это, то кажется правдоподобным утверждение, что мы, по крайней мере предварительно, будем иметь основания предполагать присутствие интеллекта. Возможно, стоит подчеркнуть еще раз, что может существовать умный субъект, в том числе и умный компьютер, тест Тьюринга пройти не сумевший. Можно допустить, например, существование машин, которые отказываются лгать по моральным соображениям. Поскольку предполагается, что участник-человек должен делать все возможное, чтобы помочь интервьюеру, то вопрос «Вы - машина?» позволит быстро отличить таких патологически правдивых субъектов от людей.

Почему так сложно?

Есть и сомневающиеся в том, что машина когда-либо сможет пройти тест Тьюринга. Среди выдвигаемых ими аргументов - различие времени распознавания слов на родном и иностранном языке у людей, способность ранжировать неологизмы и категории и наличие других особенностей человеческого восприятия, которые трудно симулировать, но которые несущественны для наличия разума.

Почему дискретная машина?

Еще одним спорным аспектом работы теста Тьюринга является то, что его обсуждение ограничено «цифровыми компьютерами». С одной стороны, очевидно, что это важно лишь для прогноза, а не касается подробностей самого метода. Действительно, если тест достоверный, то он подойдет для любой сущности, в том числе для животных, инопланетян и аналоговых вычислительных устройств. С другой стороны, весьма спорно утверждение о том, что «думающие машины» должны быть цифровыми компьютерами. Также вызывает сомнения то, что так полагал сам Тьюринг. В частности стоит отметить, что седьмое возражение, рассматриваемое им, касается возможности существования машин непрерывных состояний, которые автор признает отличными от дискретных. Тьюринг утверждал, что даже если мы являемся автоматами непрерывных состояний, то дискретная машина сможет хорошо подражать нам в игре в имитацию. Однако кажется сомнительным, что его соображения достаточны для того, чтобы установить, что при наличии машин непрерывных состояний, прошедших тест, можно сделать дискретный конечный автомат, который также успешно справится с этим испытанием.

В целом, важным моментом представляется то, что хотя Тьюринг признавал наличие значительно более обширного класса машин, помимо дискретных конечных автоматов, он был уверен в том, что правильно спроектированный дискретный автомат может преуспеть в игре в имитацию.

"Насколько вы обольстительны?", "Можно ли вам доверять?", "Способны ли вы на подвиг?" – подобными заголовками тестов пестреют газеты, журналы и даже сборники кроссвордов. Кто из нас хотя бы раз не проходил подобный тест и потом делился с близкими: "Представляешь, у меня оказывается утонченное чувство прекрасного", или недовольно отодвигал журнал: "Да ну, глупости это все. Какой же из меня деспот? Никогда не замечал...". И немногие задумываются, что тест в том виде, в котором он существует сейчас, был создан исключительно для потребностей психиатрии.

Слово "тест" происходит от английского "test" и означает "испытание, исследование", а корни тестирования (то есть проверки на пригодность к определенным функциям) теряются в глубокой древности. Уже три тысячи лет назад в Китае существовали системы приема на службу в армии, а у античных греков тестирование было спутником образования – оно использовалось для оценки физических и умственных навыков учеников. Во времена Средневековья европейские университеты ввели системы экзаменов. Основное развитие тестирования пришлось на ХІХ столетие, а тест в современном понимании появился в 30-х годах ХХ века.

"Отцом" теста считается американский психолог Джеймс Кеттел, который и ввел термин "интеллектуальный тест". После статьи Кеттела "Интеллектуальные тесты и измерения", опубликованной в 1890 году, термин приобрел безумную популярность, его начали употреблять в научных кругах, а сам процесс тестирования начал применяться разными лабораториями.

Эти тесты не были тестами в нашем понимании – вопрос с вариантами ответов. Тогдашние тесты больше напоминали лабораторные опыты, за один раз пройти тест мог лишь один человек. Но, несмотря на сложность выполнения, тесты приобретают безумную популярность, и в 1904 году Министерство образования Франции поручает врачу-психологу Альфреду Бине разработать тест, с помощью которого можно было бы отличить ленивых детей, которые имеют способности к учебе, и детей, которые страдали врожденными дефектами и не могли учиться в обычной школе.

Именно шкала Бине послужила основой для всех следующих тестов, она состояла из 30 заданий (тестов), упорядоченных по возрастанию сложности. Позже на ее основе будет создан знаменитый тест на определение коэффициента IQ – соотношения умственного возраста с возрастом фактическим. Шкала Стенфорд-Бине приобрела значительное распространение, в Америке были опубликованы несколько ее редакций. В своей последней редакции шкала Стенфорд-Бине и до сих пор используется для определения IQ.

Но тесты все еще оставались индивидуальными – они могли быть применены одновременно лишь к одному человеку – испытуемый либо отвечал устно, либо осуществлял какие-то действия с предметами. Коллективное тестирование, как и первая шкала Бине, тоже было создано на заказ. Когда в 1917 году США вступили в Первую мировую войну, перед американскими психологами возникла нелегкая задача: как можно быстрее отобрать и распределить полуторамиллионную армию рекрутов в разнообразные службы и училища. Специально созданный комитет поручил А.С. Отису разработать новые тесты – "Альфа" – для людей, которые владели английским языком, и "Бета" – для необразованных и иностранцев.

Новые тесты значительно упрощали процедуру тестирования: теперь тест могли проводить не только квалифицированные психологи, но и просто обученные процедуре тестирования люди. В 20-е годы в Америке начался самый настоящий тестовый бум. Ведь теперь каждый мог пройти тестирование и узнать, какую профессию он может получить, какие недостатки характера стоит скрывать, способности к какой профессии у него есть.

С развитием профессионального консультирования для деления персонала в промышленности и военном деле возникла потребность в дополнительной информации об особенностях психики человека. Так возникло новое направление в тестологии – тестирование особенных способностей. Стали появляться тесты механических, канцелярских, артистических способностей. Но, кроме профессиональных навыков и способностей, тестированию подлежали и другие, "неинтеллектуальные", аспекты поведения.

Тестирование личных качеств человека было основано еще в 1892 году психологом Е. Крепелином, который создал тесты на свободные ассоциации для исследования психических расстройств. И все же, первичным вариантом анкеты личности (листок для заполнения) считается листок личных данных Р.С. Вудвортса, разработанный в годы Первой мировой войны. Анкета предназначалась для выявления невротичных людей, не пригодных к военной службе. Тест содержал ряд вопросов о наличии симптомов невроза, а опрашиваемый отмечал прямо на анкете, есть они у него или нет. Результат получали путем подсчета указанных симптомов.

Также существовал другой способ выявления личных характеристик человека: тесты действия или ситуационные тесты. В таких тестах "подопытный" получает задания, цель которых ему непонятна (помните знаменитое: "какую дорогу ты выберешь – шоссе, горную тропу или лесную тропинку – так ты и идешь по жизни"). Другой вариант – задания точно описывают ежедневные ситуации для выявления индивидуальной реакции на стандартный раздражитель (например: "когда вы опаздываете на работу, вы: паникуете, немного нервничаете, храните покой?").

Когда мы впопыхах листаем журнал к странице с тестами, мы вряд ли осознаем, что даже самый простой тест – это тщательная работа команды психологов и социологов. Мы не знаем имен творцов тестов, которые помогают нам избавиться от неприятных черт характера или глупых привычек, но никогда не упустим возможность пройти тест даже по пятому разу – а вдруг результат изменяться к лучшему?

Единственный совет: не стоит слишком доверять результатам тестов. Каким бы не был результат, помните, что разрабатывался тест не для вас лично, а для всех людей сразу. Поэтому разница между результатом и реальным положением вещей могут быть достаточно значительными, и не стоит огорчаться! Напротив – это еще одно подтверждение того, что вы – уникальная личность, и у вас все выйдет!

При написании статьи использовались материалы изданий:

Валентина Павленко,
специально для проекта Хотите перепечатать...?

Английский математик Алан Мэтисон Тьюринг известен, как уникальный специалист в области информатики, вычислительной техники и криптографии. Именно он создал прообраз современного компьютера (вычислительную машину Тьюринга). У ученого было множество других достижений. В конце 40-х годов прошлого века математик начал задаваться вопросом о том, какой электронный интеллект можно считать разумным и сможет ли робот приблизиться к поведению человека настолько сильно, что собеседник не поймет, кто на самом деле находится перед ним.

Идея создания теста возникла после того, как в Англии стала популярной "Игра в имитацию". Эта модная для того времени забава предполагала участие 3 игроков - мужчины, женщины и судьи, в роли которого мог быть человек любого пола. Мужчина и женщина расходились по разным комнатам и передавали судье записки. По стилю написания и другим признакам судья должен был понять, какие записки принадлежали игроку того или иного пола. Алан Тьюринг решил, что одного из участников можно было бы заменить электронной машиной. Если в процессе электронного дистанционного общения экспериментатор не сможет определить, кто из собеседников - реальный человек, а кто - робот, можно считать, что тест пройден. И это должно стать поводом для признания разумности искусственного интеллекта.

Прохождение теста

В 1950 году Алан Тьюринг сформулировал систему вопросов, которые могли бы убедить людей в том, что машины умеют мыслить.
Со временем тест был модернизирован и в качестве объектов тестирования стали чаще выступать не машины, а компьютерные боты. За весь период существования теста его удалось пройти лишь нескольким программам. Но такой успех некоторые специалисты поставили под сомнение. Правильные ответы можно объяснить совпадением и даже в самых лучших случаях программам удалось ответить не более, чем на 60 % вопросов. Полного совпадения достичь так и не удалось.

Одной из программ, успешно прошедших тест Тьюринга, была "Элиза". Ее создатели наделили искусственный интеллект способностью выделять из речи человека ключевые слова и составлять встречные вопросы. В половине случаев люди не смогли распознать, что общались с машиной, а не с живым собеседником. Некоторые специалисты поставили под сомнение результат тестирования по причине того, что организаторы заранее настраивали испытуемых на живое общение и участвующие в эксперименте даже не догадывались, что давать ответы и задавать вопросы может робот.

Успешным можно назвать прохождение теста программой, составленной одесситом Евгением Густманом и российским инженером Владимиром Веселовым. Она имитировала личность мальчика в возрасте 13 лет. 7 июня 2014 года состоялось ее тестирование. В нем приняло участие 5 ботов и 30 реальных людей. Только 33 жюри из 100 смогли определить, какие ответы давали роботы, а какие - реальные люди. Такой успех можно объяснить не только хорошо составленной программой, но и тем, что интеллект тринадцатилетнего подростка несколько ниже интеллекта взрослого. Возможно, некоторых жюри ввело в заблуждение данное обстоятельство.

В пользу противников признания результата говорит и то, что Женя Густман, создавший программу, писал ее на английском языке. Во время тестирования многие судьи списали странные ответы машины или уход от ответов не только на возраст предполагаемого собеседника, но и на языковой барьер. Они посчитали, что робот, которого они приняли за человека, плохо знает язык.

С момента создания теста Тьюринга приблизиться к тому, чтобы успешно его пройти, удалось также программам:

  • "Deep Blue";
  • "Watson";
  • "Parry".

Премия Лебнера

При создании программ и современных роботов специалисты не считают прохождение теста Тьюринга первостепенной задачей. Это всего лишь формальность. Успех новой разработки от результатов тестирования не зависит. Самое главное, чтобы программа оказалась полезной, выполняла определенные задачи. Но в 1991 году была учреждена премия Лебнера. В ее рамках искусственные интеллекты соревнуются между собой в успешном прохождении теста. Предусмотрены 3 категории медалей:

  • золотая (общение с элементами видео и аудио);
  • серебряная (за текстовую переписку);
  • бронзовая (вручается машине, которая в текущем году достигла лучшего результата).

Золотые и серебряные медали еще не были вручены никому. Бронзовые награды вручаются регулярно. В последнее время заявок на участие в состязании становится все больше, так как создаются новые мессенджеры и чат-боты. У конкурса есть немало критиков. Беглый взгляд на протоколы участников за последние десятилетия показывает, что машину можно легко обнаружить с помощью не очень изощренных вопросов. Наиболее успешные игроки также заявляют о сложности конкурса Лебнера по причине отсутствия компьютерной программы, которая бы могла вести достойный разговор в течение пяти минут. Общепризнанным является факт, что конкурсные приложения разрабатываются исключительно с целью получения малого приза, присуждаемого лучшему участнику года, и на большее они не рассчитаны.

В настоящее время тест Тьюринга получил несколько современных модификаций:

  • обратный тест Тьюринга (необходимо ввести защитный код для подтверждения того, что пользователь - человек, а не робот);
  • минимальный интеллектуальный тест (предполагает только варианты "да" и "нет" в качестве ответов);
  • мета-тест Тьюринга.

Недостатки теста

Одним из главных недостатков теста считается то, что перед программой ставится задача обмануть человека, запутать его, чтобы заставить его поверить в общение с реальным собеседником. Получается, что признать мыслящим можно того, кто умеет манипулировать, а это можно поставить под большое сомнение. В жизни все происходит несколько иначе. В теории хороший робот должен максимально точно имитировать действия человека, а не запутывать собеседника. Программы, составленные специально для прохождения теста, в нужных местах уклоняются от ответов, ссылаются на незнание. Машины программируют на то, чтобы переписка выглядела максимально естественной.

Многие ученые считают, что фактически тест Тьюринга оценивает схожесть речевого поведения человека и робота, но не способность искусственного разума мыслить, как это было заявлено создателем. Скептики уверяют, что ориентация на подобное тестирование тормозит прогресс, не дает науке двигаться вперед. В прошлом веке прохождение теста было большим достижением и даже чем-то фантастическим, но в настоящее время способность компьютера "переписываться, как человек", нельзя назвать сверхестественным.