"Study of African IQ levels proven to be substandard" | Социальный Компас

Print PDF

Наткнулся недавно на работу Jelte M.Wicherts с соавторами в журнале Intelligence, и два других исследования того же коллектива (см.список литературы здесь). Все три посвящёны критике исследований R.Lynn (2006) «Race differences in intelligence: An evolutionary analysis. Augusta,GA:Washington Summit Publishers» и R.Lynn & Vanhannen (2006) «IQ and global inequality. Augusta, GA: WashingtonSummit Publishers». Я перескажу только первую работу, её достаточно.

Критикуемые исследования были связаны с определением IQ африканцев и национальных IQ стран Чёрной Африки. В них делался вывод, что IQ африканцев аномально низок, ниже 70, так что, мол, эти страны бедные от собственной интеллектуальной недостаточности и пусть они на жизнь не жалуются (отдельная тема – как можно вычислить некий средний показатель в странах с чудовищными контрастами между городом и деревней, между «цивилизованным» населением и совсем дикими племенами из буша, между грамотными людьми, получившими современное образование, и неграмотными, не имеющими и традиционного и т.п. Но гг. экономисты, судя по всему, ищут те критерии, которые удобны для манипуляций).

Оказалось, что эти работы некачественные и содержат направленную корректировку исходных данных, когда игнорировались и исключались из анализируемой выборки именно те исследования, в которых были показаны максимальные значения IQ. Согласно выводам критиков, при использовании несмещённой выборки IQ африканцев оказывается 80-82, что соответствует норме Голландии или Дании 1950-х. Дело в том, что в ХХ веке во всём мире имел место так называемый Flynn Effect, или интеллектуальная акселерация – рост средневыборочных значений IQ населения. С настоящей акселерацией он сходен тем, что также распространяется из более урбанизированных/индустриализированных стран в менее, из города в село, из центра на периферию и т.п., так что при нынешней норме IQ 100 (UK norms, USA norms — 98) норма для 1950-х гг. — нынешние 75-80.

О природе интеллектуальной акселерации до сих пор сильно спорят, но понятно, что наиболее важными факторами здесь явилось улучшение питания, улучшение проблем с материнством и детством (один из важных предикторов IQ – это вес при рождении, независимо от культуры и расы, для здоровых детей), улучшение образовательного положения бедных слоёв населения и нацменьшинств. Собственно, именно у них Flynn effect проявляется чётче всего, в том числе, сокращается знаменитый Racial gap между белыми и афроамериканцами. В развитых странах среди бедняков, нацменьшинств, иммигрантов второго-третьего поколения рост IQ продолжается до сих пор, тогда как у «белого среднего класса», он, возможно, застопорился (спорят, продолжается в этих слоях интеллектуальная акселерация или сошла на нет уже в 1990-х гг.).

То есть главной причиной интеллектуальной акселерации оказывается улучшение условий жизни, которое при капитализме идёт сверху вниз по общественной пирамиде, и «с Севера на Юг», из развитых стран в развивающиеся. Генетические гипотезы, объясняющие Flynn effect гетерозисом, связанным с аутбридингом в крупных городах, в общем, неубедительны. Поэтому понятно, что у бедных и слабоурбанизированных стран, находящихся в наихудшем положении относительно медицины, условий образования и качества питания людей, интеллектуальная акселерация начнётся позже и будет проявляться хуже всего.

Но, так или иначе, для сравнительных целей мы можем получить оценки «среднего IQ» той или иной страны. Для этого проводят обзор уже существующего массива эмпирических исследований детей и подростков из разных стран Чёрной Африки, в каждом из которых использовались несколько видов тестов, позволяющих вычислить уровень IQ. Это тесты Векслера для детей (WPPSI и WISC-R) и взрослых (WAIS и WAIS-III), Army Beta test (Army-B), Block Design(BD), Culture Fair Intelligence Test (CFT), Draw-a-Man test (DAM), Kaufman-Ability Battery for Children (K-ABC); Koh’s Blocks; Lorge Thorndike intelligence test (Lorge–Th), Moray House Test no.44 (M.H.T.) McCarthy Scale of Children’s Abilities (McCart); Wisconsin Card Sorting Test (табл.2). Полный перечень эмпирических исследований, в которых разными тестами был определён IQ африканцев из разных стран Чёрной Африки, приводится в таблице 2 (всего 42 штуки).

Понятно, что базовая выборка эмпирических исследований должна быть репрезентативной, сами исследования должны быть годными (негодные надо отсеять, возможно их будет много, поскольку адаптация западных IQ тестов к чужой культуре – непростая, хотя и решаемая задача), а отбор исследований из базового массива в анализируемый массив должен определяться только их качеством и не зависеть от исходных предположений о том, «высокий» или «низкий» должен быть IQ испытуемых.

Увы, анализ, проведённый Jelte M. Wicherts et al. (2010) в «A systematic literature review of the average IQ of sub-Saharan Africans» показал, что помимо разнообразных, иногда анекдотических[1], ошибок при оценке годности исследования, Линн и Линн с Ванханеном систематически игнорировали данные с высокими значениями IQ африканцев, почему их «исследование» не стоит рассматривать всерьёз.

Но теперь по порядку. Первое сомнение в работе Линна/Линна-Ванханена закрадывается в связи со следующим. Практически для всех людей, всех культур и цветов кожи IQ — хороший предиктор их успеваемости в школах европейского типа (предсказывает ли он столь же хорошо способности ученика, обучающегося в ешиве или медресе? любому традиционному ремеслу у тамошнего учителя? не знаю, ибо никто не исследовал — а интересно!).

И, к слову, предсказывает он эту самую успеваемость много успешнее, чем способность к будущей работе и достижения во взрослой жизни, отчего существенная часть исследователей считает IQ показателем не интеллекта, а социализации, приобщённости и адаптированности к культуре господствующего слоя. Но так или иначе, значения IQ и значения тестов достижений по школьным предметам тесно коррелируют друг с другом, и в разных западных странах показано, в т.ч. и на мигрантах из третьего мира, что эта корреляция сильная — где-то 0,9 — и не зависит от культуры и расы.

Так вот, данные по странам Чёрной Африки почему-то у Линна выпали из этой корреляции — тесты достижений невысоки, но не выпадают из общей картины, а вот приводимые им значения IQ почему-то анормально низкие, ниже 70. [повторю, значения IQ в этой работе, также как в критикуемой, приводятся с учётом интеллектуальной акселерации второй половины ХХ века, IQ 100 — это современный английский уровень, уровень США — 98, а нынешние 80 — это 100 голландцев и датчан в 1950-х гг. ХХ века].

Поскольку наблюдается такая странность, и поскольку Линн и Линн с Ванханеном использовали только 11 исследований из 42 — х, где определялся IQ в разных выборках населения из стран Чёрной Африки, встаёт вопрос о критериях отбора. Тем более что адаптация западных IQ тестов для других стран и культур по понятным причинам встречает существенные трудности. Скажем, тест «Нарисуй человечка» в Судане предлагался детям, которые никогда не держали карандаш, или думали что это не карандаш, а острая палочка, которой можно пользоваться для других целей; на картинках присутствуют предметы, незнакомые испытуемому, вроде телефона, фигурирует одежда, при том, что значительная часть детей ходит голыми и «наше» значение одежды у них просто отсутствует. Даже при переносе теста из одной «цивилизованной» страны в другую влияет разница культур, когда один предельно важный предмет оказывается совершенно неважным в другой, что ведёт к сбою ассоциаций и, соответственно, к ошибкам в тесте, вроде обсуждающегося в этом треде примера, какой американский президент соответствует цифре «5».

Отсюда понятно, что не все 42 исследования IQ африканцев одинаково годные, и важно дать разумные критерии оценки годности (Линн и Ванханнен даже не задаются такой задачей). Ключевыми словами здесь становятся «стандартизация» теста и «проведение». Понятно, что при адаптации тестов на интеллект к реалиям другой страны и культуры адаптирующие оказываются в положении, когда что совой об пенёк, что пеньком об сову — всё плохо получается. Помимо собственно содержания стимульного материала, тест сопровождается инструкцией для проводящих и испытуемых. Просто переводить оригинальную (английскую или американскую) инструкцию на свази или кикуйю — получишь непонимание, и данные будут несравнимы, в том смысле, что низкий результат теста не будет связан с действительно низким IQ испытуемого. Перевести и адаптировать к реалиям местной культуры — это нетривиальная задача, для которой нужно иметь местные кадры подготовленных психологов, умеющих сотрудничать с соответствующими западными, но после такой адаптации данные тоже будут несравнимы, поскольку изменение состава невербальных и вербальных задач не позволяет понять, каким образом «африканский» IQ соотносится с «западным» IQ.

Тем не менее, талант компетентных учёных преодолевает эту преграду, не всегда, но в значительной части случаев подобная адаптация состоялась, то есть для африканцев использовались именно те IQ тесты, которые сейчас стандартизированы на Западе, а не устаревшие их варианты (скажем, Army Beta Test), и перед использованием эти тесты были адаптированы применительно к местным реалиям школьной системы, культуры и языка.

На основании этого критерия наибольшей годности авторы выделили 5 категорий (и критериев годности) исследований, на основании которых можно судить об IQ африканцев (см.рисунок).

В каждом из критериев ответ «да» означает нормальную годность исследования, ответ «нет» — сниженную, что хорошо коррелирует с меньшим IQ в «негодных» исследованиях по сравнению с «годными», ибо всякая ошибка теста работает против испытуемого и никогда[2] за (в нашем случае снижает оценку IQ на 6-10 пунктов).

Ещё очень серьёзный момент — при тестировании очень трудно отделить здоровых детей от больных, а болезни, в первую очередь заражённость заражённость паразитами, от малярии до гельминтозов, по понятным причинам сильно снижает IQ, поскольку падает активность и мотивация к достижениям. Авторы критического исследования старались отделить выборки явно больных (например, с гельминтами в тестикулах), но в целом уверенности в чётком разделении у них нет, а критикуемые ими авторы даже и не задались такой целью.

Так или иначе, всем 5 критериям рисунка 1 полностью соответствуют 12 выборок, Линн и Ванханнен рассмотрели 11, а ещё 27 не рассматривали, хотя знали о них (без объяснения, почему).

Далее, таблица 5 исследования показывает, что практически по всем странам чёрной Африки годные исследования дают значительно больший IQ популяции, чем значения, представленные Линном и Ванханненом особенно если включить в рассмотрение данные по матрицам Равена, отвергнутые Линном из-за изменения инструкции для выполняющих его в странах Африки (единственный пример обсуждения критериев использования/отвержения непосредственных исследований).

Он выше и в том случае, если использовать всю выборку эмпирических исследований табл.2, то есть годные исследования вместе с частично негодными (табл.5 настоящей работы).

Такого рода сдвиг при произведении выводов на основании одной и той же базы непосредственных исследований естественным образом рождает предположение о тенденциозном отборе у Линна с Ванханненом, что они действуют как тот продавец, который никогда не ошибается себе во вред, только на пользу. Иными словами, что они направленно исключали те исследования, в которых получены наибольшие результаты IQ (отказ от использования прогрессивных матриц Равена по понятным причинам ложится в эту тенденцию в силу наибольшей культурной независимости этого теста).

Для проверки этого вывода исследовали корреляцию между средним IQ и стандартной ошибкой выборочных значений IQ а) с одной стороны, в тех исследованиях, которые отобраны Линном с Ванханненом без какого-л. обсуждения критериев годности; б) в тех, которые были им известны, но отвергнуты, в) в использованных данным авторам по тем критериям годности, что представлена на рисунке.

Понятно, что тенденциозность отбора эмпирических данных в выборку для анализа (publication bias) возможна для всех трёх случаях, и направлена она может быть в обе стороны. Можно завышать результаты, отвергая слишком низкие значения IQ под тем предлогом, что мол, тест не получился как следует (скажем, если получившийся IQ слишком мал по сравнению с западными выборками), и оставлять только достаточно высокие. Можно наоборот, по тем же причинам считать ошибочными «слишком высокие для африканцев» значения IQ или пропускать их, если соответствующие исследования рассеяны в малочитаемых журналах африканских стран.

Если мы направленно исключаем из выборки данные с наиболее высоким IQ, то распределение точек на графике «средняя величина IQ – стандартная ошибка средней» будет асимметрично, при негативной связи между средней величиной IQ и стандартной ошибкой выборки, в которой он определён. Если наоборот, мы оставляем только исследования, где получен высокий IQ, график тоже будет асимметричен, но в противоположную сторону, при положительной связи между средневыборочным IQ и ошибкой средней. Если же тенденциозности нет, асимметрии в распределении точек на соответствующем графике не будет.

Отсутствие асимметрии в точках рис.5 показывает, что выборка, удовлетворяющая критериям авторов данного исследования (см. рисунок выше) отобрана без тенденциозности. В отличие от данных, рассмотренных Линном и Ванханненом – все использованные ими данные собрались в левой половине графика, при позитивной связи между средней и ошибкой средней (рис.6). И действительно, по критерию знаков 11 выборок, рассмотренные Линном-Ванханненом (2006), показывают значимо меньшие значения IQ, чем не рассмотренные (Z=4.50; P<0.001). То же самое относится и к 21 выборке, рассмотренной Линном (2006): Z=5.25; P<0.001.

Отсюда следует, что таки да, оные авторы тенденциозно отбирали данные, исключая наиболее высокие значения IQ. Повторю, что они ко всему прочему в разных местах используют разные критерии включения/исключения данных, но нигде не обсуждают их в явном виде, о них можно только догадываться (честно говоря, от финна с ирландцем как-то ожидаешь много большей тщательности в работе, хотя бы недопущения случаев с испанскими детьми; но это уже, видимо, действуют мои собственные культурологические предрассудки). IQ в странах Чёрной Африки получается примерно 82, как и предсказывалось по тестам достижений, и он будет повышаться примерно также, как и в Европе, когда (и если) улучшатся бытовые условия, качество медицины и образования африканцев. И естественно, с учётом существенно больших национальных IQ, чем считалось ранее, должны быть пересчитаны все те многочисленные корреляции, которые успели насчитать экономисты, следующие подходу Линна с Ванханеном – между национальными IQ и уровнем преступности, заболеваемостью СПИДом и т.п. Они, в общем, и так невелики, а тут ослабнут ещё более.

***

Вообще же, на мой взгляд, величина IQ показывает не интеллект, а социализацию. Получается, что IQ измеряет не знание и не ум как умение мобилизовать знание для решения данной задачи, а укоренённость индивида в соответствующей культуре. И понятно, что укоренены только верхние и средние классы, а рабочие и нацменьшинства (частично и женщины) не укоренены, они как бы внутренние варвары, от них достижений никто не ждёт (в том числе потому, что этому обществу от них нужен труд и не нужен талант), вот и получают худшие оценки….

Какие есть основания для такого взгляда?

1. При измерении IQ критически зависит от некогнитивных факторов вроде тревожности, причём именно в области высоких значений

2. При формировании IQ критически зависит от таких факторов, которые не имеют отношения к интеллектуальному развитию, но типологически связаны с фактом рождения в данной семье, образом жизни родителей и т.п. это вес при рождении, качество питания ребёнка, насколько часто повторяются нехватки пищи, что особенно снижает IQ бедняков. И гены, коррелирующие с IQ, также относятся к параметрам семейной среды, а не к умственному развитию.

«…один из немногих генов, для полиморфных аллелей которого показана значительная корреляция с IQ (объясняющая, впрочем, лишь 2% общей дисперсии по IQ -см. Gray J.R. and Thompson P.M., 2004) — это ген IGF2R (рецептора инсулиноподобного фактора роста). У мыши этот ген импринтирован, то есть работает лишь аллель, унаследованный от одного из родителей (в данном случае от матери). Импринтированными очень часто бывают аллели, связанные с влиянием потомков на родительский вклад в собственное развитие (как до, так и после рождения). И действительно, этот ген влияет на развитие плодов в матке, а при нарушении импринтинга, когда работают два аллеля, вес новорожденных заметно снижается. У человека импринтинг потерян, хотя, возможно, не для всех аллелей, но функции гена остались сходными. Характерно, что зависимость IQ от генотипа по IGF2R имела не абсолютный, а коррелятивный характер и наблюдалась не во всех выборках. Если мы полагаем, что устойчивость развития интеллекта в заметной степени определяется генами, влияющими на качество получаемой родительской заботы, то именно такого типа зависимости мы и можем ожидать.

Множество других импринтируемых генов влияют на наследование низкого веса при рождении (один из предикторов IQ взрослых — см. Black S.E.et al, 2006), аутизма, алкоголизма и различных эмоциональных нарушений (Imprinted gene catalogue). И в этих случаях соответствующие гены могут оказывать своё влияние в первую очередь на качество пре- и постнатального взаимодействия родителей и ребёнка. Однако как первое, так и второе хотя бы частично может быть объектом направленного мониторинга и коррекции». Отсюда.

3. Известная и часто пропагандируемая как «железный закон» корреляция, при которой впадение в бедность снижает IQ, у рабочих IQ ниже, чем у среднего класса, у чёрных и у цветных – ниже, чем у белых и т.п. нарушается у т.н. «устойчивых детей», которые появляются даже в самых тяжелых условиях городских гетто и сельских районов бедности, и быть в значительном количестве, от пятой части до четверти. У устойчивых детей IQ не снижен, потому что их родители иначе с ними обращаются, развивают их и не следуют тем обычным стереотипам касты отверженных, которые отрицательно сказываются на развитии негров, латинос, или детей бедняков.

А вообще говоря, без ненужной политкорректности, «исследования» г-на Линна и г-на Ванханена представляют собой тот самый «научный расизм» или «честный расизм», когда хочется подтвердить свои собственные предрассудки как бы строго научными данными, как бы оставаясь в рамках научного метода и т.д.

Есть ещё такой как бы учёный – Филипп Раштон; его много раз ловили на сходных вещах (Horowitz Irving L. The Rushton file // Russell Jacoby and Naomi Glauberman (eds.). The bell curve debate. N.Y.: Random House, 1995. P. 179-200). Раштон тесно связан с публичной площадкой американских расистов — журналом American Renaissance (который, в свою очередь, сотрудничает с неонацистами — BNP, Дэвидом Дюком и т.д.). Линн, впрочем, тоже.

Забавно, что сам Раштон является директором Пионерского фонда, учрежденного в 1937 году американским текстильным королем Уиклиффом Дрейпером, большим поклонником евгеники. Фонд поддерживает расистские исследования и сам Раштон в течение 1980-1990-х годов получил оттуда более 1 млн долларов (Miller Adam. Professors of hate // Russell Jacoby and Naomi Glauberman (eds.). The bell curve debate. N.Y.: Random House, 1995. P. 162-178; Mehler Barry. Race and «reason». Academic ideas a pillar of racist thought // Intelligence report, winter 1999, issue 93. P. 30-31; Tucker William H. The funding of scientific racism: Wickliffe Draper and the Pioneer Fund. Urbana: Univ. of Illinois Press, 2002). И понятно, что они с Линном хвалят друг друга.

Но в целом приятно отметить, что научный метод негоден для этого самоудовлетворения – уже следующее переисследование вопроса обнаруживает направленный «отбор» исходных данных, независимо от идейных позиций, с которых оно было проведено, методологию не обманешь.

К слову, именно данные Линна с Ванханненом имел в виду нобелевский лауреат Дж.Уотсон, когда делал свои неосторожные заявления об интеллектуальной неполноценности африканцев. Я, грешным делом, думал, что он попросту выразил своё предубеждение – ну, как у нас водится, без стеснения, — а он, как настоящий учёный, опирался на конкретное исследование, опубликованное в приличном журнале и т.п.

Другое дело, что оно оказалось некачественным – ну что тут сделаешь, по вполне понятным социологическим причинам исследования, льстящие предрассудкам образованной публики, господствующим настроениям научного сообщества и т.п. будут проходить даже при сниженном качестве, поскольку их (недостоверный) результат тем не менее будет принят как «очевидный».

А что расистские настроения в «цивилизованном мире» не только никуда не делись, но даже усилились, тоже вполне очевидно. Эту гадость разносят СМИ, и часто даже вполне компетентные учёные в публичных выступлениях, интервью и т.п. играют на струнах соответствующих настроений для привлечения внимания к себе и своим исследованиям, как это делали их предшественники в 1920-1930-х гг. А расплачиваться потом всему обществу…
Примечания:

[1] Например, в качестве выборки неграмотных из экваториальной Гвинеи была добавлена выборка умственно отсталых учащихся из Испании.

[2] Кроме ситуации с тестом Равена, адаптированная инструкция к которому предположительно могла обеспечивать более высокие результаты.