Книга: Почему

Закономерности

Закономерности

МЕТОД МИЛЛЯ

Скажем, группа программистов устраивает хакерский марафон. Компьютерщики, обожающие работать по ночам, вряд ли могут похвастаться сбалансированной и здоровой диетой, так что многие из них, чтобы продержаться до рассвета, сидят на крепком кофе, пицце и энергетических напитках. К несчастью, на следующий день, когда раздают награды, многие члены команды оказываются больны или по какой-то причине не выходят на связь. Как определить, какие факторы вызвали недомогание?

Попытка понять, что общего и в чем разница у групп с отмеченным или не наблюдаемым определенным результатом, – одна из классических сфер приложения метода, разработанного в XIX веке Джоном Миллем[187] (где подавляющее большинство примеров – это пищевые отравления)[188].

Прежде всего мы можем задаться вопросом: что общего во всех ситуациях, где имеет место некое следствие? Если потребление энергетических напитков – единственный совпадающий фактор для всех случаев головной боли, это дает некоторое доказательство в пользу утверждения, что ее вызывают, возможно, энергетики. Именно это Милль называл методом согласованности. В примере на рис. 5.1 нас интересуют случаи, когда головная боль есть, так что мы просто возьмем из таблицы колонки, где отмечены люди с этой проблемой.

.


Рис. 5.1. J-образная кривая

Итак, мы начнем только с ситуаций, где следствие имеет место, а потом вернемся и посмотрим, что у них общего. Отметим: единственное совпадение – потребление энергетических напитков, а стало быть, по методу согласованности, это и есть причина головных болей.

Согласованность предполагает, что для следствия необходима причина, ибо следствие не наступает до причины. Это, однако, не означает, что следствие происходит каждый раз, когда имеет место причина. Речь идет о достаточности[189]. Например, как следует из табл. 5.1, Бетти также пьет энергетические напитки, но головной болью не страдает. Итак, мы не готовы утверждать, что энергетики – достаточное условие головной боли. Как и относительно трудов Юма, можем только сказать, что эти факторы истинны касательно того, что мы наблюдали.

Таблица 5.1. Применив метод согласованности Милля, мы обнаруживаем, что энергетические напитки вызывают головную боль


На основе ограниченной выборки мы не имеем права заявлять о необходимости или достаточности.

Одно из ограничений такого подхода – требование согласованности каждого конкретного случая. Если сотни людей заболевают, а один нет, здесь не найти причинной зависимости. Заметим, этот метод не принимает в расчет то, что Бетти тоже пила энергетики, но голова у нее не разболелась. Именно поэтому он скажет только о необходимости, но не о достаточности: не рассматривается возможность ненаступления следствия при наличии причины.

Чтобы определить достаточность, посмотрим, в чем отличие между ситуациями, когда следствие наступает и когда нет. К примеру, если все, кто на следующий день чувствовал себя уставшим, бодрствовали ночь напролет, при этом несколько не уставших человек немного поспали, мы могли бы сказать, что полное исключение сна есть достаточное условие (для этого примера) усталости наутро. Это и есть метод согласованности Милля.

С помощью табл. 5.2 путем сравнения мы узнаём, чем отличаются ситуации с наличием и отсутствием усталости. Заметим, что случаи усталости согласованы по всем четырем факторам, а значит, мы не можем выделить из них единственный как причину, если применить метод согласованности. Изучив отличия, мы увидим, что бодрствование допоздна кажется единственным условием, коррелирующим со следствием. При согласованности это довольно жесткое требование, поскольку могут возникнуть неожиданные ситуации, даже если усталость по-прежнему останется в статусе причины.

Таблица 5.2. Применив метод дифференциации Милля, мы обнаружим, что бодрствование по ночам вызывает усталость


В следующей главе мы изучим вероятностные методы, которые не требуют столь жесткой взаимозависимости, но используют показатель относительной частоты встречаемости.

Повторим еще раз: причина есть необходимое условие следствия, если оно не может произойти без причины (каждому факту следствия предшествует факт причины), и причина есть достаточное условие следствия, если она без него не может быть (за каждым фактом причины должен идти факт следствия). Причина может быть необходима, но не достаточна и наоборот. В хакерском марафоне каждый факт усталости, которому предшествует работа допоздна, делает последнюю необходимым условием усталости, но ничего не говорит о ее достаточности (может, некоторые люди бодрствуют всю ночь и не устают).

Аналогично каждый случай употребления энергетика, за которым следует головная боль, свидетельствует, что эти напитки – достаточное условие головной боли, но не необходимое (поскольку бывает головная боль иной этиологии).

Итак, некоторые причины могут быть одновременно необходимыми и достаточными для указанных следствий.

Возьмем табл. 5.3. Чтобы выяснить, какие причины одновременно необходимы и достаточны, объединим согласованность и дифференциацию – способ, названный Миллем «метод согласованности и дифференциации». Здесь мы рассмотрим факторы, общие для всех случаев наступления следствия – и только для них.

Таблица 5.3. Используя единый метод согласованности и дифференциации Милля, мы видим, что кофе способствует боли в желудке


Итак, люди, у которых разболелся желудок, и бодрствовали ночью, и пили кофе. Значит, по методу согласованности, эти факторы могут иметь характер причинности. Посмотрим, отличаются ли они для случаев, когда следствие наступает и когда нет. Диана бодрствовала допоздна, но желудок у нее не болит, а значит, работа по ночам не удовлетворяет критериям метода дифференциации. С другой стороны, потребление кофе им удовлетворяет, так как все те, кто выпил много кофе, ощутили боль в желудке, а никто из воздержавшихся этим недугом не страдал. Таким образом, кофе есть одновременно необходимое и достаточное условие больного желудка, если исходить из таблицы.

Итак, в чем же подвох?

Представьте, что 2000 человек заболели, поев немытых фруктов, при этом двоим удалось избежать пищевого отравления, а еще несколько отравились недоваренной курицей. Методы Милля не нашли бы никакой причинной зависимости между фруктами и отравлением, поскольку здесь нет ни необходимости, ни достаточности. Многие примеры каузальности, взятые из реальной жизни, не соответствуют обоим случаям, так что это условие очень строгое. В целом всего несколько контрпримеров не должны заставить полностью сбрасывать со счетов причины; однако такой метод все же может дать чисто интуитивную ниточку в исследовании каузальных гипотез. К тому же он соответствует некоторым способам качественного выяснения причин[190].

К тому же на практике единственная причина и единственное следствие – редчайший случай.

Допустим, люди едят пиццу, допоздна не спят и пьют немереное количество кофе. Это приводит к тому, что все они одновременно заболевают различными хворями. Если мы видим, что все вместе жалуются на усталость и больной желудок, при этом нет других факторов, общих для всех или отличных, что можно сделать?

В некоторых ситуациях достаточно выяснить различие между причинами, которые привели к каждой болезни. К примеру, из табл. 5.4 мы знаем, что бодрствование по ночам порождает усталость. Итак, то, что Алан, Бетти и Диана устали, объясняется ночным бдением за компьютером. Тогда можно просто взглянуть, в чем сходство и различие в случаях с больным желудком (избыточное потребление кофе), предположив, что должно быть что-то еще, вызывающее подобное недомогание, поскольку неизвестно, повинно ли в этом отсутствие ночного сна.

Таблица 5.4. Используя метод остатков Милля, мы видим, что кофе ведет к боли в желудке


Если проигнорировать усталость и бодрствование допоздна, вторым общим фактором будет кофе. Хотя люди с больным желудком часто тоже не рано ложатся, Милль делает допущение, что мы в итоге можем отбросить известные причины и следствия. Зная, что ночная работа вызывает усталость, нужно посмотреть, что останется после того, как мы примем во внимание эту причину и следствие. Если выявлена одна причина, она и есть вина оставшегося следствия. Это так называемый метод остатков. Конечно, предполагается, что нам известны все следствия других возможных причин и каждая имеет только одно следствие. Если же бодрствование допоздна и потребление кофе совместно вызывают боль в желудке, к этому заключению нельзя прийти подобным образом.

Этот метод способен дать гипотезы по поводу того, что могло вызвать результаты наблюдений, но не может доказать каузальную природу взаимосвязи. Мы вообще ничего не упоминали о наборе переменных или о том, откуда они берутся. Переменные всегда представляют собой подгруппу возможно измеримых показателей; вероятно, они отобраны на основе воспринимаемого соответствия или просто суть результаты фактических измерений при анализе данных после наступления события.

В результате набор гипотез может не охватывать истинных причин, и мы либо терпим поражение в поиске вины конкретного следствия, либо обнаруживаем всего лишь ее индикатор. Иными словами, если каждый, кто ел пиццу, к тому же напился воды подозрительной чистоты, а вода не включена в набор переменных, то мы придем к выводу, что пицца и есть причина. Просто этот индикатор дает сведения о потреблении воды, даже если на самом деле это и не причина. И если бы мы учли потребление воды, если взаимосвязь между водой и пиццей безусловна (все, кто ел пиццу, пили воду, и каждый, кто пил воду, ел пиццу), мы не смогли бы выделить пиццу в качестве единственной причины, поскольку на деле оба фактора могут быть таковыми. Именно поэтому, не наблюдая их по отдельности, мы видим только четкую закономерность между обеими потенциальными причинами и следствием.

Эта проблема не специфическая только для методов Милля: она важна в более широком смысле выведения причинно-следственных связей из данных наблюдения. Если, с другой стороны, мы провели бы эксперимент, заставив людей поесть пиццы без воды, а потом наоборот, это, видимо, решило бы проблему. Мы бы поняли, что заболели только те, кто пил воду (и не важно, ели они пиццу или нет).

Итак, возможно, наши программисты, работая ночью, решили приналечь на пиццу. Если избыточное ее потребление провоцирует набор веса, можно ожидать, что люди будут толстеть. Очередной метод Милля назван «сопутствующее изменение», когда просматривается зависимость реакции от дозы для причины и следствия. По мере количественного роста причины растет и объем следствия. К примеру, если некое исследование утверждает, что кофе снижает риск смертности до определенного возраста, мы можем решить, что должна наблюдаться дифференциация риска в зависимости от того, сколько кофе пьет некий индивидуум. С другой стороны, если одна чашка кофе в день оказывает в точности тот же эффект, что и десять, кажется более правдоподобным наличие чего-то еще, реально снижающего риск, помимо кофе.

Разумеется, реальность всегда сложнее, и может не быть линейной зависимости между причиной и следствием. К примеру, алкоголь в маленьких количествах способен положительно воздействовать на самочувствие. Однако избыточное потребление спиртных напитков – вещь крайне нездоровая. Известна так называемая J-образная (или восходящая) кривая, которая отображает соотношение потребления спиртного и, например, ишемической болезни сердца (рис. 5.1). Симптомы заболевания уменьшаются при потреблении до 20 г в день, а потом начинают усиливаться[191]. Среди других аналогичных зависимостей – гипотетическая связь между интенсивными физическими упражнениями и инфекционными заболеваниями[192], а также между потреблением кофе и количеством инфарктов[193]. Как и со многими лекарственными средствами, для этих факторов есть предел, после которого они могут причинять вред. Итак, мы не обнаруживаем ожидаемого соотношения между дозой и реакцией и наблюдаем затухание эффекта после некой точки вместо постоянного роста.

Один из самых знаменитых в истории примеров применения методов Милля – когда Джон Сноу обнаружил, что именно спровоцировало вспышку холеры 1854 года в Лондоне[194]. Он не копировал методы Милля, однако используемый им подход строился по тому же принципу.

Тогда никто не знал, каким путем распространяется болезнь, но карта города (с нанесенными очагами инфекции) дала возможность увидеть резкие отличия между районами. Передавался ли возбудитель от одного человека к другому? Или болезнь вызвало что-то по соседству? А может, у людей, проживающих в зараженных районах, имелось нечто общее?

Сноу обнаружил, что самая высокая смертность отмечалась не просто в конкретном географическом районе, а возле водяной колонки на Брод-стрит:

В домах, расположенных ближе к колонке на другой улице, умерли всего 10 человек. В пяти случаях из этих 10 родственники больных сообщили, что они всегда ходили к колонке на Брод-стрит, потому что предпочитали воду из нее другим колонкам, даже если те располагались ближе. В трех других случаях это были дети, которые шли в школу мимо колонки на Брод-стрит[195].

Увидев, что умершие в основном пользовались этой колонкой, Сноу рассмотрел, видимо, не соответствующие этой тенденции случаи, когда люди не жили по соседству, и выяснил, что они тоже брали воду на Брод-стрит. Это и есть в точности метод согласованности Милля, где выясняется, что общего у всех случаев наступления следствия (например, заболевание холерой). Сноу также применял метод дифференциации, когда писал, что «в этой части Лондона не отмечалось никаких особых вспышек или заболеваемости холерой, кроме как среди людей, имеющих обыкновение пить воду из вышеупомянутой колонки»[196]. Иными словами, доказал, что заболеваемость возросла в группе лиц, пользовавшихся колонкой, и только в этой группе.

Комплекс причин

Единственная проблема с методами Милля – ситуация, когда причина обусловливает, с той или иной долей вероятности, зависимость следствия от иных факторов. К примеру, два лекарственных препарата сами по себе могут не влиять на содержание глюкозы в крови, однако, взаимодействуя при одновременном приеме, способны существенно повысить ее показатель. Один из вариантов преодолеть эту трудность – не концентрироваться на парных зависимостях между отдельно взятыми причинами и следствиями, но рассматривать комплекс условий, вызывающих следствие. Так, одной из причин дорожного происшествия может быть нетрезвое вождение в комбинации с близко проезжающими машинами, другой – плохая видимость на обледеневшей дороге и неосторожное вождение, третьей – нарушение скоростного режима и отправка электронных сообщений за рулем.

Подобные ситуации часто возникают в эпидемиологии, где принято считать, что причины всегда взаимосвязаны, и такие факторы, как длительная подверженность окружающим условиям, образ жизни, острые кратковременные воздействия (например, инфекционные заболевания) и так далее, комбинированно влияют на здоровье. Взяв за основу подобные рассуждения, эпидемиолог Кеннет Ротман[197] ввел идею изображения таких комплексов причин в виде секторных диаграмм[198].

Секторная диаграмма причинно-следственных связей – группа факторов, достаточных для возникновения следствия, которая содержит все необходимые для этого компоненты. На рис. 5.2 изображены такие диаграммы для всех трех примеров с вождением.

.


Рис. 5.2. Три причинных комплекса дорожных происшествий

В этом примере каждая диаграмма – достаточное условие для наступления следствия, поэтому ДТП произойдет в каждом случае присутствия этих факторов. Но каждый из них по отдельности не необходимый, поскольку лишь множество условий вызывают следствие. Соблюдение требования, что причина всегда производит следствие (по утверждениям Милля и Юма), в то время как могут существовать необходимые условия для проявления следствия, которых нет в наличии; или что причина есть необходимое условие каждого случая проявления следствия, когда может быть множество возможных его причин, – это исключительно жесткие рамки. В реальности разнообразные следствия могут проявляться множеством различных путей, для чего часто требуется целый набор факторов.

Таким образом, согласно одной из концепций, причина есть компонент группы факторов, которые вместе оказываются достаточным условием возникновения следствия. Правда, такая группа может не быть необходимой, поскольку их способно оказаться множество. Этот подход разделяет Джон Маки[199], который описывает причины как INUS (недостаточные, но необходимые компоненты не-необходимых, но достаточных условий)[200]. В примере с секторными диаграммами каждый «кусочек пирога» сам по себе недостаточен (поскольку, чтобы вызвать следствие, нужны другие кусочки), но необходим (потому что, если какой-нибудь кусочек будет упущен, следствие не возникнет). С другой стороны, любая диаграмма (или «пирог») сама по себе не необходима, поскольку таких пирогов может быть много и каждый окажется достаточным условием следствия.

Итак, вместо того чтобы пытаться выделить такие факторы, как экономика, рекламные кампании конкурентов или рейтинги общественной поддержки, в качестве единственной причины результатов выборов, мы отобразим все сопутствующие факторы и, возможно, попробуем выяснить их относительную значимость.

Но не все причины становятся необходимыми INUS-условиями. К примеру, причинно-следственная связь может не иметь характер детерминизма, так что, даже если бы мы владели всей возможной информацией и наблюдали все необходимые условия, следствие не всегда возникало бы. Один из примеров индетерминизма – радиоактивный распад, где никогда нельзя знать наверняка, будет ли иметь место распад частицы в конкретный момент времени: нам известна только вероятность события. INUS-условие распада – вещь невозможная, поскольку достаточных условий здесь не существует. Точно так же могут наблюдаться INUS-условия, не оказывающиеся причинами, если, как в примере с пиццей и водой, у нас нет корректного набора переменных. Точность и полнота логических выводов всегда зависят от полноты данных.

Оглавление книги


Генерация: 0.696. Запросов К БД/Cache: 2 / 0
поделиться
Вверх Вниз