Книга: Почему

От причин – к политическим программам

От причин – к политическим программам

«Уменьшить объем бутылок с газированными напитками. Размещать информацию о калорийности в ресторанных сетях. Запретить трансжиры. Снизить содержание соли в ресторанных блюдах».

Это лишь несколько программных позиций, которые рассматривала или ввела в действие мэрия Нью-Йорка, чтобы улучшить здоровье жителей.

Если известно, что существует причинно-следственная связь между сахаром, высококалорийной пищей, трансжирами, солью и различными состояниями здоровья, улучшить которое – наша цель, можно ли знать заранее, какие действия городских властей окажутся успешными? Чтобы в этом разобраться, нужно понимать, каким будет следствие конкретного вмешательства и как сделать выбор между потенциальными воздействиями. Результатом, однако, необязательно будет конкретное следствие, которое мы хотим получить. Из одной причины может проистекать множество вещей, и, что досаднее всего, сам акт воздействия способен нарушить причинные взаимосвязи между объектами. Мы можем обнаружить, что лекарство, снижающее уровень холестерина в одних условиях, окажется совершенно бесполезным в других. Просто люди перестают следить за диетой, решив, что препарат в любом случае снизит холестерин. Или, например, оценки стандартизированных тестов изначально связаны с профессионализмом учителя. Но эта корреляция может ослабнуть, если оценки будут использоваться для аттестации учителей, которые в результате начнут ориентироваться в первую очередь на подготовку учеников к прохождению тестов[387].

Несмотря на это, мы хотим, чтобы решения основывались на доказательствах, а не байках и чтобы эти аргументации базировались на причинных зависимостях, а не корреляциях.

В пользу такого тезиса говорят научно-доказательная медицина, образование, проектирование и множество других направлений, основанных на доказательном подходе. Аргументации использовались в этих областях и ранее, просто сторонники подобных подходов предпринимают попытки формализовать понятие «надежного доказательства». Вместо того чтобы определить, говорят ли некие факты в поддержку конкретной гипотезы, они стараются провести различие между сильным и слабым аргументом и способствуют использованию наилучших. Результатом часто становится иерархия доказательств, где ВКЭ (или, точнее, систематический анализ различных ВКЭ) занимает безусловное место на вершине пирамиды[388].

И все же такие иерархии необязательно указывают, какая информация необходима для наших целей и как ее применять. В то время как идеально осуществленный выборочный эксперимент теоретически может дать лучшие из возможных доказательств, в реальности нельзя сравнить идеальное изучение с исследованием посредством наблюдения. Можно получить противоречивые результаты на основе необъективного исследования с малой выборкой участников и крупного, хорошо спланированного наблюдательного эксперимента или же иметь в распоряжении только неэкспериментальные аргументы.

Так как на практике приходится исходить из информации подобного рода, чрезвычайно важно знать, как использовать ее наилучшим образом, и мы изучим, что нужно иметь в виду при реализации политики на практике и как обобщать результаты.

Когда я говорю «политика» или «вмешательство», это может быть запрет городских властей на курение в общественных местах ради охраны здоровья, изменение государством учетной ставки в целях стимулирования экономики или просто ваше решение не пить кофе после четырех часов вечера, чтобы избавиться от бессонницы. Во всех этих случаях ради конкретной цели совершается изменение. Иногда нашим доказательством может быть реализация политики в каком-то месте (скажем, размещение в кафе и ресторанах Нью-Йорка информации о калорийности), и мы хотим использовать этот аргумент, чтобы достичь аналогичной цели где-то еще.

* * *

Многие города, например Нью-Йорк, Лондон и Париж, реализуют общественные программы проката велосипедов, когда его можно взять в одном месте и оставить там, куда направляешься. Цель этих программ – сократить количество поездок на личном автотранспорте и улучшить здоровье населения за счет физической активности[389]. Достижение этой цели зависит от следующих допущений: 1) езда на велосипеде – эффективная форма физических упражнений; 2) результатом программы станет развитие велосипедного спорта (а не просто то, что люди пересядут с собственных велосипедов на прокатные). Но как узнать, разумны ли такие допущения и что случится, если мы попытаемся внедрить подобную программу в другом городе?

Модели, с которыми мы знакомились в главе 6, можно использовать для прогнозирования последствий вмешательств. При этом, однако, приходится допускать, что используемая модель полная и корректная, а то, что мы узнали из эксперимента или пилотного исследования, можно транслировать на реальный мир. В таких моделях вмешательство было точным инструментом, который устанавливал значение переменной как истинное или ложное, более ничего не изменяя. Модели, как правило, способны лишь сказать, что происходит, если мы манипулируем одним объектом за раз, но в реальности наши вторжения вносят перемены и приводят к результатам, которых модели не спрогнозируют.

Как только принимается решение о поддержке велосипедного спорта в целях улучшения здоровья, появляется множество способов его реализации. Можно дешево продавать технику, давать уроки езды, развивать прокат и т. д. Но каждое вмешательство может привести к разным последствиям.

Даже если выбрать одну цель воздействия – скажем, прокат транспорта, – доступно реализовать ее множеством способов. Необходимо определить, из каких средств проект будет финансироваться, где размещать велосипеды и стоит ли предлагать ездокам шлемы (или требовать их наличия) – это всего несколько соображений. Итак, мы не просто пытаемся выяснить, какую причину применить, чтобы вызвать следствие, но и как заставить случиться саму причину.

Контекст

Одна из первоочередных вещей, которые необходимо осмыслить, – это контекст вмешательства.

Будет ли работать прокат транспорта только там, где есть выделенные дорожки? Требуется ли наличие большого количества велосипедистов? Будет ли зависеть успех программы от ее реализации в густонаселенном городе, имеющем много пунктов, где можно оставлять велосипеды?

Метод Маки и секторные диаграммы из главы 5 исходят из наличия набора условий, необходимых для того, чтобы причина произвела следствие.

Чтобы вмешательство оказалось успешным, нам нужно знать, какие факторы обусловливают эффективность причины и есть ли они там, где мы планируем реализовать нашу политику. Также надо убедиться в отсутствии факторов, способных помешать эффективному действию причины. Например, новое лекарство окажется бесполезным, если из-за высокой цены пациенты не смогут принимать рекомендованные дозы[390]. Прокат велосипедов не приживется там, где нет велосипедных дорожек, потому что люди сочтут небезопасным делить проезжую часть с городским транспортом.

Согласно одному исследованию, наблюдалась корреляция между частотой использования станции проката велосипедов в Вашингтоне и наличием поблизости велосипедных дорожек[391].

Понимание контекста помогает спрогнозировать успешность вмешательства и объяснить его провал. Говоря «контекст», я подразумеваю другие части секторной диаграммы или иные условия INUS, необходимые, чтобы причина произвела следствие. Если они отсутствуют, возможно, не удастся воспроизвести результаты экспериментального исследования, доказывающие, что вмешательство уже где-то сработало.

Противомоскитные сетки – хорошая защита от малярии, но на пути их применения есть разнообразные препятствия, в том числе цена. Бесплатная раздача сеток должна, таким образом, снизить уровень заболеваемости малярией. Но это утверждение будет истинным, только если приспособления употреблять по назначению. Хотя в большинстве случаев это именно так, порой сетки использовались для рыбной ловли, потому что людям не хватало пищи, а голод – более насущная проблема для целевой группы населения, чем малярия[392]. Таким образом, до вмешательства необходимы либо доказательства, что сетки будут применяться в установленных целях, либо политика, учитывающая препятствия[393].

Одно из затруднений в том, что не все факторы могут быть известны, потому что их никто никогда не измерял. Если правда, что велосипедные дорожки (а не пункты проката рядом с ними) способствуют езде на двухколесном транспорте, тогда программа может провалиться, если мы не будем располагать сведениями о наличии таких дорожек в новом месте или не будем убеждены в их необходимости.

Действенность и эффективность

Вмешательство, которое абсолютно не сумело достичь цели, – случай исключительный, однако то, что происходит в реальном мире (эффективность, effectiveness), порой существенно отличается от спрогнозированных результатов вмешательства, изученного на основе идеализированных установок (действенность, efficasy)[394]. Отличие между действенностью и эффективностью чаще всего встречается в медицине, однако оно достойно осмысления в каждом случае, когда для реализации вмешательств в ином контексте мы используем информацию, полученную на основе контролируемых установочных параметров.

К примеру, измерение уровня сахара с помощью глюкометров[395], берущих кровь из пальца, менее точно в домашних условиях, чем в контролируемых, потому что люди в быту гораздо менее внимательно следят за чистотой проб и реже моют руки[396]. Лекарства, демонстрировавшие высокую действенность в условиях эксперимента, когда их принимали в одно и то же время каждый день, могут оказаться куда менее эффективны в реальности, когда график приема соблюдается не так четко. Итак, если исходить из простого допущения, что эффективность вмешательства будет такой же, как та, что наблюдается в условиях контролируемого эксперимента или исследования с другой выборкой участников, ее показатель может оказаться завышенным. Пациенты решат не принимать лекарство в нужное время и в правильных дозах или прервать курс лечения.

Вероятность расхождения (и его степени) между действенностью и эффективностью влияет на выбор вмешательства. Есть ли у нас основания верить, что можно поддерживать эффект аналогичного уровня в реальных условиях? Выбирая воздействие, мы должны не только проверить, какие из них работают (например, что действительно снижало калорийность блюд в заказе), но и в какой степени (например, на сколько именно снизилась жирность в расчете на заказ). Если в идеализированных условиях, которые, как правило, представляют собой самый оптимистичный сценарий, калорийность заказанных блюд снизилась незначительно, следует скептически отнестись к возможности существенно увеличить эффект в реальности. Точно так же нужно учитывать распределение степени воздействия эффекта. Если в среднем питательность блюд снизилась незначительно, стоит определить, будет ли этот показатель одинаковым при всех условиях или же среднее значение затемняет нижний и верхний экстремумы (в одном месте калорийность намного выше, в другом – намного ниже).

Понимание, как установочные параметры вмешательства могут отличаться от условий, принятых в исследованиях, которые выявили причинную зависимость, поможет спрогнозировать потенциальные неудачи и разработать стратегии воздействия, чтобы избежать провала.

Итак, одно из соображений, которые следует учитывать, принимая решение о вмешательстве, – это не только степень его эффективности, но и возможность его успеха с учетом реально существующих условий.

Непреднамеренные последствия

Выборочный эксперимент под названием Tennessee STAR program («Программа звезд Теннесси») обнаружил, что ученики из классов меньшей численности лучше сдавали стандартизированные экзамены, чем школьники из классов большей наполняемости[397]. В этом случае нам известны подробности эксперимента с сокращением учащихся в классах. С помощью рандомизации групп эксперты устранили влияние любых факторов, которые могут стать причиной одновременно классов меньшей численности и лучших оценок на экзаменах. В конце концов, школы с малыми классами могут показывать лучшие результаты из-за чего угодно, и может оказаться, что небольшие классы – просто индикатор присутствия неких атрибутов.

Сомнения относительно больших классов в Калифорнии и положительные результаты Tennessee STAR program вызвали к жизни инициативу стоимостью в несколько миллиардов: сократить размеры учебных классов в Калифорнии[398]. В теннессийском эксперименте ученики и учителя случайным образом были распределены по классам разных размеров. Чтобы стимулировать сокращение размеров классов, штат выплачивал бонус в размере 650 долларов на одного ученика.

Программа была быстро реализована, но, конечно, чтобы иметь небольшие классы и стабильную группу учеников, понадобилось намного больше учителей. Поскольку предложение преподавательских услуг не успевало за растущим спросом, возросла доля неопытных педагогов[399].

Районы с низкими доходами и населенные главным образом этническими меньшинствами, где реализация программы заняла больше времени из-за недостатка аудиторий, оказались в невыгодном положении: учителей не хватало, а новых поздно вводили в проект. В результате более 20 % учителей, начавших работать в этих школах, не имели достаточной квалификации[400].

И все-таки ВКЭ Tennessee STAR program дал возможность сделать ключевой вывод: от сокращения размеров класса максимальную пользу получили ученики из числа меньшинств. Быстрая реализация в Калифорнии этого подхода как программы льгот для всех школ, которая привела к резкому спросу на учителей и конкуренции между ними, означала, что как раз те учебные заведения, которые получили бы максимальную выгоду от проекта, остались за бортом.

В итоге затея была сочтена неудачной. Любые заявления о ее преимуществах звучали неубедительно или незначительно, и считалось, что программа увеличила неравенство в области образовательных возможностей. В то же самое время, несмотря на очень скромный эффект вмешательства в Калифорнии, проект внедрялся далеко не бесплатно. Он стоил миллиарды долларов, которые не были использованы на другие цели, к тому же потребовал дополнительных помещений для классных комнат, которые приходилось откуда-то забирать, например у специального образования, компьютерных лабораторий и библиотек[401].

Исследования, фокусирующиеся на доказательстве причинных зависимостей, в целом не занимаются подобным анализом стоимости/эффективности. Но этот момент очень важен с точки зрения реализации вмешательства, когда ресурсы ограничены и выполнение одной вещи означает, что сделать другую уже не получится[402].

В маломасштабной программе сокращения численности классов в Теннесси участвовали только школы, где уже имелось достаточно места для новых групп, а сам масштаб эксперимента был недостаточен, чтобы вмешаться в спрос на педагогический персонал.

Чтобы успешнее просчитать эффективность программы в Калифорнии еще до реализации, понадобилось бы учесть контекст и ограничения (например, наличие места) и определить, как изменятся другие переменные, например ресурсы, которые придется направить на реализацию этого проекта, забрав у других.

Непреднамеренные последствия принимают разные формы. В простейшем случае вмешательство имеет побочный эффект, означая, что оно становится причиной не только запланированного исхода, но и других моментов. К примеру, лекарство может снимать головную боль, одновременно вызывая слабость. Это, правда, не изменяет присущих системе свойств. С другой стороны, одна из проблем с прокатом велосипедов заключается в возможном ее негативном влиянии на здоровье, если, например, в программе примут участие неопытные велосипедисты, а езда на этом транспорте в городах – дело небезопасное.

Именно поэтому программа сокращения численности учеников в калифорнийских классах пошла не так. Она была просто введена, без изменения чего-либо другого. Масштабное и при этом скорое воплощение привело к различиям профессионализма учителей в некоторых районах, а также к сокращению финансирования и ограничению места для других проектов.

Сосредоточиваясь на вопросе о непосредственном достижении цели вмешательства, нужно проанализировать, к каким еще последствиям оно может привести. Если прогнозы делаются на основе модели, где переменная «размер класса» просто назначается истинной или ложной, они не учитывают, что случится, если сократить размеры классов за счет финансовых льгот, перенаправляя ресурсы из других программ, и если персонал для этих новых классов будет набран неквалифицированный.

Правда, более детализированная модель (каузальная, которой мы научаемся, или симуляционная, которую мы строим), предусматривающая не только причину, но и метод ее воплощения, поможет сравнить различные способы сокращения численности учеников. То есть мы сможем оценить следствия сначала таргетированием[403] областей, где цель труднодостижима, вместо того чтобы перейти прямо к реализации программы в масштабе всего штата; сможем протестировать различные программы льгот и т. д.

Однако далеко не все непреднамеренные последствия негативны. Некоторые на самом деле могут дать лучшие доказательства в пользу результативности программы, если ее преимущества окажутся выше ожидаемых. Например, если прокат велосипедов снизил загрязнение воздуха, это положительный побочный эффект.

Такие побочные действия порой возникают потому, что мы не имеем возможности манипулировать единственной вещью изолированно от прочих. Вместо «того самого» вмешательства может понадобиться изменить много факторов одновременно. Мы, скорее всего, не сможем просто предоставить велосипеды для проката; вероятно, понадобится одновременно устроить выделенные велосипедные дорожки – либо желая развивать велосипедный спорт в целом, либо как необходимое условие безопасности программы.

Таким образом, в одно и то же время может быть введено в действие множество программ, непредсказуемо взаимодействующих. Например, программа проката велосипедов, не предусматривающая выдачи защитных шлемов, может стартовать одновременно с принятием закона, требующего носить такие шлемы. Следствием закона будет низкий уровень пользования программой, если люди не хотят носить с собой шлемы повсюду.

Ко множеству вещей, изменяющихся одновременно, добавляется проблема планирования и оценки вмешательств, так как нельзя сразу сказать, какое именно вызвало некие очевидные следствия. Если, однако, известно о различных компонентах, есть возможность их учесть[404].

Оглавление книги


Генерация: 0.053. Запросов К БД/Cache: 0 / 0
поделиться
Вверх Вниз