Развитие опросной индустрии за последние полвека прошло через несколько последовательных этапов, каждый из которых был связан с изменением коммуникационной среды и повседневных практик населения. В середине XX века основным стандартом массовых исследований являлись личные интервью по месту жительства (face-to-face, CAPI/PAPI). С распространением телефонии многие исследовательские организации начали переходить к телефонным опросам, сначала основанным преимущественно на стационарных номерах, а затем на комбинированных выборках стационарных и мобильных телефонов (CATI dual-frame). В 2000–2010-е годы стремительное развитие интернета привело к росту популярности онлайн-опросов (CAWI), которые существенно снизили стоимость полевых работ и ускорили получение результатов.
Однако каждый новый метод сбора данных не вытеснял предыдущий полностью. Напротив, каждый следующий этап выявлял ограничения доминирующего способа опроса и заставлял исследователей возвращаться к вопросу о комбинации различных модусов и поиску «золотой середины». Если телефонные опросы в своё время позволили решить проблему высокой стоимости личных интервью, то впоследствии сами столкнулись со снижением достижимости населения. Аналогично, интернет-опросы обеспечили быстрый и дешёвый доступ к большим массивам респондентов, но одновременно породили новые проблемы охвата целевых популяций и случайности отбора. В результате современная мировая практика всё чаще рассматривает различные методы как взаимодополняющие инструменты, а не как взаимозаменяемые альтернативы.
Отчасти поэтому в последние два десятилетия в мировой исследовательской практике сформировался устойчивый тренд перехода от мономодальных опросов к смешанным дизайнам сбора данных (mixed-mode). Основная причина заключается в постепенном снижении эффективности телефонного канала: во многих странах падают коэффициенты ответа (response rates) из-за распространения технологий скрининга звонков, законодательных ограничений и роста настороженности граждан к звонкам от неизвестных абонентов. Аналогичные процессы наблюдаются и в России. В результате достижимость респондентов по телефону снижается, а стоимость получения одного завершённого интервью неуклонно растёт.
Вместе с тем перенос исследований в онлайн-среду (CAWI) остро ставит проблему репрезентативности. Интернет-опросы невозможно приземлить ни на какую генеральную совокупность с четкими территориальными границами, они подвержены систематическим смещениям, поскольку в выборке зачастую оказываются сверхпредставлены более молодые, образованные, компетентные в цифровых вопросах и социально активные группы населения, тогда как пожилые люди и граждане с низкой цифровой вовлечённостью из охвата выпадать. Однако и традиционные офлайн-методы уже не являются универсальным решением. Квартирные опросы по маршрутной выборке сталкиваются с ростом недоступности домохозяйств. Как реакция, распространение получили уличные опросы, которые, однако, годятся для зондажа — примерной, грубой, черновой оценки, — поскольку в принципе не претендуют на случайный отбор из генеральной совокупности с ясными (ясно представленными) границами.
В результате ни один из практикуемых способов сбора данных сегодня не обеспечивает полного и несмещённого охвата населения, что и стало одной из ключевых причин перехода мировой исследовательской индустрии к смешанным (mixed-mode) дизайнам, комбинирующим преимущества различных каналов рекрутирования и интервьюирования.
Сегодня телефонный опрос, особенно по RDD-выборке, всё реже рассматривается как самостоятельный, а тем более единственный источник данных. Во многих крупных исследовательских проектах он используется как инструмент компенсации недобора, охвата труднодоступных категорий населения и снижения выборочных смещений. Таким образом, важным направлением развития современной опросной методологии становится комбинирование отдельных методов сбора данных. Аналитики AAPOR отмечали еще в 2019 г., что многие крупномасштабные опросы переходят от телефонных опросов к комбинациям нескольких модусов для набора участников и проведения опросов, где телефон может быть лишь одним из используемых модусов.
Опросные компании и национальные статистические агентства сегодня используют различные дизайны комбинирования модусов сбора данных. Можно выделить следующие основные модели, каждая из которых имеет свои плюсы и минусы:
1. Последовательный дизайн
Наиболее распространённой моделью mixed-mode исследований сегодня является последовательный дизайн (sequential mixed-mode), в котором респонденту первоначально предлагается пройти опрос онлайн (CAWI), а к неответившим впоследствии применяются дополнительные каналы контакта — телефонный опрос (CATI) или личное интервью (CAPI). В англоязычной литературе такой подход часто обозначается как push-to-web или web-first design. Смысл прост: наиболее дешёвый и быстрый канал используется первым, а более дорогие способы подключаются только для компенсации недобора и повышения охвата. В отличие от классических телефонных исследований, где все респонденты опрашиваются через CATI, последовательный дизайн позволяет существенно сократить стоимость полевых работ без заметной потери качества данных. Именно поэтому за последние десять лет многие национальные статистические службы, академические панели и крупные исследовательские центры перешли на схему «CAWI → CATI/CAPI».
CATI перестаёт быть основным инструментом сбора данных и фактически используется для тех групп населения, которые хуже реагируют на цифровые приглашения: пожилых людей, лиц с низкой цифровой грамотностью, представителей отдельных этнических или территориальных групп и т.д.
Одним из примеров перехода к последовательному mixed-mode дизайну является британская панель Understanding Society (UKHLS), крупнейшее лонгитюдное исследование домохозяйств в Великобритании. Переход к смешанному дизайну начался еще до пандемии: начиная с 7-й волны часть выборки переводилась на последовательный дизайн (web + CAPI). После начала пандемии COVID-19 в 2020 г. все домохозяйства были переведены на схему web-first с последующим телефонным донабором (CATI), что фактически завершило переход проекта к смешанному дизайну. Особый интерес представляет эксперимент по использованию SMS-напоминаний в сочетании с веб-анкетой, проведённый в 2022–2023 гг. Исследование Cabrera-Álvarez и Lynn (2024) показало, что общий прирост отклика оказался умеренным, однако SMS существенно улучшили участие молодых респондентов и тех участников панели, для которых отсутствовали адреса электронной почты. Фактически SMS стали промежуточным каналом между онлайн-опросом и телефонным донабором, снижая необходимость дорогостоящих CATI-интервью. Практический вывод исследователей состоял в том, что телефон сегодня эффективен прежде всего как инструмент добора специфических категорий респондентов.
Другой показательный пример связан с американским лонгитюдным исследованием Panel Study of Income Dynamics (PSID), одним из старейших панельных проектов мира. В 2021 году исследование осуществило плановый переход от почти пятидесяти лет преимущественно телефонного сбора данных к web-first mixed-mode дизайну, сочетающему онлайн-анкетирование и последующий CATI-донабор неответивших респондентов. Экспериментальное сравнение показало преимущества web-first протокола: снижение полевых затрат, сокращение числа контактов интервьюеров, уменьшение продолжительности полевых работ и сохранение высокого уровня участия респондентов. Исследователи отмечают, что значительная часть участников предпочитала самостоятельно заполнять веб-анкету в удобное время, а телефонный модус использовался главным образом для компенсации недобора и удержания труднодоступных участников панели.
Еще один пример — Monitoring the Future, одно из крупных лонгитюдных исследований американской молодёжи. В серии методологических экспериментов исследователи сравнивали традиционный почтовый сбор бумажных анкет с последовательным mixed-mode подходом, включавшим веб-анкетирование, электронные напоминания, SMS и мобильный доступ к анкете. Результаты показали, что web-push дизайн обеспечивал более высокий уровень участия молодых респондентов (до 42% против 34% в контрольных группах) и снижал стоимость полевых работ без существенного влияния на содержательные оценки. После успешных экспериментов web-first был принят в качестве стандартного протокола панельного сбора данных для участников 19–30 лет.
Последовательный дизайн применяется также и национальными статистическими агентствами. Перепись населения 2021 года стала крупнейшим примером внедрения последовательного mixed-mode дизайна в Великобритании. В отличие от предыдущих переписей, где основным инструментом выступали бумажные анкеты, Census 2021 был построен по принципу web-first.
Схема сбора данных включала несколько последовательных этапов:
- Домохозяйства по списку получали приглашение пройти перепись онлайн.
- Не ответившим направлялись напоминания.
- Использовалась телефонная поддержка и контакт-центр для помощи респондентам.
- Для оставшихся «неответчиков» применялись личные визиты переписчиков.
Таким образом, дорогостоящие личные контакты использовались только на завершающем этапе и только для ограниченного числа домохозяйств. Результаты оказались успешными:
- около 88–89% всех ответов были получены онлайн;
- существенно сократились расходы на обработку бумажных анкет;
- сохранился высокий уровень охвата населения;
- удалось обеспечить участие групп с низкой цифровой вовлечённостью благодаря последующим контактам и полевому донабору.
С методологической точки зрения Census 2021 считается одним из наиболее масштабных примеров реализации стратегии web-first, где интернет выступает основным модусом сбора данных, а телефонные и личные контакты используются для компенсации недобора и снижения смещений охвата.
Еще одним масштабным и методологически проработанным примером последовательного mixed-mode дизайна является American Community Survey (ACS), проводимое Бюро переписи населения США. ACS считается крупнейшим непрерывным социально-демографическим обследованием в мире и ежегодно охватывает около 3,5 млн домохозяйств. Сбор данных в ACS организован по принципу последовательного подключения всё более дорогостоящих каналов контакта. Первоначально отобранные домохозяйства получают приглашение пройти опрос через интернет. Для не ответивших участников далее используются бумажные анкеты, затем телефонные интервью (CATI), а на завершающем этапе личные визиты интервьюеров (CAPI). Таким образом, каждый следующий модус применяется только к тем респондентам, которые не ответили на предыдущем этапе. Интернет выступает основным каналом сбора данных, тогда как телефонный опрос используется для компенсации недобора и расширения охвата, а личное интервьюирование сохраняется исключительно для наиболее труднодоступных домохозяйств. Во всех подобных случаях выборки формируются из стационарных адресных баз резидентов.
Основные преимущества последовательного дизайна
Опыт национальных статистических служб и крупнейших академических исследований показывает, что последовательный дизайн позволяет одновременно решать несколько задач:
- снижать стоимость сбора данных за счёт перевода основной массы интервью в онлайн;
- повышать скорость полевых работ;
- сокращать нагрузку на интервьюеров;
- сохранять охват групп населения, которые плохо представлены в интернете;
- уменьшать риск систематических смещений выборки;
- использовать телефонный опрос более адресно: для донабора конкретных сегментов населения, а не для сплошного обзвона.
2. Параллельный дизайн
Параллельный mixed-mode дизайн предполагает, что все доступные модусы сбора данных предлагаются респонденту одновременно с самого начала полевого этапа. В отличие от последовательных схем (push-to-web), где модусы меняются по мере отсутствия ответа, здесь респондент получает равнозначную возможность выбора способа участия: онлайн (CAWI), телефон (CATI), личное интервью (CAPI), а в отдельных случаях даже бумажную анкету (PAPI). Ключевая методологическая особенность данного подхода заключается в смещении акцента с оптимизации стоимости на управление участием. Выбор модуса рассматривается как инструмент снижения отказов и повышения включенности труднодоступных групп, а не как средство экономии ресурсов.
Как отмечает компания Ipsos, параллельный дизайн – «по-настоящему клиент-ориентированный» подход, дающий респондентам возможность «завершить любой опрос тем способом, который им наиболее удобен». Одновременно параллельный дизайн позволяет быстрее собрать данные, поскольку несколько каналов работают синхронно и онлайн-анкеты могут быть заполнены за короткое время. Параллельный дизайн применяется не только в первичных исследованиях, его используют также в панелях. Например, его использует Pew Research Center, предлагая возможность своим панелистам выбирать, как проходить опрос: онлайн или по телефону.
Одним из наиболее известных европейских примеров частичного параллельного mixed-mode дизайна является National Centre for Social Research (NatCen) и его исследование British Social Attitudes (BSA) в период после COVID-19. Методологическая трансформация заключалась в переходе от доминирующего face-to-face интервью к схеме, в которой респондентам предоставлялась возможность участия через разные каналы, включая онлайн-анкеты и телефонное интервьюирование. В ряде волн после 2020 года NatCen применял комбинированную стратегию, где приглашение к участию допускало альтернативные способы завершения интервью. Такая схема позволила привлечь новых участников при относительно низком уровне отказов, сохранив репрезентативность выборки.
Методологические отчёты фиксируют несколько эффектов такого подхода:
- снижение барьеров участия за счёт выбора модуса опроса;
- частичное восстановление отклика после пандемийного падения достижимости;
- сохранение сопоставимости при корректировке весов.
В пилотном исследовании GEDA (Германия) сравнивались два варианта mixed-mode дизайна: параллельный (concurrent), в котором респондентам одновременно предлагались веб-, бумажная и телефонная версии анкеты, и последовательный (sequential), где модусы подключались поэтапно. Существенных различий по ключевым содержательным показателям выявлено не было. При этом параллельный дизайн обеспечивал более высокий первоначальный отклик и несколько меньший риск смещений, тогда как последовательный дизайн демонстрировал лучшие показатели по стоимости и организации полевых работ.
Еще один пример использования параллельного дизайна — Национальное исследование депрессии (Польша, 2022–2023). Польские учёные П. Точиски и М. Феликсяк провели три репрезентативных волны опроса. Все интервью собирались одновременно в трем модусах: CAPI, CATI и CAWI. Параллельный сбор данных обеспечил хороший охват уязвимых групп. Например, пожилые люди и малоимущие легче шли на CAPI/CATI, тогда как молодёжь активно участвовала через веб. Такой подход расширил охват и снизил смещение по многим признакам.
Таким образом, параллельный mixed-mode делает опрос более ориентированным на респондента, потенциально ускоряет сбор данных и помогает компенсировать дефицит менее «цифровых» групп (пожилых, социально-необеспеченных и др.). При этом при грамотном дизайне такие схемы могут поддерживать высокую долю ответивших без ухудшения качества выборки.
3. Гибридный дизайн
В самых сложных исследованиях (особенно национальных переписях или крупных панелях) используют комбинацию всех доступных модусов. Если при параллельном (concurrent) mixed-mode дизайне всем респондентам с самого начала предлагаются сразу несколько способов участия и респондент сам выбирает наиболее удобный канал, то гибридный дизайн сочетает в себе элементы последовательного и параллельного подходов. То есть часть выборки проходит через один приоритетный модус (например, онлайн), а затем к «неоткликнувшимся» применяются дополнительные модусы, либо, наоборот, некоторые группы сразу набираются через офлайн-каналы. Гибридный подход направлен на расширение охвата: он использует все доступные модусы, чтобы включить труднодоступные группы (пожилых, маломобильных и т.д.), тогда как чисто последовательные схемы обычно ориентированы на оптимизацию затрат. Например, обычная практика — адресный отбор домохозяйств с отправлением онлайн-анкеты (CAWI), а затем телефонные опросы (CATI) и, при необходимости, выезд интервьюеров (CAPI). Такой адресной рассылке с мультиканальным сбором отдают предпочтение, чтобы не потерять слабо достижимые группы.
Показательным примером гибридного подхода являются практики национального статистического агентства Нидерландов (Statistics Netherlands)[1]. На первом этапе респондентам предлагается пройти опрос онлайн, поскольку CAWI является наиболее быстрым и экономически эффективным каналом (однако веб-модус не рассматривается как самодостаточный). Если респондент не отвечает онлайн, к нему последовательно применяются более затратные, но более сильные по охвату модусы: сначала телефонное интервьюирование (CATI), затем, при необходимости, личное интервьюирование (CAPI). В отдельных конфигурациях веб-опрос может также сочетаться с бумажной анкетой, что расширяет возможности участия для респондентов, плохо владеющих цифровыми каналами.
Ключевая особенность этого подхода состоит в его дифференцированности. Модус сбора данных подбирается с учётом характеристик респондентов и ожидаемых рисков неответа (хотя принцип от наименее дорогого к наиболее дорогому тоже сохраняется). Для одних групп достаточно онлайн-приглашения, для других заранее требуется телефонный контакт или личное интервью. Поэтому такой дизайн можно считать гибридным: он сочетает каскадное подключение модусов с адаптацией стратегии под разные сегменты выборки.
Эксперименты Statistics Netherlands показывают, что подобная схема позволяет сохранять приемлемый уровень отклика и одновременно улучшать структуру достигнутой выборки. Веб-этап обеспечивает быстрый и сравнительно недорогой сбор основной части интервью; CATI добавляет респондентов, не среагировавших на онлайн-приглашение; CAPI помогает добрать наиболее труднодоступные группы. Тем самым гибридный дизайн снижает риск смещений, характерных для чисто онлайн-опросов, и одновременно обходится дешевле, чем полностью личное интервьюирование. Его методологический смысл заключается в том, что разные модусы выполняют разные функции в единой системе обеспечения охвата и качества данных.
4. Компромиссные mixed-source designs: когда смешиваются не только модусы, но и источники выборки
В прикладных исследованиях практикуется и другой тип компромиссных дизайнов, где комбинируются не только модусы сбора данных для формирования единой выборки, но комбинируются сами выборки, сформированные из разных основ. Такие схемы встречаются прежде всего там, где одна основа для вероятностной выборки не обеспечивает достаточного охвата, нужного размера редкой подгруппы или приемлемой стоимости поля. В англоязычной методологической литературе и полстерской практике такие решения описываются как blended sample (смешанная выборка), multi-frame design (многоосновные выборки), mixed-source[2] design (выборки из разных источников) или hybrid polling (гибридный опрос). В этих случаях исследователи могут параллельно использовать RDD-выборку, вероятностную онлайн-панель и opt-in панель, случайную мобильную SMS-выборку или таргетированный добор через социальные сети.
В испанском исследовании ESPACOV о социальных последствиях COVID-19 веб-опрос строился на сочетании SMS-приглашений на случайно сгенерированные мобильные номера и таргетированной рекламы в Facebook, Instagram и Google Ads для добора недопредставленных социально-демографических групп. Журнал статистики и методологии опросов, издаваемый при поддержке AAPOR и Американской статистической ассоциации, опубликовал статью «Сочетание вероятностных и невероятностных выборок: применение к опросу лиц, осуществляющих уход за военнослужащими», в которой представлены новые методы статистического взвешивания для комбинирования данных.
В исследовании распространённости пищевых аллергий среди взрослых в США участников сначала набирали из вероятностной панели NORC AmeriSpeak, затем добавляли респондентов из не-вероятностной панели Survey Sampling International. Еще один пример — опрос родителей на тему обеспокоенности стрельбы в школе (Чикаго). Респонденты были набраны посредством приглашений по электронной почте, сформированных на основе вероятностных выборок. Для обеспечения достаточного размера выборки для проведения анализа подгрупп вероятностная выборка была дополнена взвешенными по калибровке ответами, полученными через онлайн-панели с добровольным участием. Для набора участников масштабного межстранового лонгитюда также использовались три основных метода выборки: вероятностная выборка, не вероятностная выборка или их комбинация.
Методологически такие кейсы важно отличать от строгого mixed-mode. Здесь смешиваются не только способы интервьюирования, но и разные механизмы попадания респондента в массив данных. Это позволяет повысить охват, скорость или численность редких групп, но одновременно усложняет интерпретацию. Поэтому такие дизайны требуют отдельного описания: какие источники были объединены, в каких пропорциях, какие группы каждый источник покрывает лучше или хуже, как учитывалось пересечение рамок и какие процедуры взвешивания использовались для получения итоговых оценок.
Выводы
В целом мировая практика показывает, что опросная индустрия постепенно уходит от мономодальных дизайнов к смешанным моделям сбора данных. CATI при этом не исчезает, но всё реже выступает как единственный или основной способ опроса, становясь одним из дополнительных инструментов для донабора неответивших, включения менее цифровизированных групп, контроля смещений и сохранения сопоставимости длинных временных рядов. Преимущество mixed-mode подходов состоит в более точном распределении функций между модусами: онлайн обеспечивает скорость и снижение стоимости, телефон помогает вернуть труднодоступных респондентов, а личное интервью остаётся резервом для групп, которые плохо достижимы дистанционно.
Опыт Gallup хорошо показывает, что переход к mixed-mode требует профессионализма и методологической аккуратности. Компания признаёт, что телефонные опросы становятся всё более сложными и дорогими из-за снижения достижимости респондентов и блокировки звонков, поэтому развивает вероятностную Gallup Panel, web- и mail-опросы. Однако для длинных исторических серий (Gallup Poll Social Series) телефон сохраняется как основной модус, поскольку переход на самозаполнение может создавать искажение (mode effects) и нарушать сопоставимость данных.
Именно поэтому mixed-mode нельзя понимать, как простое «смешивание». Это полноценная методологическая работа: исследователь должен заранее понимать, какие группы каким модусом лучше достигаются, как разные способы интервьюирования влияют на ответы, какие mode effects возникают и как их корректировать. Многие крупные исследовательские центры и статистические агентства успешно применяют смешанные дизайны именно потому, что внутри одной выборки используют разные методы управляемо: тестируют модусные эффекты, сравнивают состав достигнутых подвыборок, оценивают уровень отказов, применяют стратификацию, калибровку и весовые поправки. В этом смысле mixed-mode — это более зрелая модель опросной методологии, в которой качество данных обеспечивается через осознанное комбинирование модусов и постоянный контроль их влияния на результат.
Наконец, принципиально важно уточнить, что в mixed-mode дизайнах смешиваются не выборки, а модусы сбора данных. Такая схема предполагает единую, заранее спроектированную вероятностную выборку, сформированную из основы выборки — списка элементов целевой популяции с возможностью адресного контакта. Только в этом случае исследователь, меняя модусы контакта и интервьюирования, понимает, какого именно респондента необходимо достичь повторно: пригласить онлайн, дозвониться, направить бумажную анкету или организовать личное интервью. Если же исходный отбор построен на слепом RDD-обзвоне или маршрутном обходе без информации о конкретном респонденте за пределами одного канала, то возможность качественного последовательного или гибридного mixed-mode резко ограничена: недостигнутого человека фактически нельзя «перенести» в другой модус, не нарушая механику исходного отбора.
Отсюда следует важное ограничение для переноса международных практик в российские условия. Описанные выше модели высокого качества, как правило, опираются на наличие надежной выборочной основы: адресных регистров, панельных баз, административных списков или их функциональных аналогов, позволяющих работать с конкретными отобранными элементами выборки и при необходимости переводить их между разными модусами контакта. Там, где такие основы недоступны исследователям организационно или юридически, возможности применения mixed-mode дизайнов в строгом смысле оказываются существенно ограничены. В этих условиях простое комбинирование CATI, CAWI и CAPI само по себе не устраняет смещения: без единой выборки и контролируемого добора труднодоступных групп оно может привести к объединению нескольких частичных и не вполне сопоставимых источников данных. Поэтому развитие mixed-mode подходов в России предполагает, прежде всего, обсуждение условий, при которых исследователи получают доступ к качественным выборочным основам.
При отсутствии надежной списочной или адресной основы возможной альтернативой становится более компромиссная схема комбинирования разных безадресных выборочных источников. В телефонном модусе таким источником может выступать RDD-выборка, в личном интервью — маршрутный или территориальный отбор по месту жительства, в онлайн-среде — панели, основанные на вероятностном отборе. Однако такой подход требует самостоятельного методологического обоснования: необходимо определить, какую генеральную совокупность репрезентирует итоговый массив, в каких пропорциях допустимо объединять разные источники, как учитывать различия в вероятностях включения, как оценивать ошибку выборки и каким образом отделять эффекты модуса от эффектов самой выборочной рамки. Поэтому смешение безадресных выборочных источников следует рассматривать как отдельный класс компромиссных mixed-source дизайнов, требующий специального анализа, а не как прямой аналог mixed-mode обследований, построенных на единой вероятностной выборке.
[1] См. рецензию Оберемко, О. А., & Смак, Т. С. (2025). Официальные опросы по комбинированным выборкам: дизайн и анализ. Рец. на кн.: Schouten B., van den Brakel J., Buelens B., Giesen D., Luiten A., Meertens V. (2022) Mixed-Mode Official Surveys: Design and Analysis. Boca Ranton, FL: CRC Press. Мониторинг общественного мнения: экономические и социальные перемены, (2), 243–251. https://doi.org/10.14515/monitoring.2025.2.2757
[2] «Выборка из разных источников» — это определение идеально подходит для случаев, когда собственно основы выборки отсутствуют или недоступны, и их подменяют списки действующих (вернее, открытых для пользования) телефонных номеров и/или маршруты на географических картах. То есть, когда основы выборки, как списка генсовокупности, нет, но он подменяется процедурой, формально эквивалентной случайному отбору из списка. Цена именно формальной эквивалентности (а не полного тождества) — невозможность применять mixed дизайны, описанные в параграфах 1–3.