Перепись населения: от пересчета по головам к изучению каждого человека

05.03.2022

В подкасте «Экономика на слух» Маргарита Лютова обсудила с профессором РЭШ Евгением Яковлевым и заместителем директора Центра перспективных управленческих решений Витовтом Копытком один из важнейших источников данных для экономических исследований – перепись населения.

Маргарита Лютова

 

С древних времен правители проводили переписи, чтобы узнать, сколько налогов они могут собрать себе в казну и воинов – под свои знамена. В современной цивилизации люди уже не просто источник доходов бюджета или пополнения армий. Государствам важно проводить переписи и понимать, сколько людей живет на их территории, чтобы реализовывать эффективную политику: инвестировать в инфраструктуру и социальные объекты, определять приоритеты в бюджетных расходах. Переписи – практически незаменимый источник данных и для экономистов. Например, огромное количество экономических исследований, основанных на данных США, использует именно данные переписей, включая и работы многих нобелевских лауреатов, например Дэвида Карда и Джошуа Ангриста (подробнее об их работах – в выпуске подкаста «Экономика на слух» с профессорами РЭШ Сергеем Измалковым и Ольгой Кузьминой). 

 

Альтернативы переписи населения

Евгений Яковлев: Все государственные реестры служат конкретной цели, т. е. не обладают той широтой охвата, какую дает перепись населения. Например, налоговая база данных не может дать информацию о несовершеннолетних (ведь они не платят налоги) или о том, люди каких национальностей проживают в России. Перепись незаменима и для сбора демографических данных. Так, данные, полученные во время переписи 2002 г. в России, стали сильнейшим аргументом для введения материнского капитала, поскольку зафиксировали падение рождаемости и сокращение количества матерей, готовых завести детей. С моей точки зрения, ни одна база данных в ближайшие десятилетия в России перепись не заменит. 

Витовт Копыток: В мире по большому счету есть две модели переписи населения. Во-первых, это классическая модель, которая предполагает сплошное обследование всего населения. Во-вторых, анализ административных источников данных, или так называемая административная перепись. Это два полюса, но есть и смешанные модели. Например, в Германии часть сведений получают из административных источников, а затем дополняют их данными выборочного обследования. 

Административные переписи больше подходят для стран с не очень большой территорией и не очень большой численностью населения. В больших странах использовать такую модель значительно труднее. Дело в том, что перепись – не просто пересчет населения по головам, это данные о том, какие люди и как живут на конкретной территории.

 

Микроданные переписей: что это и зачем они нужны 

Евгений Яковлев: В США проводятся переписи по классической модели сплошного обследования населения, и на данных переписей действительно основано невероятное количество научных работ. Во многом это связано с тем, что в США очень высоко развита инфраструктура для исследователей. Там вы можете получить доступ к данным переписей населения за достаточно длительный промежуток времени, причем и к микроданным.

Витовт Копыток: Микроданные – это буквально записи каждого переписного листа, т. е. не данные, агрегированные на уровне, например, города, а буквально сведения о каждом домохозяйстве, доступ к которым – разумеется, в обезличенном виде – может быть предоставлен исследователям. С недавних пор такая возможность появилась и у исследователей в России. 

Евгений Яковлев: Исследователям очень важен доступ к микроданным, поскольку они помогают выявлять причинно-следственные связи. Имея только агрегированные данные, невозможно анализировать разнообразные факторы. Объясню на примере моей работы о влиянии программы материнского капитала на рождаемость. Если вы в данных видите рост рождаемости, важно оценить целый ряд факторов: например, такой рост, возможно, происходит только в религиозных семьях – а такие сведения о домохозяйствах есть лишь в микроданных переписи. Вывод о том, что программа материнского капитала ускорила рост рождаемости, я смог сделать именно благодаря анализу микроданных российской переписи 2010 г. В целом доступ к микроданным позволяет экономистам улучшить инструментарий и делать более обоснованные выводы. 

 

Как замужних женщин оказывается больше, чем женатых мужчин

Евгений Яковлев: Разумеется, у данных переписи есть свои ограничения. Во-первых, их качество сильно зависит от вопросов в переписных листах. В России вопросов в переписной анкете меньше, чем в других странах. Например, в российских анкетах нет вопроса о доходах, поскольку он считается слишком чувствительным. Во-вторых, многие вопросы переписи предполагают ответ на основе самоидентификации. Есть знаменитый пример: по итогам переписи в России оказывается больше замужних женщин, чем женатых мужчин, потому что люди по-разному для себя определяют статус своих отношений. Схожая ситуация и с вопросом о национальности. Но такие искажения есть везде, и исследователям они заранее хорошо известны, так что с такими данными все равно можно работать. 

Витовт Копыток: Еще один яркий пример: по данным переписи 2010 г., кандидатов наук и докторов оказалось в 4 раза больше, чем по официальным данным Росстата, в некоторых регионах разница и вовсе была в 15 раз. Искажения вносит и, например, военная служба: мы видим в результатах переписи недостаток данных о мужчинах призывного возраста, их в соотношении с женщинами в данных переписи меньше, чем в реальности. Но все эти искажения вполне преодолимы для исследователей. 

 

Проблемы российской переписи населения 2020 г.

Евгений Яковлев: Главной трудностью может стать то, что при использовании административных данных для восполнения пробелов в переписи невозможно учесть важные факторы – например, неофициальную миграцию, ведь не все регистрируются по месту жительства. Это может привести к занижению численности населения или, наоборот, к завышению. Как следствие, невозможно будет корректно рассчитать коэффициенты смертности или рождаемости, потому что, чтобы их получить, вам нужно данные из загсов об умерших и родившихся соотносить с общей численностью населения, а также количеством женщин детородного возраста. 

Помочь восполнить пробелы могут массовые репрезентативные опросы, но полностью заменить перепись они не могут. Ни одна выборка не позволит в полной мере учесть такие редкие события, как покупка жилья, рождение детей или, что еще реже, рождение детей у матерей-одиночек. Главное – что и сами эти опросы невозможны без переписей: именно данные переписи позволяют формировать репрезентативные выборки населения, необходимые для проведения опросов.

 

Как экономическая наука становится внимательнее к людям 

Витовт Копыток: Возможность анализировать микроданные помогает исследователям оценивать эффекты той или иной государственной политики не в среднем для всего населения, а для конкретной группы и даже для конкретных людей. Как следствие, государство может делать свою политику более целенаправленной, эффективнее помогать конкретным группам людей. 

Евгений Яковлев: Благодаря доступу к данным, в том числе к микроданным переписей, экономический анализ стал значительно честнее. Мы обнаруживаем эффекты и связи, которые просто не могли увидеть ранее из-за недостатка данных. Мы сами как ученые видим свою эволюцию и понимаем, как интересно работать с этими данными и сколько важного мы можем сделать.