Экономисты научились предсказывать рождаемость по поисковым запросам

Анна Сальникова Редактор новостной ленты

Сотрудники факультета экономических наук НИУ ВШЭ показали, что точность прогноза рождаемости в России можно повысить почти в полтора раза, если учитывать динамику поисковых запросов, связанных с беременностью и родами. Результаты исследования опубликованы в журнале Populations and Economics.

Авторами работы стали Лилия Родионова и Елена Копнова, а также аспиранты Никита Родионов и Светлана Камелендинова. Исследователи считают, что поведение пользователей в интернете может быть дополнительным источником данных для оценки демографических процессов.

Прогнозирование рождаемости важно для планирования социальной инфраструктуры. Такие данные помогают заранее рассчитывать потребность в детских садах, школах, услугах для семей, а также оценивать будущую ситуацию на рынке труда и долгосрочные социальные расходы.

Ученые проанализировали ежемесячные данные Росстата о числе родившихся в России за период с 2011 по 2024 год. Эти сведения сопоставили с динамикой поисковых запросов в Google Trends.

Для исследования был собран корпус из 56 слов и выражений. С помощью методов машинного обучения их разделили на четыре смысловых блока: планирование беременности, течение беременности, подготовка к родам и универсальные запросы.

В работе использовалась модель SARIMA, которая позволяет учитывать динамику рождений с поправкой на сезонность.

На горизонте прогноза в один год стандартная модель показала среднюю ошибку 4,62 процента. В абсолютных значениях это составило около 4,6 тысячи на 100 тысяч рождений.

После добавления поисковых данных ошибка снизилась до 3,2 процента. Наиболее эффективным оказался блок запросов, связанных с подготовкой к родам.

Доцент факультета экономических наук НИУ ВШЭ Лилия Родионова пояснила, что запросы вроде «роддом» и «сумка в роддом» чаще делают женщины, которые уже знают о беременности и готовятся к рождению ребенка. Поэтому такие запросы могут служить надежным краткосрочным предиктором.

Исследователи также учли временные лаги. По их предположению, информацию о течении беременности пользователи ищут заранее, а запросы о сборах в роддом или дыхании при родах появляются ближе к моменту рождения ребенка.

Блок «планирование беременности» проявляется в модели примерно через 7,4 месяца, а блок «подготовка к родам» — через шесть месяцев.

При более длительном горизонте прогнозирования лучшие результаты показала модель, включавшая все блоки запросов и временные интервалы. При прогнозе на два года ошибка снизилась до 2,7 процента, а на три года — до 2,6 процента.

По словам Лилии Родионовой, модель проверяли на данных до декабря 2024 года. Этот период включал пандемию коронавируса и начало геополитической нестабильности. Высокая точность на контрольном периоде, по ее оценке, говорит о потенциале такого подхода.

Рекомендуем также:

  1. С 1 июля меняются правила для пенсионеров: что важно знать тем, кто прописан с детьми или внуками
  2. Кабачки по-корейски станут хитом стола: три рецепта для острой закуски на каждый день и на зиму
  3. Квитанции ЖКХ станут прозрачнее: что изменится с 1 июля и как это может снизить ваши расходы
  4. Жареная рыба больше не нужна: французский способ делает блюдо нежным, сочным и ароматным
  5. Не говорите лишнего на остановке: как правильно отвечать на вопрос инспектора «Куда едете?»

Есть жалобы? Канал для добрых казанцев, которых вывели из себя. Делитеcь тем, что вас разозлило: Злой Казанец