На Земле больше людей, чем мы думали? Спутники «потеряли» половину жителей сельских территорий

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Статья | Наука и космос

Современные управленческие решения — от распределения вакцин до планирования спасательных операций при наводнениях — опираются на большие данные. Считается, что спутниковый мониторинг и компьютерное моделирование позволили создать точную цифровую копию населения Земли. Однако новое исследование, опубликованное в журнале Nature Communications, вскрывает проблему: алгоритмы, которым доверяют ООН и правительства, систематически исключают из расчетов сотни миллионов жителей сельских территорий. Погрешность в этих зонах оказалась кратным занижением реальных показателей.

В эпоху цифровизации перепись населения, когда переписчики физически обходят каждый дом, кажется архаизмом. На смену ей пришли глобальные сеточные данные о населении. Это цифровые карты, разбивающие поверхность планеты на ячейки (обычно размером 1x1 км или 100x100 метров), где для каждого квадрата указано расчетное число жителей.

Невидимость сельского населения, вольная интерпретация
Автор: ИИ Copilot Designer//DALL·E 3

Эти базы данных (такие как WorldPop, LandScan, GHS-POP) формируются сложными алгоритмами. Программа анализирует спутниковые снимки, карты дорог, данные о ночном освещении Земли и накладывает их на доступную официальную статистику. Результатом становится подробная тепловая карта присутствия человека.

Именно эти карты используют международные организации для оценки рисков. Когда эпидемиологи рассчитывают распространение вируса, а климатологи прогнозируют число пострадавших от повышения уровня моря, они смотрят на эти сетки. Но группа ученых из Университета Аалто (Финляндия) доказала: в сельской местности эти карты дают ложную картину реальности.

Проблема верификации: как проверить непроверяемое

Главная сложность в оценке точности глобальных карт заключается в отсутствии надежного эталона для сравнения. В развитых странах и крупных городах статистика ведется тщательно. Но в сельских районах развивающихся стран — именно там, где проживает значительная часть населения Земли — переписи проводятся редко, нерегулярно или с большими ошибками.

Традиционные методы проверки работают по кругу: алгоритм калибруется на данных переписи, а затем его результаты сверяются с той же (часто устаревшей) переписью. Это не позволяет выявить системные ошибки моделирования.

Авторы нового исследования применили нестандартный подход к верификации. В качестве источника истинных данных они использовали отчеты о переселении людей при строительстве крупных плотин.

Строительство гидроэлектростанции и создание водохранилища требует полного освобождения территории. В отличие от обычной переписи, где кого-то могут пропустить, процедура переселения подразумевает строгий физический учет каждого жителя для выплаты компенсаций и организации переезда. Это делает данные о переселении одними из самых точных демографических сведений, доступных исследователям.

Ученые собрали базу данных по 307 проектам плотин в 35 странах мира. Они восстановили контуры затопленных территорий и сравнили официальное число реально выселенных людей с тем количеством, которое видели на этих территориях глобальные цифровые модели до момента затопления.

Пример расхождений в данных на карте провинции Туенкуанг (северный Вьетнам). Здесь показаны расчеты плотности населения за 2000 год по пяти разным системам: GWP (a), GRUMP (b), GHS-POP (c), LandScan (d) и WorldPop (e). Серый контур обозначает территорию будущего водохранилища Наханг. При его заполнении в 2008 году власти официально переселили из этой зоны 4000 человек. Однако, если взглянуть на представленные карты, большинство моделей (особенно GHS-POP и GWP) показывают этот район практически безлюдным, игнорируя тысячи реально живущих там людей.
Автор: Láng-Ritter, J., Keskinen, M. & Tenkanen, H. Источник: www.nature.com
Масштаб «невидимого» населения

Результаты анализа показали, что все пять ведущих мировых баз данных о населении (WorldPop, LandScan, GHS-POP, GRUMP, GWP) страдают от одной и той же системной ошибки. Они критически занижают плотность населения в сельской местности.

Диапазон ошибок варьируется:

  • WorldPop: занижение показателей на 53%.
  • GWP (Gridded Population of the World): занижение на 65%.
  • LandScan: занижение на 68%.
  • GHS-POP: занижение на 84%.

Эти цифры означают, что в среднем компьютерные модели теряют от половины до четырех пятых реального населения сельских районов. Например, модель GHS-POP, разработанная Объединенным исследовательским центром Еврокомиссии, показала наихудший результат, практически игнорируя существование людей в зонах с низкой плотностью застройки.

Важно отметить, что речь идет не о случайных отклонениях в обе стороны. Ошибка носит строго однонаправленный характер: алгоритмы всегда занижают численность, но практически никогда не завышают её.

Сравнение точности пяти систем моделирования. Каждая вертикальная группа из пяти точек соответствует одному из 33 сельских районов (данные за 2000 год). Пять точек — это пять разных прогнозов численности населения для одного и того же места. На обеих осях используется логарифмическая шкала (каждое крупное деление означает рост числа жителей в 10 раз). Чем ниже точка находится относительно диагональной линии, тем сильнее система занизила реальное число жителей.
Автор: Láng-Ritter, J., Keskinen, M. & Tenkanen, H. Источник: www.nature.com
Технические причины сбоя алгоритмов

Почему самые совершенные системы наблюдения за планетой не замечают миллионы людей? Исследователи выделяют три основные причины, связанные с ограничениями технологий дистанционного зондирования.

1. Оптическая избирательность материалов

Алгоритмы машинного обучения, распознающие здания на спутниковых снимках, обучаются преимущественно на примерах городской архитектуры. Нейросети отлично идентифицируют прямоугольные крыши из бетона, металла, шифера или черепицы. Они ищут высокий контраст и четкую геометрию.

Сельская застройка в развивающихся странах выглядит иначе. Дома часто строятся из природных материалов (глина, дерево), а крыши покрываются соломой или сухой растительностью. Для оптического сенсора спутника такая крыша спектрально не отличается от окружающей земли или сухой травы. Алгоритм воспринимает поселение как пустой ландшафт.

2. Эффект ночного освещения

Многие модели используют данные о ночной светимости Земли как ключевой маркер присутствия человека. Логика проста: где есть люди, там есть свет. В городах эта корреляция работает безупречно.

Однако в сельских районах беднейших стран уровень электрификации остается низким. Даже при наличии электричества жители могут экономить его, не включая освещение ночью. В результате огромные населенные территории на ночных снимках остаются абсолютно черными, и модель классифицирует их как необитаемые.

3. Проблема разрешения и растительности

Модели с высоким разрешением, которые пытаются выделять отдельные строения, сталкиваются с проблемой маскировки. В лесистых регионах или джунглях небольшие постройки часто скрыты под кронами деревьев. Спутник фиксирует только лес, и программное обеспечение не регистрирует наличие жилья под зеленым покровом.

Таким образом, глобальные карты фактически откалиброваны под урбанизированную среду. Они точно подсчитывают жителей городов, но при попытке применить те же критерии к сельской местности их эффективность падает.

Анализ точности данных по странам. Страны упорядочены по алфавиту согласно международным кодам (ISO3). Число под кодом каждой страны показывает общее количество изученных в ней сельских районов. Символ «x» означает, что в конкретном наборе данных отсутствовали сведения за нужные годы, что сделало расчет процента погрешности невозможным.
Автор: Láng-Ritter, J., Keskinen, M. & Tenkanen, H. Источник: www.nature.com
Последствия для глобальной политики и безопасности

Ошибочные данные лежат в основе стратегического планирования, и их использование приводит к неравномерному распределению ресурсов и росту рисков.

Управление в чрезвычайных ситуациях

При планировании реакции на стихийные бедствия (землетрясения, наводнения, ураганы) спасательные службы используют сеточные данные для оценки количества потенциальных жертв и расчета необходимой помощи. Если модель занижает население в зоне бедствия на 80%, спасатели отправят в этот район в пять раз меньше продовольствия, воды, медикаментов и палаток, чем требуется реально. Это прямая угроза жизни людей.

Здравоохранение и эпидемиология

Программы вакцинации и борьбы с инфекционными заболеваниями (например, малярией) также опираются на карты плотности населения. Невидимость сельских сообществ для алгоритмов означает, что эти группы систематически исключаются из медицинских планов. Врачи не заказывают нужное количество доз вакцин и не планируют логистику доставки в районы, которые на карте выглядят пустыми. Это создает условия для возникновения скрытых резервуаров инфекций.

Инфраструктурное развитие

Решения о строительстве школ, больниц, дорог и вышек сотовой связи часто принимаются на основе анализа экономической целесообразности, который базируется на плотности населения. Если данные показывают отсутствие людей, инвестиции в регион не приходят. Ошибка в данных консервирует бедность и изоляцию сельских территорий, лишая их доступа к базовым благам цивилизации.

Точность цифровых контуров. Проверка показала, что инструменты моделирования (GeoDAR polygons) систематически занижают реальную площадь водохранилищ. В среднем расчетная площадь оказывается на 18,8% меньше фактической.
Автор: Láng-Ritter, J., Keskinen, M. & Tenkanen, H. Источник: www.nature.com
Необходимость смены парадигмы

Авторы исследования подчеркивают: полный отказ от использования сеточных данных невозможен, так как зачастую это единственный доступный инструмент планирования. Однако необходимо пересмотреть отношение к их точности.

Пользователи данных — от чиновников ООН до локальных администраций — должны осознавать, что цифры по сельской местности являются не фактом, а крайне консервативной нижней оценкой.

Для решения проблемы требуется изменение методологии создания таких карт. Исключительно дистанционных методов (спутниковых снимков) недостаточно. Необходим переход к гибридным моделям, которые будут активно использовать данные полевых микро-переписей и альтернативные источники информации, не зависящие от наличия электрического освещения или типа кровельных материалов.

До тех пор, пока алгоритмы не научатся корректно распознавать нестандартную застройку и учитывать специфику сельского образа жизни, карта мира будет оставаться искаженной. И цена этого искажения — недополученная помощь и нереализованные права миллионов людей на развитие и безопасность.

Источник: Nature Communications

3 комментария

C
Ерунда, со спутникам нельзя узнать население сфтткаф дома. Есть куча пустующего жилья, лишнего. И в городах и в деревнях. У многих в наследство перешло и пустует. У нас даже лишнее жилье есть.
S
Очень советую ознакомится со значением слова Статистика :D
V
Данные со спутниковых снимков определяют не количество людей, а только вероятность их наличия. Причем алгоритм плохо различает признаки наличия людей вне городов: например, полевой выход воинской части будет проигнорирован. С одной стороны, это не критическая ошибка, ибо эти люди будут учтены при возвращении в казармы, а вот всякие хутора, землянки, мелкие поселения в лесах и горах так же игнорируются, тем самым занижая статистические данные учета населения.

Добавить комментарий

Сейчас на главной

Новости

Публикации

В 2030 году переопределят секунду: как оптические часы переписывают стандарты системы СИ

В 1967 году Международная система единиц (СИ) зафиксировала определение секунды, основанное на частоте сверхтонкого перехода в атоме цезия-133. Это решение обеспечило технологический фундамент для...

Вселенная началась со всплеска: почему кварк-глюонная плазма ведет себя как сверхтекучая жидкость

Коллаборация CMS, работающая на Большом адронном коллайдере (LHC), опубликовала результаты исследования, которое меняет подход к изучению материи ранней Вселенной. Физикам удалось зафиксировать,...

8 самых больших пустынь планеты — и ни одна не песчаная

  • Тематическая подборка
  • Оффтопик
Когда мы слышим слово «пустыня», большинство из нас представляет бескрайние золотые барханы, палящее солнце и верблюдов. Однако настоящее определение пустыни гораздо шире: это территория с очень...

Как создать польский аккаунт PlayStation в 2026 году

В этой статье вы узнаете, как с нуля создать польский аккаунт PlayStation. Перед тем как перейти к регистрации, я собрал несколько действительно важных моментов, которые лучше не упускать из виду....

10 смартфонов января 2026 года: «доступный флагман» от Realme и возвращение зеркальца для селфи

Пока Apple продолжает пожинать плоды от линейки iPhone 17, а Samsung только готовится представить линейку S26, китайские производители уже вовсю запускают конвейеры по производству новых...

Высветит скрытое за 20 метров: обзор УФ-фонаря Sofirn SR15 UV

Фонари со светодиодами существуют не только для создания видимого глазу света. Особое распространение в быту и для технологических процессов получил свет ультрафиолетового диапазона. Китайский...