Усвоение данных (data assimilation) – это область прикладной математики, целью которой является оценка состояния системы (атмосферы в нашем случае) по данным наблюдений с использованием модели её эволюции. Наш основной продукт – это единственная в России система оперативного усвоения данных метеорологических наблюдений, которую мы разработали и продолжаем развивать. Мы также внесли вклад в оперативную систему усвоения данных в Мировом океане.
Крупными мазками, в усвоении данных мы имеем два источника информации о текущем состоянии атмосферы – наблюдения и краткосрочный прогноз. Задача – оптимально их использовать с учётом неточности обоих источников информации, а также неполноты покрытия атмосферы данными наблюдений. Теоретические основы усвоения данных – это (а) вероятностные методы моделирования неопределённостей как прогноза, так и многообразных имеющихся наблюдений, и (б) статистические методы оценивания текущего состояния атмосферы по всей имеющейся информации. Специфика наших задач состоит в их огромной размерности (порядка 109) и необходимости учёта хаотического характера динамики атмосферы.
Направления исследований и разработок:
(1) Методология усвоения данных
Основное внимание в своей работе над методологией усвоения данных мы в последнее время уделяли оптимизации использования ансамблей прогнозов, см. SpatialStatistics2024.pdf, QuartJournal2019.pdf, PhysicaD2017.pdf.
Дальнейшее развитие будет определяться тем, насколько успешно мы сможем использовать возможности, предоставляемые современными методами машинного обучения - в первую очередь, нейросетями. Задача состоит в поиске и обосновании оптимального сочетания классических вероятностных подходов и методов нейросетевого моделирования. Наши первые попытки в этом направлении оказались неожиданно (для нас самих) успешными – см. SpatialStatistics2024.pdf.
(2) Усвоение данных спутниковых наблюдений
Наблюдения состояния атмосферы с искусственных спутников Земли весьма многочисленны (порядка 108 измерений в сутки) и потенциально весьма информативны, но сложны для усвоения. Причин этой сложности три. Во-первых, это их косвенный характер – измеряется, например, уходящее излучение системы «Земля-атмосфера» или задержка радиосигнала в атмосфере, а не нужные нам температура, ветер, влажность. Во-вторых, недостаток информации о вероятностной структуре неопределённости таких наблюдений. В-третьих, возможная нелинейность их связи с интересующими нас полями. Наши работы в этом направлении включают коррекцию ошибок наблюдений PureApplGeophys2017.pdf, исследование структуры ошибок спутниковых наблюдений MonWeaRev2011.pdf, см. также MeteoHydro2017.pdf, MeteoHydro2021.pdf, MeteoHydro2024.pdf.
Ведущиеся в настоящее время и дальнейшие разработки в этой области будут, по всей видимости, во многом опираться на методы машинного обучения. Особое внимание мы уделяли и будем уделять усвоению спутниковых наблюдений, производимых на российских метеорологических спутниках.
(3) Ансамблевое прогнозирование
Ансамбли прогнозов поставляют важную информацию об изменчивой точности прогноза (это необходимо для вероятностного прогнозирования) и его локальной пространственной структуре неопределённости (это требуется для эффективного усвоения данных). Генерация ансамблей, адекватно отражающих структуру неопределённости прогноза, является сложной и лишь частично решённой задачей. Наш вклад в эту область отражён в работах Tellus2023.pdf и MeteorolZ2017.pdf. Как и в методологии усвоения данных и в усвоении спутниковых наблюдений, здесь также основная задача на ближайшие годы - это интеграция устоявшихся подходов и новых методов, основанных на машинном обучении.
Исследования и разработки мы ведём с использованием Matlab, R, Python, TensorFlow, Torch. Оперативные технологии используют, преимущественно, Фортран, как наиболее быстрый язык, в среде Linux.
До недавних пор мы активно участвовали в международном сотрудничестве, в частности в рамках Европейского консорциума COSMO. Надеемся на возобновление такого сотрудничества в обозримом будущем.
Требования к кандидатам в сотрудники:
- Прикладная математика (анализ, линейная алгебра, теория вероятностей и статистика, случайные процессы, численные методы, машинное обучение);
- Желание разбираться в новых темах (методы оптимальной фильтрации, физика атмосферы, метеорологические наблюдения, быстрые вычисления на современных компьютерах и т.п.) и решать интересные прикладные задачи;
- Программирование;
- Английский язык;
- Гражданство РФ.
По всем вопросам можно писать зав. лабораторией Михаилу Давыдовичу Цырульникову - mik.tsyrulnikov@gmail.com.
10/01/2025