Новая технология машинного обучения позволяет предсказывать скольжение разломов при землетрясениях
Новая технология машинного обучения позволяет предсказывать скольжение разломов при землетрясениях в лаборатории и может стать ключом к прогнозированию скольжения разломов и потенциальных землетрясений в полевых условиях.
Исследование, проведенное группой специалистов Лос-Аламосской национальной лаборатории, основывается на их предыдущем успехе в использовании подходов, основанных на данных, которые работали при медленном скольжении в земле, но не сработали при крупномасштабных разломах с палочным скольжением, которые генерируют относительно мало данных, но вызывают сильные землетрясения.
"Очень большой промежуток времени между крупными землетрясениями ограничивает наборы данных, поскольку крупные разломы могут проскальзывать только раз в 50-100 лет или дольше, а значит, у сейсмологов было мало возможностей собрать огромное количество данных наблюдений, необходимых для машинного обучения", - сказал Пол Джонсон, геофизик из Лос-Аламоса и соавтор новой статьи "Прогнозирование проскальзывания разломов с помощью трансфертного обучения" в журнале Nature Communications.
По словам Джонсона, чтобы компенсировать ограниченность данных, команда обучила сверточную нейронную сеть на результатах численного моделирования лабораторных землетрясений, а также на небольшом наборе данных лабораторных экспериментов. Затем они смогли предсказать проскальзывание разломов на оставшихся без внимания лабораторных данных.
По словам Джонсона, это исследование стало первым применением трансфертного обучения для численного моделирования с целью прогнозирования проскальзывания разломов в лабораторных экспериментах, и никто не применял его для наблюдений на Земле.
С помощью трансфертного обучения исследователи могут обобщать одну модель на другую как способ преодоления нехватки данных. Этот подход позволил команде лаборатории на основе ранее проведенных экспериментов по машинному обучению на основе данных успешно предсказать скольжение при лабораторных землетрясениях и применить его к разреженным данным, полученным при моделировании.
В частности, в данном случае под трансферным обучением понимается обучение нейронной сети на одном типе данных - результатах моделирования - и применение ее к другому типу данных - экспериментальным данным - с дополнительным шагом обучения на небольшом подмножестве экспериментальных данных.
"Мы можем смоделировать сейсмогенный разлом на Земле, а затем включить данные с реального разлома в течение части цикла скольжения с помощью такого же перекрестного обучения. Цель состоит в том, чтобы предсказать движение разлома в сейсмогенном разломе, таком как Сан-Андреас, где данные ограничены из-за нечастых землетрясений"
В данной работе конволюционная нейронная сеть состояла из кодера, который сводил результаты моделирования к ключевым характеристикам, закодированным в скрытом, или латентном, пространстве модели между кодером и декодером. Эти особенности являются сутью входных данных, которые могут предсказать поведение разлома-скольжения.
Нейронная сеть декодирует упрощенные характеристики для оценки трения на разломе в любой момент времени. В ходе дальнейшего усовершенствования этого метода латентное пространство модели было дополнительно обучено на небольшом срезе экспериментальных данных. Вооружившись таким "перекрестным обучением", нейронная сеть точно предсказывала события, связанные с проскальзыванием по разлому, когда ей подавались невидимые данные из другого эксперимента.