Первоначальные
измерения Цвикки и многие другие, сделанные после, страдают от ошибок, которые
смещают массу в большую или меньшую сторону. Теперь, используя инструменты
машинного обучения, команда под руководством физиков из Университета
Карнеги-Меллона разработала метод глубокого обучения, который точно оценивает
массу скопления Волосы Вероники (Abell 1656) и эффективно устраняет источники
ошибок.
«Люди делали
массовые оценки скопления Волосы Вероники в течение многих-многих лет. Но,
показав, что наши методы машинного обучения согласуются с этими предыдущими
массовыми оценками, мы укрепляем доверие к новым, очень мощным методам, которые
пользуются популярностью в этой области космологии прямо сейчас», — сказал
Мэтью Хо, аспирант пятого курса Центра космологии Мак-Вильямса физического
факультета и член Института планирования искусственного интеллекта NSF
Карнеги-Меллона для физики будущего.
Методы машинного
обучения успешно используются в самых разных областях для поиска
закономерностей в сложных данных, но в космологических исследованиях они
закрепились лишь в последнее десятилетие. Для некоторых исследователей в этой
области такие методы вызывают серьезную озабоченность: поскольку сложно понять
внутреннюю работу сложной модели машинного обучения, можно ли им доверять в
том, для чего они предназначены? Хо и его коллеги решили устранить эти сомнения
в последнем исследовании, опубликованном в журнале Nature Astronomy.
Чтобы рассчитать массу скопления Волосы Вероники, Цвикки и другие использовали измерение динамической массы, в ходе которого они изучали движение или скорость объектов, вращающихся вокруг скопления, а затем использовали понимание гравитации для определения массы скопления. Но это измерение подвержено множеству ошибок. Скопления галактик существуют как узлы в огромной паутине материи, распределенной по всей Вселенной, и они постоянно сталкиваются и сливаются друг с другом, что искажает профиль скорости составляющих галактик. И поскольку астрономы наблюдают за скоплением с большого расстояния, между ними есть много других вещей, которые могут выглядеть и вести себя так, как будто являются частью скопления галактик, что может привести к искажению измерения массы. По словам Хо, недавние исследования достигли прогресса в количественной оценке и учете последствий этих ошибок, но методы, основанные на машинном обучении, предлагают инновационный подход, основанный на данных.
«Наш метод
глубокого обучения изучает на основе реальных данных, какие измерения являются
полезными, а какие нет», — сказал Хо, добавив, что их метод устраняет ошибки
из-за взаимодействующих галактик (эффекты отбора) и учитывает различные формы
галактик (физические эффекты). «Использование этих методов, основанных на данных,
делает наши прогнозы более точными и автоматизированными».
«Один из основных
недостатков стандартных подходов к машинному обучению заключается в том, что
они обычно дают результаты без каких-либо неопределенностей», — добавил доцент
физики Хай Трек, советник Хо. «Наш метод включает надежную байесовскую
статистику, которая позволяет количественно оценить неопределенность наших
результатов».
Хо и его коллеги
разработали свой метод, настроив известный инструмент машинного обучения,
называемый сверточной нейронной сетью, который представляет собой тип алгоритма
глубокого обучения, используемого для распознавания изображений. Исследователи
обучили модель, передав ей данные космологического моделирования Вселенной.
Модель училась, глядя на наблюдаемые характеристики тысяч скоплений галактик,
масса которых уже известна. После глубокого анализа того, как модель
обрабатывает данные моделирования, Хо применил ее к реальной системе —
скоплению Волосы Вероники, чья истинная масса неизвестна. Метод Хо рассчитал
оценку массы, которая согласуется с большинством оценок массы, сделанных с
1980-х годов. Это первый раз, когда эта конкретная методология машинного
обучения была применена к системе наблюдения.
«Чтобы повысить
надежность моделей машинного обучения, важно проверить прогнозы модели на хорошо
изученных системах», — сказал Хо. «В настоящее время мы проводим более
тщательную и всестороннюю проверку нашего метода. Многообещающие результаты —
это важный шаг к применению нашего метода на новых, неизученных данных».
Подобные модели
будут иметь решающее значение в будущем, особенно когда крупномасштабные
спектроскопические исследования, такие как Спектроскопический инструмент темной
энергии, Обсерватория Веры С. Рубин и Евклид, начнут публиковать огромные
объемы данных, которые они собирают о небе.
«Скоро у нас
будет поток данных размером в петабайты, — пояснил Хо. «Это огромно. Люди не
могут проанализировать это вручную. Поскольку мы работаем над созданием
моделей, которые могут быть надежными оценщиками таких вещей, как масса, при
этом уменьшая источники ошибок, еще одним важным аспектом стало то, что они
должны быть вычислительно эффективными, если мы собираемся обрабатывать этот
огромный поток данных из этих новых опросов. И это именно то, что мы пытаемся
решить — использовать машинное обучение, чтобы улучшить наш анализ и сделать
его быстрее».
Комментарии: