Обсерватория Веры Рубин (ВРО) – нечто особенное среди телескопов. Он не создан для лучшего углового разрешения и повышенной разрешающей способности, как Европейский Чрезвычайно Большой Телескоп или Гигантский Магелланов Телескоп. Он построен на базе массивной цифровой камеры и будет многократно снимать широкие и глубокие виды всего неба, а не фокусироваться на отдельных объектах.
Постоянно осматривая небо, VRO обнаружит любые изменения или астрономические переходные процессы. Астрономы называют этот тип наблюдения астрономией временной области.
Когда VRO обнаруживает что-то переходное в ночном небе, он автоматически отправляет оповещения другим обсерваториям, которые будут детально наблюдать за переходным объектом. Это может быть далекий взрыв сверхновой, опасный астероид здесь, во внутренней Солнечной системе, или что-то еще, что зафиксирует изменение на небе. Задача ВРО — обнаружить это и затем передать эстафету другим обсерваториям.
Но выдача предупреждений другим телескопам — это лишь одна из задач VRO. Основная программа наблюдений VRO называется «Наследие обзора пространства и времени» (LSST). LSST будет каталогизировать все доступное ночное небо, делая снимки его каждую ночь в течение десяти лет с помощью своей огромной 3,2-гигапиксельной камеры. Каждые пять секунд камера будет указывать на другую часть неба и делать снимок с выдержкой 15 секунд.
Эти десятилетние усилия позволят собрать огромное количество данных. Для этого понадобится 200 000 изображений в год, что составит 1,28 петабайта данных. Данных будет так много, что проект VRO включает в себя новый конвейер данных, идущий со своей площадки на севере Чили обратно в США. Люди не смогут обработать все данные, поэтому машинное обучение будет играть большую роль в их обработке и поиске того, что скрыто.
Авторы новой исследовательской работы разработали для обсерватории новый способ обнаружения аномалий в огромном объеме генерируемых ею данных. Статья называется «Странное и чудесное в нашей Солнечной системе: поиск счастливой случайности в изучении наследия пространства и времени». Оно было принято к публикации в «Астрономическом журнале», а ведущим автором является Брайан Роджерс с факультета физики Оксфордского университета.
Список объектов и событий, которые обнаружит VRO, содержит все, что мы ожидаем увидеть. Наряду со сверхновыми и астероидами, VRO может обнаружить неуловимую Планету 9, которая может скрываться в дальних уголках нашей Солнечной системы. Он также увидит килоновые, гамма-всплески, переменные квазары, АЯГ и даже межзвездные объекты (ISO), такие как Оумаумуа и Борисов.
Но чтобы найти эти объекты во всех этих данных, требуется машинное обучение. Авторы разработали тип нейронной сети для обработки данных. Нейронная сеть — это тип искусственного интеллекта, который имитирует работу человеческого мозга. В нем используется многоуровневая сеть отдельных узлов или нейронов, которая чем-то напоминает человеческий мозг.
Авторы разработали особый тип нейронной сети, называемый автоэнкодером. Автоэнкодеры могут выполнять очень полезную функцию. Они берут данные, кодируют или сжимают их, а затем восстанавливают данные обратно в свою версию. Делая это, автоэнкодер может «узнать», какие аспекты данных актуальны, а какие являются шумом. Тогда шум можно будет отбросить.
В своей статье исследователи пишут: «Мы представляем новый метод обнаружения аномалий в данных объектов Солнечной системы в рамках подготовки к «Наследию исследования пространства и времени». Мы обучаем глубокий автокодировщик обнаружению аномалий и используем изученное скрытое пространство для поиска других интересных объектов».
Автокодировщик авторов основан на поиске аномалий, таких как межзвездные объекты (ISO). Если автокодировщик может их идентифицировать, это означает, что огромный объем данных LSST становится более управляемым. «Мы демонстрируем эффективность подхода автокодировщика, находя интересные примеры, такие как межзвездные объекты, и показываем, что с помощью автокодировщика можно найти дополнительные примеры интересных классов», — объясняют они.
Они протестировали свой автоэнкодер на моделировании данных за 10 лет, которые будет собирать LSST. По мере поступления реальных данных от LSST они намерены продолжать тестирование своего автокодировщика и улучшать его. «Между тем, эта работа не пытается количественно оценить вероятный выход необычных объектов, а просто демонстрирует, что мы можем найти их в большом обзоре того типа, который будет производить LSST», — пишут они.
Большую роль в работе играют то, что авторы называют «потерями при реконструкции», а также аномалии.
Работая с известными смоделированными данными, исследователи измерили точность автоэнкодера. Они просто сравнивали выходной сигнал с входным. Потери при реконструкции являются мерой того, насколько точен автоэнкодер, и их можно определить количественно.
Аномалии — это необычные объекты, которые выделяются, как и ISO. На рисунке выше авторы определили десять крупнейших аномалий, ранжированных по потерям при реконструкции. Для каждого из этих десяти они определили двадцать ближайших соседей. Это не соседи по Солнечной системе; они соседи в скрытом пространстве.
Окрестности объектов связаны аспектами данных. Это районы данных. Например, одно из окрестностей основано на измеренных величинах. Другой основан на эксцентриситете орбиты, а третий — на объектах-выбросах в окрестностях Юпитера.
Астрономия меняется. Наши обсерватории и телескопы становятся настолько мощными и автоматизированными, что создают огромную вселенную данных. Астрономическое сообщество не в силах справиться с данными без автоматизированной помощи. Обучая автокодировщик обнаруживать аномалии, он может анализировать данные LSST и отмечать аномалии.
Авторы сразу отмечают, что автоэнкодер не является полностью автоматическим. Ему все еще нужна человеческая помощь.
«После оценки недостатков автономных неконтролируемых методов мы продемонстрировали силу обратной связи между людьми при обнаружении аномалий с использованием контролируемого подхода», — пишут они. «Использование обратной связи с людьми может повысить актуальность, точность и точность системы обнаружения аномалий».
Не будет преувеличением сказать, что обсерватория Веры Рубин изменит наше понимание нашей Солнечной системы и вещей, лежащих далеко за ее пределами. Его первый запуск запланирован на январь 2025 года. Для тестирования и ввода в эксплуатацию всего оборудования потребуется некоторое время, но через некоторое время после этого данные начнут поступать.
Как только это произойдет, остановить это будет уже невозможно, и астрономам потребуются такие инструменты, как автоэнкодеры, которые помогут им найти аномалии.
«Отдавая нужные аномалии в правильные руки, мы можем умножить ценность данных, собранных LSST, и ускорить потенциальные последующие исследования наиболее интересных объектов, обнаруженных в ходе исследования», — пишут исследователи в своей работе. «Мы продемонстрировали, что глубокие автоэнкодеры могут выполнять эту роль в качестве модели неконтролируемого обнаружения, работая в масштабе LSST, и что они могут обеспечить эффективное обнаружение аномалий для наиболее интересных объектов Солнечной системы».