Астрономия

Астрономы используют методы машинного обучения, чтобы найти квазары из ранней Вселенной в море данных

ИИ помогает искать космические драгоценности в море данных

Подробное изображение из «Обзора темной энергии», показывающее поле, охватываемое одним из отдельных детекторов камеры темной энергии. Изображение предоставлено: DES Collaboration/NOIRLab/NSF/AURA/M. Замани

Квазары — это чрезвычайно яркие ядра галактик, в которых газ и пыль, попадающие в центральную сверхмассивную черную дыру, излучают огромное количество света. Из-за своей исключительной яркости эти объекты видны на больших красных смещениях, то есть на больших расстояниях.

Более высокое красное смещение указывает не только на то, что квазар находится дальше, но и на то, что он находится еще дальше. Астрономы заинтересованы в изучении этих древних объектов, поскольку они содержат подсказки об эволюции нашей Вселенной в ее ранней молодости.

Кандидаты в квазары с большим красным смещением сначала идентифицируются по их цвету (они очень красные), а затем их необходимо подтвердить, рассматривая отдельные наблюдения их спектров. Однако некоторые кандидаты с высоким красным смещением могут быть ошибочно исключены из дальнейшего исследования, поскольку их внешний вид искажен гравитационным линзированием.

Это явление возникает, когда между нами и далеким объектом находится массивный объект, например галактика. Масса галактики искривляет пространство и действует как увеличительное стекло. Это искривляет путь света удаленного объекта, что приводит к искажению изображения объекта.

Хотя такое выравнивание может быть полезным — гравитационное линзирование увеличивает изображение квазара, делая его ярче и легче видимым — оно также может обманчиво изменить внешний вид квазара.

Мешающий свет звезд в промежуточной линзирующей галактике может сделать квазар более синим, а искривление пространства-времени может сделать его размытым или умноженным. Оба эффекта означают, что он, вероятно, исключен из числа кандидатов в квазары.

Поэтому группа астрономов под руководством Ксандера Бирна, астронома из Кембриджского университета и ведущего автора статьи, представляющей эти результаты в «Ежемесячных уведомлениях Королевского астрономического общества», намеревалась заново открыть линзированные квазары, которые были идентифицированы в предыдущих исследованиях. было упущено из виду.

Бирн намеревался найти эти пропавшие сокровища в обширном архиве данных Обследования темной энергии (DES). DES был выполнен с помощью камеры темной энергии, изготовленной Министерством энергетики, установленной на 4-метровом телескопе Виктора М. Бланко в Межамериканской обсерватории Серро Тололо Национального научного фонда США, в рамках программы NSF NOIRLab.

Поэтому задача заключалась в том, чтобы найти метод извлечения этих космических драгоценностей из огромного океана данных.

Полный набор данных DES содержит более 700 миллионов объектов. Бирн сократил этот архив, сравнив данные с изображениями других обзоров, чтобы отсеять маловероятных кандидатов, в том числе объекты, которые, вероятно, были коричневыми карликами, которые, хоть и полностью отличались от квазаров почти во всех отношениях, но на изображениях могли выглядеть удивительно похожими на них. В результате этого процесса был получен гораздо более управляемый набор данных из 7438 объектов.

Бирну нужно было максимально повысить эффективность поиска этих 7438 объектов, но он знал, что традиционные методы, скорее всего, не упустят квазары с высоким красным смещением, которые он искал. «Чтобы избежать преждевременного исключения квазаров с высоким красным смещением, мы применили контрастный алгоритм обучения, и он прекрасно сработал».

Контрастное обучение — это тип алгоритма искусственного интеллекта (ИИ), который использует последовательные решения для классификации каждой точки данных в группу на основе того, чем она является, а что нет. «Это может показаться волшебством, — сказал Бирн, — но алгоритм не использует больше информации, чем та, которая уже содержится в данных. Машинное обучение — это выяснение того, какие биты данных полезны».

Решение Бирна не полагаться на визуальную интерпретацию человеком привело его к рассмотрению неконтролируемого процесса ИИ, что означает, что процесс обучения контролируется самим алгоритмом, а не человеком.

Алгоритмы контролируемого машинного обучения основаны на так называемой «истине базового уровня», определенной программистом-человеком. Например, процесс может начаться с описания кошки и таких решений, как «Это/не изображение кошки. Это/не изображение черной кошки».

Напротив, неконтролируемые алгоритмы не полагаются на это первоначальное определение, определенное человеком, как на основу для своих решений. Вместо этого алгоритм сортирует каждую точку данных на основе сходства с другими точками данных в наборе. В этом случае алгоритм найдет сходство между изображениями нескольких животных и сгруппирует их как кошку, собаку, жирафа, пингвина и т. д.

Учитывая 7438 объектов Бирна, неконтролируемый алгоритм сортировал объекты по группам. Команда использовала географическую аналогию и назвала группы данных архипелагом. (Этот термин не подразумевает пространственной близости между объектами. Именно их свойства группируют их «близко» друг к другу, а не их положение на небе.)

Внутри этого архипелага небольшая «островная» группа объектов была сгруппирована как возможные кандидаты в квазары. Среди этих кандидатов четверо выделялись, как драгоценные камни из груды камешков.

Используя архивные данные Южного телескопа Джемини, половины Международной обсерватории Джемини, управляемой NSF NOIRLab, Бирн подтвердил, что три из четырех кандидатов на «остров квазара» действительно являются квазарами с большим красным смещением. И один из них, скорее всего, является космической добычей, которую надеялся найти Бирн, — квазаром с гравитационными линзами и высоким красным смещением. В настоящее время команда планирует дальнейшие снимки, чтобы подтвердить линзовидную природу квазара.

«Если открытие одного двояковыпуклого квазара в выборке из четырех целей подтвердится, вероятность успеха будет чрезвычайно высока! И если бы этот поиск проводился с использованием стандартных методов поиска, этот драгоценный камень, вероятно, остался бы скрытым».

Работа Бирна является ярким примером того, как ИИ может помочь астрономам искать во все больших объемах данных. Массивный приток астрономических данных ожидается в ближайшие годы благодаря продолжающемуся пятилетнему исследованию спектроскопического инструмента темной энергии, а также предстоящим исследованиям «Наследие» и «Пространство и время», проводимым обсерваторией Веры К. Рубин, начиная с 2025 года.

Информация от: NOIRLab NSF.

Кнопка «Наверх»