Астрономия

Что ИИ может узнать о Вселенной?

Искусственный интеллект и машинное обучение стали повсеместными, их приложения варьируются от анализа данных, кибербезопасности, фармацевтических разработок, создания музыки и художественной визуализации. В последние годы также появились большие языковые модели (LLM), которые добавили человеческое взаимодействие и письмо к длинному списку приложений. Сюда входит ChatGPT, LLM, который оказал огромное влияние с момента его появления менее двух лет назад. Это приложение вызвало серьезные дебаты (и противоречия) о потенциальном использовании и последствиях ИИ.

Астрономия также получила огромную выгоду: машинное обучение используется для сортировки огромных объемов данных в поисках признаков планетарных транзитов, корректировки атмосферных помех и поиска закономерностей в шуме. По мнению международной команды астрофизиков, это может быть только началом того, что ИИ может сделать для астрономии. В недавнем исследовании команда усовершенствовала модель генеративного предварительно обученного трансформатора (GPT), используя наблюдения за астрономическими объектами. В процессе они успешно продемонстрировали, что модели GPT могут эффективно помочь в научных исследованиях.

Исследование было проведено Международным центром релятивистской астрофизики (ICRANet), международным консорциумом, состоящим из исследователей из Международного центра релятивистской астрофизики (ICRA), Национального института астрофизики (INAF), Университета науки и технологий США. Китай, Институт физики высоких энергий Китайской академии наук (CAS-IHEP), Университет Падуи, Исфаханский технологический университет и Университет Ферреры. Препринт их статьи «Тест тонкой настройки GPT по астрофизическим данным» недавно появился в Интернете.

quasar 1024x607 - Что ИИ может узнать о Вселенной?
Иллюстрация активного квазара. Новое исследование показывает, что ИИ может их идентифицировать и классифицировать. Фото: ESO/М. Корнмессер

Как уже упоминалось, астрономы широко полагаются на алгоритмы машинного обучения для сортировки объемов данных, полученных современными телескопами и инструментами. Эта практика началась около десяти лет назад и с тех пор стремительно разрослась до такой степени, что ИИ был интегрирован во весь исследовательский процесс. Президент ICRA и ведущий автор исследования Ю Ван рассказал Universe Today по электронной почте:

«Астрономия всегда опиралась на данные, и астрономы являются одними из первых ученых, принявших и применяющих машинное обучение. Теперь машинное обучение интегрировано во весь процесс астрономических исследований, начиная с производства и управления наземными и космическими телескопами (например, оптимизация работы систем адаптивной оптики, улучшение инициирования конкретных действий (триггеров) спутников). при определенных условиях и т. д.), анализу данных (например, снижение шума, вменение данных, классификация, моделирование и т. д.), а также созданию и проверке теоретических моделей (например, тестирование модифицированной гравитации, ограничение уравнения состояния нейтрона звезды и т. д.)».

Анализ данных остается наиболее распространенным среди этих приложений, поскольку это самая простая область, в которой можно интегрировать машинное обучение. Традиционно десятки исследователей и сотни гражданских ученых анализировали объемы данных, полученных в ходе кампании наблюдения. Однако это непрактично в эпоху, когда современные телескопы ежедневно собирают терабайты данных. Сюда входят обзоры всего неба, такие как Обзор неба с очень большой решеткой (VLASS), а также многочисленные этапы, проводимые Слоановским цифровым обзором неба (SDSS).

На сегодняшний день LLM применяются в астрономических исследованиях лишь время от времени, учитывая, что они появились сравнительно недавно. Но, по мнению таких сторонников, как Ван, она оказала огромное влияние на общество и имеет нижний предел потенциала, эквивалентный «промышленной революции». Что касается верхнего предела, Ван предсказывает, что он может значительно варьироваться и, возможно, может привести к «просветлению или уничтожению» человечества. Однако, в отличие от промышленной революции, темпы изменений и интеграции ИИ гораздо быстрее, что поднимает вопросы о том, как далеко зайдет его внедрение.

Телескоп Sloan Digital Sky Survey выделяется на потрясающем фоне гор Сакраменто. 234 звезды из каталога Слоана, насчитывающего более 2,5 миллионов звезд, излучают необъяснимый импульсный сигнал. Изображение: SDSS, Fermilab Visual Media Services.
Телескоп Sloan Digital Sky Survey выделяется на захватывающем фоне гор Сакраменто. Фото: SDSS/Fermilab Visual Media Services.

По словам Вана, чтобы определить его потенциал для области астрономии, он и его коллеги взяли предварительно обученную модель GPT и настроили ее для выявления астрономических явлений:

«OpenAI предоставляет предварительно обученные модели, и мы провели тонкую настройку, которая включает в себя изменение некоторых параметров на основе исходной модели, что позволяет ей распознавать астрономические данные и рассчитывать результаты на основе этих данных. Это похоже на то, как OpenAI предоставляет нам студента бакалавриата, которого мы затем обучаем, чтобы он стал аспирантом по астрономии.

«Мы предоставили ограниченные данные со скромным разрешением и обучили GPT меньшее количество раз по сравнению с обычными моделями. Тем не менее, результаты впечатляют: точность составляет около 90%. Столь высокий уровень точности объясняется прочной основой GPT, которая уже понимает обработку данных и обладает возможностями логического вывода, а также коммуникативными навыками».

Чтобы уточнить свою модель, команда представила наблюдения различных астрономических явлений, полученные из различных каталогов. Сюда вошли 2000 выборок квазаров, галактик, звезд и квазаров с широкой линией поглощения (BAL) из SDSS (по 500 каждый). Они также объединили наблюдения коротких и длинных гамма-всплесков (GRB), галактик, звезд и моделирования черных дыр. В ходе испытаний их модель успешно классифицировала различные явления, различала типы квазаров, определяла их расстояние на основе красного смещения и измеряла вращение и наклон черных дыр.

«Эта работа, по крайней мере, демонстрирует, что LLM способны обрабатывать астрономические данные», — сказал Ван. «Более того, способность модели обрабатывать различные типы астрономических данных — это способность, которой не обладают другие специализированные модели. Мы надеемся, что LLM смогут интегрировать различные виды данных, а затем выявить общие основополагающие принципы, которые помогут нам понять мир. Конечно, это сложная задача, и астрономы не могут справиться с ней в одиночку».

11953 1024x400 - Что ИИ может узнать о Вселенной?
Обсерватория Веры Рубин в сумерках, апрель 2021 года. Ожидание было долгим, но обсерватория должна увидеть первый свет уже в этом году. Фото: Рубин Обс/NSF/AURA

Конечно, команда признает, что набор данных, с которым они экспериментировали, был очень мал по сравнению с данными, выдаваемыми современными обсерваториями. Это особенно верно в отношении объектов нового поколения, таких как обсерватория Веры К. Рубин, которая недавно получила камеру LSST, самую большую цифровую камеру в мире! Как только Рубин заработает, он проведет десятилетнее исследование пространства и времени (LSST), которое, как ожидается, будет давать 15 терабайт данных за ночь! По словам Вана, удовлетворение потребностей будущих кампаний потребует улучшений и сотрудничества между обсерваториями и профессиональными компаниями, занимающимися искусственным интеллектом.

Тем не менее, предрешено, что в ближайшем будущем будет больше заявок на получение степени LLM по астрономии. Это не только вероятное развитие событий, но и необходимое, учитывая огромные объемы данных, которые сегодня генерируют астрономические исследования. И поскольку в ближайшем будущем эта цифра, вероятно, будет расти в геометрической прогрессии, ИИ, скорее всего, станет незаменимым в этой области исследований.

Дальнейшее чтение: arXiv

Кнопка «Наверх»