За последние два с половиной года в космос были отправлены два телескопа нового поколения: НАСА Космический телескоп Джеймса Уэбба (JWST) и ЕКА Евклидовая обсерватория. Прежде чем десятилетие закончится, к ним присоединятся НАСА. Римский космический телескоп Нэнси Грейс (РСТ), Спектрофотометр для истории Вселенной, эпохи реионизации и исследователя льдов (SPHEREx) и ЕКА ПЛАНЕТНЫЕ ТРАНЗИТЫ И КОЛЕБАНИЯ ЗВЕЗД (ПЛАТОН) и АРИЭЛЬ телескопы. Эти обсерватории будут полагаться на передовую оптику и инструменты, которые помогут в поиске и описании экзопланет с конечной целью поиска планет, пригодных для жизни.
Наряду с продолжающимися миссиями, эти обсерватории будут собирать огромные объемы спектроскопических данных высокого разрешения. Для сортировки этих данных потребуются передовые методы машинного обучения для поиска признаков жизни и биологических процессов (так называемых биосигнатур). В недавней статье группа ученых из Института фундаментальной теории Университета Флориды (UF-IFL) рекомендовала в будущих исследованиях использовать машинное обучение для поиска аномалий в спектрах, которые могут выявить необычные химические признаки и неизвестные биосигнатуры.
Исследование проводилось совместно физиками и экспертами в области машинного обучения, в том числе доцентом Катей Матчевой, аспирантом-физиком Роем Т. Форестано, профессором Константином Т. Матчевым и доктором философии. студент Эйюп Б. Унлу. Препринт их статьи «Поиск новой химии в экзопланетных атмосферах с использованием машинного обучения для обнаружения аномалий» недавно появился в Интернете и рассматривается для публикации в журнале Астрофизический журнал. Как они объяснили, основная предпосылка их статьи заключается в том, что то, что представляет собой «жизнь», остается открытым вопросом для ученых, и было бы полезно расширить сферу наших поисков.
Прежде всего, важно признать, насколько далеко продвинулось изучение экзопланет за последние десятилетия. Первое подтвержденное обнаружение произошло только в 1992 году и состояло из двух Суперземли (Полтергейст и Фобитор) наблюдались вокруг пульсара (PSR B1257+12, он же Лич), расположенного на расстоянии 2300 световых лет от Земли. Хотя ученые твердо верили, что большинство звезд имеют свою собственную систему планет, до этого открытия у них не было неопровержимых доказательств. И до тех пор, пока Космический телескоп Кеплер запущенный в 2009 году, количество открытий экзопланет увеличивалось по несколько в год.
С тех пор в общей сложности было подтверждено 5496 экзопланет в 4096 системах, еще 9820 кандидатов ожидают подтверждения. В последние годы процесс перешел от процесса открытий к определению характеристик, где улучшенные инструменты и методы позволили астрономам напрямую анализировать атмосферу экзопланет, чтобы измерить их потенциальную обитаемость. Как объяснила профессор Матчева изданию Universe Today по электронной почте:
«Приборы становятся все лучше и лучше: лучшее спектральное разрешение, исключительный уровень соотношения сигнал/шум, более широкий диапазон длин волн. В дополнение к JWST, который предоставил ряд исключительных спектроскопических наблюдений нескольких экзопланет, ЕКА планирует создать специальный экзопланетный космический телескоп ARIEL, который будет наблюдать 1000 планет. Анализ этих данных займет у ученых еще долгое время».
По словам Матчевой, области изучения экзопланет и астробиологии невероятно интересны из-за огромного потенциала. В настоящее время эта область в основном занимается ограничением «обитаемости» посредством целевого поиска биосигнатур: свидетельств существования жизни и органических процессов. Используя Землю в качестве шаблона, единственную планету, на которой, как мы знаем, существует жизнь, наиболее востребованные биосигнатуры включают газообразный азот (N2), газообразный кислород (O2), диоксид углерода (CO2), метан (CH4), аммиак (NH3) и вода (H2О).
Это представляет собой «подход с легкими фруктами», когда ученые ищут жизнь, соответствующую земным стандартам. Это не случайность и не ленивый подход. Просто потому, что искать признаки жизни, совершенно нам незнакомые, чрезвычайно сложно. Но это также дает возможность рассмотреть возможности и расширить диапазон того, что мы знаем. «Знаем ли мы, что искать?» добавила Матчева. «Знаем ли мы, где искать? Узнали бы мы это, если бы увидели? Научное сообщество экзопланет всегда работает с учетом этих вопросов».
В своем исследовании Матчева и ее коллеги изучали, как можно обучить машинное обучение поиску «аномалий» в транзитных спектрах. Речь идет о кривых блеска, полученных при наблюдении далеких звезд за периодическими провалами светимости, что может указывать на наличие планеты, проходящей перед звездой относительно наблюдателя. Это известно как транзитная спектроскопия (или транзитный метод), которая остается наиболее эффективным и широко используемым методом обнаружения экзопланет. Помимо обнаружения, этот метод позволяет астрономам время от времени наблюдать свет, проходящий через атмосферу планеты.
При измерении с помощью спектрометра эти наблюдения дадут данные о химическом составе атмосферы, которые могут включать характерные биосигнатуры! В ближайшие годы сочетание телескопов следующего поколения и машинного обучения (МО) позволит астрономам более точно определить потенциальную обитаемость экзопланет. «Мы считаем, что методы машинного обучения в астрофизике могут изменить правила игры в том, как мы обрабатываем данные с точки зрения скорости, объема и методологии», — сказала Матчева. «И мы видим это во всех областях науки».
Для своих целей Матчева и ее команда использовали два популярных метода машинного обучения для обнаружения аномалий — локальный коэффициент выбросов (LOF) и одноклассовую машину опорных векторов (OCSVM) для анализа большой общедоступной базы данных синтетических спектров. Эта база данных была разработана научной группой ESA ARIEL в преддверии миссии (запуск запланирован на 2029 год) и содержит более 100 000 сгенерированных компьютером спектральных сигналов экзопланет. Команда также использовала кривые рабочих характеристик приемника (ROC) для количественной оценки и сравнения производительности двух методов машинного обучения. Как рассказала Матчева, процесс и результаты были захватывающими:
«Спектры рассчитываются с использованием существующих моделей, предполагая, что атмосфера каждой планеты представляет собой смесь 5 различных газов в разных пропорциях. В качестве эксперимента мы обработали один из поглотителей (например, H2О) как «таинственный» поглотитель. Мы обучили алгоритм ML на подмножестве данных, которому не хватает H2О, и проверил, правильно ли он помечает планеты с водой как аномальные».
«Мы повторили эксперимент для четырех газов. Мы использовали как LOF, так и OCSVM. Оба метода проделали выдающуюся работу по обнаружению аномальных планет при отсутствии шума или при очень малом шуме (~ 10 частей на миллион), даже при очень небольших количествах «загадочного» газа. Неудивительно, что модель ML начинает совершать ошибки, когда уровень шума увеличивается слишком сильно».
Как указала Матчева, их статья продемонстрировала, что методы LOF и OCSVM очень надежны даже в присутствии шума сигнала. Эти результаты дают представление о том, что может быть возможно в ближайшем будущем, когда буквально тысячи экзопланет можно будет быстро и систематически анализировать с использованием методов ML для выявления аномальных планет для последующих исследований. Эти исследования, вероятно, будут очень познавательными, учитывая, что несоответствия между теоретическими моделями и наблюдениями часто являются причиной самых интересных открытий.
«Хотя поиск биосигнатур не был основной целью этой статьи, это очень интересный результат, и мы очень воодушевлены потенциалом этого метода», — сказала Матчева. «Поиск признаков жизни во Вселенной больше похож на поиск иголки в стоге сена, чем на поиск дымящегося пистолета. На самом деле это еще сложнее, потому что мы не знаем, как выглядит игла. Методы обнаружения новизны созданы именно для этого: редкие события [where] мы не знаем, как они выглядят, пахнут и звучат».
Как отмечалось ранее, поиск внеземной жизни – и, по сути, поиск внеземного разума (SETI) – можно резюмировать как поиск жизни, «какой мы ее знаем». Но если жизнь очень редка во Вселенной или очень «экзотична» в природе (это означает, что она может возникнуть из самых разных химических веществ и условий), тогда имеет смысл закинуть более широкую сеть. В конце концов, если наша система взглядов является препятствием для наших усилий в области астробиологии (можно, конечно, и с этим поспорить), ее расширение может стать разницей между поиском доказательств того, что мы не одиноки, и оставлением вопроса без ответа для другого поколения. Сказала Матчева:
«Сообщество астробиологов уже давно работает над определением понятия «жизнь», но мы понятия не имеем, как на самом деле выглядят инопланетяне и как они будут взаимодействовать с окружающей средой. На нас влияет наш человеческий опыт, и нынешняя стратегия заключается в поиске жизни в «обитаемой зоне», которая по определению дружелюбна к человеку (или земной жизни). Так как же искать что-то, если не знаешь, как оно выглядит? Именно здесь на помощь приходят методы обнаружения новизны машинного обучения — они могут отмечать точки данных, которые несовместимы с данными обучения, то есть не согласуются с текущими теоретическими моделями. Так что в этом смысле наш метод ищет жизнь «такой, какой мы ее не знаем».
Как сказал Айзек Азимов: «Самая волнующая фраза, которую можно услышать в науке, которая предвещает новые открытия, — это не «Эврика!» но «Это смешно».