З початку 20 століття вчені та фізики були обтяжені поясненням того, як і чому, як видається, Всесвіт розширюється зі швидкістю. Окрім відповідальності за космічне прискорення, ця енергія також вважає, що вона становить 68,3% від невидимої маси Всесвіту.
Так само, як і темна матерія, існування цієї невидимої сили базується на спостережуваних явищах і тому, що це, мабуть, відповідає нашим сучасним моделям космології, а не прямим свідченням. Натомість вчені повинні спиратися на непрямі спостереження, спостерігаючи за тим, як швидко розширюються космічні об'єкти (зокрема, супернові типу Ia) у міру розширення Всесвіту.
Цей процес був би вкрай стомлюючим для науковців - як і тих, хто працює для дослідження темної енергії (DES) - якби не нові алгоритми, розроблені спільно дослідниками Національної лабораторії Лоуренса Берклі та UC Berkeley.
"Наш алгоритм може класифікувати виявлення кандидата на сверхнову приблизно за 0,01 секунди, тоді як досвідчений сканер людини може зайняти кілька секунд", - сказав Денні Голдштейн, аспірант Університету Берклі, який розробив код для автоматизації процесу виявлення наднової на зображеннях DES .
В даний час у своєму другому сезоні DES фотографує нічні фотографії Південного неба за допомогою DECam - 570-мегапіксельної камери, встановленої на телескопі Віктора М. Бланко в Міжамериканській обсерваторії Cerro Tololo (CTIO) в чилійських Андах. Щовечора камера генерує від 100 гігабайт (ГБ) та 1 Терабайт (ТБ) даних зображень, які надсилаються до Національного центру прикладних обчислювальних програм (NCSA) та Міністерства охорони здоров'я Фермілаба в штаті Іллінойс для початкової обробки та архівації.
Програми розпізнавання об'єктів, розроблені в Національному науково-обчислювальному центрі енергетичних досліджень (NERSC) та реалізовані в NCSA, потім розчісують зображення для пошуку можливих виявлень наднових типів Ia. Ці потужні вибухи відбуваються в бінарних системах зірок, де одна зірка - це білий карлик, який накопичує матеріал від зірки-супутника до тих пір, поки не досягне критичної маси і не вибухне в наднові типу Іа.
"Ці вибухи чудові тим, що їх можна використовувати як космічні індикатори відстані з точністю до 3-10 відсотків", - говорить Голдштейн.
Відстань важлива, оскільки чим далі об'єкт розташований у просторі, тим далі він знаходиться у часі. Відстежуючи наднорки типу Ia на різних відстанях, дослідники можуть виміряти космічне розширення протягом усієї історії Всесвіту. Це дозволяє їм обмежувати швидкість розширення Всесвіту і, можливо, навіть надає інші підказки щодо природи темної енергії.
"Науково, це дійсно хвилюючий час, тому що кілька груп у всьому світі намагаються точно виміряти наднови типу Іа, щоб обмежити і зрозуміти темну енергію, яка рухає прискореним розширенням Всесвіту", - говорить Голдштейн, який також студент науковий співробітник Центру обчислювальної космології Лабораторії Берклі (C3).
DES починає пошук вибухів типу Ia, розкриваючи зміни на нічному небі, саме там надходить трубопровід віднімання зображень, розроблений та впроваджений дослідниками робочої групи DES Supernova. Трубопровід віднімає зображення, що містять відомі космічні об'єкти, з нових зображень які піддаються CTIO щоночі.
Щовечора трубопровід виробляє від 10 000 до декількох сотень тисяч виявлення кандидатів наднових, які потрібно перевірити.
«Історично підготовлені астрономи годинами сиділи за комп’ютером, дивилися на ці крапки і пропонували думки про те, чи мають вони особливості наднової, чи вони спричинені хибними ефектами, які маскуються в дані наднових. Цей процес здається простим, поки ви не зрозумієте, що кількість кандидатів, яких потрібно класифікувати щовечора, непомірно велика, і лише кожен з кількох сотень - справжня супернова будь-якого типу », - каже Голдштейн. «Цей процес є надзвичайно виснажливим та трудомістким. Він також чинить великий тиск на робочу групу наднових для швидкої обробки та сканування даних, що є важкою роботою ».
Щоб спростити завдання перевірки кандидатів, Гольдштейн розробив код, який використовує техніку машинного навчання «Випадковий ліс» для автоматичного ветеринального виявлення кандидатів на наднових для оптимізації їх для DES. Методика використовує ансамбль дерев рішень, щоб автоматично задавати типи питань, які астрономи зазвичай враховують при класифікації кандидатів наднових.
В кінці процесу кожному виявленню кандидата присвоюється оцінка на основі частки дерев рішень, які вважали, що вони мають характеристики виявлення наднової. Чим ближче бал до класифікації, тим сильніше кандидат. Гольдштейн зазначає, що в попередніх тестах трубопровід класифікації досяг загальної точності 96 відсотків.
"Коли ви віднімаєте самостійно, ви отримуєте занадто багато" помилкових позитивних результатів "- інструментальних або програмних артефактів, які виявляються потенційними кандидатами у сверхнову людину - щоб люди просіли їх", - говорить Роллін Томас з "C3" Берклі Лабораторії, який був співробітником Голдштейна.
Він зазначає, що за допомогою класифікатора дослідники можуть швидко та точно відстежувати артефакти від кандидатів на наднові. "Це означає, що замість того, щоб 20 вчених з робочої групи наднової постійно просіювати тисячі кандидатів щовечора, ви можете просто призначити одну людину, щоб подивитися, можливо, кілька сотень сильних кандидатів", - каже Томас. "Це суттєво прискорює наш робочий процес і дозволяє нам ідентифікувати наднові в режимі реального часу, що має вирішальне значення для проведення подальших спостережень".
"Використовуючи близько 60 ядер на суперкомп'ютері, ми можемо класифікувати 200 000 детектувань за 20 хвилин, включаючи час для взаємодії з базою даних та вилучення функцій" каже Голдштейн.
Гольдштейн та Томас зазначають, що наступним кроком у цій роботі є додавання до рівня машинного навчання машинобудування для підвищення точності класифікації. Цей додатковий шар повинен враховувати класифікацію об'єкта в попередніх спостереженнях, оскільки він визначає ймовірність того, що кандидат є "реальним". В даний час дослідники та їхні колеги працюють над різними підходами для досягнення цієї можливості.