Ми вже знаємо, що Великий адронний колайдер (LHC) буде найбільшим, найдорожчим фізичним експериментом, який коли-небудь проводив людство. Збігання релятивістських частинок при енергіях, які раніше були неможливо уявити (до позначки 14 ТеВ до кінця десятиліття), генерує мільйони частинок (відомих і поки не з'ясованих), які потрібно відстежувати та характеризувати величезні детектори частинок. Цей історичний експеримент потребує масштабних зусиль щодо збору та зберігання даних, щоб переписати правила обробки даних. Кожні п’ять секунд зіткнення LHC генерує еквівалент даних, що вартує DVD, тобто швидкість отримання даних - один гігабайт в секунду. Для цього, середній побутовий комп'ютер із дуже хорошим зв’язком може завантажувати дані зі швидкістю один або два мегабайти в секунду (якщо вам дуже пощастило! Я отримую 500 кілобайт / секунду). Отже, інженери LHC розробили новий вид обробки даних, який може зберігати та поширювати петабайт (мільйонів гігабайт) даних для співробітників LHC по всьому світу (без застарілого та сірого під час очікування завантаження).
У 1990 році Європейська організація ядерних досліджень (CERN) здійснила революцію в тому, як ми живемо. Попередній рік Тім Бернерс-Лі, фізик CERN, написав пропозицію щодо електронного управління інформацією. Він висунув ідею, що інформацію можна легко передавати через Інтернет, використовуючи щось, що називається "гіпертекст". З плином часу Бернерс-Лі та його співавтор Роберт Кайліау, системний інженер також у CERN, зібрали єдину інформаційну мережу, щоб допомогти вченим CERN співпрацювати та обмінюватися інформацією зі своїх персональних комп'ютерів, не потребуючи їх збереження на громіздких пристроях зберігання даних. Гіпертекст дозволив користувачам переглядати та ділитися текстом через веб-сторінки, використовуючи гіперпосилання. Тоді Бернерс-Лі продовжив створення редактора браузерів, і незабаром зрозумів, що ця нова форма спілкування може поділитися величезною кількістю людей. До травня 1990 р. Вчені ЦЕРН назвали цю нову мережу спільної роботи Всесвітня мережа. Насправді, CERN відповідав за перший у світі веб-сайт: http://info.cern.ch/, а ранній приклад того, як виглядав цей сайт, можна знайти на веб-сайті Всесвітнього консорціуму.
Таким чином, CERN не дивно для управління даними через Інтернет, але абсолютно новий LHC потребує спеціального лікування. Як підкреслив Девід Бадер, виконавчий директор обчислювальної техніки з високою ефективністю в Інституті технологій Джорджії, поточна пропускна здатність, дозволена Інтернетом, є величезним вузьким місцем, що робить інші форми обміну даними більш бажаними. "Якщо я дивлюся на LHC та те, що він робить на майбутнє, єдине, що Мережа не змогла зробити, - це керувати феноменальним багатством даних", - сказав він, маючи на увазі, що легше зберігати великі набори даних на терабайтних жорстких дисках, а потім надсилати їх на посаду співпрацівників. Хоча CERN звертався до спільного характеру обміну даними у всесвітній павутині, дані, які LHC буде генерувати, легко перевантажать малі наявні на сьогодні пропускну здатність.
Саме тому була розроблена обчислювальна сітка LHC. Сітка обробляє велике виробництво набору даних LHC в ярусах, перший (Рівень 0) знаходиться на місці в місті CERN поблизу Женеви, Швейцарія. Рівень 0 складається з величезної паралельної комп'ютерної мережі, що містить 100 000 вдосконалених процесорів, створених для негайного зберігання та управління вихідними даними (1s та 0s двійкового коду), вивантаженими LHC. На цьому етапі варто зазначити, що не всі зіткнення частинок будуть виявлені датчиками, лише дуже мала частка може бути захоплена. Хоча може бути виявлено лише порівняно невелика кількість частинок, це все ж перетворюється на величезний вихід.
Рівень 0 управляє частинами даних, що виводяться, підриваючи їх через виділені волоконно-оптичні лінії 10 гігабіт на секунду до 11 Рівень 1 сайти по всій Північній Америці, Азії та Європі. Це дозволяє таким співробітникам, як релятивістський важкий іонний колайдер (RHIC) в Національній лабораторії Брукхейвена в Нью-Йорку, аналізувати дані експерименту ALICE, порівнюючи результати результатів зіткнення свинцевих іонів LHC з власними результатами зіткнення важких іонів.
Із міжнародних комп’ютерів першого рівня набори даних упаковуються та надсилаються до 140 2 рівень комп'ютерні мережі, розташовані в університетах, лабораторіях та приватних компаніях по всьому світу. Саме в цей час вчені отримають доступ до наборів даних для здійснення перетворення з необробленого двійкового коду в корисну інформацію про енергію частинок і траєкторії.
Система ярусів - це все добре і добре, але вона не працюватиме без високоефективного типу програмного забезпечення, що називається "середнє програмне забезпечення". При спробі отримати доступ до даних, користувач може захотіти інформацію, яка поширюється через петабайти даних на різних серверах у різних форматах. Платформа середнього ПЗ з відкритим кодом Глобус буде покладено величезну відповідальність за безперебійний збір необхідної інформації, ніби ця інформація вже сидить усередині комп'ютера дослідника.
Саме ця комбінація багаторівневої системи, швидкого зв’язку та геніального програмного забезпечення може бути розширена за межами проекту LHC. У світі, де все стає «на вимогу», подібні технології можуть зробити Інтернет прозорий кінцевому користувачеві. Був би миттєвий доступ до всього, від даних, отриманих експериментами з іншого боку планети, до перегляду фільмів високої чіткості, не чекаючи панелі прогресу завантаження. Подібно до винаходу HTML Бернерса Лі, LHC Computing Grid може зробити революцію в застосуванні Інтернету.
Джерела: Scientific American, CERN