Мегасайенс, преобразующий мысль

Возможность получения большого массива экспериментальных данных и сверхбыстрая их обработка, — ключ к созданию новейших технологий и получению современных продуктов, соответствующих статусу четвертой промышленной революции. И, конечно же, иные возможности в медицине, фармакологии, генетике, индустрии — во всём, что касается качества жизни современного человека. Эту важную тему обсудили на круглом столе прошедшего в Новосибирске Международного форума «Open Bio» «Открытая меганаука: суперкомпьютеры и генераторы больших научных данных — СКИФ и «Центр генетических технологий»

Под невыносимым прессом массива данных

Доктор биологических наук, профессор, академик РАН, научный руководитель Института цитологии и генетики СО РАН Николай Колчанов отмечает: проблемы накопления больших генетических данных возникли в связи с разработкой высокоэффективных методов секвенирования, то есть масштабного считывания генетического кода с целью обнаружения в нем мутаций. В результате в генетике произошел своего рода информационный взрыв в накоплении больших геномных данных.
В соответствии с прогнозом, к 2025 году суммарный объем геномной информации в несколько раз превысит объем данных, которые будут накоплены в астрономии и социальных сетях, Твиттер и Ютуб. Одновременно обращает на себя внимание и то, что с 2001 года по настоящее время произошло выраженное (примерно на пять порядков) снижение стоимости секвенирования геномной ДНК, как это показано для генома человека — от 10 миллионов до одной тысячи долларов США.
Нужно пояснить, что секвенирование — это общее название методов, которые позволяют установить последовательность нуклеотидов в молекуле ДНК. В настоящее время нет ни одного метода секвенирования, который бы работал для молекулы ДНК целиком. А поэтому сначала готовится большое число небольших участков ДНК (клонируется молекула ДНК многократно и «разрезается» в случайных местах), а потом «читается» каждый участок по отдельности. Это способ получения генетической информации, а значит, ключ к решению многих проблем медицины и не только.
Да, сегодня интерес к теме полного секвенирования генома во многом стимулируется коммерческими лабораториями, которые предлагают клиентам узнать все о своем геноме, чтобы правильно подобрать диету, определить таланты, узнать свою этническую принадлежность. Однако всё обстоит значительно серьезнее: полное секвенирование генома — это, прежде всего, серьезный медицинский инструмент, который позволяет диагностировать, к примеру, наследственные болезни, а при планировании семьи он работает как метод скрининга на носительство патогенных мутаций, используется также для получения информации о некоторых высокорисковых состояниях человеческого организма.
Интерес к исследованию генома человека стал причиной того, что генетика стала основным источником больших данных во всех науках и технологиях, перегнав по темпам роста упомянутые социальные сети. Для понимания: например, один только медицинский исследовательский центр BroadInstituteofMITandHarvard, USA продуцирует в год до семи петабайт (это семь миллионов 340 тысяч 32 гигабайта) геномной информации!
Что является источниками больших геномных данных? Это, прежде всего, геномика человека. В этом плане обращает на себя внимание международный проект «1000 геномов», начавшийся в 2008 году и продолжающийся по сей день. В ходе проекта планировалось упорядочить геномы примерно 2500 человек, чтобы создать подробный каталог генетических вариаций человека.
На сегодняшний день это самое полное исследование геномов человека. В ходе него проанализированы геномы 85 тысяч пациентов с редкими заболеваниями, в том числе, раком. В геномах человека выявлено более 720 миллионов одиночных нуклеотидных замен, в том числе, ассоциированных с заболеванием.
Второй источник больших научных данных — геномные данные растений, полученные, в частности, в ходе реализации международных проектов «10000 геномов растений», «3000 геномов риса», «Полногеномные транскриптомы 1173 видов растений», «1001 геном арабидопсиса».
Это, в том числе, геномика микроорганизмов, которая просеквенировала более 150 тысяч полных геномов бактерий. Это протеомика (направление молекулярной биологии), идентифицировавшая 200 миллионов аминокислотных последовательностей и расшифровавшая более 160 тысяч пространственных структур белков. Наконец, это мас-спектрометрия — метод исследования и анализа веществ, распознавший 100 миллионов мас-спектров пептидов, метаболитов из различных тканей, биологических жидкостей и клеток.
Пишу об этом столь подробно, чтобы было понятно, насколько космически огромный массив информации, который нужно обработать, уже получен. И это только начало.
«Проблема еще и в том, что сложность геномов исключительно велика, — подчеркивает Николай Колчанов. — Мы должны анализировать, расшифровывать не только локализацию генов, но и функции РНК, и пространственную структуру белков, в том числе, её предсказание. И это главный вызов для мировой биоинформатики. Российская ситуация при этом похуже, поскольку мощных вычислительных средств у нас пока нет».
Обработка больших данных — не только научная, но, прежде всего, практическая задача, как говорят сегодня, «задача масштабирования». В частности, на основе методов геномики и биоинформатики разрабатываются технологии геномной селекции сельскохозяйственных растений и животных, которые эффективны при отборе по количественным признакам, контролируемым большим количеством генов.

Здоровье для человечества и суперкорова для человека

Как делается эта работа? Все количественные признаки контролируются не одним геном, а большим количеством локусов (положений гена), распределенных по геномам. Сначала секвенируется эталонная выборка растения или животного с максимальными характеристиками, затем проводится компьютерный анализ и строится компьютерная модель, которая позволяет сравнивать любой произвольный геном этого вида с эталоном. На этой основе отбирается лучший геном.
Николай Колчанов привел необычный пример современной геномной селекции — американскую корову My 1326, установившую мировой рекорд продуктивности, равный 32 803 кг молока в год — это 90 кг молока в день! Вот нам бы так.
Так что необходимо для того, чтобы российская биоинформатика как одна из сквозных, базовых генетических технологий получила возможности для ускоренного развития? По мнению Николая Колчанова, первое — это формирование для накопления и хранения больших генетических данных: национального российского портала геномной информации ёмкостью в десятки петабайт. Портала, аналогичного NCBI (National Center for Biotechnology Information, USA) и EMBL-EBI (European Bioinformatics Institute United Kingdom). Второе — обеспечение доступа российских генетиков и биоинформатиков к сети высокопроизводительных российских вычислительных систем петафлопсного уровня (одним из элементов которой может быть СКЦ «Лаврентьев»). В-третьих, необходима расширенная подготовка специалистов в области биоинформатики и искусственного интеллекта для анализа больших генетических данных на базе ведущих университетов России, включая Новосибирский государственный университет.
А пока темпы роста объёмов геномных данных на порядок опережают возможности их компьютерного анализа. Представьте: только порядка десяти(!) процентов полученных данных обрабатываются на достаточно глубоком уровне.

«Лаврентьевых» не бывает много

Михаил Воевода, доктор медицинских наук, профессор, академик РАН, директор Федерального Исследовательского Центра Фундаментальной и трансляционной медицины, заместитель председателя СО РАН уверен, что в ближайшем будущем тематика больших данных в области «наука-жизнь» станет одной из основных. И самый большой научный вызов на современном этапе, который можно обозначить как мегасайенс, то есть создание крупных дорогостоящих международных научных и исследовательских комплексов, находится именно в этой плоскости. Подобные масштабные проекты реализуются сегодня и в Западной Европе, и в США, и в Китае. База для этих проектов, причем, закладывалась в этих странах десятилетия назад. В рамках этих проектов, помимо генетической информации, будут получены и другие характеристики живой материи. «Нам также предстоит анализировать всё это в комплексе — для получения важной информации в области здравоохранения, фармакологии, — отметил он. — Во всяком случае, в медицине в настоящее время происходит полная смена прежней парадигмы».
«Большие данные и меганаука — это то, что рождается у нас на глазах, — сказал в своём выступлении Михаил Федорук, доктор физико-математических наук, профессор, академик РАН, руководитель проекта «Суперкомпьютерный центр «Лаврентьев» и ректор НГУ. — Я вижу, что в дорожной карте строительства ЦКП «СКИФ» заложены хорошие темпы — в конце 2023 года уже должны быть получены данные первого эксперимента. У нас на сегодня уже есть два центра генетических технологий плюс международный математический центр, поэтому естественно, что крайне необходима обработка больших данных, суперкомпьютерное моделирование.
Поэтому в университете мы не можем не обращать на это внимания. За пять предыдущих лет на 74 процента НГУ увеличил подготовку кадров по IT-технологиям, и даже на физическом факультете выделен отдельный профиль под названием «Физическая информатика». Конкурс по этим направлениям, интерес молодого поколения к ним постоянно растет. Что же касается суперкомпьютерного центра, который мы планируем построить к 2025 году, а именно — центра искусственного интеллекта СКЦ «Лаврентьев», он, надеюсь, станет не только одним из основных проектов самого Академгородка, но и всей Новосибирской области в целом».

Что может дать СКЦ «Лаврентьев»? Прежде всего, это новые возможности для исследований и разработки, поэтому он — основополагающий проект Академгородка 2.0 наряду с инфраструктурой НГУ, центрами коллективного пользования, строительство которых также запланировано на ближайшее время. Также центр позволит увеличить мощности вычислительных ресурсов российских суперкомпьютерных центров в интересах научных и образовательных организаций. Его строительство будет реализовано в рамках национального проекта «Наука» и нацпрограммы «Цифровая экономика Российской Федерации».
Надо сказать, что это решение назрело, и давно — достаточно посмотреть на наше скромное положение по сравнению с возможностями крупных мировых технологических держав. С 2008 года начинается это катастрофическое, как сформулировал Михаил Федорук, отставание в суперкомпьютерных мощностях от Евросоюза, Японии, Китая, США. «Пока отставание линейное, но скоро оно может стать экспоненциальным, — отметил ректор НГУ. — От США, скажем, мы отстаём уже на 11,5 лет — это данные ноября 2020 года».
Приведу пример: для исследования коронавируса суперкомпьютерное партнерство выделило дополнительные 77 миллионов (!) ядро-часов на суперкомпьютерах Евросоюза. Да, они могут себе это позволить, и, конечно же, это существенно расширяет возможности и даёт быстрый результат.
Вот другие свежие примеры. В немецком Штутгарте на моделирование полупроводников задействованы ресурсы в 37 миллионов ядро-часов на суперкомпьютере HazelHen. Исследование процессов роста раковых опухолей на суперкомпьютере Summit в американском Оук-Ридж имеет ресурс в 600 тысяч узло-часов. Для оптимизации формы самолета в целях повышения топливной эффективности и снижения производимого шума используются ресурсы в 250 тысяч ядро-часов на суперкомпьютерах MareNostrum (Барселона, Испания) и Beskow (Стокгольм, Швеция).

Сибирь петафлопсной мощности

У нас же сегодня — всего три компьютера петафлопсной мощности (один петафлопс – это 10 в 15 степени операций в секунду. — Ред.), и все они расположены в пределах Садового кольца и недалеко от него. Что касается Сибири, то, несмотря на её огромный научный потенциал («Мы любим говорить, что 25 процентов научного потенциала сосредоточено в Сибирском регионе», — заметил Федорук), в Сибирском федеральном округе мы имеем только три процента по суперкомпьютерным мощностям, что является удручающей ситуацией.
Почему нашему региону так нужен суперкомпьютер? Есть пять веских причин. Первая — необходимость диверсификации и распределения суперкомпьютерных центров по всей территории России в целях стратегической безопасности. Я полагаю, что эта задача имеет государственное значение. Второе — это позиционирование нашего региона как одного из ведущих в России и мире в плане развития современной науки и технологий, что вполне закономерно, учитывая научный потенциал, копившийся десятилетиями. Третье, что может дать создание такого центра — это стимулирование цифровой трансформации, о которой так много говорят, всех отраслей региона за счет роста компетенций в области современных высокопроизводительных вычислений. Не менее важна концентрация компетенций обработки больших данных, современных вычислительных алгоритмов, методов машинного обучения, искусственного интеллекта для проведения фундаментальных исследований научными организациями макрорегиона. И, наконец, сбор и обработка уникальных потоков данных от установки мегасайенс — существующих и планируемых технологических центров мирового уровня.
Кроме всего этого, одно из ключевых направлений будущего — зеленые технологии, и эта тема близка Новосибирску, поскольку один из полигонов по декарбонизации, создаваемых в России, планируется разместить в кампусе НГУ. В университете создан проект под названием «Углеродно-нейтральная Сибирь 2040», и не секрет, что для полигонов потребуются существенные вычислительные ресурсы для автоматизированной обработки и анализа данных мониторинга углеродного следа. Расчёты на СКЦ «Лаврентьев», несомненно, могут поспособствовать цели достижения декарбонизации Академгородка.
Можно говорить и о других проектах с участием НГУ, которые можно определить как актуальные задачи мирового уровня, завязанные на обработке больших данных. Они касаются разных сфер. Это достижение принципиально нового уровня персонализированной медицины на основе объединения передовых медицинских технологий и цифровых двойников (совместно с НМИЦ им. академика Е.Н. Мешалкина). Это быстрые разработки и конструирование малошумных и экономичных реактивных двигателей для авиации (совместно с АО «ОДК»). Это работа над созданием экономичных паровых и газовых турбин для крупных энергетических установок (совместно с АО «Силовые машины»). Это участие в проектировании новых многоцелевых космических аппаратов (совместно с РКК «Энергия»). Задачи интересные и серьезные. Но они, помимо прочего, требуют и соответствующего высоким задачам суперкомпьютерного обеспечения.
Комментируя перспективы участия НГУ в прорывных проектах, Михаил Федорук отмечает: «На новый уровень мы должны поднимать и образование, а бизнес и наука — подталкивать нас к этому. Университет сегодня уже вышел за пределы экосистемы — это ни плохо, ни хорошо. Но он расширил своё влияние. Поэтому помимо того, что мы взаимодействуем со своими традиционными партнерами, готовим кадры для институтов СО РАН и высокотехнологичного бизнеса, мы, чтобы развиваться, должны взаимодействовать с крупными индустриальными партнерами, вносить свой вклад в экосистему и инновации Новосибирской области — этим продиктованы наши планы на перспективные амбициозные проекты».
Согласно дорожной карте, всего два года остается до того момента, как СКИФ будет запущен. С пуском синхротрона однозначно встанет вопрос обработки больших данных, которые будут поступать с установки мегасайенс. В Академгородке вопросами супервычислений традиционно владеет Институт вычислительной математики и математической геофизики. Михаил Марченко, директор ИВМиМГ СО РАН, доктор физико-математических наук, профессор рассказал о процессе организации суперкомпьютерных вычислений и обработки больших данных.
Известно, что установки класса мегасайенс, производя гигантский поток экспериментальных данных, используют для обработки и проведения моделирования цифровые сервисы. Причем, количество данных с каждым годом растет, и сейчас речь идет о сотнях петабайт с каждой из установок. На примере CERN — Европейской организации по ядерным исследованиям и крупнейшей в мире лаборатории физики высоких энергий — известно, что сервисы построены на базе распределенной сети ресурсов, а для работы с открытыми данными созданы специализированные порталы — это современный тренд, в том числе, и для российской науки.
Для чего нужны супервычисления? Это необходимый этап перед проведением сложных экспериментов. Цифровое моделирование, разработка и применение цифровых двойников — это те сущности, которые используются на всех этапах существования большой установки, либо производства, либо исследуемого процесса.
Сейчас в России создаётся национальная компьютерная инфраструктура и исследовательская компьютерная сеть — сеть передачи данных. Новосибирск в этом плане, по словам Михаила Марченко, находится в трудной ситуации, поскольку связь с Москвой очень слабая — 1 Гб в секунду, и это ничтожно мало. В Европе, к примеру, действуют 100-гигабитные сети, в Японии скорость еще больше. Но нам приходится пока опираться на наши, существующие или будущие (имея в виду Центр «Лаврентьев») мощности.
В Академгородке в настоящее время — два суперкомпьютерных центра: в ИВМиМГ СО РАН и в НГУ, высокоскоростная сеть соединяет эти ресурсы с институтами СО РАН и университетами. Суперкомпьютерный центр ИВМиМГ — это более 200 пользователей из 24 организаций. С помощью Сибирского суперкомпьютерного центра выполняется более 100 НИР в год на общую сумму в 700 миллионов рублей. Текущая производительность ССКЦ — 200 Терафлопс.
Говоря о задачах ЦКП «СКИФ», Михаил Марченко заметил, что предварительные обсуждения говорят о том, что в проекте СКИФ разрабатывается внутренняя система вычислительного контура и хранения данных, и уверен, что для полномасштабного моделирования и обработки данных мощностей будет недостаточно. «Нужно разрабатывать систему внешнего контура, чтобы хранить «тёплые» и «холодные» данные, создавать сервисы. Что очень важно: сейчас не хватает достаточного количества высокоуровневых специалистов. Поэтому нужно готовить молодежь и давать дополнительное образование биологам, физикам, химикам, то есть, специалистам, представляющим предметные области знания — именно они станут пользователями СКИФа. Определенно, что для эффективной работы СКИФу потребуется многоуровневая система хранения данных и распределенная вычислительная система, цифровые системы обработки данных и суперкомпьютерного моделирования, а также сообщество высококлассных специалистов».
На данный момент многоуровневая система прорабатывается полным ходом, как и вопрос, как объединять существующие и будущие ресурсы в суперкомпьютерную сеть России и как использовать ресурсы других центров. По мнению директора ИВМиМГ, целесообразно на базе НГУ создать «Центр цифровых сервисов» с привлечением к этой работе профильных институтов СО РАН и ИТ-компаний. Это своего рода консорциум, в который могут войти ЦКП СКИФ, НГУ, профильные институты
СО РАН и ИТ-компании. Его работа должна будет синхронизироваться управляющим офисом ЦКП СКИФ, чтобы обеспечивать взаимодействие вычислительных ресурсов внешнего и внутреннего контура. Также необходимо создавать собственные цифровые сервисы, это касается, в том числе, цифрового двойника ЦКП «СКИФ» и вычислительной системы, также необходима серьезная работа с пользователями в плане информирования.

СКИФ через прицел «коллективных пользователей»

Сердце СКИФа — большое накопительное кольцо. Длина орбиты кольца — 476 метров. Электроны «вылетают» со скоростью света энергией 3 ГэВ. Электрическая мощность — 12000 кВт. Шесть экспериментальных станций станут первой очередью, а всего их планируется 30. Станцию будут обслуживать 400 сотрудников. Количество пользователей — более 50 одновременно, это 3000-5000 человек в год. Пучковое время — до 6500 часов в год. Вот вкратце то, что нужно знать о СКИФе.
Но это не всё. Замкнутая орбита синхротрона создаётся специальными поворотными магнитами. Суть работы установки такова: электроны, проходя участок искривленной орбиты, излучают электромагнитное излучение, максимум которого приходится на рентгеновский диапазон. А значит, это сверхмощная рентгеновская установка. Помимо поворотных магнитов в прямолинейных участках существуют многополюсные магнитные структуры, которые позволяют управляемо модифицировать свойства рентгеновского излучения, которое установка генерирует. Основные преимущества установки синхротронного излучения перед стандартными лабораторными приборами — очень высокая интенсивность (при сравнении счет идет в триллионы раз). Вокруг накопительного кольца располагаются исследовательские установки.
В мире таких установок, то есть, мировых синхротронных центров, — около 50. Синхротронные источники — это фабрики экспериментальных данных, которые работают круглосуточно. Основное направление их использования — это классическая наука(физика, химия, материаловедение, биомедицина, структурная биология). Для понимания значимости центров мегасайенс: за последнюю четверть века не менее семи Нобелевских премий по химии были присуждены за работы в области структурной биологии на базе использования синхротронного излучения.

Помимо классической фундаментальной науки и биомедицины, синхротронное излучение активно используется для развития инноваций в высокотехнологичных отраслях производства. Своего рода трендом является использование синхротрона в интересах социальных наук, археологии, музейного дела, экологии.
К концу 2023 года начнет работу первая экспериментальная станция СКИФа. Шесть экспериментальных станций должны заработать к концу 2024 года. С этого момента начнется реализация фазы-2 данного проекта: в 2025 году будет разработана программа модернизации станции, а в 2026 году не менее двух станций будет введено в эксплуатацию. Флагманская станция, которая должна быть запущена первой из станций второй очереди, являет собой комплекс станций структурной вирусологии, который конструируется совместно с «Вектором». «Мы слышим посылы со стороны руководства страны, что хотелось бы ускорить ввод именно этой станции», — заметил Ян Зубавичус, заместитель директора по научно-методическому обеспечению ЦКП «СКИФ».
Если структурно обозначить основные направления деятельности ЦКП, то это: в науке — медицина и биологическая безопасность, зеленые технологии для химической промышленности и энергетики, новые конструкционные материалы и технологии машиностроения; в инфраструктуре — импортозамещение в научном приборостроении; в «цифре» — цифровизация научных исследований, разработок и образовательных технологий и в кадрах — подготовка научных и инженерных кадров. Всего шесть ключевых направлений.
«Очень важный аспект для нас — это научное приборостроение. Нами будет использоваться очень сложное, передовое оборудование, и важная задача — обеспечить импортозамещение, поскольку на данный момент подавляющее количество оборудования требуемого класса можно закупить только за рубежом», — отметил Ян Зубавичус.
В чем преимущество используемого на ЦКП программного обеспечения? Оно обеспечивает onthefly – обработку данных, pipelines (то есть, отбор образцов и оптимизация параметров сбора данных), расшифровку кристаллических структур по данным рентгеноструктурного анализа, решение обратной задачи спектроскопии, помогает распознавать образы, классифицировать и обрабатывать изображения. Это возможности использования технологий искусственного интеллекта и глубокого машинного обучения, это цифровое моделирование, квантовая механика, инженерные расчеты и, наконец, развитие собственных алгоритмов и программных комплексов, оптимизированных под нужды локального сообщества.
«Самая технически сложная задача для нас — это хранение данных, — признается Зубавичус. — Синхротрон генерирует колоссальные потоки данных, и их нужно хранить вечно, поскольку именно в этих «сырых» экспериментальных данных может содержаться самый яркий научный результат, к ним автор может вернуться. Эти данные должны быть доступны и для широкого научного сообщества — их можно переработать и повторно использовать».

И наработаться, и извлечь выгоду

Сергей Архипов, ведущий инженер ЦКП «СКИФ», попытался ответить на вопрос: чего хотят пользователи от современной станции и какие требования порождают их желания?
Опуская технологию проведения опыта с кристаллами, предложенного спикером, перейдем к этапу от момента получения исходных экспериментальных данных к логике потенциального пользователя.
«В первую очередь, хочу обратиться к пользователям из индустрии — их можно разделить на две категории, — сказал выступающий. — Первое — это большие компании и даже корпорации, например, AstraZeneca, Bayer. У них есть свои структурные отделы, свои специалисты. Наряду с этим, существуют малые, средние фирмы, которые занимаются только структурной биологией, но так или иначе у них хорошая квалификация. Основная цель, которую они могут и будут преследовать — минимизация затрат при получении экспериментальных данных».
Основные категории затрат при обращении к ЦКП — это, во-первых, стоимость использованного времени пучка, во-вторых — стоимость доставки образцов на синхротрон, в-третьих — стоимость программного обеспечения и в-четвертых — стоимость работы сотрудника компании.
В среднем час времени пользования синхротроном стоит в пределе 300-500 долларов США, обычно время покупается сменами, смена — 8-часовая. Пользователь может купить одну, две или три смены. Одна смена генерирует порядка 25 терабайт данных. Важный вопрос — программное обеспечение. Что происходит с полученными экспериментальными данными? Пользователю нужно, в первую очередь, оценить — тот ли это набор данных, который ему необходим, подходит ли он для решения задачи, годятся ли они для дальнейшей расшифровки? Эта процедура называется интегрирование.
С детектора полученные данные попадают на компьютер, с компьютера — на кластер. На кластере существует несколько так называемых пайплайнов (пайплайн — это процесс разработки, программный конвейер — Ред.), которые как раз и производят интегрирование данных. В идеале через 10-15 минут пользователь должен увидеть картинку, которая ему скажет, данные годятся или нет.
«Существует определенное количество пайплайнов, — продолжил Сергей Архипов, — я выделил autoPROG, Fastdp, XiA2, EDNA, FutoDrag. Данное программное обеспечение бесплатно для академической науки, но юзер из индустрии должен его купить — оплачивается лицензия. Поэтому чем разнообразнее будет количество пайплайнов на синхротроне, тем большее количество пользователей смогут им воспользоваться. Основная задача кластера при этом — «на лету» обработать данные для того, чтобы оператор понял, сколько экспериментов ему необходимо провести.
Хочу обратиться к пользователям из академической науки. Здесь могут ставиться разные задачи, иногда, условно говоря, нужно посмотреть ингибитор, иногда комплекс, иногда хочется провести эксперимент другого класса, и для особо сложных экспериментов уже необходимо присутствие пользователя на источнике, то есть, это нельзя решить удаленно. Что важно пользователям из науки? В отличие от представителей индустрии, которая все-таки обладает в своей массе хорошо подготовленными кадрами, в науке достаточно много новичков. Поэтому для СКИФа важен инструмент планирования — его сегодня имеет каждый центр мегасайенс. Также необходимо квалифицированное сопровождение эксперимента. Что касается потенциальных пользователей, то в идеале — на первоначальном этапе — нужна организация образовательных курсов, которые давали бы общее понимание: какие эксперименты, в каких областях и какой сложности можно выполнить, используя возможности синхротрона. Конечно, нужны и более глубокие знания, скажем, по обработке данных, и в этом может помочь НГУ. Такие знания, а для кого-то, возможно, компетенции полезны и выгодны — и ЦКП «СКИФ», и вузу, и индустриальному пользователю, и академической науке».

Сергей ГОНТАРЕНКО