Научной проблемой, на решение которой направлен проект, является исследование и разработка методов машинного обучения для анализа моделей физических явлений с использованием выборок случайных состояний (семплов). До последнего времени практически единственным подходом, позволяющим численно моделировать очень сложные физические явления, являлся подход на основе методов Монте-Карло. Однако использование реалистичных физических моделей на основе метода Монте-Карло требуют весьма больших временных и ресурсных затрат. Одним из альтернативных и весьма перспективных методов является использование методов машинного обучения для генерации выборок случайных векторов.
Отличительной особенностью моделирования физических явлений, особенно в физике элементарных частиц и космических лучей, является необходимость воспроизвести состояния системы с учетом ограничений, определяемых природой физического явления. Априорные знания могут иметь форму логических правил, алгебраических или дифференциальных уравнений (например законы сохранения или уравнения связей между параметрами или степенями свободы, описывающими изучаемые явления), наличия симметрий относительно дискретных или непрерывных групп входных/выходных данных, а также заранее известные вероятностные соотношения между данными. В методе Монте-Карло такие ограничения вводятся на уровне математической модели. Для методов машинного обучения, основанных на принципе обучения, такие ограничения воспроизводятся с трудом. Особенно это касается различных статистических распределений по совокупности состояний. Эти проблемы можно решить путем дополнительного включения априорных знаний о таких ограничениях в процесс обучения. В этом состоит новизна предлагаемого подхода к решению общей проблемы — эффективного генерирования выборок случайных состояний (семплов) с учетом априорных знаний. Практическая проверка разрабатываемых подходов будет применена для анализа моделей физических явлений в астрофизике частиц.
Конкретной задачей данного проекта в рамках общей проблемы является исследование и разработка методов глубокого обучения генерации выборок многомерных случайных векторов в пространствах с большим числом измерений, с учетом априорной детерминистской и вероятностной информации о генерируемых событиях и их выборках для моделирования сложных физических явлений на примере экспериментов в области наземной гамма-
астрономии. Наземная гамма-астрономия изучает излучение гамма-квантов галактического и внегалактического происхождения с помощью специально разработанных установок, так называемых атмосферных черенковских гамма-
телескопов (Imaging Atmospheric (or Air) Cherenkov Telescope, IACT). С помощью этого метода гамма-излучение
регистрируется на земле оптически как черенковский свет, порождаемый ливнями вторичных частиц, когда гамма-кванты очень высокой энергии попадают в атмосферу. Гамма-кванты таких энергий составляют лишь малую долю (меньше одной десяти тысячной) потока космических лучей, состоящего, в основном, из протонов. Для анализа данных, планирования эксперимента и других задач необходимо проводить моделирование, результатом которого должны стать сотни тысяч и миллионы событий, включая протонные события, являющиеся фоном. На разработку эффективных алгоритмов машинного обучения для генерации семплов и направлен предложенный проект. Решение данной проблемы является весьма важным для гамма-астрономии, поскольку благодаря отсутствию электрического заряда, гамма-кванты несут информацию об их сверхудаленных источниках, в которых происходят экзотические и экстремальные процессы во Вселенной.
Интеграция в процесс обучения априорных, заранее известных знаний позволит заметно повысить качество полученных выборок, а следовательно и качество моделирования событий, в частности, событий широких атмосферных ливней, регистрируемых черенковскими телескопами. Практическими задачами проекта будут: исследование существующих и разработка новых методов машинного обучения для генерации случайных векторов с учетом априорной информации; разработка алгоритмов на их основе и их программная реализация; исследование, сравнение, выбор наилучшего (или лучших) методов; сравнение с существующими методами. В ходе осуществления проекта будет проведен полный цикл исследований и решения поставленных задач — от теоретической разработки подхода до практической программной реализации.