This is an old revision of the document!

Program

17.06.2025

The list of accepted reports will be publish later.

The first author is the presenter.

If someone did not find themselves in the list, please inform us by email dlcp@sinp.msu.ru

Section 1. Machine Learning in Fundamental Physics

3. Применение графовых нейронных сетей для сегментации хитов в глубоководном нейтринном телескопе Baikal-GVD

Лев Осадчий (1), Иван Харук (2,3)
(1) физический факультет МГУ им. М. В. Ломоносова, (2) ИЯИ РАН, (3) МФТИ

Исследуется применение графовых нейронных сетей для сегментации сигнальных хитов на фоне оптического шума в данных телескопа Baikal-GVD. В работе сравниваются архитектуры на основе графовых сверток, механизмов внимания и парадигмы Message Passing. Рассматриваются особенности адаптации моделей к данным детектора, в частности — использование финальных полносвязных слоев для сохранения различимости признаков между узлами. На основе анализа метрик определены наиболее эффективные подходы и функции агрегации для выделения полезного сигнала.

1

Section 2. Machine Learning in Natural Sciences

13. Метод автоматизированной обработки научных публикаций

Хвостова Мария Олеговна (1), Артамонов Алексей Анатольевич(2), Пряхина Дарья Игоревна
(1) Филиал МГУ в г. Дубне, (2) НИЯУ МИФИ, (3) ОИЯИ

В работе представлен метод автоматизированной обработки полнотекстовых научных публикаций в формате PDF, который выполняет анализ основных типов информации – таблиц, рисунков, текста. Таблицы и рисунки структурируются на уровне распознавания названий, извлечения и упорядочивания ячеек. Это позволяет преобразовать визуальные объекты в машиночитаемый формат для дальнейшего индексирования, а сохранение соответствующих областей документа-источника в виде изображений даёт возможность верифицировать извлечённые данные вручную. Текст анализируется по предикатно-аргументной модели. Аргументы, выполняют разные синтаксические роли – агент, пациенс, локатив, темпоратив, мера, инструмент, результат – и несут информацию об объектах, задействованных в эксперименте (материалы, оборудование и установки), условиях проведения эксперимента (место, время, параметры), количественных характеристиках. Предикаты устанавливают отношения между аргументами, благодаря чему формируются структурированные смысловые единицы, которые извлекаются с помощью набора продукционных правил. Атрибутирование источника осуществляется при извлечении ключевых библиографических сведений – авторов, названия, журнала и даты публикации, цифрового идентификатора . В работе используются: свёрточные нейронные сети для оптического распознавания символов и детекции структурных объектов на страницах публикации; трансформерная модель для морфо-синтаксического анализа предложений; языковая модель для извлечения неграмматичных данных; лингвистический анализатор на основе продукционных правил для грамматичных данных. Метод устойчив к вариативности визуально-структурной модели документа, не требует обучения на размеченных данных и может быть адаптирован для различных научно-технических дисциплин. Результаты ориентированы на практическое применение в наукометрических системах и базах знаний.

1

Section 3. Machine Learning for Environmental Sciences

Convolutional Neural Networks and Bayesian Classification for Risk Assessment of High-Latitude Critical Infrastructure

Lapin A.N. (1), Vorobev A.V. (2), Vorobeva G.R. (1)
(1) Ufa University of Science and Technology, (2) (Geophysical Center of the Russian Academy of Sciences

Geomagnetic activity at high latitudes poses significant risks to the operation of certain technological systems within the critical infrastructure of the Russian Arctic zone. In the absence or scarcity of instrumental data in hard-to-reach regions, the use of natural indicators of space weather, including polar aurorae, becomes highly relevant. In this work, we develop an approach based on convolutional neural networks and a Bayesian classifier to estimate the posterior probabilities of extreme geomagnetically induced currents and additional inclinometric measurement errors arising from the highly variable magnetic environment of the Arctic region. Using an analysis of synchronous auroral observations over 7 years (2015–2021), training datasets are constructed and corresponding statistical relationships, consistent with the physical mechanisms of the processes under study, are established. Application of ensemble models to the acquired datasets reveals that the highest risks of extreme measurement errors in azimuthal and zenith angles in the Arctic region occur during the observation of bright, well-defined aurorae in the southern part of the sky (4.9% and 14.7%, respectively). The results of our research robustly demonstrate the feasibility of using visual observations of aurorae in the optical range as a natural indicator of geomagnetic conditions to support decision-making in the operation of technological facilities in high-latitude infrastructure.

1

THEORY

Table of Contents