1. Разработка и реализация программ на основе разработанных на первом этапе методов и алгоритмов для целей учета априорных знаний при генерации событий нейросетями, включая:
методы и алгоритмы учета детерминистских ограничений;
методы и алгоритмы учета статистических ограничений;
Основным методом учета таких ограничений является использование условных нейросетевых моделей (conditionak
generative neural network), а также нейросетевых моделей с ограничениями (constrained generative neural network).
Регистрация ПО
2. Проведение вычислительных экспериментов с целью исследования разработанных генераторов событий для гамма-
астрономии. В том числе:
проверка соответствия критериям их эффективного функционирования, выработанным на первом этапе;
сравнительный анализ МС генераторов и генераторов основанных на машинном обучении;
Основными критериями, которые будут использованы для оценки качества построенный генеративных моделей будут
время генерации событий, а также качество воспроизведения энергетического спектра событий.
3. Оптимизация программной реализации генераторов, основанных на машинном обучении по результатам
экспериментальных исследований;
4. Анализ, полученных результатов, в том числе:
обобщение результатов исследований;
сопоставление анализа научно-информационных источников и результатов теоретических и экспериментальных исследований;
оценка эффективности полученных результатов в сравнении с современным научно-техническим уровнем.
5. Подготовка докладов на международных и всероссийских конференциях, публикация результатов исследований в
журналах, входящих в список RSCI.
6. Подготовка подготовка итогового отчета.
Вторая основная задача на 2023г.
Довести часть разработанных методов до практического применения в TAIGA.
Третья задача на 2023г
Начать работу по реализации идей, заложенных в заявку на грант РНФ, не дожидаясь результата конкурса.
VAEС.П.
Получены изображения для протонов.
Обработать эти изображения и построить гистограммы по основным параметрам Хилласа - Е.Г.
Результат эксперимента для случая, когда не делается предположения о пикселе, если входное значение ноль.
Возможно требуется нормировка MSE функции на число рабочих пикселей.
Использование constrined VAE дает существенное улучшение.
Сделать тройки картинок: МК, усредненная, сгенерированная VAE их гаммовость.
А что с протонами? Что с файковыми гамма?
Распределение гаммовости по сайзам (сгенерировать 1000 событий).
Параметры ПО (время обучения, генерации 100 событий, оперативной памяти, размер программы)
Генерация избражений GAN (Ю.Д.)
Посмотреть вариант с разбиением на 2 класса только последнего 10 класса.
Результат искусственного увеличения числа событий в 2 раза путем дублирования и перемешивания.
Воспроизвести результат для 10 кл. –> 8/12/2022 –> 15/12/2022
Построить гистограмму распределения ошибко между МК и GAN.
Повторить для GAN с ограничениями.
HiSCORE, 120 станций (А.В.)
Провести рассчеты для случаев когда сработали минимум 4 станции и 5 станций и сравнить со случаем 3-х станций.
Добавить медианы
Ограничить phi 90 градусами.
Графики для телесных углов.
IACT (Е.Г.)
Использование автоэнкодеров для сжатия данных.
Провести сравнение с JPEG (с потерями) и ZIP/PNG (без потель). Важно! Сохранение физических параметров в пределах допустимых ошибок.
Проверить качество восстановленных параметров Хилласа.
Рассмотреть 2 варианта: просто полносвязанные сети и сверточные автоэнкодеры.
Прочее
Следующее совещание (22.12.2022) будет последним в этом году.
Отчет 2022 года
Результаты работы на первом этапе:
[✓ admin, 2022-12-15]Аналитический обзор анализа современной научно-технической литературы. - А.Д.
[✓ admin, 2022-12-15]Список критериев эффективного функционирования генераторов событий на примере (астро)физики высоких энергий. - А.К.
[✓ admin, 2022-12-15]Обоснованный выбор основных типов генеративных сетей для использования в качестве генераторов событий.- А.К.
[✓ admin, 2022-12-15]Адаптированные существующие и новые методы и алгоритмы учета априорных ограничений. - Ю.Д., С.П.
[✓ admin, 2022-12-15]Прототип генеративной нейронной сети для генерации семплов с учетом априорных знаний, включая учет
статистических ограничений. - Ю.Д., С.П.
Результат эксперимента для случая, когда не делается предположения о пикселе, если входное значение ноль.
Возможно требуется нормировка MSE функции на число рабочих пикселей.
Использование constrined VAE дает существенное улучшение.
Генерация избражений GAN (Ю.Д.)
Посмотреть вариант с разбиением на 2 класса только последнего 10 класса.
Результат искусственного увеличения числа событий в 2 раза путем дублирования и перемешивания.
Воспроизвести результат для 10 кл. → 8/12/2022
* Было произведено разбиение на 20 одинаковых по численнести классов.
* Наблюдается довольно длинный хвост в распределении по энергии с заметным привышением исходного распределения.
* При малых энергиях наоборот, сильное занижение распределения.
HiSCORE, 120 станций (А.В.)
Провести рассчеты для случаев когда сработали минимум 4 станции и 5 станций и сравнить со случаем 3-х станций.
Добавить медианы
Ограничить phi 90 градусами.
Графики для телесных углов.
* Новые результаты распределения ошибок по телесному углу.
* Использовалась аппроксимация (усреднение).
* Ошибка по телесному углу составила 1.5-2 градуса. Неплохо. (картинки!)
IACT (Е.Г.)
Использование автоэнкодеров для сжатия данных.
Основание: данные имеют заметные случайные флуктуации, поэтому можно использовать сжатие с потерями. В какой-то мере это задача очистки шума.
Провести сравнение с PNG JPEG (с потерями) и ZIP/PNG (без потель). Важно! Сохранение физических параметров в пределах допустимых ошибок.
Проверить качество восстановленных параметров Хилласа.
Рассмотреть 2 варианта: просто полносвязанные сети и сверточные автоэнкодеры.
При оценки ошибки использовать только те пиксели, которые не нулевые, т.к. мы не знаем их значения.
Должна увеличится сайз изображения, но это неважно. Важна разметка по сайзу!
Генерация изображений VAE (С.П.)
Нового ничего нет.
Провести эксперимент для случая, когда не делается предположения о пикселе, если входное значение ноль.
Генерация избражений GAN (Ю.Д.)
Посмотреть вариант с разбиением на 2 класса только последнего 10 класса.
Возможно надо искусственно увеличить число событий в нем в 2 раза путем дублирования и перемешивания.
Пока ничего не получается.
Воспроизвести результат для 10 кл. → 8/12/2022
* Было произведено разбиение на 20 одинаковых по численнести классов.
* Наблюдается довольно длинный хвост в распределении по энергии с заметным привышением исходного распределения.
* При малых энергиях наоборот, сильное занижение распределения.
HiSCORE, 120 станций (А.В.)
Провести рассчеты для случаев когда сработали минимум 4 станции и 5 станций и сравнить со случаем 3-х станций.
Добавить медианы
Ограничить phi 90 градусами.
Графики для телесных углов.
* Новые результаты распределения ошибок по телесному углу.
* Использовалась аппроксимация (усреднение).
* Ошибка по телесному углу составила 1.5-2 градуса. Неплохо. (картинки!)
IACT (Е.Г.)
Использование автоэнкодеров для сжатия данных.
Основание: данные имеют заметные случайные флуктуации, поэтому можно использовать сжатие с потерями. В какой-то мере это задача очистки шума.
Провести сравнение с PNG (с потерями) и ZIP (без потель). Важно! Сохранение физических параметров в пределах допустимых ошибок.
Рассмотреть 2 варианта: просто полносвязанные сети и сверточные автоэнкодеры.
Разместить на сайте список литературы - А.Д.
Подготовка отчета 2022 (А.К.)
Буду просить вас присылать мне тексты на русском. Просьба оперативно откликаться.
Прочее
24.11.2022
Присутсвовали: А.К., С.П., Е.Г., Ю.Д., А.В., А.Д.
Текущие дела
Размещение статей в ArXiv (4)
Поместили: Е.Г., С.П., А.В.
Генерация изображений VAE (С.П.)
Нового ничего нет.
Генерация избражений GAN (Ю.Д.)
Было произведено разбиение на 20 одинаковых по численнести классов.
Наблюдается довольно длинный хвост в распределении по энергии с заметным привышением исходного распределения.
При малых энергиях наоборот, сильное занижение распределения.
Посмотреть вариант с разбиением на 2 класса только последнего 10 класса.
Возможно надо искусственно увеличить число событий в нем в 2 раза путем дублирования и перемешивания.
HiSCORE, 120 станций (А.В.)
Новые результаты распределения ошибок по телесному углу.
Использовалась аппроксимация (усреднение).
Ошибка по телесному углу составила 1.5-2 градуса. Неплохо. (картинки!)
Повторить для случаев когда сработали минимум 4 станции и 5 станций и сравнить со случаем 3-х станций.
IACT (Е.Г.)
А.К.: Задача использование автоэнкодеров для сжатия данных.
Основание: данные имеют заметные случайные флуктуации, поэтому можно использовать сжатие с потерями.
Провести сравнение с PNG (с потерями) и ZIP (без потель).
Рассмотреть 2 варианта: просто полносвязанные сети и сверточные автоэнкодеры.
Разместить на сайте список литературы - А.Д.
ОТЧЕТ 2022 (А.К.)
Самое главное сейчас - это отчет первого года.
План по публикациям мы выполнили.
Буду просить вас присылать мне тексты на русском. Просьба оперативно откликаться.
поиск минимума на поверхностях, определяемых условиями ограничений (априоными знаниями) — так называемый жесткий вариант учета ограничений (hard constraints);
мягкий вариант (soft constraints) — путем добавления ограничений в функцию потерь генеративной сети.
Последний способ предполагается рассмотреть в двух вариантах:
множитель перед членом с ограничениями в функции потерь рассматривается как один из гиперпараметров и подбирается экспериментально;
использование формализма множителей Лагранжа, так что значение множителя перед членом определяется экстремумом (седловой точкой) такой гибридной функции потерь.
поиск минимума на поверхностях, определяемых условиями ограничений (априоными знаниями) — так называемый жесткий вариант учета ограничений (hard constraints);
мягкий вариант (soft constraints) — путем добавления ограничений в функцию потерь генеративной сети.
Последний способ предполагается рассмотреть в двух вариантах:
множитель перед членом с ограничениями в функции потерь рассматривается как один из гиперпараметров и подбирается экспериментально;
использование формализма множителей Лагранжа, так что значение множителя перед членом определяется экстремумом (седловой точкой) такой гибридной функции потерь.
Стоимость платной публикации от 1000 до 2500 долларов.
Труды ACAT-2021.
21/04/2022
Текущие вопросы - А.К.
Подготовка заявки на новый грант РНФ сдвинул ряд наших вопросов.
Участие в конференции RCRC-2022, 27.06-02.07, Москва.
Подготовка DLCP-2022, Дубна. Вторая половина июня, м.б. июль.
Избранные сатьи будут опубликованы в журнале “Вычислительные методы и программирование” (Воеводин).
Официальная информация о том, что список допустимых изданимй будет расширен за счет российских журналов, пока нет.
Хохлов опубликовал сообщение, что руководители грантов “получили” уведомление РНФ, что будут учитываться публикации в RSCI. Это WoS+Scopus+дополнительный список ведущих российских изданий. Я пока такого уведомления не получал.
поиск минимума на поверхностях, определяемых условиями ограничений (априоными знаниями) — так называемый жесткий вариант учета ограничений (hard constraints);
мягкий вариант (soft constraints) — путем добавления ограничений в функцию потерь генеративной сети.
Последний способ предполагается рассмотреть в двух вариантах:
множитель перед членом с ограничениями в функции потерь рассматривается как один из гиперпараметров и подбирается экспериментально;
А.Д. Формализм множителей Лагранжа, так что значение множителя перед членом определяется экстремумом (седловой точкой) такой гибридной функции потерь.
Физические критерии, например, качество генерации событий, распределение по энергии.
Программные критерии, например, устойчивость к переобучению, скрорость генерации.
Выбор типа сетей - А.К.
GAN и основанные на них сети. - Ю.Д., Е.Г.
Ю.Д. Добавить иллюстрации и ссылки на источники в заметки по GAN
Лиза - проверить как работает cGAN, если дополнительную информацию просто добавлять во входной случайный вектор.
Если после входного слоя идет полносвязанный, то все будет перемешано и вроде все должно работать без перевода дополнительной информации в формат “картинки”.
VAE и основанные на них сети. - С.П., А.В.
Условные VAE - ссылки на работы.
Функции ошибок (Wasserstein) - А.Д., А.К.
Провести тесты по использованию “мягких связей”. Например, генерация событий с определенной энергией.
А.Д. Вопрос об использовании членов lambda*Ф(E) в функции ошибок.
Для начала будет вместо энергии использовать хорошо определенную величину - size (яркость).
Адаптация существующих и разработка новых методов
Текущие результаты по GAN - Ю.Д., Е.Г.
Картинки с примерами событий.
Текущие результаты по cGAN - Ю.Д., Е.Г.
VAE - С.П., А.В.
Текущие результаты по VAE - С.П., А.В.
Картинки с примерами событий.
Сделать картинки более яркими.
Инструкция для запуска контейнеров.
А.К.: Где она на сайте?
cVAE - С.П.
для cVAE используем size вместо жэнергии, как более простой и четкий критерий.
Подготовка публикаций - А.Д., А.К. –> 28/04/2022
The 21st International Symposium on Very High Energy Cosmic Ray Interactions (ISVHECRI 2022)
India, May 23-28, 2022. Есть ZOOM.
37 Всероссийская конференция по космическим лучам (ВККЛ-2022)
Москва, 27 июня → 2 июля 2022 года
Избранные статьи в журнале ВМиП, после дополнительного рецензирования!
Труды ACAT-2021.
Прочее
Следующее совещание состоиться 12 мая. Будет сообщено дополнительно.
14/04/2022
Текущие вопросы - А.К.
Участие в конференции RCRC-2022, 27.06-02.07, Москва.
Подготовка DLCP-2022, Дубна. Вторая половина июня, м.б. июль.
Есть информация, что список допустимых изданимй будет расширен за счет российских журналов. Официальное извещение ожидается в ближайшие дни.
Аналитический обзор - А.Д, А.К. –> 21/04/2022
А.К.: Добавить иллюстративный материал.
А.К.: сети с условиями.
поиск минимума на поверхностях, определяемых условиями ограничений (априоными знаниями) — так называемый жесткий вариант учета ограничений (hard constraints);
мягкий вариант (soft constraints) — путем добавления ограничений в функцию потерь генеративной сети.
Последний способ предполагается рассмотреть в двух вариантах:
множитель перед членом с ограничениями в функции потерь рассматривается как один из гиперпараметров и подбирается экспериментально;
использование формализма множителей Лагранжа, так что значение множителя перед членом определяется экстремумом (седловой точкой) такой гибридной функции потерь.</code>
При этом будут исследованы различные способы поиска минимума такой
гибридной функции ошибок, в частности:
- поиск минимума на поверхностях, определяемых условиями ограничений
(априоными знаниями) — так называемый жесткий вариант учета ограничений
(hard constraints);
- мягкий вариант (soft constraints) — путем добавления ограничений в
функцию потерь генеративной сети.
Последний способ предполагается рассмотреть в двух вариантах:
- множитель перед членом с ограничениями в функции потерь
рассматривается как один из гиперпараметров и подбирается
экспериментально;
- использование формализма множителей Лагранжа, так что значение
множителя перед членом определяется экстремумом (седловой точкой)
такой гибридной функции потерь.