BAMT: библиотека моделирования и анализа данных на основе байесовских сетей
Инструмент помогает разрешить ситуацию, когда экспертные знания, необходимые для структурирования сети (ориентированной вероятностной модели, позволяющей моделировать многомерные распределения данных) оказываются недоступны. Для устранения этой проблемы производят обучение «из данных». BAMT работает с дискретными и непрерывными их типами. Также инструмент позволяет восстанавливать пропуски, извлекать информацию о зависимостях, выделять аномальные значения и генерировать синтетические данные.
Эффекты от внедрения
- Повышение эффективности моделирования в 2 раза на индустриальных данных по сравнения с экспертными моделями
Конкурентные преимущества
Автоматизация подбора решения по системе метрик качества
Объяснимость решения и генерация кода решения задачи на Python
Алгоритмы работают в том числе со смешанными данными (непрерывные и категориальные значения)
Поддерживаются функции оценки для смешанных данных
Для параметрического обучения реализовано использование смеси гауссовых распределений для аппроксимации непрерывных распределений
- Обеспечено непараметрическое обучение распределений с использованием различных пользовательских моделей регрессии и классификации
Доступен алгоритм структурного обучения больших байесовских сетей
Общая информация
УГТ-8
Система проверена на работоспособность в своей конечной форме и в ожидаемых условиях эксплуатации
Руководитель разработки
к.ф-м.н. Ирина Деева ideeva@itmo.ru
Инициатор