В ИТМО представили ИИ-помощника для автоматизации работы с научным кодом

Ученые ИТМО представили (OSA) — инструмент на основе больших языковых моделей, который «наводит порядок» в хранилищах открытого научного кода и делает их более удобными для переиспользования другими научными командами.
В ИТМО представили ИИ-помощника для автоматизации работы с научным кодом
Руководитель проекта к.т.н. Николай Никитин. Фото: Дмитрий Григорьев. Источник изображения: ITMO NEWS

В частности, применение OSA поможет ученым заново провести описанные в чужой статье эксперименты или запустить алгоритм. Инструмент упрощает систематизацию научных данных и за счет этого повышает ценность научных публикаций. Разработка будет полезна как самим авторам кода, так и пользователям, которые хотят разобраться в чужих данных и использовать их в своих исследованиях.

Чтобы ученые могли пользоваться наработками других команд, важно публиковать все результаты и делать их прозрачными и понятными. Для этого научные статьи и вспомогательные материалы для них (например, данные для обучения моделей, код для реализации алгоритмов, проведения экспериментов, эталонные наборы данных) загружают в репозитории — специальные хранилища кода, открытые для других пользователей. Каждый такой репозиторий должен быть удобен для запуска и использования: хорошо структурирован, написан на английском языке, иметь описание. Но часто это не так: код и данные хранятся хаотично и разобраться в них может только автор. Из-за этого сложно переиспользовать опубликованные результаты, воспроизвести описанный в статье алгоритм — а это, в свою очередь, снижает ценность научной публикации, ее цитируемость.

Для решения этой проблемы можно использовать ИИ-ассистентов для написания кода (например, GitHub Copilot), отдельные инструменты для документирования кода. Однако комплексного решения, которое полностью автоматизирует цикл работы с репозиторием на всех этапах, до сих пор не существовало.

Чтобы сделать научные данные более читаемыми и воспроизводимыми, ученые ИТМО разработали Open Source Advisor (OSA) — инструмент на основе больших языковых моделей, который улучшает репозитории с открытым научным кодом. Он позволяет создавать открытые репозитории на основе имеющегося кода и научной статьи по реализации предложенного метода, генерирует описание и для репозитория в целом, и для отдельных классов и методов, «пишет» отчеты о необходимых доработках, упорядочивает содержание. Инструмент будет полезен ученым (например, биологам и химикам), которые не обладают опытом коммерческой разработки и навыками оформления кода.

Авторы использовали мультиагентную систему на основе больших языковых моделей, каждая из которых решает свою задачу: генерация документации, тестирование и анализ кода. В зависимости от наличия доступа пользователь сам может выбрать, какие модели он хочет использовать: GPT-4, LLaMA, GigaChat и другие.

«Сейчас инструмент находится на стадии бета-тестирования (в частности, мы обсуждаем тестирование OSA на AI-first платформе GitVerse), а полноценную версию инструмента планируем выпустить к осени. В будущем мы хотим развернуть этот инструмент на серверах ИТМО, чтобы пользоваться им было еще проще. Сейчас мы работаем над автоматической генерацией тестов, чтобы пользователь мог убедиться, что код корректно запускается, а также реализуем автоматическое создание графов знаний о лучших практиках открытой разработки, применение которых обеспечивает повышение качества модели», — рассказал руководитель проекта и группы научно-технического развития исследовательского центра «Сильный искусственный интеллект в промышленности» ИТМО Николай Никитин.

Ученые уже протестировали программу на нескольких репозиториях команд ИТМО, а также на проектах зарубежных коллег из Бразилии — на них в том числе проверили функцию автоматического перевода названий файлов и папок с португальского языка на английский, чтобы создаваемый открытый код был доступен международному научному сообществу. В будущем исследователи планируют «научить» программу решать более сложные задачи разработки научных проектов и еще больше снизить степень требования к начальной готовности кода.

Источник: ITMO NEWS

Читайте также

  • 25.11.2025

    Ученые ИТМО и Сбера представили новую мультиагентную ИИ-систему для быстрого создания новых лекарств

    Исследователи из ИТМО при поддержке ученых Центра практического искусственного интеллекта Сбера разработали мультиагентную систему для поиска новых лекарственных молекул.

  • 30.10.2025

    Маршрут перестроен: в ИТМО разработали ИИ-сервис для оптимизации маршрутов общественного транспорта

    С помощью ИИ-инструмента ConnectPT от разработчиков из Института искусственного интеллекта ИТМО можно быстро и без дополнительных затрат проанализировать уже существующие маршруты городского пассажирского транспорта и получить рекомендации, как их улучшить.

  • 17.09.2025

    Совместное исследование Yandex B2B Tech и Университета ИТМО: 75% разработчиков уже используют ИИ-ассистенты при работе с кодом

    Yandex B2B Tech и Университет ИТМО провели исследование инструментов разработки среди более чем 600 разработчиков, преподавателей и студентов IT-направлений.