| Разработчики: | Норильский никель, ГМК (Норникель) |
| Дата премьеры системы: | декабрь 2025 г. |
| Отрасли: | Металлургическая промышленность |
2025: Анонс продукта
В декабре 2025 года «Норникель» представила MetalGPT-1 — собственную доменную языковую модель для металлургии и горнодобывающей отрасли. Модель стала первой в семействе больших языковых моделей компани. О запуске модели компания сообщила 9 декабря 2025 года.
Как сообщает пресс-служба «Норникеля», разработанная модель формирует единый языковый слой для инженерных, технологических, производственных и корпоративных задач. На её основе компания создаёт персональных ИИ-ассистентов и автономных агентов, которые внедряются в операционные процессы. Использование доменной модели снижает уровень галлюцинаций и повышает качество решений, принимаемых на основе рекомендаций искусственного интеллекта.
Языковая модель включает 32 млрд параметров и обучена на 10 гигабайтах профильных текстов по металлургии и горнодобывающей промышленности. Этот объём сопоставим с половиной англоязычной Википедии. Ключевое конкурентное преимущество модели — уникальное качество данных. Обучение проведено на более чем 1 млн документов, недоступных в открытых источниках.Российский рынок BPM-систем: оценки, лидеры, тренды и перспективы. Обзор TAdviser
Обучающие данные включают технологические протоколы, внутренние регламенты и инструкции предприятий, проектную и строительную документацию, патенты, отчёты НИОКР, научно-техническую литературу. Все данные прошли многоступенчатую очистку и анонимизацию, что позволило использовать отраслевые знания без раскрытия коммерческой тайны.
Дополнительно создано около 500 тыс. вопросно-ответных и инструктивных пар на основе реальных производственных и научных задач. Это помогает модели лучше улавливать причинно-следственные связи в технологических процессах и выдавать устойчивые к ошибкам ответы. Синтетические данные обучают модель понимать контекст специфических производственных ситуаций.
Разработка MetalGPT-1 заняла около года. Шесть месяцев ушло на сбор и подготовку данных, два месяца — на базовое обучение и ещё два — на доменную адаптацию и тонкую настройку модели. Длительный этап подготовки данных отражает сложность работы с промышленной документацией и необходимость её структурирования.[1]
