Skip to main content

Обучение и использование моделей

Полный цикл: от сбора данных до развёрнутой модели, выдающей Health Index и рекомендации по обслуживанию.

Пошаговый workflow

1. Требования к данным

Минимальный baseline

ПараметрРекомендация
Длительность записи14–30 дней непрерывной работы
Количество файлов>1 000 на точку измерения
Режимы работыДолжны быть представлены все штатные режимы (пуск, нагрузка, холостой ход)
Качество данныхБез пропусков >5 мин, без аномалий датчика

Источники данных

ИсточникОписаниеГде хранится
Сырые вибросигналыВременные ряды с Пассер-В, Пассер-ТS3 / MinIO
СпектрыFFT-разложение, вычисленное на ЛарусS3 / MinIO
ТелеметрияТемпература, давление, оборотыClickHouse (Стрикс)
Справочник подшипниковГеометрия, характерные частотыБаза знаний системы
Данные без дефектов

На новом оборудовании обычно нет данных с дефектами. Используйте синтетические дефекты для первоначального обучения, затем дообучите модель на реальных данных по мере их накопления.

2. Подготовка данных

ЭтапОписание
ФильтрацияУдаление шума, артефактов датчиков, нерабочих периодов
НормализацияПриведение к единому масштабу (z-score или min-max)
Разбиение на окнаДеление длинного сигнала на фрагменты фиксированной длины
СинхронизацияСопоставление вибрации с телеметрией по временным меткам

3. Извлечение признаков

Fedot.Industrial автоматически выполняет отбор признаков, но основные категории:

КатегорияПримеры признаков
ВременныеСКЗ, пик-фактор, эксцесс, асимметрия, энергия
ЧастотныеАмплитуды BPFO/BPFI/BSF/FTF, энергия полос, центральная частота
СпектральныеФорма огибающей спектра, спектральный эксцесс
Статистическиеq95, медиана, стандартное отклонение

4. Кластеризация и разметка

Выполняется в интерфейсе обучения:

  1. Автоматическая кластеризация по извлечённым признакам
  2. Визуализация в 2D/3D — оценка разделимости классов
  3. Ручная корректировка при необходимости
  4. Сохранение размеченной выборки

5. Обучение модели

Типы моделей

ЗадачаТип моделиОписание
Обнаружение аномалийAutoencoderОбучается на «нормальных» данных. Любое отклонение — аномалия
Классификация дефектовCNN / Random ForestОпределяет тип дефекта: подшипник, расцентровка, дисбаланс
Прогноз ресурса (RUL)LSTM / GRUПрогнозирует остаточный ресурс по тренду деградации
AutoML (Fedot.Industrial)

Fedot.Industrial автоматически подбирает оптимальную архитектуру модели и гиперпараметры. Инженеру не нужно выбирать тип модели вручную — достаточно подготовить данные и запустить обучение.

Параметры обучения

ПараметрЗначениеОписание
Размер тестовой выборки20–30%Данные, не участвующие в обучении — для оценки качества
Временная валидацияОбязательнаТестовая выборка — более поздний период, не случайная
Cross-validation5-foldДля малых выборок — перекрёстная проверка

6. Валидация

МетрикаОписаниеЦелевое значение
AccuracyДоля правильных предсказаний>95%
PrecisionДоля истинных дефектов среди предсказанных>90%
RecallДоля обнаруженных дефектов от всех реальных>97%
F1-scoreГармоническое среднее precision и recall>93%
False Alarm RateДоля ложных тревог<5%
Приоритет — Recall

В промышленной диагностике пропуск дефекта (false negative) опаснее ложной тревоги (false positive). Поэтому recall должен быть максимальным — лучше лишний раз проверить оборудование, чем пропустить развивающийся дефект.

7. Развёртывание

После успешной валидации модель развёртывается в продуктивной среде:

Привязка к оборудованию

Модель привязывается к конкретному элементу дерева предприятия через AAS. Для каждой точки мониторинга хранится:

  • Текущая версия модели
  • История версий
  • Метрики качества
  • Период обучающих данных

8. Интерпретация результатов

Health Index

Интегральная оценка состояния оборудования:

Health IndexСостояниеДействие
80–100%НормаШтатный мониторинг
60–80%ПредупреждениеПланирование осмотра
40–60%ВниманиеОсмотр в ближайший плановый останов
20–40%ОпасностьПодготовка к внеплановому ТОиР
0–20%КритическоеНемедленный останов

Уровни тревог

УровеньИсточникДействие
InfoML-модель обнаружила изменение паттернаЗапись в журнал
WarningHealth Index снизился ниже 60%Уведомление ответственному
AlarmHealth Index ниже 40% или классифицирован конкретный дефектАвтозаявка ТОиР в ЛиманИСУ

Переиспользование моделей

СценарийВозможностьУсловия
Тот же станок, другая точкаЧастичноЕсли элемент того же типа (оба — подшипник 6205)
Станок той же моделиДа (с ограничениями)Аналогичная конфигурация, схожие режимы
Станок другой моделиТолько спектральный сценарийТребуется дообучение на новых данных
Другой тип оборудованияНетНеобходимо обучение с нуля
Стратегия переиспользования

Начните с обучения модели на одном станке. После накопления данных с аналогичных станков — создайте обобщённую модель. Это снижает затраты на развёртывание при масштабировании.

FAQ

Сколько данных нужно для обучения?

Минимум 14 дней непрерывной записи для baseline. Для модели классификации дефектов — не менее 100 примеров каждого класса (реальных или синтетических). Оптимально — 30 дней baseline и последующее дообучение по мере накопления.

Работает ли модель офлайн?

Да. Инференс выполняется на сервере Стрикс Atlas, который может работать автономно без подключения к внешним сервисам. При потере связи с облаком модель продолжает работать.

Заменяет ли ML-модель эксперта-диагноста?

Нет. ML-модель — инструмент для инженера, а не замена. Модель обнаруживает отклонения и классифицирует их, но финальное решение о действиях принимает человек. Особенно на ранних стадиях внедрения важна верификация результатов экспертом.

Что делать с ложными тревогами?

Ложные тревоги — нормальная часть процесса, особенно на начальном этапе. Стратегия снижения:

  1. Обратная связь — отмечать ложные тревоги в системе
  2. Дообучение — периодически обновлять модель с учётом обратной связи
  3. Адаптивные пороги — модель автоматически корректирует чувствительность

Какой формат экспорта модели?

Поддерживаются стандартные форматы: ONNX, PMML, pickle. Модель экспортируется вместе с метаданными (версия, параметры обучения, метрики качества).

Связанные разделы