Обучение и использование моделей

Полный цикл: от сбора данных до развёрнутой модели, выдающей Health Index и рекомендации по обслуживанию.

Пошаговый workflow

1. Требования к данным

Минимальный baseline

Параметр	Рекомендация
Длительность записи	14–30 дней непрерывной работы
Количество файлов	>1 000 на точку измерения
Режимы работы	Должны быть представлены все штатные режимы (пуск, нагрузка, холостой ход)
Качество данных	Без пропусков >5 мин, без аномалий датчика

Источники данных

Источник	Описание	Где хранится
Сырые вибросигналы	Временные ряды с Пассер-В, Пассер-Т	S3 / MinIO
Спектры	FFT-разложение, вычисленное на Ларус	S3 / MinIO
Телеметрия	Температура, давление, обороты	ClickHouse (Стрикс)
Справочник подшипников	Геометрия, характерные частоты	База знаний системы

Данные без дефектов

На новом оборудовании обычно нет данных с дефектами. Используйте синтетические дефекты для первоначального обучения, затем дообучите модель на реальных данных по мере их накопления.

2. Подготовка данных

Этап	Описание
Фильтрация	Удаление шума, артефактов датчиков, нерабочих периодов
Нормализация	Приведение к единому масштабу (z-score или min-max)
Разбиение на окна	Деление длинного сигнала на фрагменты фиксированной длины
Синхронизация	Сопоставление вибрации с телеметрией по временным меткам

3. Извлечение признаков

Fedot.Industrial автоматически выполняет отбор признаков, но основные категории:

Категория	Примеры признаков
Временные	СКЗ, пик-фактор, эксцесс, асимметрия, энергия
Частотные	Амплитуды BPFO/BPFI/BSF/FTF, энергия полос, центральная частота
Спектральные	Форма огибающей спектра, спектральный эксцесс
Статистические	q95, медиана, стандартное отклонение

4. Кластеризация и разметка

Выполняется в интерфейсе обучения:

Автоматическая кластеризация по извлечённым признакам
Визуализация в 2D/3D — оценка разделимости классов
Ручная корректировка при необходимости
Сохранение размеченной выборки

5. Обучение модели

Типы моделей

Задача	Тип модели	Описание
Обнаружение аномалий	Autoencoder	Обучается на «нормальных» данных. Любое отклонение — аномалия
Классификация дефектов	CNN / Random Forest	Определяет тип дефекта: подшипник, расцентровка, дисбаланс
Прогноз ресурса (RUL)	LSTM / GRU	Прогнозирует остаточный ресурс по тренду деградации

AutoML (Fedot.Industrial)

Fedot.Industrial автоматически подбирает оптимальную архитектуру модели и гиперпараметры. Инженеру не нужно выбирать тип модели вручную — достаточно подготовить данные и запустить обучение.

Параметры обучения

Параметр	Значение	Описание
Размер тестовой выборки	20–30%	Данные, не участвующие в обучении — для оценки качества
Временная валидация	Обязательна	Тестовая выборка — более поздний период, не случайная
Cross-validation	5-fold	Для малых выборок — перекрёстная проверка

6. Валидация

Метрика	Описание	Целевое значение
Accuracy	Доля правильных предсказаний	>95%
Precision	Доля истинных дефектов среди предсказанных	>90%
Recall	Доля обнаруженных дефектов от всех реальных	>97%
F1-score	Гармоническое среднее precision и recall	>93%
False Alarm Rate	Доля ложных тревог	<5%

Приоритет — Recall

В промышленной диагностике пропуск дефекта (false negative) опаснее ложной тревоги (false positive). Поэтому recall должен быть максимальным — лучше лишний раз проверить оборудование, чем пропустить развивающийся дефект.

7. Развёртывание

После успешной валидации модель развёртывается в продуктивной среде:

Привязка к оборудованию

Модель привязывается к конкретному элементу дерева предприятия через AAS. Для каждой точки мониторинга хранится:

Текущая версия модели
История версий
Метрики качества
Период обучающих данных

8. Интерпретация результатов

Health Index

Интегральная оценка состояния оборудования:

Health Index	Состояние	Действие
80–100%	Норма	Штатный мониторинг
60–80%	Предупреждение	Планирование осмотра
40–60%	Внимание	Осмотр в ближайший плановый останов
20–40%	Опасность	Подготовка к внеплановому ТОиР
0–20%	Критическое	Немедленный останов

Уровни тревог

Уровень	Источник	Действие
Info	ML-модель обнаружила изменение паттерна	Запись в журнал
Warning	Health Index снизился ниже 60%	Уведомление ответственному
Alarm	Health Index ниже 40% или классифицирован конкретный дефект	Автозаявка ТОиР в ЛиманИСУ

Переиспользование моделей

Сценарий	Возможность	Условия
Тот же станок, другая точка	Частично	Если элемент того же типа (оба — подшипник 6205)
Станок той же модели	Да (с ограничениями)	Аналогичная конфигурация, схожие режимы
Станок другой модели	Только спектральный сценарий	Требуется дообучение на новых данных
Другой тип оборудования	Нет	Необходимо обучение с нуля

Стратегия переиспользования

Начните с обучения модели на одном станке. После накопления данных с аналогичных станков — создайте обобщённую модель. Это снижает затраты на развёртывание при масштабировании.

FAQ

Сколько данных нужно для обучения?

Минимум 14 дней непрерывной записи для baseline. Для модели классификации дефектов — не менее 100 примеров каждого класса (реальных или синтетических). Оптимально — 30 дней baseline и последующее дообучение по мере накопления.

Работает ли модель офлайн?

Да. Инференс выполняется на сервере Стрикс Atlas, который может работать автономно без подключения к внешним сервисам. При потере связи с облаком модель продолжает работать.

Заменяет ли ML-модель эксперта-диагноста?

Нет. ML-модель — инструмент для инженера, а не замена. Модель обнаруживает отклонения и классифицирует их, но финальное решение о действиях принимает человек. Особенно на ранних стадиях внедрения важна верификация результатов экспертом.

Что делать с ложными тревогами?

Ложные тревоги — нормальная часть процесса, особенно на начальном этапе. Стратегия снижения:

Обратная связь — отмечать ложные тревоги в системе
Дообучение — периодически обновлять модель с учётом обратной связи
Адаптивные пороги — модель автоматически корректирует чувствительность

Какой формат экспорта модели?

Поддерживаются стандартные форматы: ONNX, PMML, pickle. Модель экспортируется вместе с метаданными (версия, параметры обучения, метрики качества).

Связанные разделы

Сценарии использования — выбор подхода к обучению
Интерфейс обучения моделей — практическая работа с данными
Подключение к платформе — интеграция модели с AAS
Стрикс.Диагност — продукт, использующий ML-аналитику
Прогноз ресурса в ЛиманИСУ — тренды и остаточный ресурс

Пошаговый workflow​

1. Требования к данным​

Минимальный baseline​

Источники данных​

2. Подготовка данных​

3. Извлечение признаков​

4. Кластеризация и разметка​

5. Обучение модели​

Типы моделей​

Параметры обучения​

6. Валидация​

7. Развёртывание​

Привязка к оборудованию​

8. Интерпретация результатов​

Health Index​

Уровни тревог​

Переиспользование моделей​

FAQ​

Сколько данных нужно для обучения?​

Работает ли модель офлайн?​

Заменяет ли ML-модель эксперта-диагноста?​

Что делать с ложными тревогами?​

Какой формат экспорта модели?​

Связанные разделы​