Обучение и использование моделей
Полный цикл: от сбора данных до развёрнутой модели, выдающей Health Index и рекомендации по обслуживанию.
Пошаговый workflow
1. Требования к данным
Минимальный baseline
| Параметр | Рекомендация |
|---|---|
| Длительность записи | 14–30 дней непрерывной работы |
| Количество файлов | >1 000 на точку измерения |
| Режимы работы | Должны быть представлены все штатные режимы (пуск, нагрузка, холостой ход) |
| Качество данных | Без пропусков >5 мин, без аномалий датчика |
Источники данных
| Источник | Описание | Где хранится |
|---|---|---|
| Сырые вибросигналы | Временные ряды с Пассер-В, Пассер-Т | S3 / MinIO |
| Спектры | FFT-разложение, вычисленное на Ларус | S3 / MinIO |
| Телеметрия | Температура, давлен ие, обороты | ClickHouse (Стрикс) |
| Справочник подшипников | Геометрия, характерные частоты | База знаний системы |
На новом оборудовании обычно нет данных с дефектами. Используйте синтетические дефекты для первоначального обучения, затем дообучите модель на реальных данных по мере их накопления.
2. Подготовка данных
| Этап | Описание |
|---|---|
| Фильтрация | Удаление шума, артефактов датчиков, нерабочих периодов |
| Нормализация | Приведение к единому масштабу (z-score или min-max) |
| Разбиение на окна | Деление длинного сигнала на фрагменты фиксированной длины |
| Синхронизация | Сопоставление вибрации с телеметрией по временным меткам |
3. Извлечение признаков
Fedot.Industrial автоматически выполняет отбор признаков, но основные категории:
| Категория | Примеры признаков |
|---|---|
| Временные | СКЗ, пик-фактор, эксцесс, асимметрия, энергия |
| Частотные | Амплитуды BPFO/BPFI/BSF/FTF, энергия полос, центральная частота |
| Спектральные | Форма огибающей спектра, спектральный эксцесс |
| Статистические | q95, медиана, стандартное отклонение |
4. Кластеризация и разметка
Выполняется в интерфейсе обучения:
- Автоматическая кластеризация по извлечённым признакам
- Визуализация в 2D/3D — оценка разделимости классов
- Ручная корректировка при необходимости
- Сохранение размеченной выборки
5. Обучение модели
Типы моделей
| Задача | Тип модели | Описание |
|---|---|---|
| Обнаружение аномалий | Autoencoder | Обучается на «нормальных» данных. Любое отклонение — аномалия |
| Классификация дефектов | CNN / Random Forest | Определяет тип дефекта: подшипник, расцентровка, дисбаланс |
| Прогноз ресурса (RUL) | LSTM / GRU | Прогнозирует остаточный ресурс по тренду деградации |
Fedot.Industrial автоматически подбирает оптимальную архитектуру модели и гиперпараметры. Инженеру не нужно выбирать тип модели вручную — достаточно подготовить данные и запустить обучение.
Параметры обучения
| Параметр | Значение | Описание |
|---|---|---|
| Размер тестовой выборки | 20–30% | Данные, не участвующие в обучении — для оценки качества |
| Временная валидация | Обязательна | Тестовая выборка — более поздний период, не случайная |
| Cross-validation | 5-fold | Для малых выборок — перекрёстная проверка |
6. Валидация
| Метрика | Описание | Целевое значение |
|---|---|---|
| Accuracy | Доля правильных предсказаний | >95% |
| Precision | Доля истинных дефектов среди предсказанных | >90% |
| Recall | Доля обнаруженных дефектов от всех реальных | >97% |
| F1-score | Гармоническое среднее precision и recall | >93% |
| False Alarm Rate | Доля ложных тревог | <5% |
В промышленной диагностике пропуск дефекта (false negative) опаснее ложной тревоги (false positive). Поэтому recall должен быть максимальным — лучше лишний раз проверить оборудование, чем пропустить развивающийся дефект.
7. Развёртывание
После успешной валидации модель развёртывается в продуктивной среде:
Привязка к оборудованию
Модель привязывается к конкретному элементу дерева предприятия через AAS. Для каждой точки мониторинга хранится:
- Текущая версия модели
- История версий
- Метрики качества
- Период обучающих данных
8. Интерпретация результатов
Health Index
Интегральная оценка состояния оборудования:
| Health Index | Состояние | Действие |
|---|---|---|
| 80–100% | Норма | Штатный мониторинг |
| 60–80% | Предупреждение | Планирование осмотра |
| 40–60% | Внимание | Осмотр в ближайший плановый останов |
| 20–40% | Опасность | Подготовка к внеплановому ТОиР |
| 0–20% | Критическое | Немедленный останов |
Уровни тревог
| Уровень | Источник | Действие |
|---|---|---|
| Info | ML-модель обнаружила изменение паттерна | Запись в журнал |
| Warning | Health Index снизился ниже 60% | Уведомление ответственному |
| Alarm | Health Index ниже 40% или классифицирован конкретный дефект | Автозаявка ТОиР в ЛиманИСУ |
Переиспользование моделей
| Сценарий | Возможность | Условия |
|---|---|---|
| Тот же станок, другая точка | Частично | Если элемент того же типа (оба — подшипник 6205) |
| Станок той же модели | Да (с ограничениями) | Аналогичная конфигурация, схожие режимы |
| Станок другой модели | Только спектральный сценарий | Требуется дообучение на новых данных |
| Другой тип оборудования | Нет | Необходимо обучение с нуля |
Начните с обучения модели на одном станке. После накопления данных с аналогичных станков — создайте обобщённую модель. Это снижает затраты на развёртывание при масштабировании.
FAQ
Сколько данных нужно для обучения?
Минимум 14 дней непрерывной записи для baseline. Для модели классификации дефектов — не менее 100 примеров каждого класса (реальных или синтетических). Оптимально — 30 дней baseline и последующее дообучение по мере накопления.
Работает ли модель офлайн?
Да. Инференс выполняется на сервере Стрикс Atlas, который может работать автономно без подключения к внешним сервисам. При потере связи с облаком модель продолжает работать.
Заменяет ли ML-модель эксперта-диагноста?
Нет. ML-модель — инструмент для инженера, а не замена. Модель обнаруживает отклонения и классифицирует их, но финальное решение о действиях принимает человек. Особенно на ранних стадиях внедрения важна верификация результатов экспертом.
Что делать с ложн ыми тревогами?
Ложные тревоги — нормальная часть процесса, особенно на начальном этапе. Стратегия снижения:
- Обратная связь — отмечать ложные тревоги в системе
- Дообучение — периодически обновлять модель с учётом обратной связи
- Адаптивные пороги — модель автоматически корректирует чувствительность
Какой формат экспорта модели?
Поддерживаются стандартные форматы: ONNX, PMML, pickle. Модель экспортируется вместе с метаданными (версия, параметры обучения, метрики качества).
Связанные разделы
- Сценарии использования — выбор подхода к обучению
- Интерфейс обучения моделей — практическая работа с данными
- Подключение к платформе — интеграция модели с AAS
- Стрикс.Диагност — продукт, использующий ML-аналитику
- Прогноз ресурса в ЛиманИСУ — тренды и остаточный ресурс