简介
为何工业 AI 终于落地可用。
过去三年的三项结构性变化,已经把工业 AI 从 PPT 时代带入实际可用阶段。第一,边缘 GPU 价格大幅下降:NVIDIA Jetson Orin Nano 如今以三分之一的成本,提供了 2022 年 Xavier 才能交付的算力。第二,时间序列数据库——InfluxDB、TimescaleDB、QuestDB——已成熟为生产级基础设施。第三,预训练模型,从用于视觉的 YOLO 到用于时间序列预测的 PatchTST,把训练数据需求降低了一个数量级。曾经的研究课题,如今已成为工程任务。
然而大多数工厂仍未真正使用自己已经采集的数据。工业调研一再发现,60% 至 80% 的制造业现场拥有大量 historian 或 SCADA 数据,却几乎不用于预测。它们的"分析"是描述性的:一块 Grafana 面板、一份 Power BI 仪表板、一份每周 KPI 汇报。这些必要,但谈不上规范性分析。从"描述发生了什么"跃迁到"建议接下来该做什么"——正是工业 AI 创造价值的所在。
印度尼西亚映射出同样的差距,且各行业差异显著。卡拉旺与芝卡朗的汽车一级供应商已具备 AI 就绪条件:产线接入 OPC UA,MES 反馈给 ERP,工程团队也早已熟悉 OEE 语言。棕榈油加工厂、船厂与水务公司正在追赶——他们的原始数据有时比汽车行业更丰富,但分析成熟度更弱。两个细分市场都需要能熬过班次轮换、设备更替和季节性漂移的 AI 项目——而不是在实验室里跑得好、三个月后悄无声息停摆的试点。
SURIOTA 将工业 AI 定位为生产工程,而非数据科学秀场。我们部署的每一个模型都与一个基线启发式方法进行基准比较、配备漂移监测仪表,并附带重训 runbook 交付。当 rolling average 加报警阈值已经能以 10% 的运行成本提供 80% 的价值时,我们没有任何动机去推销最复杂的模型。能拿到长期回报的客户,正是那些从简单方案起步、只在数据本身要求时才增加复杂度的客户。
核心能力
我们在 AI 与工业分析领域的交付。
01 — 预测性维护
机器学习故障预测
将振动、温度与电流特征分析与机器学习模型相结合,在停机影响生产线前提前预警故障。
02 — 机器视觉质检
产线缺陷检测
基于定制化机器学习训练的视觉检测自动化方案;通过边缘 GPU 推理实现产线节拍同步运行。
03 — 异常检测
无监督实时监控
无监督模型能发现未知的故障模式;根因分析仪表板加速工程师响应。
04 — OEE 与生产分析
端到端可视化
设备综合效率监控、停机根因分析、班次间性能对比。
方法论
数据为先,模型为次,运维为底。
第一阶段是数据审计,约消耗整个项目工作量的 60%。我们盘点每一处数据源——historian、SCADA、MES、ERP、人工日志——评估采样率、缺失情况、标签质量与数据血缘,然后建立一份特征目录,把每一个变量绑定到具体的工艺含义。工业 AI 项目失败的 60% 根源于这一阶段。在脏数据上训练出来的不是模型,而是一台自信地输出错误预测的发生器,多数团队等到模型已经上仪表板时才发现这一点。
第二阶段先确立基线,再追求复杂度。我们先采用简单、可解释的方法——rolling average、isolation forest、统计过程控制、ARIMA、exponential smoothing——只有在能证明基线已达到瓶颈之后,才转向深度学习。每一个高级模型都在同样的留出窗口与同样的运营成本假设下,与该基线进行基准比较。我们已经叫停过若干本来颇为出色的深度学习原型,因为 rolling-window 基线以十分之一的运营复杂度就达成了同等效果。
第三阶段是部署,架构因用例而异。机器视觉质检在产线上运行于 NVIDIA Jetson 或 Intel OpenVINO,因为产线节拍加摄像头帧率不允许云端延迟。预测性维护与能源分析在云端进行批量打分,通常每 5 至 15 分钟一次,针对 TimescaleDB 或 InfluxDB。OEE 分析与异常检测居于中间——边缘聚合,云端推理。我们通过 Docker 容器部署,在边缘以 Portainer 或轻量级 Kubernetes(K3s)管理,并锁定每一项依赖的版本。
第四阶段是 MLOps,我们将其视为不可省略的环节。每一个生产模型都装配漂移监测仪表,针对参考分布做对比,按既定节奏或漂移告警触发重训,并与其取代的传统启发式方法进行 A/B 对比。模型性能、预测置信度与下游业务 KPI 都会被记录。当模型性能下降时——所有模型最终都会下降——runbook 会告诉值班工程师在接下来 30 分钟内该做什么,而不是接下来 30 天。
支撑栈刻意保持务实:深度学习用 TensorFlow 与 PyTorch,其余一切用 scikit-learn,实验跟踪用 MLflow,时间序列存储用 InfluxDB 与 TimescaleDB,仪表板用 Grafana 与 Power BI,推理服务用 FastAPI。在可能的情况下我们避免厂家锁定——每个模型都可以在另一套技术栈上重新实现,所需工作量有据可查,因为工程价值沉淀在数据层与特征上,而非工具链。
服务行业
我们的部署领域。
0+
已交付项目
0
自研产品
0+
工程师
0
核心服务领域
工作流程
从数据审计到持续优化。
- 01
数据审计
数据源盘点、质量评估、特征目录梳理。
- 02
模型开发
基线评测、候选模型训练、验证流水线搭建。
- 03
试点
在有限产线部署、在线监控与模型校准。
- 04
规模化
全厂推广、MLOps 流水线、漂移监控。
- 05
优化
持续再训练、业务指标归因、模型刷新。
成果
能打动董事会的数字。
预测性维护是最具可银行价值的用例。在我们交付或审计过的部署中,非计划停机时间在头 12 个月减少 15% 至 25% 是常态,第二年随着模型成熟与维护团队信任度提升,再叠加 5% 至 10% 的复利。维护预算从被动响应向计划维护转移 20% 至 30%——同样的资金换来更多正常运行时间——紧急呼叫的加班支出也相应下降。
当基线是产线节拍下的人工检验时,机器视觉质检带来的数字最为惊人。缺陷检出率提升 30% 至 60% 是现实可达的,false-positive 率在第一个月调优后降至 2% 以下,检验吞吐量实际上变得不受限制,因为相机不会疲劳。节省体现为废品减少、客户退货下降以及返工减少——都可度量、都可审计。
OEE 分析单点提升较小,却以激进的方式复利累积。在头 90 天内提升 5 至 10 个 OEE 百分点很常见——只要把停线、微停以及质量损失正确分类,多数工厂只是从未真正了解时间花在了哪里。能源分析提供了另一个杠杆:通过负荷曲线优化、削峰填谷与 HVAC 调度,能源支出下降 8% 至 15%,仅就分析投资本身而言,回本周期常常在十二个月以内。
战略成果比任何单一 KPI 都更重要。AI 能力是持久的竞争护城河:它随着数据积累而复利增长,把维护与运营文化推向以证据为依据的决策方式,并提高每个班次在每条产线上能够达成的下限。三年之后,那些较早起步工业 AI 的客户,运行的并不是更好看的仪表板——他们运行的是更好的工厂,与尚未启动的对手之间的差距,已不再是一次资本支出可以弥合的。
常见问题
常见问题。
大多数客户在试点上线后 90 天内即可看到停机时间的明显下降,全面 ROI 通常在 12 个月内实现。
两者皆可。客户根据数据敏感度、延迟需求与现有基础设施自主选择。
由我们的第一项服务(工业 IoT)负责传感器加装。对于全新部署的分析项目,两项服务会打包交付。
归您所有。所有模型、权重、数据集与流水线均按合同移交给贵司团队。
相关案例