跳到主要内容

快速入门

本文将指导您从零开始，在 MLOps 模块中以“异常检测”等基础算法场景为例，走通一条“准备数据集 -> 开启模型训练 -> 上线发布服务 -> 在线推理调用”的核心大满贯链路。

前置条件

您已经拥有 BK-Lite 的访问账户并且授予了 MLOps 资源的管理视图相关权限。
提前准备好了一份能够用于该算法场景的测试数据集（例如一批指标形态的结构化 CSV 原文件等，符合选定特征的数据集文件即可）。

分步操作指引

1. 挂载数据底座 (数据集管理)

模型的效果好坏强赖于前期的“喂养”。

登录系统进入 MLOps，在平台左上角“场景下拉框”中选择您的目标算法场景（例如：异常检测 或 图片分类）。
前往左侧导航栏的「数据集」菜单，点击「新建数据集」，输入基本信息等进行数据坑位建桩。
点击新创建的数据集详情，将您的原始样本文件批量上传，并结合业务规则，在页面上为它们标记对应的用途，例如：“训练集”或者“测试集”。
样本划分完毕后，点击顶部的「发布版本」，为此时间截面上的数据打一个用于挂载的“数据基线（V1版）”，状态将流转至“已发布”即可用。

2. 调度与生成模型 (训练任务管理)

组装刚打好的数据基线和系统底层算法开始让机器自动总结规律。

回到左侧菜单，进入「训练任务」区域并点击「新建任务」。
在任务配置界面的弹窗内，核心只需挂载两项内容：① 您在“步骤1”中刚打好的「数据集发布版本」；② 希望使用的算法配置与核心的入参特征。
点击保存后，任务将处于「待训练」状态。此时点进任务列表对应的「启动训练」按钮。
在实际训练过程中（处于“训练中”），您可以随时刷新并透视此任务的指标历史与运行参数面板，以此判断效果并预估剩余等待时间。

3. 构建可消费的黑盒能力 (能力发布)

模型只要变为在线接口或测试窗后，其业务价值才得以外溢。

当训练任务状态变更为“已完成”后，点击左侧「能力发布」并选择「新建服务」。
在弹框中指定刚刚跑好的那份“训练任务记录”及其孵化出的那条确切的“模型产物版本号”。
保存完成后系统会为您分配一条处于休眠状态的服务。点击操作栏的「启动」，系统底层容器接管将启动对应的推理容器包分配并把流量打通。

结果验证与闭环

成功拉起容器（即服务状态展示为 Active/已启动 ）后，请不要急着离开网页：

直接在能力发布栏找到您上线的那条规则，点击「在线推理」按钮。
在弹出的可视化交互窗中，传入您准备的一条从未给模型投喂过的全新数据或本地测试图片，点击提交。
观察下方的模型吐出结果（推理响应区），判断它的识别打标是否准确。
业务闭环建议：当推理质量达到您的验收预期后，您的相关客户端系统或内部运维模块，就可以对接本服务所公示的统一 API 以便进行全自动的高频识别调用工作了。如果效果欠佳，请返回「数据集管理」环节补充您的特殊案例数据，重新发布 V2 版并进行新一轮的迭代训练。

前置条件
分步操作指引
结果验证与闭环