跳到主要内容

快速入门

本文将指导您从零开始,在 MLOps 模块中以“异常检测”等基础算法场景为例,走通一条“准备数据集 -> 开启模型训练 -> 上线发布服务 -> 在线推理调用”的核心大满贯链路。

前置条件

  • 您已经拥有 BK-Lite 的访问账户并且授予了 MLOps 资源的管理视图相关权限。
  • 提前准备好了一份能够用于该算法场景的测试数据集(例如一批指标形态的结构化 CSV 原文件等,符合选定特征的数据集文件即可)。

分步操作指引

1. 挂载数据底座 (数据集管理)

模型的效果好坏强赖于前期的“喂养”。

  1. 登录系统进入 MLOps,在平台左上角“场景下拉框”中选择您的目标算法场景(例如:异常检测图片分类)。
  2. 前往左侧导航栏的「数据集」菜单,点击「新建数据集」,输入基本信息等进行数据坑位建桩。
  3. 点击新创建的数据集详情,将您的原始样本文件批量上传,并结合业务规则,在页面上为它们标记对应的用途,例如:“训练集”或者“测试集”。
  4. 样本划分完毕后,点击顶部的「发布版本」,为此时间截面上的数据打一个用于挂载的“数据基线(V1版)”,状态将流转至“已发布”即可用。

2. 调度与生成模型 (训练任务管理)

组装刚打好的数据基线和系统底层算法开始让机器自动总结规律。

  1. 回到左侧菜单,进入「训练任务」区域并点击「新建任务」。
  2. 在任务配置界面的弹窗内,核心只需挂载两项内容:① 您在“步骤1”中刚打好的「数据集发布版本」;② 希望使用的算法配置与核心的入参特征。
  3. 点击保存后,任务将处于「待训练」状态。此时点进任务列表对应的「启动训练」按钮。
  4. 在实际训练过程中(处于“训练中”),您可以随时刷新并透视此任务的指标历史运行参数面板,以此判断效果并预估剩余等待时间。

3. 构建可消费的黑盒能力 (能力发布)

模型只要变为在线接口或测试窗后,其业务价值才得以外溢。

  1. 当训练任务状态变更为“已完成”后,点击左侧「能力发布」并选择「新建服务」。
  2. 在弹框中指定刚刚跑好的那份“训练任务记录”及其孵化出的那条确切的“模型产物版本号”。
  3. 保存完成后系统会为您分配一条处于休眠状态的服务。点击操作栏的「启动」,系统底层容器接管将启动对应的推理容器包分配并把流量打通。

结果验证与闭环

成功拉起容器(即服务状态展示为 Active/已启动 )后,请不要急着离开网页:

  1. 直接在能力发布栏找到您上线的那条规则,点击「在线推理」按钮。
  2. 在弹出的可视化交互窗中,传入您准备的一条从未给模型投喂过的全新数据或本地测试图片,点击提交。
  3. 观察下方的模型吐出结果(推理响应区),判断它的识别打标是否准确。
  4. 业务闭环建议:当推理质量达到您的验收预期后,您的相关客户端系统或内部运维模块,就可以对接本服务所公示的统一 API 以便进行全自动的高频识别调用工作了。如果效果欠佳,请返回「数据集管理」环节补充您的特殊案例数据,重新发布 V2 版并进行新一轮的迭代训练。