跳到主要内容
返回视频教程列表

AI 部署 / 功能介绍

大模型安装使用

通过 Rainbond 内置的大模型入口,完成大模型插件安装、模型仓库下载或上传、模型实例部署、API 密钥创建和模型监控查看。

时长 01:24预计操作 10 分钟希望在 Rainbond 中统一部署、调用和监控大模型的用户
大模型GPUNVIDIA 驱动模型仓库模型实例API 密钥模型监控
大模型安装使用 视频封面
点击封面后将在新窗口打开 Rainbond 官方 B 站视频。B 站打开

本教程共 8 个操作步骤

安装 GPU 驱动和容器运行依赖

这一步不在 Rainbond 控制台中操作,需要先在 GPU 节点的操作系统里完成基础运行环境准备。

  • 如果 GPU 节点尚未准备好,先按官方文档完成 NVIDIA 驱动、Docker 和 NVIDIA Container Toolkit 安装。NVIDIA 驱动DockerNVIDIA Container Toolkit
  • 准备完成后,确认节点可以正常识别 GPU,并且容器运行时可用。
  • 环境确认无误后,再回到 Rainbond 控制台继续后续的大模型插件安装和模型部署。
前提条件
  1. 1
    NVIDIA GPU 节点必备

    准备一个至少配备一块 NVIDIA GPU 的 Linux 节点,用于运行大模型推理实例。

  2. 2
    驱动和容器运行依赖必装

    确保节点上已安装 NVIDIA 驱动程序、Docker 和 NVIDIA Container Toolkit。

  3. 3
    GPU 节点系统要求Linux

    GPU 节点仅支持 Linux。Windows 可考虑 WSL2 并避免使用 Docker Desktop;macOS 不支持作为 GPU 节点。

准备 Rainbond 控制台

使用大模型能力前,需要先有一个可访问的 Rainbond 控制台,并确认当前账号具备安装插件和创建模型实例的权限。

  • 确认 Rainbond 控制台可以正常访问。
  • 如果还没有安装 Rainbond,可以先通过快速安装完成环境部署。快速安装视频
  • 登录控制台后,进入创建向导或平台入口,准备查找大模型能力。
准备 Rainbond 控制台

安装大模型插件

在创建向导中找到大模型入口。如果当前环境还没有安装插件,系统会提示并跳转到插件列表。

  • 在创建向导或插件列表中找到大模型插件。
  • 点击安装并等待插件安装完成。
  • 安装完成后,左侧菜单会新增 AI 大模型入口。
安装大模型插件

进入 AI 大模型模块并准备模型

插件安装完成后,从左侧菜单进入 AI 大模型模块,在模型仓库中准备后续部署要用的基础模型。

  • 打开左侧菜单中的 AI 大模型。
  • 进入模型仓库页面,选择平台提供的模型,例如千问 0.6B。
  • 点击下载并等待模型准备完成;如果已有自己的模型,也可以通过上传方式导入。
准备基础模型

创建模型实例

模型准备好后,创建模型实例,选择基础模型并填写部署参数。

  • 选择刚刚下载或上传的基础模型。
  • 填写实例名称、资源规格和相关部署参数。
  • 确认配置后开始部署模型实例。
创建模型实例

查看日志并验证回复

模型部署过程中可以通过日志查看进度。部署完成后,直接验证模型是否能正常返回结果。

  • 打开模型实例日志,查看下载、启动和服务就绪进度。
  • 等待模型实例部署完成。
  • 在页面中发起测试请求,确认模型可以正常回复。
验证模型回复

创建 API 密钥

模型可以正常回复后,切换到 API 密钥页面创建密钥,供后续业务系统调用。

  • 进入 API 密钥页面。
  • 创建新的调用密钥。
  • 后续业务系统、智能体应用或知识库服务,都可以通过这个密钥调用模型接口。
创建 API 密钥

查看模型监控

进入模型监控页面,查看模型实例运行状态、节点信息和资源指标,确认模型持续可用。

  • 查看模型实例当前运行状态。
  • 确认节点信息和资源使用率。
  • 结合监控数据判断模型服务是否稳定运行。
查看模型监控