# 01.Triton快速入门

Triton 入门。通过下边的步骤快速启动一个Triton Server。类似我们学习一门编程语言的Hello World。也可以参考：Triton Quickstart (opens new window)

前提你有一台Linux主机，有一张GPU显卡。主机已经安装了cuda驱动、docker组件。

根据驱动版本和cuda版本下载对应版本的Triton Docker 镜像，版本对应关系参照：Release Notes :: NVIDIA Deep Learning Triton Inference Server Documentation (opens new window)

根据自己驱动的版本，选择合适的docker镜像。比如我的主机驱动如下，选择版本是：22.05

NVIDIA-SMI 530.30.02              Driver Version: 530.30.02    CUDA Version: 12.1

下载模型文件

git clone -b r22.05 https://github.com/triton-inference-server/server.git

cd server/docs/examples

#下载默认的模型
./fetch_models.sh

1
2
3
4
5
6

启动Triton Server

docker run --gpus=0 --rm --net=host -v ${PWD}/model_repository:/models nvcr.io/nvidia/tritonserver:22.05-py3 tritonserver --model-repository=/models

启动成功，控制台能看到如下界面： Triton启动完成的截图

打开一个新的窗口，通过客户端测试下推理。

docker run -it --rm --net=host nvcr.io/nvidia/tritonserver:22.05-py3-sdk

#推理
/workspace/install/bin/image_client -m densenet_onnx -c 3 -s INCEPTION /workspace/images/mug.jpg

#output
root@d0-dev-gpu-002:/workspace/install/java/examples# /workspace/install/bin/image_client -m densenet_onnx -c 3 -s INCEPTION /workspace/images/mug.jpg
Request 0, batch size 1
Image '/workspace/images/mug.jpg':
    15.349566 (504) = COFFEE MUG
    13.227468 (968) = CUP
    10.424895 (505) = COFFEEPOT

1
2
3
4
5
6
7
8
9
10
11
12

引用

Triton Tutorials (opens new window)

← 23.书生·浦语大模型实战营 2.Model Repository →