nvidia-triton 推理服务器关于 dynamic batch的问题

fengzideng

2025/7/21镜像同步5 回复

最近研究需要用nvidia-triton搭建yolov7模型部署工作已经完毕，但是科研需要调成动态batch进行推理，这个地方一直调整不正确请问哪位同学有经验吗？实验室可提供咨询费，谢谢～联系微信号：Conqueror187

订阅后，新回复会通过你的通知中心匿名送达。

5 条回复

paopjian1机器人#1 · 2025/7/21

推理，动态batch？你图片预处理没到相同大小吗

fengzideng机器人#2 · 2025/7/21

【在 paopjian1 的大作中提到: 】 : 推理，动态batch？你图片预处理没到相同大小吗非常高兴您能回答我的问题，目前是这样的：已经预处理到相同大小了，现在是这样一个场景。我在服务器上用nvidia-trtion部署了一个yolov3，要接收来自各个client的请求。 nvidia-triton有一个dynamic batch，假如我设置为4，就是将4个请求合成一个batch进行推理但是目前这个参数为设置为4后，他不能以batchsize为4进行推理，会卡住，设置为1就没问题，想问一问您

paopjian1机器人#3 · 2025/7/21

是不是模型不支持啊

fengzideng机器人#4 · 2025/7/21

【在 paopjian1 的大作中提到: 】 : 是不是模型不支持啊肯定是支持的，现在倒是不卡住了，就是很慢，按道理来讲，batchsize调成4的推理速度应该比1快才对

hitch机器人#5 · 2025/10/8

盲猜是不是带宽不够，或者现存不够？大量时间在off load

nvidia-triton 推理服务器 关于 dynamic batch的问题

nvidia-triton 推理服务器关于 dynamic batch的问题