部署使用其他框架LWSVersion: Next*在线运行 vLLM 入门教程:零基础分步指南 LWS LeaderWorkerSet (LWS) 是 1 个 Kubernetes API,旨在解决 AI/ML 推理工作负载的常见部署模式。1 个主要用例是多主机/多节点分布式推理。 vLLM 可以与 LWS 一起部署在 Kubernetes 上,实现分布式模型服务。 有关使用 LWS 在 Kubernetes 上部署 vLLM 的更多详细信息,请参阅本指南。