部署使用其他框架ModalVersion: Next*在线运行 vLLM 入门教程:零基础分步指南 Modal vLLM 可以在云 GPU 上通过 Modal 运行,Modal 是一个专为快速自动扩展设计的无服务器计算平台。 获取更多如何在 Modal 上部署 vLLM 的细节,请参阅 Modal 稳定中的该教程。