服务器配置是两台ubantu系统电脑,每台电脑安装两张4090-48G显存的显卡,共计192G显存。
服务器1
 
 服务器2
 
 准备工作:
 1.两台电脑都已经安装了docker
 2.两台电脑都已经安装了nvidia驱动
参考vllm官方资料
 https://docs.vllm.ai/en/latest/serving/distributed_serving.html#
 
 1.先下载.sh文件
 https://github.com/vllm-project/vllm/blob/main/examples/online_serving/run_cluster.sh

 做主从关联
 
