测试了一下不同硬件平台LLM的性能

水木社区手机版

主题:测试了一下不同硬件平台LLM的性能
1楼|adamhj|2025-10-24 17:32:24|展开
我看这个测试华为的数据里，token数和时间不是线性的，感觉像是载入模型花了不少时间

是不是云环境里模型的文件在内存里有缓存，在华为的机器测的时候没有先缓存？

【在 iwannabe 的大作中提到: 】
: 弄了三个测试环境，都安装gpustack+vllm(华为用mindie）
: 1. MAC Studio MAX M3 512G，号称可以运行deepseek 671b。
: 2. 华为910b 8卡， 512G内存，512G显存
: ...................
--
修改:adamhj FROM 182.85.137.*
FROM 182.85.137.*
11楼|adamhj|2025-10-28 10:14:29|展开
个人最适合是租api

【在 AmethystZh 的大作中提到: 】
: 我擦！
: 那这样看起来MAC才是最适合个人单蹦的啊
--
FROM 182.85.143.*

BYR-Team©2010. KBS Dev-Team©2011 登录完整版