经测试目前0.32版本兼容128权重格式 并不兼容134权重格式 参数也无法选择backend=cudnn可能需要更新版本才能执行大型权重(标准 CUDA 后端仅支持传统卷积网络(格式 ≤ 128))
个人计算机4060 8g 5700x48g参数自行调整的部分:可观察内存使用的大小调整
--minibatch-size=512 \ # 提升批处理量(显存允许)
--max-prefetch=64 \ # 增加预取缓冲
--threads=6 \ # 5700X可支持更多线程
--nncache=200000000 \ # 2亿节点缓存
--move-overheadms=100 \ # 降低延迟敏感度
--cpuct=3 \ # 增强探索深度