- 主题:显卡视频编解码的坑真多
- m1也分好几种,最低端的没有,得pro和max才有。不过最低端的也很快,视频编解码速度是max的1/3,但是比i7还快
 【 在 Avocado 的大作中提到: 】
 : m1家族特别强化了媒体编解码,提供很大的硅面积给media engine,比传统GPU厂商顺带手附赠的强多了
 :
 --
 FROM 115.206.127.*
 
- 所以也不是啥显卡坑
 显卡就没有把视频编解码当主业
 不过你还是可以用CUDA之类的利用显卡并行处理来加速视频编码
 
 【 在 wwpty 的大作中提到: 】
 : m1也分好几种,最低端的没有,得pro和max才有。不过最低端的也很快,视频编解码速度是max的1/3,但是比i7还快
 --
 FROM 73.63.245.*
 
- 我看介绍说,nvidia视频转码的画质很差,这是cuda原理决定的,还是cpu转码出来的的画质好。苹果m1有特殊设计,效果倒是既快又好。
 【 在 Avocado 的大作中提到: 】
 : 所以也不是啥显卡坑
 : 显卡就没有把视频编解码当主业
 : 不过你还是可以用CUDA之类的利用显卡并行处理来加速视频编码
 : ...................
 --
 FROM 115.206.127.*
 
- 这我比较怀疑
 画质和软件实现相关,如果有这个结论,大概是因为算法不够好
 
 cuda有什么原理会导致质量差?精度不够?不能啊,HPC行业大把用GPU加速的
 
 【 在 wwpty 的大作中提到: 】
 : 我看介绍说,nvidia视频转码的画质很差,这是cuda原理决定的,还是cpu转码出来的的画质好。苹果m1有特殊设计,效果倒是既快又好。
 --
 FROM 73.63.245.*
 
- 我也不太懂,看文章说的,每个cuda核分配到的显存很少,只有几mb,算法做不到精细计算,就是傻快。cpu核就那么几个,分到的内存多,几个gb都不止,算法可以慢慢地计算,画质好不少。结论就是编码用cpu,解码用gpu。
 【 在 Avocado 的大作中提到: 】
 : 这我比较怀疑
 : 画质和软件实现相关,如果有这个结论,大概是因为算法不够好
 : cuda有什么原理会导致质量差?精度不够?不能啊,HPC行业大把用GPU加速的
 : ...................
 --
 FROM 115.206.127.*
 
- 这个听起来有点道理,也就是说单个编码进程的精度可能不够
 但这个我猜测是可以通过优化编码算法来解决的
 
 【 在 wwpty 的大作中提到: 】
 : 我也不太懂,看文章说的,每个cuda核分配到的显存很少,只有几mb,算法做不到精细计算,就是傻快。cpu核就那么几个,分到的内存多,几个gb都不止,算法可以慢慢地计算,画质好不少。结论就是编码用cpu,解码用gpu。
 --
 FROM 73.63.245.*
 
- 好像是硬件的限制,因为cuda核太多,所以真正参与转码的核只有几分之一,一大半都浪费了。苹果m1芯片架构特殊,比如m1 max典型配置,10核cpu、32核gpu、64g内存都集成在一起,每个核分到的内存足够大,所以可以高精度计算,速度和画质兼得。
 【 在 Avocado 的大作中提到: 】
 : 这个听起来有点道理,也就是说单个编码进程的精度可能不够
 : 但这个我猜测是可以通过优化编码算法来解决的
 :
 --
 修改:wwpty FROM 115.206.127.*
 FROM 115.206.127.*
 
- 可能就是精度不够吧
 浮点用的字节数不够
 
 【 在 Avocado (Persea) 的大作中提到: 】
 :
 :  这我比较怀疑
 :  画质和软件实现相关,如果有这个结论,大概是因为算法不够好
 :
 --
 FROM 60.21.96.*