- 主题:CPU比GPU训练神经网络快十几倍zz
作者的意思是:反向传播这种基于矩阵乘法O(N^3)的算法,在模型日益膨胀的当下如果不反思一下就太说不过去了。于是搬出了局部敏感哈希。
【 在 meizhi (meizhi) 的大作中提到: 】
: 猜测是滤掉了一些对精度影响不大但占比比较多的操作,计算量小时间就省下来了。如果真是这样,直接吹cpu比gpu训练快是扯犊子。。
: 发自「今日水木 on Redmi Note 7」
--
修改:tgfbeta FROM 60.27.94.*
FROM 60.27.94.*
好像不好使。否则也不会找intel合作了。
【 在 meizhi (meizhi) 的大作中提到: 】
: 那标题是太唬人了。。如果哈希在gpu上好使,还是会吊打cpu。
: 发自「今日水木 on Redmi Note 7」
--
FROM 60.27.94.*
这个方案主要是利用locality sensitive hash把前向和后向的计算变成稀疏的,所以也就没GPU啥事儿了
【 在 meizhi (meizhi) 的大作中提到: 】
: 那标题是太唬人了。。如果哈希在gpu上好使,还是会吊打cpu。
: 发自「今日水木 on Redmi Note 7」
--
FROM 60.27.94.*