- 主题:折腾了小半年,发现垂直领域模型是个坑
- 目前大模型搞精准领域的确实还差点意思,还是要往处理基础数据、或者水基础内容等提升效率思路走
 【 在 scramjet 的大作中提到: 】
 : 分别和某头部大学,以及北京某研究所合作
 : 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
 : 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
 : ...................
 --
 FROM 120.229.24.*
 
- 怎么才能不吹水
 【 在 Aladdin 的大作中提到: 】
 : 其中99%估计都是吹水
 :
 --
 FROM 117.129.52.*
 
- 但是有的吹啊,训练出出某领域大模型,这个能有成果的。虽然效果一样
 --
 FROM 112.10.140.*
 
- 你们这个垂直模型要达到啥效果?  一竿子打死垂直领域模型,显然是不合适的
 
 
 
 
 
 【 在 scramjet 的大作中提到: 】
 : 分别和某头部大学,以及北京某研究所合作
 : 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
 : 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
 : ...................
 --
 FROM 60.2.184.*
 
- 说实话 我只知道大模型等同于大语言模型
 你说的大模型是啥
 【 在 Zshadow 的大作中提到: 】
 : 好多人大模型和大语言模型都混在一起。现在的所谓垂直大模型,其实都是垂直领域的语言大模型,不是 alpgago, alphafoler,气象这种专门模式. 效果大部分靠吹. 教育部今年要发布10个领域大模型,且看他一地鸡毛吧。
 --
 FROM 112.224.75.*
 
- 就不能承认项目失败了吗?失败了不是很正常吗?做研究哪有做一个成一个的?如果是做一个成一个,那肯定是造假了。
 【 在 scramjet 的大作中提到: 】
 : 一方面现在查的严,专家都不敢随便签字,所以指标不能差太多
 : 另外肯定是不会真的应用到工程,这个大家心知肚明
 发自「快看水母 于 BVL-AN16」
 --
 FROM 223.104.78.*
 
- 这种考虑通用大模型+行业数据迁移学习,效果应该不错,还能节约成本
 【 在 scramjet 的大作中提到: 】
 : 分别和某头部大学,以及北京某研究所合作
 : 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
 : 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
 : ...................
 --
 FROM 124.17.28.*
 
- 科研探索不能保证一定有预期结果
 ChatGPT,DeepSeek也是探索出来的。成功之前那都是乱花钱
 
 【 在 scramjet 的大作中提到: 】
 :
 : 分别和某头部大学,以及北京某研究所合作
 : 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
 : 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
 : 其效果和RAG+基座模型相比并没有实质性改善
 
 #发自zSMTH@ANP-AN00
 --
 FROM 27.154.203.*
 
- 先看通用模型,在特定场景case上能不能部分解决。
 有影儿的话,补充垂类数据,sft+rl
 这条路确实玄学成分比较大,也在趟坑中…
 【 在 scramjet 的大作中提到: 】
 : 分别和某头部大学,以及北京某研究所合作
 : 搞海洋测绘数据的垂直大模型,以及某化工过程的行业大模型
 : 最后的结果都是一地鸡毛,花费大量的精力训出来的模型
 : 其效果和RAG+基座模型相比并没有实质性改善
 : --
 :
 
 发自「今日水木 on iPhone 12」
 --
 FROM 120.244.222.*
 
- 感觉很难。
 训练需要的资源很多,垂类自有数据其实很有限,容易过拟合自high.
 
 【 在 bigbigbigben 的大作中提到: 】
 : 先看通用模型,在特定场景case上能不能部分解决。
 : 有影儿的话,补充垂类数据,sft+rl
 : 这条路确实玄学成分比较大,也在趟坑中…
 : ...................
 --
 FROM 36.40.165.*