好博士不一定是好牛马
博士阶段需常年深耕单一领域,张艺凡觉得这就像在狭长隧道里埋头摸索,等走到出口,才发现外面的世界和想象中全然不同。
今年年初,张艺凡进入国内某头部互联网大厂,参与多模态大模型研究项目实习。此前,他曾耗时10个月研究自监督训练原理,找到一套节省训练数据成本的方法,本期待能将这项成果在业界落地。
可认知脱节很快袭来:大厂坐拥充足的算力与数据资源,他在学校担忧的数据成本问题根本不存在,企业也不会在这类细枝末节上投入精力。
“此前的研究有用,但不多”,张艺凡无奈发现。
他在计算机视觉领域积累的专业知识,同样难在业界派上用场。当下行业聚焦商业化,大厂更倾向于打造“通用大模型”,靠全面的应用功能抢占用户入口,而非深耕单一功能的优化——就像如今各类AI应用的花式功能,多停留在“能用”层面,远未到“专业好用”。
张艺凡的研究聚焦计算机视觉细分方向,可企业更需要能整体优化模型的综合能力,这类细分研究对项目落地变现收效甚微。
实习期间,他做得最多的是根据不同场景,用现有模型微调出可落地的产品功能,而非发挥自己的专长。
即便身为AI博士,多数企业需要的仍是能助力变现的牛马。
张艺凡这类专业背景的博士,只有去到专做图像生成类模型的项目中,才有对口的用武之地。但行业里专做细分领域的大模型项目或岗位较少,或技术门槛低,不需要博士代劳。
为凑够论文发表要求,张艺凡在学校的几乎所有精力都投入到计算机视觉中的3D图像感知方向,极少关注领域外的技术。
第一次参加企业技术研讨会时,他彻底懵了:同事们讨论如何用现有大模型优化图像生成质量,他却一直纠结“多模态大模型如何理解图像”,忍不住提出疑问。
同事诧异地后仰脖子:“就是token化啊,大模型能把图像当文字一样理解。”张艺凡才意识到,这是大模型基础原理,作为AI博士,问出这话“有些愚蠢”。平日里同事聊前沿技术,比如大模型与AR技术交互,他更是完全插不上话。
实习中接触到大模型相关知识后,张艺凡本想调整后续研究方向,可听到领导说“转正需6篇研究成果”,他还是决定在熟悉领域抓紧发论文。尽管这些研究对企业应用意义不大,但无奈是入职的刚性门槛。
实习结束后,他将社交网名改成“千里烟波”,觉得自己难在多变的AI行业抓住确定性,未来迷茫辽远。
同样在“凑”论文的李睿峰,还正在努力学习维护人脉。在他看来,AI博士的不少岗位要靠“熟人推荐”。
刚入学时,他在新生群看到一位大模型博士的分享:对方仅3篇论文,却靠同组师兄内推拿到苹果面试机会,最终成功入职。李睿峰明白,个人能力固然重要,但熟人推荐是关键敲门砖。
“AI行业圈子不大”,某一方向的优秀研究者有限,与他们有关联的人自然多了层“稀缺标签”。李睿峰常听说,企业会因仰慕导师名气录用其学生。加之AI行业计算资源昂贵、博士岗位薪资高,企业试错成本大,便更愿意相信熟人推荐的人选。
--
FROM 223.104.194.*