【 以下文字转载自 AI 讨论区 】
发信人: anylinkin (ALK), 信区: AI
标 题: AIcoding在定制化/同型多版本领域的幻觉率高,适用范围有限
发信站: 水木社区 (Thu Feb 19 09:52:31 2026), 站内
标题:当前AI coding在定制化/同型多版本领域的幻觉率高,适用范围有限
近期在测试AI Coding时,发现几乎所有的大模型,其适用性依然停留在强通用性与标准化的高级编程语言,以及一些高层次的常见架构算法等逻辑层次高但可能智商要求相对较低的层次,这些编程领域普遍具有通用性、单一性、成熟库的特点。
AI Coding的适用范围主要是在:
- 通用高级语言(Python、JavaScript、Go、Rust......)
- 框架和库(React、Django、TensorFlow)
- 算法和数据结构(LeetCode风格的题目)
- Web开发、后端架构
但是,对于一些具备定制化、多版本化、相对较新(即使超过1年了,但是仍属于通领域相对较新,而AI的上次训练的知识库可能截止1年多前)、嵌入式系统编程 等领域,AI Coding就开始非常高概率地出现幻觉性基础性错误。
AI Coding不适合的范围:
- 高级语言编程的较新库支持
- 嵌入式系统编程的定制化和新款芯片、不同版本/型号间的细微差异(HAL版本、芯片变体,当然,更不要说硬件相关的底层调试(时序、电气特性)
- 需要查阅最新文档的场景
即使号称地表编程之王的claude AI opus,也是如此,存在严重的幻觉和局限,错误严重。
具体表现就是,它们会胡乱引用,导致给你的代码存在非常多的类似编译、API函数使用错误、甚至底层使用错误的问题或错误。
总之,当前AI coding,依然像是一个低级的ctrl+C/Ctrl+V码农,甚至还不如后者,因为后者起码有些时候知道版本差别不能胡乱套用。
当前这种现状,可能也符合和反映这目前整个AI的进展状况:依然更像一个专家库的模式匹配,而非真正的人类智能的模拟和逼近。
基于传统的概率预测的生成式模型(LLM)下的AI Coding,与人类智能(包括严谨工程逻辑)之间,依然存在着本质性的巨大鸿沟。
--
修改:anylinkin FROM 223.104.44.*
FROM 223.104.44.*