- 主题:欢迎大家试用我的新项目,纯开源
Github搜DocMason
DocMason is a repo-native agent app for analyst-grade answers over complex private files. The repo is the app. Codex is the runtime.
可以你本地各种格式的私人文件ppt excel pdf doc等等,变成你的私人知识库,并且可以询问非常复杂的问题,都可以得到深度分析所有本地资料后咨询级的答案或者报告。
我自己平时解决工作上的问题,基本不用动手分析内部资料了
--
FROM 39.144.103.*
你可以说是RAG,不过实际说起来比这个复杂不少。你可以把项目clone了让AI解释代码给你听。反正我是全开源的
另外没有用什么切片向量化,本质上是Agentic RAG+KB。切片向量化那是上古的淘汰的技术了
【 在 finlab 的大作中提到: 】
: ?
: 自己实现的rag吗? 是切片向量化,还是有新的实现方式?
:
: ...................
--
FROM 61.164.43.*
可以的,网络信息也能分析。你可以下载了用Codex打开DocMason目录,然后随便问问题(基于你的office文档知识库或者网络问题都行)
【 在 ad4 的大作中提到: 】
: 试试
: 正好想分析一下房价走势
--
FROM 61.164.43.*
Readme里有支持的文件列表
First-Class Office & PDF: pdf, pptx, ppt, docx, doc, xlsx, xls
First-Class Deep Text: md, markdown, txt, eml (email)
Lightweight Text: mdx, yaml, yml, tex, csv, tsv
【 在 butely 的大作中提到: 】
: 结构化数据支持吗?比如excel,数据库……
:
--
FROM 112.17.242.*
用Codex或者Claude code的订阅来打开,否则用不起
【 在 smthhz 的大作中提到: 】
: 怕没钱用啊,每个文档都要agent先看一遍吗
--
FROM 112.17.242.*
可以白嫖codex的token以及ai agent能力
【 在 b4n 的大作中提到: 】
: 请问下这样的和 ima 知识库的区别就是可以用自己指定的大模型吗
--
FROM 112.17.242.*
有任何感受欢迎去github提issues或者discussion啊
【 在 seanj 的大作中提到: 】
: 赞 试试
:
--
FROM 218.82.29.*
功能上,DocMason会事先把office文档变成多模态的知识库,从而让Codex的AI Agent可以更有效的进行Agentic RAG,而且问答尤其是对复杂问题的问答过程也做了优化,强制AI Agent不能偷懒。
另外DocMason也做了很多产品化的处理,比如自动准备环境(比如你要多模态读ppt你得安装Libreoffice),增量更新KB,记住每次问答的runtime和证据,提取历史问答进入知识库成为interaction memory等等。甚至我还做了自动检查更新和无缝升级。
具体欢迎区DocMason项目的readme看架构图哈。另外记得点Star哦!
【 在 prettyPIG 的大作中提到: 】
: 比起直接用cc加skills去整理并解读文档,有什么具体优势吗?
: 还没看github啊,看你在请教一下。
--
FROM 103.149.83.*
视频不支持,但是如下文件里的多模态图像都能读取和理解:
First-Class Office & PDF: pdf, pptx, ppt, docx, doc, xlsx, xls
First-Class Deep Text: md, markdown, txt, eml (email)
Lightweight Text: mdx, yaml, yml, tex, csv, tsv
【 在 Aladdin 的大作中提到: 】
: 对多模态的输入支持如何?能支持图片或者视频这种吗?
:
--
FROM 103.149.83.*
我没试过哦,你可以试试。有issue欢迎去github上提,我来改进哈。
我认为如果是国内的顶级大模型,那么区别不会很大,最关键的是你用的runtime的AI Agent harnessing能力(比如Codex或者Claude code)
【 在 liismn 的大作中提到: 】
: 如果将大模型替换为国产的大模型,你觉得效果会有变化吗,还是保持稳定?
:
--
FROM 27.115.98.*