
因为我最近在看对应的agent的一些知识而且我现在也在用cursor和claude code这两个产品所以个人有些拙见鉴于我的公司不是一个agent的公司所以这个知识一个有趣的一个理论猜测看到的一些agent的大致思路现在的agent主要有用的是深度agent用langchain这个公司的说法就是将问题列一个表然后agent按照这个步骤去完成这样的话任务就不会偏离因为agent在做这些步骤的时候不需要知道前面那个任务对应的所有的上下文信息他只需要对应的结论如我现在有一个叫ai去帮我规划旅游想法那么可以拆分成主题 用户需要去旅游 1. 搜索网络上有名的旅游信息 2. 搜索对应的机票或高铁票信息 3. 设置旅游信息设计旅游路线 当前任务步骤1 搜索网上有名的旅游信息主题 用户需要去旅游 1. 搜索网络上有名的旅游信息 2. 搜索对应的机票或高铁票信息 3. 设置旅游信息设计旅游路线 任务完成情况 1. 湖北武汉步行街 2. 大冶铜绿山 当前任务步骤2 搜索武汉步行街大冶铜绿山的飞机票和高铁票整理对应的旅游路线这个是现在的一个ai解决问题的一个思路可以看到把任务根据步骤拆分那么我只需要管对应步骤的任务对于已完成的任务我只是要他的一个结果或者说一个结论我就可以用尽量少的上下问去完成对应的任务对应任务进行的时候搜索的大量介绍的文本或者其他的都不需要只需要将对应的任务的结果发送出来有可能你说这个任务的结果信息太少那么也可以通过agent去将总结如把旅游的推荐理由等信息添加上那么就可以给用户更多的信息对应一些难的一个任务现在的做法则是在每一个任务的步骤中判断这个搜索对不对如搜索第一个结果后主题用户需要去旅游 1. 搜索网络上有名的旅游信息 结果 1. 湖北武汉步行街 2. 大冶铜绿山 用户输入我想去看黄网的景点那么就会重新进入这个节点直接去搜索黄冈的一个信息这样方式去修正他的任务目标然后根据新的任务目标去执行对应的一个任务这样反反复复直到达成任务目标注意这个react这个用户react的这个流程好像是只有claude code 复杂任务才有cursor中目前没有遇到过这种任务流程并且claude code中应该有一个任务的评判这个任务简单的化好像就不会去触发这个流程一些当前agent项目用的技术猜想本地化open claw 全局agent配置因为每一个人用的ai的方式都是不同的同样一个问题有的用户可能需要比较详细的技术实现的一个理论有的用户只注重对应的结果有的用户只喜欢用严谨的语言有的用户喜欢用开放式的去实现但是如果用户每次使用ai强调这个的话是不是有点太浪费时间那么是不是可以借用抖音的一个思维就是给用户标签话那么我们也可以在agent项目中在用户的电脑本地中创建一个agent备注用来确定用户的性格如在之前的对话中判断用户喜欢每次对话有对应的总结那么在后续的新的agent提示词中直接加上这一步通过这种动态提示词的方式让用户不需要再去输入这些注意事项主题修正像cursor和claude中应该使用了这种主题的修正就是提示词中的主题他是变动的就是我在使用claude的时候使用过一个很离谱的主题但是ai在查看了这个主题并判断这个主题是不合理的非人类的时候就会将这个主题从这个对话中去掉但是本地还是存储的只有当我主动提起的时候他才会去查看这个主题并告诉我这个主题是不合理的那么说明现在的agent项目对应的主题应该是变动的他是根据用户的需求一步步修正的并且在判断某一个对话不合理的话就会将对应的对话记录从对话中剔除只有在用户再次强调的时候才会从你的硬盘中读取梳理并以新的角度添加到对话中多模态猜想目前的训练是moe就是将一个大模型分成几个小的专家模型对应领域的知识由小模型而有一个决策者也就是说当你在问对应的问题的时候就会激活对应的专家从而达到模型避免因为知识太多导致出现大量的幻觉提高的模型的专业能力并且因为没有大量多余的知识导致模型不需要遍历那么多的知识所以提高了对应的效率所以我在想对于识别是不是也可以这么多就是类似于一个ai是管理视觉识别他用来整合视频的上下的变化帧而我们的数据模型通过视觉模型对于两个画面的描述是更准确的判断这个画面干什么当然要整合这两个模型的信息交互我目前觉得是十分难的结尾目前我想到的就这么多只是基于一些表象推理出来的一些理论因为本人不是搞ai训练的所以对于很多模型训练的不是很懂所以这个文档只是图一乐