本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。
Codex效率提40倍周活破400万:OpenAI大神分享榨干全攻略
> 2026年4月底,OpenAI Codex的周活跃用户突破400万,但比增长数字更值得关注的是,开发者正将其从单次问答工具改造为能长期运行、自主工作的数字系统。一场围绕AI编程的效率革命与工作流重塑正在发生。  ## 效率突破:科研任务压缩40倍 2026年5月,一项实验震动开发者社区:Agentic AI工程师Dan McAteer使用Codex的**Goal模式**,将一项机械可解释性研究任务从博士生预估的**80小时**压缩至**1小时56分钟**完成,表面效率提升约**40倍**。  实验配置简单,仅使用Codex的/goal命令、GPT-5.5高精度模型和快速模式,但结果揭示了AI智能体在复杂任务上的质变潜力。 Goal模式的核心在于改变了Codex的运作逻辑。它并非执行孤立的指令,而是让**目标在多轮对话中持续存在**,直至达成或失败。在实际操作中,Codex会依据Goal自动执行以下流程: - 分离核心结论与支撑性结论 - 将结论映射到可用证据上 - 重建可以在本地测试的部分 - 标注哪些结论因缺乏材料无法精确复现 这使得最终产出物能明确区分复现成功的工作机制、近似训练结果、被阻断的精确复现路径及剩余不确定性,而非简单地声明“成功”。 ## 系统化心法:长期线程与本地知识库 新加入OpenAI Codex团队的Jason Liu(13k星开源库Instructor作者)公开了一套将Codex改造为工作系统的完整方法。其核心是摒弃单次会话习惯,转而创建**跨月存活的巨型线程**,为不同工作流(如日程管理、开源项目监控)设置置顶线程,通过快捷键一键跳转。 线程内积累数月的历史对话与决策,使AI能自动承接进度,如同老员工。 > 真正让Codex从工具变员工的,是Heartbeats+@computer这套组合拳。 **Heartbeats**相当于为AI添加了定时任务调度。例如,Jason的“首席助理线程”每30分钟自动运行一次:扫描Slack和Gmail,判断消息优先级,并为需要回复的起草草稿(由人最终决定是否发出)。 在动画项目中,他让Codex每15分钟检查Slack审阅线程,如有同事反馈,便自动重新渲染新版本并调用@computer上传文件。 几乎放弃内置记忆系统,Jason将核心规则存储在本地可控的**AGENTS.md**文件中。这相当于写给AI的项目说明书,Codex会将其作为长期上下文读取。配置分为多层:  - **全局层面**:存放个人偏好,如要求回答使用中文、修改代码前先给出计划。 - **项目根目录**:定义项目规范,包括技术栈、启动命令、代码风格。 - **子目录**:设置模块特殊规则,例如标记老代码目录以避免重构公共接口。 ## 新功能赋能:Appshots与Goal模式转正 2026年5月22日的更新为Codex带来了两项关键增强。Mac版新增**Appshots**功能,用户按下左右两个Command键(可自定义快捷键),即可将当前应用窗口截屏并直接“喂”给Codex。 传送的数据不只是一张截图,Codex能读取窗口内的所有文字内容,包括屏幕上未显示的部分。结合Computer Use和Chrome自动化能力,AI可进一步浏览以获取更多上下文。这解决了手动截图、复制文字的繁琐步骤,适用于调试网页、处理设计稿或编辑备忘录等场景。 同时,/goal命令已**结束实验阶段,正式上线**。用户可在Codex应用、IDE扩展或命令行中设定明确目标,Codex会持续推进任务,跨越数小时甚至数天,中途允许查看进度、调整方向或直接暂停。 常见用法包括设定预算限制,如“在30000 token以内,完成RSS bridge的所有功能并验证”。 ## 远程操控:手机端集成与控制面板化 Codex已集成进ChatGPT手机应用,iOS和Android用户可通过同一账号连接桌面端。手机充当**远程控制面板**,用于查看进度、发送指令或审批操作,而实际的代码读取、测试执行和文件修改仍发生在本地电脑上。 这意味着用户可随时在手机上查看任务线程的实时更新,包括终端输出、截图、测试结果和文件差异对比,并在关键节点进行干预,无需守在电脑前。 ## 行业影响:用户增长与“管道”挑战 Codex的用户增长曲线堪称迅猛:从**200万**周活攀升至**400万**不足七周,相较于2026年年初规模暴涨**8倍**。这标志着AI辅助编程从小众工具转变为开发者生产力标配。 然而,伴随效率提升而来的是系统化挑战。Stripe平台工程团队一位负责人指出,智能体在理想环境中的代码生成正确率超过85%,但在接入生产环境的认证网关、审计日志等机制后,有效可用率可能跌至60%以下。 > 她的结论是:“我们花了一年时间让模型变得足够好。接下来可能要花两年时间让管道足够结实。” 这句话精准标定了智能体编程已越过“能不能跑”的阶段,进入了“**能不能大规模跑、能不能在风雨里跑**”的新阶段。当科研周期从周缩减至小时,当AI开始自主设定并推进目标,开发者与AI的协作模式正经历根本性重塑。
全部评论