人类击败AI编程夺冠：“效率幻觉”背后的真相与未来

日期：2025-07-18 18:45:36 / 人气：6

在东京举行的AtCoder 2025世界巡回赛中，人类选手Psyho以较大优势击败OpenAI的自动化程序OpenAIAHC，夺得榜首。这一结果虽值得欢呼，但OpenAIAHC紧随其后，且AI参与编程竞赛的实力正不断增强，从零调试的程序已逼近人类顶尖选手水平。

研究揭示效率降低：美国AI安全机构METR的实测研究表明，16名经验丰富的开发者使用Claude Code辅助编程后，完成任务时间平均增加19%，但参与者自我感觉效率提升20%，形成“效率幻觉”。
原因分析：写prompt耗时且需反复修改；Claude生成的代码大多不能直接使用，需手动改逻辑、查bug；开发者陷入“提示 - 等待 - 修改”的循环，被打断状态影响效率。

小实验验证：设计命令行工具任务，使用Gemini CLI和Claude Code进行测试。Gemini CLI虽能快速生成部分代码，但在遇到知乎登录问题时无法解决；Claude Code在科研任务中虽能快速生成大量代码，但缺乏创新性，且消耗完免费API Token后项目进展有限。
体验感受：AI编程带来“爽感”，代码如魔法般自动生成，但报错或逻辑不通时，开发者发现自己并不真正理解代码，也不知如何修改。

“规范”的重要性：OpenAI的Sean Grove认为，使用AI编程工具时，“规范”比提示工程更重要。当前“Vibe Coding”存在保留代码却丢弃原始意图提示词的问题，不可持续。编程的未来在于通过结构化的“规范”定义和传达意图。
开发者的反思：参与研究的开发者分享经历，指出LLM只是工具，存在特定编程任务训练数据不足、上下文退化、等待过程中分心、缺乏准确成功衡量标准等“长尾问题”。强调要理解工具和自身短板，主动适应。

高效使用案例：有用户在X上分享使用Claude Code提高生产力的经验，通过创建自定义文档和命令，如/journal、/todos等，实现智能助手功能；还利用MCP连接更多网络信息，提升工作效率。
技术发展趋势：AI编程从最初在侧边栏调用GitHub Copilot，发展到丰富的Agentic AI编程工具，如Cursor、WindSurf等；今年从GUI向CLI转变，出现Claude Code和Gemini CLI等工具。技术发展迅速，应关注趋势，动手尝试，摸清边界，找到适合自己的使用方式，推动技术进步。

AI编程虽带来效率“幻觉”，但也展现出巨大潜力。人类在编程竞赛中暂胜，提醒我们关注AI编程的真实效率问题。未来，通过建立“规范”、理解工具短板，有望实现效率与爽感的兼得，推动AI编程迈向新高度。

作者：长征娱乐