分享时长:30分钟主讲 + 10分钟问答
- 让 AI 改了半天代码,最后发现方向全错了?
- 上下文越来越长,AI 开始前言不搭后语?
- 换了个新工具,感觉和以前没什么区别?
旧工作流
打开网页 → 粘贴代码 → 复制结果 → 手动修改 → 再开新窗口...
新工作流
AI 在 IDE 里 → 直接看你的代码 → 自己跑命令修错误 → 内网同步一行 git pull
从 "写好代码" → "做好设计"
没有好的设计,AI 执行得越快,偏差越大
明确目标 → 输出设计方案 → 扮演挑战者评审方案 → 细化实施计划 → 交给 AI 执行
反例(呼应开篇)
"直接让 AI 写代码 → 改了半天 → 发现方向全错"
—— 问题不在 AI,在于缺少设计阶段
| 设备 | 选型 | 特点 |
|---|---|---|
| 外网机 | Mac Mini | ~3000元,16GB,性价比首选 |
| 外设共享 | USB切换器 | ~50元,一套键鼠同时控制两台机 |
外网机开发 → git push 私有仓库 → 内网机 git pull
可配合 rsync 自动上传服务器
| 工具 | 形态 | 适合场景 |
|---|---|---|
| Codex / OpenCode | 对话优先 | 从 ChatGPT 迁移,成本最低 |
| Claude Code | 命令行优先 | 熟悉终端,偏好轻量无 GUI |
| Antigravity | IDE 优先 | 想对代码有掌控感 |
golden-moment-predictor(川西旅行景观预测引擎)
先完成设计方案文档,不急着写一行代码
2026-02-09 v1.0 — 初版文档(1份 .md)
2026-02-10 v2.0 — 全面重写:ER图、评分一致性、ScoreEngine注册机制
2026-02-10 v3.0 — 架构重构:可插拔 ScorerPlugin 体系
2026-02-12 v4.0 — 最终对齐,移除并发,明确同步架构
2026-02-12 ✅ 开始写第一行代码
design/
├── 01-architecture.md # 系统架构、数据流
├── 03-scoring-plugins.md # 可插拔 Plugin 架构
├── 06-class-sequence.md # 类图、时序图(UML)
├── 10-frontend-A/B/C.md # 前端三个方案并行设计
└── ...(共 12 个)
对方案的架构、时序图、组件关系不断提问和质疑
目标:把方案逼到经得起推敲才算完成设计
| 质疑点 | 结果 |
|---|---|
| 架构是否足够可插拔? | 重构为 Plugin 体系,DataContext 复用 |
| 只支持单站点,能否支持「线路」? | 新增 Route/RouteStop 概念 |
| 文档之间有 10 处不一致? | 逐一修补,SafetyFilter 改为 Plugin 自治 |
| 并发设计是否真的必要? | 果断移除,明确 CLI-only 同步架构 |
挑战者提问:"云量 30% 和 90% 对景观的影响是线性的吗?"
单个会话过长 → AI 丢失重要信息
探测信号:"喵喵规则"
在 system prompt 中要求 AI 每次回复末尾加"喵喵"
如果丢失 → 说明上下文已过长 → 立刻开新会话
实践:把任务拆成独立子任务,每个子任务独立会话完成
M01-project-init.md
M02-data-models-exceptions.md
M09A-plugin-cloud-sea.md ← 云海插件
M09B-plugin-frost.md ← 雾凇插件
M10A-plugin-golden-mountain.md ← 日照金山插件
M10B-plugin-stargazing.md ← 观星插件
... (共 30+ 个)
AI 的注意力就像手电筒,你给的输入越精准,它照的越准。
设计方案 → 实施计划编写 → 代码开发(/impl)→ 代码检视(/check-impl)
开发阶段只看实施计划,不看设计讨论过程
→ 减少上下文噪音,AI 更专注
✅ 与实施计划一致性:完全一致
✅ 与设计文档一致性:完全一致(§11.4 reject_reason 字段定义)
✅ 测试覆盖:覆盖计划中列出的全部测试点
⚠️ [Low] 建议补充 breakdown 全部 max=0 的边界测试用例
整体结论:✅ 通过
"这份报告不是我写的,是 AI 拿着文档自己写出来的——这是「让 AI 监督 AI」"
| 指标 | 数字 |
|---|---|
| 设计文档版本迭代 | v1.0 → v4.0,6 个版本 |
| 实施计划文档数量 | 30+ 个(拆分到功能单元级) |
| 后端单元测试 | 455 个,全部通过 |
| 前端单元测试 | 364 个,全部通过 |
| 支持景观类型 | 7 种(日出/日落金山、云海、观星、雾凇、树挂、冰挂) |
| 覆盖观景台数量 | 46 个 |
项目:
AgentScope(阿里巴巴开源的多智能体应用开发框架)
| 方式 | 优点 | 缺点 |
|---|---|---|
| 直接让 AI 分析本地代码 | 方便 | 大项目容易遗漏,代码量超出上下文 |
| 看 DeepWiki / 官方文档 | 有结构化 Wiki + 对话式定位代码 | 只能在线看,无法喂给本地 AI |
| 网页 AI Deep Research + Voyager 插件导出 | 让 AI 主动调研整合,导出为本地文档 | 需额外安装插件 |
网页 AI 的调研广度 + 本地 AI 的代码精准度,两者互补
项目规模:2年演进历史(v0.0.1 → v1.0.0),跨越 Alibaba 内部孵化到开源,数千次提交
AI 一次性梳理出的结构(342行报告):
✅ 项目定位:面向开发者的多智能体编程框架(AOP范式)
✅ 核心架构:4大基础模块(Message / Model / Memory / Tool)
✅ 核心范式:ReAct 智能体工作流
✅ 分布式 Runtime:Engine + Sandbox 双引擎架构
✅ 评估体系:GeneralEvaluator → RayEvaluator(分布式生产)
✅ 生态集成:LangChain Adapter / MCP 协议 / Mem0 长期记忆
AI 会给你一份 API 使用说明,等同于直接看文档
✅ 正确问法(探索模式):
"AgentScope 的 Memory 和普通的 Chat History 有什么本质区别?它的设计到底在解决什么问题?"
开发者控制(Session 级)
record / retrieve — 系统性管理生命周期
智能体控制(Runtime 级)
record_to_memory / retrieve_from_memory — 供 Agent 在推理过程中自主决策
为什么回答这么准?
导出的文档包含了官方架构说明和代码示例,AI 有依据,不是在猜
目的:充分利用 AI 的广度,避免自己的盲区
自然流程:先探索 → 选定方向 → 再定向执行
背景:我对前端开发完全陌生,不知道该选什么架构
"帮我用地图做前端,按照高德地图的方式"
✅ 正确问法(探索模式):
"我需要一个前端界面,展示川西 46 个观景台的景观预测分数。用户群是手机端旅行者,需要方便截图发朋友圈。请给我几个候选架构方案。"
| 方案 | 名称 | 核心理念 | 参照产品 |
|---|---|---|---|
| A | 沉浸地图 | 地图即一切,点击标记点获取信息 | Google Maps / 高德 App |
| B | 分屏浏览 | 列表优先,效率为王,地图辅助定位 | Airbnb / 携程酒店列表 |
| C | 卡片流 | 卡片本身就是分享图,左右滑动浏览 | Instagram / 探探 |
→ 最终选择了方案A(沉浸地图),因为地图总览图天然适合发朋友圈
如果一开始就说"用地图做",AI 只会给出一套方案。探索模式让我看到了我根本不知道存在的 B、C 方案。
| 维度 | 旧思维 | 新思维 |
|---|---|---|
| 能力重心 | 写好代码 | 做好设计 |
| 工具使用 | 网页粘贴,手动复制 | IDE 集成,自动执行 |
| 与 AI 协作 | 随意提问,听 AI 的 | 主动引导,审 AI 的 |
| 上下文管理 | 一个会话到底 | 主动分段,按需新开 |
| 遇到问题 | 反复 retry | 分析根因,重新出发 |
- 你们的工具怎么解决网络问题的?
- 喵喵规则真的有用吗?
- 实施计划怎么写才算好?