把教学经验转化为 AI 产品规则
用数据证明每一个决策

英语教育背景 × 7 年一线经验 × AI 产品原型与辅助开发落地能力 | 三个从 0 到 1 的 AI 产品,所有量化数据可追溯到原始文件
100% → 0%语法助手编造率 —— 30 题 Golden Dataset 全量评估,幻觉彻底归零
15/15WordCraft Agent Baseline 全通过 —— 义项 100% 可追溯,语境消歧验证通过
24 轮润言真实使用驱动迭代 —— 交付 Windows 可分发客户端
三个项目 —— 质量控制 · 方法论 · 交付力
PROJECT 01 · 教育 RAG
AI 语法学习助手
把通用大模型约束成「只讲教材」的语法老师:教材有的带页码答,教材没有的诚实拒绝。三类问题分流,教学路径可控。
编造率 100%→0%引用率 90%诚实率 100%
查看项目详情 →
PROJECT 02 · AI AGENT
WordCraft 词义理解 Agent
受控 Agent:义项只从词库选择、不自造。从 PRD、Figma 原型到 Dify Agentic Workflow,再到分层测试封账交付的完整闭环。
Baseline 15/15消歧 5/54 模型选型
查看项目详情 →
PROJECT 03 · AI 效率工具
润言 · AI 智能语音输入
语音直出可用文字:录音 → AI 转写 → LLM 智能清洗 → 自动输入。双引擎架构,24 轮真实使用迭代,可分发 Windows 客户端。
24 轮迭代双引擎回归测试集
查看项目详情 →
能力标签

AI 产品设计

PRDMVP 范围定义用户故事验收标准(Given/When/Then)低保真原型北极星指标

RAG 与 Agent

混合检索Embedding 选型Rerank输入分流Guardrail降级处理诚实拒答

Eval 与可靠性

Golden DatasetBad Case 归因幻觉控制回归测试集沉淀编造率 / 诚实率 / 引用率指标设计

技术验证

Python 批测脚本API 批测 · 断点续跑Token 成本测算模型选型对比本地多模态部署
为什么值得看这份作品集
每个数字都有出处。编造率 100%→0% 背后是 30 题逐题记录表;Baseline 15/15 背后是 JSONL 原始结果与 CSV 运行日志;24 轮迭代背后是全程会话记录。面试中任何追问,都可以现场打开原始文件。
一以贯之的产品哲学:数据不够时诚实降级,而不是硬编。语法助手对超纲问题诚实拒绝;WordCraft 对低频义项标记 low_confidence 不硬造例句;润言对清洗失败回退原文——三个产品,同一条质量底线。