图书

电子书

课程

VIP会员

书课包

人人都是AI程序员：TRAE+Cursor 从0到1全栈实战

978-7-115-68750-0

作者: 吴振耀（@安仔）张斌（@Captain）

译者:

编辑: 傅道坤

分类: 软件开发

图书目录:

详情

本书以Vibe Coding（氛围编程）这一理念为核心，系统阐述如何与AI进行高效协作，将脑海中闪光的想法转化为真实、可运行的数字产品。本书不仅涵盖从零开始建立数字产品实践自信的科学学习方法，更创新性地提出一套名为“节俭全栈”的低成本实践方案，手把手引导读者使用Figma、Vercel、Supabase等免费或极低成本的专业级工具，亲手构建并成功发布自己的第一款全栈应用。本书内容深入浅出，构建了从“心法”到“实操”的完整体系：从“独立开发者的哲学”等认知层面筑牢基础，再到提示工程、UI设计、前后端开发、数据库管理、支付集成等具体实操环节提供详尽的实战指引，旨在拆掉阻碍创造者前行的“技术之墙”，让每一个好想法都能在AI时代顺利变为现实。本书适合怀揣产品想法却缺乏技术背景的准创业者与产品经理、希望借AI工具提升效率的独立开发者和设计师、对AI驱动应用开发及创作者经济感兴趣的技术爱好者，以及渴望将创意转化为数字产品的所有梦想家和行动派阅读。

图书摘要

版权信息

书名：人人都是AI程序员：TRAE+Cursor 从0到1全栈实战

ISBN：978-7-115-68750-0

您购买的人民邮电出版社电子书仅供您个人使用，未经授权，不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟，与我们共同保护知识产权。

如果购买者有侵权行为，我们可能对该用户实施包括但不限于关闭该帐号等维权措施，并可能追究法律责任。

版权

著吴振耀（@安仔）、张斌（@Captain）

责任编辑 傅道坤

人民邮电出版社出版发行　　北京市丰台区成寿寺路11号

邮编　100164 　电子邮件　315@ptpress.com.cn

网址　http://www.ptpress.com.cn

读者服务热线：(010)81055410

反盗版热线：(010)81055315

内容提要

本书内容深入浅出，构建了从“心法”到“实操”的完整体系：从“独立开发者的哲学”等认知层面筑牢基础，再到提示工程、UI设计、前后端开发、数据库管理、支付集成等具体实操环节提供详尽的实战指引，旨在拆掉阻碍创造者前行的“技术之墙”，让每一个好想法都能在AI时代顺利变为现实。

本书适合怀揣产品想法却缺乏技术背景的准创业者与产品经理、希望借AI工具提升效率的独立开发者和设计师、对AI驱动应用开发及创作者经济感兴趣的技术爱好者，以及渴望将创意转化为数字产品的所有梦想家和行动派阅读。

作者简介

吴振耀（安仔），通信领域创业公司系统架构师、TRAE EXPERT、亚马逊认证解决方案架构师、全栈独立开发者。他在全栈开发、云解决方案架构（AWS/阿里云/腾讯云）以及DevOps流水线搭建等领域具有丰富的经验，热衷于探索实践前沿技术，致力于以优雅的架构设计与高效的开发流程破解复杂的工程难题。

他兼具丰富的本土创业经验与广阔的国际视野，曾以DevOps顾问的身份为国外某大型医疗集团提供长达5年的深度技术咨询服务，成功助力其技术团队从30余人平稳扩容至200人以上的规模。

在AI浪潮下，他积极投身于技术社区的建设与知识传播——不仅是AI开源社区WaytoAGI AI Agent板块以及AGI掘金知识库的共建者，更著有掘金小册《Coze从入门到实践：全面掌握AI智能体》，以实操内容助力降低AI技术的应用门槛。如今，他希望通过本书，将AI时代的技术红利与自身多年的独立开发实践经验，传递给每一位怀揣梦想的创造者。

可通过如下方式与安仔联系（加微信好友时请备注“氛围编程学习”）。

公众号：程序员安仔

个人微信：Andywuwu07

张斌（Captain），开发者社区运营，深耕大模型与AI编码赛道，曾从0到1搭建AGI知识库与AI编程子社区，更通过个人播客“浪说播客”长期联动一线大厂技术专家，持续解读技术趋势、AI编程方法论与行业观察。著有《Vibe编程：探索AI时代编程新范式》一书，并坚信在AI时代，编程的本质是人机协同协作的状态（即Vibe）。

可扫描如下二维码关注其个人播客。

浪说播客

前言

写给未来的创作者

我们正处在一个创造力迸发的非凡时代。

曾几何时，电影级广告、专业摄影作品、录音室级作品这类需要庞大团队与巨额预算才能落地的成果，如今借助AI工具，一个创作者便可独立完成。这场深刻的革命，正式宣告了创造力民主化浪潮的到来。

现在，让我们把目光聚焦于你。

你的脑海中，一定藏着某个闪闪发光的创意。但或许有个声音让你犹豫：“可是，我不是技术出身。”这个标签宛如一道无形的壁垒，让无数极具潜力的想法在萌芽阶段便悄然凋零。

而这本书，正是为拆掉这堵“技术之墙”而作。

你正站在一个前所未有的历史机遇面前：创作者经济的爆发式增长，叠加AI工具的革命性普及，为你打开了一扇短暂却珍贵的机会窗口。过去横亘在创意与实现之间的三大核心障碍——技术门槛、资金限制与分发渠道壁垒，正在被AI浪潮快速瓦解。

为了帮助你牢牢抓住这一机遇，本书将为你提供一套与这个AI时代适配的全新思维模式与可落地的行动方案。

首先，是一种名为Vibe Coding（氛围编程）的思维。

它并非一门编程语言，而是一种与AI高效协作的实践艺术。不妨想象“人马象棋”的模式——人类棋手与AI组队协作，其表现能超越最顶尖的人类大师与最强大的计算机。这正是Vibe Coding的精髓：你提供愿景、直觉和判断力，AI则提供无可比拟的执行力。本书将手把手教你如何成为一名“人马创造者”，精准引导AI将你的创意落地为现实。

其次，是一套帮你重建创造自信的科学学习方法。

我们深知“不知如何起步”的迷茫与恐惧。因此，本书将所有知识点都拆分为“每日几分钟”的微小任务。这种设计旨在通过持续积累“小成功”，帮你系统性地建立起坚不可摧的创造自信。你终将发现，自己的创造潜力远超想象。

最后，是一个名为“节俭全栈”的低成本实践方案。

我们将彻底打破最重要的一道障碍：资金门槛。你将学会运用Figma、Framer、Supabase等一系列低成本甚至免费的专业级工具，从零开始构建并发布你的第一个数字产品。低成本启动数字项目，从此不再是梦想。

创作者经济、AI革命与工具普惠三大历史性浪潮在此交汇，所有外部条件均已成熟。如今，整个等式中只剩下最后一个变量——你的行动。

你即将开启的旅程，并非令人胆怯地纵身一跃，而是一连串每天只需几分钟的微小探索。你的第一步，仅仅是翻开本书的下一页。

未来，正在由无数像你一样怀揣梦想的普通人共同构建。

让我们即刻启程。

本书组织结构

本书共分为6章，各章主题相对独立且逻辑层层递进。读者既可按顺序通读，以系统性构建完整的知识体系；也可根据兴趣与实际需求精准挑选特定章节阅读，快速解决实际问题。

• 第1章，“心态与理念——成为AI时代的创造者”：作为全书的理论基石，本章的核心目标是帮助读者完成从“消费者”到“创造者”的心态蜕变。本章将详细拆解Vibe Coding的核心理念，破除初学者面对技术时的三大心魔，并引入独立开发者必备的五大思维工具箱。最后，本章将深入讲解与AI高效协作的关键技能——提示工程的实操技巧。

• 第2章，“前端设计与AI实现——从想法到精美界面”：本章聚焦于创意“可视化”的落地过程。读者将掌握Trickle、v0.dev等前沿AI驱动工具的使用方法，通过自然语言与简单指令，快速将脑海中的创意转换为专业美观的用户界面（UI）。同时，本章还将系统讲解行业标准设计工具Figma的核心基础知识，并介绍TRAE SOLO、Cursor等AI编程工作台，助力读者打通从设计到代码的完整落地链路。

• 第3章，“基础设施搭建——你的“节俭全栈”工具箱”：本章将为读者的数字产品搭建坚实的技术“地基”。本章首创性地提出“节俭全栈”概念，详细介绍如何利用Vercel、Supabase、Cloudflare R2等免费或低成本的云服务，构建一套专业、可扩展的现代化技术基础设施。学完本章后，读者能够独立完成域名购买配置、数据库搭建、用户认证系统搭建等关键实操步骤。

• 第4章，“后端开发与高级集成——驱动应用的强大引擎”：本章将带领读者进入应用的“后厨”，探索驱动应用运行的核心逻辑。本章将展示如何指挥TRAE SOLO、Cursor等AI编程工具，完成传统开发中最为复杂的后端开发工作，包括API设计、数据库管理、业务逻辑实现等。同时，本章还将引入模型上下文协议（MCP）这一前沿技术，教读者如何让AI连接外部工具，实现高级自动化工作流。

• 第5章，“项目实战1：从0到1构建习惯追踪器”：本章是一个完整的全栈项目实战内容。读者将综合运用前4章所学知识，从产品规划起步，逐步搭建一个功能完备的“习惯追踪器”应用，全程涵盖AI辅助规划、数据库设计、用户系统开发、邮件服务集成以及最终部署上线等全流程。

• 第6章，“项目实战2：构建商业级AI图像生成平台”：作为本书的“毕业项目”，本章聚焦于一个具备真实商业价值的复杂应用开发。读者将搭建一个集成了前沿AI模型（Replicate）、完整支付体系（Stripe）、用户管理和积分系统的AI图像生成平台。通过这个项目，读者将全面掌握独立开发、部署并运营商业级SaaS产品的完整经验。

本书读者对象

• 创意落地核心人群：怀揣产品创意但缺乏技术背景，希望低成本实现商业目标的准创业者和产品经理。

• 技术效率提升人群：已掌握基础技能，希望通过AI工具优化工作流程、提升开发/设计效率的独立开发者和设计师。

• 技术趋势探索人群：对AI驱动的应用开发、创作者经济和低成本启动模式抱有学习兴趣的技术爱好者。

• 泛化创意实践人群：渴望将创意转化为实际数字产品，开启自己首个项目的所有梦想家和行动派。

资源与支持

资源获取

本书提供如下资源：

• 本书思维导图；

• 本书配套资源；

• 异步社区7天VIP会员。

要获得以上资源，您可以扫描右侧二维码，根据指引领取。

提交勘误

作者和编辑尽最大努力来确保书中内容的准确性，但难免会存在疏漏。欢迎您将发现的问题反馈给我们，帮助我们提升图书的质量。

当您发现错误时，请登录异步社区（https://www.epubit.com/），按书名搜索，进入本书页面，点击“发表勘误”，输入勘误信息，点击“提交勘误”按钮即可（见下图）。本书的作者和编辑会对您提交的勘误进行审核，确认并接受后，您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。

与我们联系

我们的联系邮箱是fudaokun@ptpress.com.cn。

如果您对本书有任何疑问或建议，请您发邮件给我们，并请在邮件标题中注明本书书名，以便我们更高效地做出反馈。

如果您有兴趣出版图书、录制教学视频，或者参与图书翻译、技术审校等工作，可以发邮件给我们。

如果您所在的学校、培训机构或企业，想批量购买本书或异步社区出版的其他图书，也可以发邮件给我们。

如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为，包括对图书全部或部分内容的非授权传播，请您将怀疑有侵权行为的链接发邮件给我们。您的这一举动是对作者权益的保护，也是我们持续为您提供有价值的内容的动力之源。

关于异步社区和异步图书

“异步社区”（www.epubit.com）是由人民邮电出版社创办的IT专业图书社区，于2015年8月上线运营，致力于优质内容的出版和分享，为读者提供高品质的学习内容，为作译者提供专业的出版服务，实现作者与读者在线交流互动，以及传统出版与数字出版的融合发展。

“异步图书”是异步社区策划出版的精品IT图书的品牌，依托于人民邮电出版社在计算机图书领域30余年的发展与积淀。异步图书面向IT行业以及各行业使用IT技术的用户。

第1章心态与理念——成为AI时代的创造者

脑海中闪闪发光的创意，会不会因技术门槛的阻隔，永远只能停留在想象的彼岸？

这一章，将彻底重塑你与技术的关系。

你即将邂逅一种全新的创造范式——Vibe Coding。它并非又一门需要埋头苦学的编程语言，而是一种与AI高效协作的实践艺术。

从雷菲克·阿纳多尔（Refik Anadol）将数据转化为艺术并亮相MoMA殿堂的经典案例，到你亲手实现的第一个可运行的“Hello World”项目；从理解“导演与演员”般的全新协作模式逻辑，到掌握与AI对话的黄金法则——这一章将为你搭建一座坚实的桥梁，助你从“想法的囚徒”蜕变为“现实的创造者”。

所有伟大的故事都始于相信。这一章，正是让你坚信自我创造力的起点。

1.1 一种全新的创造方式：从零到创作者

2024年2月，在苏格兰格拉斯哥举行的一场活动，意外发酵为一场轰动全网的事件。这场名为“威利·旺卡巧克力体验”的活动，其宣传材料堪称视觉盛宴：由人工智能（AI）生成的画面构建出一个充满魔幻色彩的世界——郁郁葱葱的巨型棒棒糖森林、奔流不息的巧克力河、炫彩夺目的奇妙灯光，仿佛将童话世界照进了现实。无数家长被这些梦幻场景吸引，纷纷购票，期盼带孩子踏入一个“巧克力梦想成真之地”。

然而，当满怀期待的家庭抵达现场时，眼前的景象却让他们瞠目结舌。所谓的“魔法工厂”，不过是一间装饰简陋的空旷仓库。宣传中色彩斑斓的仙境，沦为几张潦草打印后钉在墙上的AI背景板；奇幻的糖果景观，仅剩一个孤零零、半泄气的充气城堡；至于承诺的“美味佳肴”，最终只是分给孩子们的几颗软糖和半杯柠檬水。现场扮演“奥柏伦柏人”的工作人员垂头丧气，而扮演威利·旺卡的演员，则被迫背诵一份连他自己都坦言是“15页AI生成的胡言乱语”的剧本。失望透顶的家长们愤怒报警，这场“沉浸式体验”最终在一片混乱和投诉中草草收场。

这场“威利·旺卡事件”之所以迅速传播，不仅因其是一场彻底失败的商业活动，更因其像一则精准的现代寓言——它精准戳中了无数创意人士所面临的核心困境：我们脑海中想象的如AI宣传画般美好的绝妙愿景（Vision），却在将其转化为现实的巨大鸿沟前束手无策。这道鸿沟，就是传统意义上的“技术壁垒”。

活动组织者手握清晰的“提示”（Prompt）——“创造一个沉浸式的威利·旺卡体验”，甚至借助AI生成了视觉化的“成果输出”，却缺乏将数字愿景落地为物理现实的核心能力——从布景设计、活动管理到实体工程，每一项都成为了无法跨越的障碍。这与许多人的焦虑不谋而合：“我有一个绝妙的应用（App）构想，但不会写代码，只能让它停留在脑海里，无法变为现实。”我们头脑中的创意，正如那些虚假的AI图片，美丽却遥不可及。

这个故事触碰了我们内心深处的恐惧：一个伟大的想法，会不会因为缺乏技术能力而胎死腹中？

现在，请大胆想象：如果有一种方法，能让你轻松跨越这道技术鸿沟，让你的奇思妙想不再重蹈那场灾难性巧克力工厂体验的覆辙——不再只停留在虚幻的画面中，而是真正被创造、被体验、被使用，那会怎样？

欢迎来到Vibe Coding的世界。它，就是连接你非凡想象与精彩现实的桥梁。

1.1.1 Vibe Coding概念

在深入探讨如何构建这座连接想象与现实的桥梁之前，我们首先需要建立一种全新的创造心态。如果说“威利·旺卡事件”是创造力与技术脱节导致的失控闹剧，那么我们将见证，当创造力与AI以科学的方式结合时，便能升华为真正的艺术。

1.感性认知

让我们将目光从格拉斯哥那间混乱的仓库移开，转向纽约现代艺术博物馆（MoMA）的殿堂。在这里，土耳其裔美国媒体艺术家雷菲克·阿纳多尔的作品让无数观众为之震撼。阿纳多尔虽然不做应用开发，但却是一位顶级的Vibe Coder。他将我们周围无处不在的数据——城市交通数据、自然环境数据，甚至是人类的集体记忆——都视作专属的“数字颜料”。借助先进的机器学习算法，他将这些冰冷的数据“翻译”为流动变换、抽象灵动且色彩斑斓的沉浸式环境艺术，如图1-1所示。

图1-1 雷菲克·阿纳多尔的作品

想象一下，你置身于一个巨大的空间，四周的墙壁和地面都在流动变幻，仿佛踏入了一台机器的梦境之中。这就是阿纳多尔的著名项目“梦想档案”（Archive Dreaming）所带来的体验。他向AI抛出了一个极具诗意的问题：“如果机器能做梦，会发生什么？”而这个问题的答案，不是一行行冰冷的代码，而是一场令人叹为观止的视觉盛宴。

Vibe这个词，在这里可以理解为一种感觉、一种氛围，或是一种直觉的愿景。阿纳多尔的成功之处，在于他能将“机器的梦境”或“地球的回声”这类抽象的Vibe精准地传递给AI，并通过协作引导它将这份“感觉”视觉化。他的作品证明，AI驱动的创造可以不是廉价的复制品，而是货真价实的高雅艺术。

这正是Vibe Coding的感性核心：创造始于一种感觉，一种氛围，始于你想要带给世界的独特体验，而非对分号与括号的纠结。

2.理性认知

当然，Vibe Coding并不仅仅是一种单纯的艺术哲学，在其感性表达的背后，是坚实的理性基础在提供支撑。当我们剥开艺术的外壳，深入其技术内核时，便会发现一种革命性的软件开发新范式。

Vibe Coding的正式定义是：一种现代编程方法，开发者或创作者使用自然语言（如日常沟通用的中文或英文）描述希望应用程序实现的功能，然后由先进的AI模型（如OpenAI的GPT-4o或Anthropic的Claude）将这些指令（即自然语言）转化为可实际运行的软件。

这个概念与“提示驱动开发”（Prompt-Driven Development，PDD）这一专业术语紧密相连。作为一种创新的软件工程方法，PDD的核心是颠覆人与计算机的传统交互模式。过去，我们必须学习计算机的语言（编程语言），一步步告诉它“如何”执行任务；而在PDD范式下，我们只需用自己的语言告诉AI“想要实现什么”。

例如，你不再需要学习数据库的搭建、用户验证逻辑的编写、前端页面点击事件的处理等技能，只需给出一个清晰的提示：“创建一个登录页面，要求用户通过邮箱和密码进行认证。”AI会准确理解你的意图，自动生成所有必要的前端代码、后端逻辑和数据库配置。

这种转变的本质，是从“与语法搏斗”转向“专注于结果”。开发者的心智负担大幅减轻，他们不再需要将宝贵的精力消耗在记忆复杂的语法、配置烦琐的环境或调试难以捉摸的bug上，而是可以将全部创造力聚焦于设计更好的产品、优化用户体验、实现更宏大的愿景。这种“感觉先行，逻辑跟上”的模式，既降低了创造的门槛，也提升了创造的上限。

1.1.2 Vibe Coding核心理念

在理解了Vibe Coding是艺术感觉与理性范式的融合后，我们便能触及它最核心的变革：创作者角色的转型。要成为一名Vibe Coder，你无须学习新的编程语言，而是要建立一种全新的合作关系。

1.从“工匠”到“导演”

在传统的软件开发领域，程序员更像一位技艺精湛的“工匠”。他们必须熟练掌握手中的工具（如Python、Java等编程语言），了解每一种“材料”（数据结构）的特性，然后亲手逐行打磨、雕琢、组装每一个“零件”（代码），最终构建出完整的作品。这一过程严谨精密，但也极其耗时，且对工匠的技艺有着极高的要求。

而Vibe Coder，则更像一位电影“导演”。导演通常不亲自操作摄像机、调整灯光或进行剪辑，但他对最终的画面有着最清晰的愿景。他的核心工作是向整个“剧组”——摄影师、灯光师、演员、剪辑师等——清晰传达自己的想法和要求，然后审视结果、给出反馈，直到最终成片与他脑海中的愿景完全一致。

在这一比喻中，AI就是你那无所不能、精力充沛的“超级剧组”。因此，作为“导演”的你，核心技能不再是工匠式的埋头苦干，而是两项关键能力的结合：清晰的“描述”与敏锐的“迭代”。前者通常被称为“提示工程”（Prompt Engineering），是一种将脑中模糊的想法转化为AI可理解执行的、精确清晰且具体的自然语言指令的技艺，这也是Vibe Coding的基石；后者则是一种创造性的协作——AI的首次尝试往往并不完美，你需要像导演审视样片一样，评估AI的输出，识别偏差，并通过调整“剧本”（提示）来引导AI趋近最终目标。这是一个持续、充满互动与协作的对话过程。

2.案例研究

艺术家Jon Han为微软2023年年度工作趋势指数报告创作主视觉的经历，完美地诠释了Vibe Coder的“导演”角色是如何实践的。他的创作过程，堪称一场与AI的精彩对话。

◎ 第一轮对话：初步提示

Han的初始想法围绕“人与科技的连接”展开。他向AI图像生成器提交了初始提示，AI随即返回一些图像，但Han觉得这些作品“太像科幻电影了”，氛围偏于冰冷，不符合他期望传递的“更快乐的情绪”，如图1-2所示。这就像导演看完第一条片子后说：“感觉不对，我们重新来过。”

◎ 第二轮对话：迭代调整

为了调整氛围，Han在提示中补充了新的指令——“郁郁葱葱的风景”。AI立刻领会他的意图，新生成的图像变得更有机、更有氛围感，摆脱了此前的阴暗与过度数字化的特质，如图1-3所示。这一步如同导演给出更具体的创作指导：“我需要更温暖、更自然的色调。”

图1-2 第一轮对话生成的图像

图1-3 第二轮对话生成的图像

◎ 第三轮对话：微调与探索学习

随后，Han尝试直接在提示中加入“温暖”这个词，结果AI生成的画面“仿佛一切都在燃烧”，完全偏离了预期方向，如图1-4所示。这次小小的失误让Han意识到，与AI协作同样存在学习曲线。他必须像导演熟悉每位演员的脾性一样，探索并掌握与AI沟通的“技巧”，理解一些词汇对AI“创作表现”的影响。

图1-4 第三轮对话生成的图像

◎ 最终协作

在经过多轮这样的对话和实验后，AI直接生成的完整复杂画面如图1-5所示。但这个单纯由AI生成的画面还是不能让他满意，于是他参考结合AI生成的画面亲手设计了最终构图框架，然后将AI作为高效协作助手，指示其生成画作中的特定元素（比如不同风格的树木或天空），再由他进行挑选和组合创作，如图1-6所示。

Jon Han的经历生动展现了Vibe Coder的工作模式：他没有亲手绘制成品中的任何像素级元素，却通过一轮又一轮的对话、反馈和迭代，成功引导AI这位强大的创意合作伙伴，最终实现了他独特的艺术构想。

图1-5 多轮协作后AI生成的画面

图1-6 John Han的最终成品

这一案例充分印证了Vibe Coding的精髓是人机协作：以人类的创作愿景和审美判断为核心，驾驭AI强大的生成能力。创作者的核心价值，体现在自己的审美品位、精准指导和持续迭代的协作能力之中。

为了让读者更清晰地理解这种心态的转变，表1-1对传统编程与Vibe Coding的核心理念差异进行了梳理总结。

表1-1 传统编程与Vibe Coding的区别

维度	传统编程	Vibe Coding
核心技能	语法精确性与算法逻辑	愿景沟通与迭代反馈
主要工具	特定的编程语言（如Python、Java）	自然语言与AI模型
对待失败	花费大量精力修复棘手且原因不明的bug	将其视为学习和迭代的机会
原型交付周期	数周或数月，需要大量前期准备工作	数分钟或数小时，几乎无须前期准备
心智焦点	关注“如何做”：“我该如何正确编写这段代码？”	关注“做什么”：“我想要实现什么样的结果？”

表1-1清晰揭示了本书的核心主张：“心态超越语法”。成为一名Vibe Coder，关键在于接纳一种全新的思维模式，即以创意和沟通为核心的工作理念。

注：关于人与AI协作作品的版权归属问题，目前业界普遍认为，AI只能作为放大或辅助人类创造力的“共同作者”。要想让最终作品获得充分的法律保护并具有商业价值，创作者必须亲自掌控创意全链条，清晰记录人类自身的创作贡献，并与平台及法律体系协同完善发展。

1.1.3 直面初学者的三大恐惧

即使你已经对Vibe Coding的理念满怀热忱，但内心深处或许仍潜藏着一些根深蒂固的恐惧。这些“心魔”是阻碍无数人迈出创造第一步的无形壁垒。现在，让我们逐一击破它们。

1.恐惧1：“我不是技术专家”

这一恐惧源于一个早已过时的认知：创造软件=编写代码。如今，Vibe Coding已将这一等式彻底改写为：创造软件=清晰沟通。

你的价值不再取决于否能记住上百个API或复杂的算法，而在于否能将自己的想法清晰、有条理地表达出来。这恰恰是许多“非技术”人士的强项。

以国产AI大模型DeepSeek为例，其核心开发者之一辛华剑，在中山大学主修逻辑学期间，就凭借出色的逻辑思维和实践能力，成为AI大模型DeepSeek-Prover的核心开发人员。他的专业背景并非计算机领域，而是严谨的逻辑推理——这正是构建有效提示（Prompt）的关键能力。

辛华剑的校友周方婷，本科主修新媒体与传播学，在接触数据分析后通过自学成功转型为AI算法工程师，还为企业设计了AI知识管理系统。她的核心竞争力，正是传播学训练赋予的强大沟通和信息整合能力。

这一趋势并不仅限于技术领域。不少著名科幻作家已开始借助AI进行“共创写作”，部分知名人士也表示，如果AI能帮忙把小说写得更好，他们也是乐于接纳的。他们都不是传统意义上的“技术专家”，却是思想和语言的大师。

在AI时代，深刻的思想、精准的表达和独特的创造力，本身就是最核心的“技术”。所以，请放下“我不是技术专家”的心理包袱，你的专业背景、你的独特视角，恰恰是你作为Vibe Coder最宝贵的财富。

2.恐惧2：“我害怕失败”

对失败的恐惧，是人类的天性。在传统教育和工作环境中，失败往往与惩罚挂钩。项目失败，可能意味着加班补救、遭受批评，甚至影响职业发展。这种环境范围让我们对“犯错”避之不及，逐渐养成了畏缩不前的心态。

然而在创新领域，这是一种致命的心态。Vibe Coding所借鉴的两个核心思想——敏捷开发（Agile）和设计思维（Design Thinking），都将“失败”视为创新的燃料，而非需要规避的事故。

敏捷开发中流传着一句著名的口号——fail fast，fail loud（快速失败，并公开承认）。它的意思是，我们应尽早以尽可能低的成本去尝试，一旦发现行不通，便立刻正视失败、汲取经验，然后调整方向重新出发。此时的失败不再是需要掩盖的耻辱，而是通往成功的踏脚石。

这与设计思维中的“迭代”概念不谋而合。迭代的本质，就是一个不断循环往复的“原型搭建-测试验证-总结学习-优化修改”的过程。

Vibe Coding将这种低成本试错的理念推向了极致。在传统编程中，一项功能开发失败，可能意味着数天甚至数周的时间成本付诸东流。而在Vibe Coding中，一次不理想的生成结果，或许只需你花费几秒钟时间，重新组织一次措辞即可。你完全可以在一个下午尝试几十种不同的想法，而不用担心任何实质的损失。这种近乎为零的失败成本，极大地激发了大胆实验和创新的勇气。

所以，请重新定义你对“失败”的认知。在Vibe Coding的世界里，没有绝对的失败，只有持续的迭代。每一次“错误”的输出，都是AI在向你发问：“导演，这是你想要的吗？如果不是，请给我更清晰的指令。”

3.恐惧3：“学习成本太高”

最后一个心魔，也是最现实的一个：费用。学习新技能往往意味着昂贵的课程、软件和硬件投入。很多人一想到“全栈开发”（Full-Stack Development），脑海中浮现的便是一长串需要付费的技术工具，以及复杂的服务器配置流程。

为了彻底打消你的顾虑，我们提出一个全新的概念：“节俭全栈”（Frugal Full-Stack）。

“节俭全栈”既是一种理念，也是一套实践方法。它指的是利用当今触手可及的免费或极低成本的AI工具以及无代码/低代码平台，构建、部署并运营一个功能完备的应用程序。这里的“全栈”，不再意味着你需要亲自掌握前端（用户界面）、后端（服务器逻辑）、数据库（数据存储）等所有技术，而是可以借助AI和现成工具，轻松地实现全栈功能。

你不需要成为一位全能的开发者，只需学会组装一个由各种免费或低成本工具构成的“节俭工具箱”。这个工具箱中包含下面这些工具。

• 免费/低成本的应用构建器：像Figma Make和v0.dev这样的工具，可以让你在几分钟内将简单的电子表格转换为一款功能强大的Web应用。你可以用它们免费创建内部CRM、项目跟踪器、客户门户网站等，全程无须编写一行代码。

• 免费的AI编程助手：DeepSeek、Kimi、ChatGPT、Gemini等主流AI工具，均提供功能强大的免费版本。它们可以帮你生成代码片段、解释复杂的技术概念、规划应用架构，甚至撰写专业的推广邮件。

在本书中，我们将引导你完成第一个项目，在这个过程中将完全使用这些低成本甚至是免费的工具，你不需要购买任何服务器，唯一的投入便是你的时间和创造力。

这三大恐惧——对专业性的焦虑、对失败的畏惧、对成本的担忧——实际上是相互关联的。因为失败的成本几乎为零，所以你不必从一开始就是专家，完全可以通过持续的免费实验，一边学习一边成长。

1.1.4 告别“劝退仪式”，创造你的第一款应用

我们已经从理论上拆除了你内心的壁垒，但真正的信心终究来源于亲手创造的体验。在这一节，我们将带你感受传统编程与Vibe Coding在“第一次”尝试上的天壤之别，一同证那个足以点燃你内心创造火焰的“它能工作！”时刻。

1.对比传统编程的挫败感

如果你曾尝试学习传统编程，你很可能经历过那个经典的“劝退仪式”——配置本地开发环境。

对于没有相关经历的读者，可以想象这样一个场景。你满怀激情地打开一份教程，第一步通常是安装各种软件：特定版本的编程语言（比如Python 3.9，而不是3.10）、包管理器、代码编辑器、数据库服务……每个环节都可能出错。环境变量设置错误、依赖包版本冲突、端口被占用、防火墙拦截……这些复杂的错误信息会像潮水一样淹没你的热情。

一位资深工程师曾无奈地感叹：“我见过不少工程师花费数小时甚至数天，只为调试本地开发环境的问题。”对满怀期待的新人来说，这种体验是毁灭性的。当一个人兴致勃勃地开始一项新工作，却因本地开发环境配置受阻而停滞不前时，其失望和无力感可想而知。在团队协作中，一句“在我的机器上可以运行”更是成为推卸责任、阻碍进度的常见说辞。

在真正开始创造之前，这个过程就耗尽了无数人的信心和耐心。它像一道高墙，无情地挡住了那些缺乏毅力或技术背景的人。

2. Vibe Coding的即时正反馈

现在，请想象一个完全不同的场景。你坐在电脑前，准备构建第一款应用。没有复杂的安装命令，没有令人困惑的配置文件。你打开的只是一个简洁的网页。

下面，我们通过瑞典AI新创公司Lovable的平台来亲身体验。这个平台的目标，就是让非工程师也能用自然语言创建全栈应用。

1.访问Lovable的官方网站，成功访问后，会看到如图1-7所示的页面。

图1-7 Lovable主页面

2.单击右上角的Get started按钮，按照指引注册一个账户。

3.注册完成后，回到主页面，直接在输入框中输入一句简单的话，如图1-8所示。

图1-8 在输入框中输入一句话

按下回车键后，屏幕进入实时变化状态——AI理解了你的意图，随后启动应用构建流程。你会看到一个用户界面逐渐成型，上面出现了“喂奶记录”和“睡眠记录”输入框，如图1-9所示。

图1-9 Lovable生成的用户界面

一个简单的图表组件也出现在页面下方。这并非一张静态的图片，而是AI在后台同步推进全流程开发的结果：生成真实的前端代码、搭建后端逻辑，并配置好一个简单的数据库来存储数据。整个过程结束后，AI甚至会生成一个可公开访问的网站链接，让你一键分享最终的应用成果（见图1-10）。

图1-10 Lovable最终生成的应用

在这短短的几分钟内，你所体验到的就是那个点燃信心的决定性时刻——“它能工作！”

你看到的不是模拟的线框图，也不是虚假的效果图，而是一个鲜活、可交互、能实际运行的软件。这种即时且极具冲击力的正反馈，正是传统编程学习曲线中缺失的关键一环。它向你证明了一个颠覆性的事实：“我，一个非技术人员，刚刚亲手创造了一个能工作的软件。创造，原来如此简单。”

1.1.5 小结

让我们回到开篇那个“威利·旺卡”的寓言。那场活动生动展现了当美好的想法与落地执行能力完全脱节时，结局会是多么令人惋惜。

而你，就在刚才的几分钟里，亲身体验了将一个创意迅速转化为现实的过程。你已经成功跨越了那道“想”与“做”的鸿沟。

这或许只是一个简单的原型，功能还很粗糙，界面也不够精致，但这些都不重要。重要的是，你已经迈出了从“梦想家”到“创造者”的第一步，掌握了点燃创造之火的方法。

我们接下来的旅程，将是学习如何更好地驾驭AI这位强大的合作者。你会像一位真正的“导演”，通过精准的对话引导和敏锐的迭代反馈，将手中这颗小小的火种，培育成熊熊燃烧的烈焰，把类似你在1.1.4小节创造的第一款应用打磨成真正能为世界创造价值、独一无二的作品。

真正的创造之旅，才刚刚开始。

1.2 独立开发者的思维工具箱

你是否曾经萌生过一个宏伟的想法？可能是一款能改变世界的应用程序、一个能颠覆行业的平台，或是一个绝妙的创意构想。你兴奋地在脑海中勾勒它的每一个细节：流畅的交互动画、数十种实用的功能、完美无瑕的用户界面，甚至提前想好了要在产品发布会上穿什么颜色的T恤。

然而，这个想法却没有走出你的脑海，沦为未竟的遗憾。

只因这个想法太过庞大，太过追求完美，以至于你无从下手。每当试图开始时，那座名为“完美”的大山就压得你喘不过气。最终，这个绝妙的构想和无数未面世的创意一样，静静地留在了你的脑海里。

这就是“要么全部，要么没有”的思维陷阱，不仅新手开发者容易陷入，许多经验丰富的创造者也难逃其扰。我们总想一步到位，直接造出一艘“航空母舰”，却忘了任何伟大的航行，都始于一艘能够顺利下水的“小船”。

在本节中，我们将介绍一套专为独立开发者打造的思维工具箱，这套工具箱特别适配与AI协同工作的Vibe Coder。这套工具箱包含五大核心原则，它们并不是僵化的规则，而是一系列灵活的思维方式，旨在帮助你管理复杂需求、降低创造风险，同时让整个创造过程充满乐趣和可持续性。

1.2.1 原则1：从小处着手

一旦你接受了“从小处着手”（start small）的理念，下一个关键步骤就是为你的“小船”绘制一张航行图，哪怕只是一张简单的草图。

1.先构建最核心的功能

首先，我们来讨论一个在科技圈广为人知的概念：MVP。它不是指“最有价值球员”（Most Valuable Player），而是“最小可行产品”（Minimum Viable Product）。这一概念由精益创业的先驱埃里克·莱斯（Eric Ries）提出，他给出的定义是：“一个新产品的版本，能让团队以最少的努力，收集到关于客户的最大量的有效认知。”

简单来说，MVP就是产品的最简化版本，它只包含足以解决用户核心痛点的功能，但它必须是“可行”的，也就是能用，能完整呈现核心流程，能让用户获得闭环体验。这里的“最小”不是“差”或“半成品”的代名词，而是“专注”和“智慧”的体现。MVP的核心目标是，在投入大量资金和时间之前，用最低的成本快速验证你的想法是否真的有用户愿意买单，如图1-11所示。

图1-11 什么是MVP

2.纸杯蛋糕原则

想象一下，你的梦想是开一家享誉世界的蛋糕店。此时，你有下面两个截然不同的选择。

• 婚礼蛋糕模式：花费一整年时间，投入所有积蓄，闭门造车般地精心研发一款七层高的豪华婚礼蛋糕，蛋糕上装饰着精致的翻糖花朵和珍珠糖霜。你相信，只要它一问世，必定惊艳全场。

• 纸杯蛋糕模式：用一周时间和有限的预算，专注于打磨一款口味绝佳、外形可爱的纸杯蛋糕。然后推着小餐车，在周末的市集上开始售卖。

婚礼蛋糕模式的风险极高，如果顾客不喜欢你的口味，或者市场上根本就不需要这么奢华的产品，那么你一年的心血和全部投资就可能付诸东流。而纸杯蛋糕模式，就是MVP思想的完美体现。

这个小小的纸杯蛋糕，绝非粗糙的半成品，而是一款完整、美味且能带给人快乐的产品。它能帮助你实现三大核心目标。

• 测试配方（验证想法）：顾客的即时反应会直接告诉你，你的产品是否真的受欢迎。

• 获得反馈（收集认知）：他们可能会提议“奶油少点甜味会更好”，或者“希望出巧克力味的蛋糕”，这些真实反馈都是无价的改进方向。

• 开始赚钱（产生价值）：每一笔销售都是对产品价值的肯定，也能为后续研发提供资金、降低风险。

只有当你的纸杯蛋糕大获成功，证明了烘焙理念的可行性时，你才有足够的信心和资本去挑战更复杂的双层蛋糕，乃至最终那款梦寐以求的七层婚礼蛋糕。

独立开发也是一样：在你投入大量资源建造“婚礼蛋糕”式的完美产品前，先用一款“纸杯蛋糕”式的最小可行产品，验证市场是否真的喜欢你的创意与手艺——这是无数成功产品从想法走向落地的关键第一步。

3.巨头们的起点

几乎所有你如今熟知的科技巨头，起点往往是一个极其简陋，甚至有些粗糙的MVP。

◎ 爱彼迎（Airbnb）：从三张气垫床起步

2007年，旧金山即将举办一场大型设计峰会，当地酒店房间早已预订一空；而此时，爱彼迎的创始人布莱恩·切斯基（Brian Chesky）和乔·戈比亚（Joe Gebbia）正面临一个棘手的问题——他们难以支付自己的房租。他们灵机一动：既然酒店满房，为什么不能把公寓里的空地方租出去？他们没有开发功能完备的预订平台，而是搭建了一个极其简单的网站，上传了几张阁楼里三张气垫床的照片，还承诺为租客提供早餐。他们的这个MVP叫Airbed & Breakfast（气垫床和早餐），这就是Airbnb的前身。结果，他们迎来了三位付费客人——这不仅解决了他们的房租难题，更重要的是验证了一个颠覆性的商业模式：人们愿意为更实惠、更具本土化体验的住宿，住进陌生人的家里。

◎ Zappos：“绿野仙踪”式MVP

1999年，Zappos的创始人尼克·斯威姆（Nick Swinmurn）想验证一个当时看似大胆的想法：人们是否愿意在网上购买无法试穿的鞋子。他没有像传统零售商那样，先投入重金租赁仓库、批量进货，而是采用了堪称“零成本”的验证方式：跑到当地鞋店给鞋子拍照，然后把照片上传到自己的网站上（见图1-12）。一旦有顾客下单，他就立刻返回那家鞋店买下鞋子，打包后寄给顾客。这种模式被称为“绿野仙踪”式MVP（Wizard of Oz MVP）——在用户看来，网站背后似乎有一个强大的自动化系统和庞大的库存，但实际上幕后只有一个像魔法师一样手动处理事务的人。这个聪明的MVP成功证明了人们确实有在线购买鞋子的需求，而Zappos则在几乎零库存风险的情况下，验证了其核心商业模式。

图1-12 Zappos网站

这些故事都在传递一个核心：MVP的核心价值在于“学习”，而非“完美”。你的第一个产品，其首要目的不是营利或惊艳世界，而是回答一个关键问题：“我的这个想法，真的有人在乎吗？”

更重要的是，对于非技术背景的创作者而言，你的第一个MVP甚至可以与代码无关。它可以是一间简陋的出租房（如Airbnb）、一项手动的服务（如Zappos），或是一个用来收集潜在用户邮箱的简单登录页面。从今天起，你完全可以即刻行动验证想法，无须等到掌握所有技术之后。这，正是“从小处着手”的真正力量。

1.2.2 原则2：规划你的构建

在动手之前，先让思路落地。如果说“从小处着手”是在明确“做什么”，那么“规划你的构建”就是在教你“怎么做”。这两个原则相辅相成：前者帮你缩小聚焦范围，后者帮你绘制行动路径。

1.一份简单的计划，是通往现实的捷径

许多人对创造过程抱有一种浪漫的幻想：一位天才开发者在灵感的驱动下，手指在键盘上飞速舞动，最终一个伟大的产品横空出世。现实并非如此——混乱的灵感或许能催生一些零散的代码片段，但绝不可能构建出稳定、可用且能真正解决问题的产品。通往成功的最快路径，往往是一份清晰简洁的计划。

这里要引入一个专业术语：PRD（Product Requirements Document，产品需求文档）。这个术语听起来可能很正式，但我们提倡一种更轻量、更敏捷的形式——最小可行PRD（Minimal Viable PRD）。

你可以把它视为一张“项目蓝图”。这张蓝图或许只有一页纸，但却能清晰明确三件核心的事情：

• 目标是什么（你要构建的产品具体是什么）；

• 为谁而建（你的目标用户群体是谁）；

• 为何而建（它能解决什么核心问题，能为用户带来什么实际好处）。

这份文档并不是刻板的律法，而是一份“活的文档”，随着项目的推进，你可以随时更新和调整它的内容。它的存在，是为了给你自己以及AI编程伙伴，提供一份清晰一致的行动指引。

2.“最小可行PRD”实践

为了能让你立刻上手，我们准备了一个极其简单的模板，如表1-2所示。在启动任何项目之前，请花一些时间填完这张表——这个梳理的过程本身，就是一次极具价值的战略思考。

表1-2 最小可行PRD模板

组件	问题指引（你需要回答什么）	你的答案（示例：“15分钟快手厨房”App）
项目名称	给你的项目起一个简单明了的名字	“快手厨房”
项目概述	用一两句话说清楚“这是什么、为谁服务、解决什么问题”	“快手厨房”是一款为工作繁忙的年轻父母设计的移动应用，提供15分钟内可完成的健康食谱，解决他们没时间做饭的核心痛点
目标用户	详细描述你的核心用户：他们是谁、生活状态如何、核心痛点是什么	• 姓名：张丽（32岁） • 职业：市场经理，两个孩子的母亲 • 痛点：下班晚、时间紧张，想给家人做健康晚餐，但没有时间和精力研究复杂食谱，不得不经常点外卖
核心问题	你的产品要解决的最关键的一个问题是什么	如何让忙碌的父母在15分钟内，用简单的食材做出健康美味的晚餐
必须具备的功能（MVP）	列出解决核心问题绝对必需的3～5个功能（记住，是“必需”，不是“最好有”）	• 食谱浏览：支持分类浏览食谱 • 食谱详情页：清晰展示食材、步骤和预计耗时 • 计时器功能：内置烹饪步骤专属计时器 • 搜索功能：可按食材名称搜索食谱
明确不做什么	为保持专注，列出第一个版本坚决不做的功能（对抗“功能蔓延”）	• 用户注册和登录系统 • 社区分享和评论功能 • 购物清单生成功能 • 卡路里计算功能
成功指标	如何判断MVP成功了？为此设定简单可衡量的指标	一个月内有1000次下载量，且平均每个用户每周打开应用2次以上

花时间完成这份PRD，能帮助独立开发者避开多个常见的陷阱。

• “为谁服务”：避免开发“人人可用，却无人想用”的泛化产品。

• “核心问题”：确保你的产品具备明确的存在价值，不做无用功。

• “必须具备的功能”：精确定义MVP范围，抵御“功能越多越好”的诱惑。

• “明确不做什么”：像一道防火墙，防止精力和时间浪费在次要功能上。

• “成功指标”：让你从一开始就聚焦价值衡量，而不是凭感觉推进。

这份计划，是你与未来自己的对话，锁定了你最初、最核心的决策。更重要的是，在AI时代，这份PRD是你与AI伙伴沟通的基石。如果你向AI编程工具下达模糊的指令，比如“帮我写个食谱应用”，得到的结果也必然空洞浮泛，难以直接落地；而基于PRD的清晰提示，比如，“为‘快手厨房’App创建一个食谱详情页面：目标用户是时间紧张的父母，界面需要极其简洁，必须包含三个部分——一张大图、固定格式的食材列表（含名称和用量），以及带编号的烹饪步骤，暂不添加评论区和分享按钮”，这可以引导AI生成精准、高质量、符合你构想的代码。

1.2.3 原则3：迭代，而非堆砌

有了地图，就该踏上征程——但别奢望一口气抵达终点。你已经通过原则1确定了要攀登的小山，通过原则2绘制了清晰的登山路线图。现在，你需要掌握正确的攀登节奏：如何稳健、持续地向前推进，而不是在半山腰就精疲力竭。这正是原则3要解决的核心问题。

1.迭代的原则

一旦有了清晰的计划，就进入了实际的构建阶段。这里要引入第三个核心原则：迭代，而非堆砌（Pile On）。

迭代，意味着将整个开发过程拆分为一系列微小、可控的循环：构建一小部分功能，测试验证，优化完善，然后进入下一个循环。这与“堆砌”模式截然不同——后者试图一次性搭建所有功能，直到最后才发现地基早已倾斜，返工成本极高。

为了更好地践行迭代理念，可以遵循一个简单的“三不”原则。

• 不一次构建多个功能：集中全部精力，一次只攻克一个功能点，确保做深做透。

• 不一次修复多个问题：发现bug后逐个击破，避免同时处理多个bug导致混乱或遗漏。

• 不跳跃开发步骤：严格遵循“构建-测试-修复”的微循环，不要因为赶进度而省略测试环节，避免小问题积累成大隐患。

2.敏捷的厨师

让我们再次回到厨房。一个优秀厨师的工作流程，天生就是迭代式的。他绝不会把所有食材一股脑地扔进锅里，然后祈祷半小时后能变出美味佳肴。他的工作流程如图1-13所示。

图1-13 一个优秀厨师的工作流程

1.准备工作（各就各位）：这是迭代的“第0步”，对应着你的PRD。厨师会将所有食材清洗切配好，分门别类地装入小碗，工具也摆放得井井有条，为后续烹饪的流畅性打下基础。

2.烹饪核心（构建核心功能）：他会先专注于菜品的核心部分。比如做法式洋葱汤，会先花大量时间专心炒洋葱，直到达到完美的焦糖化状态，此时他绝不会分心去烤面包或者准备沙拉。这就像你集中精力构建应用的第一个核心功能，比如“食谱浏览”页面。

3.品尝调整（测试与调试）：在烹饪的每一步，厨师都会反复品尝。汤底熬好尝一口，如果盐不够就补一点，汤汁偏腻就挤几滴柠檬汁。每一次品尝都是一次微小的测试，每一次调整都是一次快速的调试——这与你完成一个功能后立刻上手试用，检查是否有bug、流程是否顺畅，完全是同一个道理。

4.组合装盘（集成与部署）：只有当汤底、奶酪、面包片等单一食材都各自达到理想状态时，厨师才会将它们组合，完成最终装盘并呈现给顾客。同样，你也应该在确保每个小功能独立运行正常后，再将它们集成到整个应用中。

这种迭代式的烹饪方法，确保了最终菜品的每一个组成部分都是高质量的。软件开发也是如此——通过“一次只做一件事”的迭代循环，主动地将质量注入项目的每一个细节。

这种做法与传统的“瀑布式”开发形成了鲜明对比。瀑布式开发就像建房子，过程是线性且不可逆的。如果在封顶之后才发现地基有严重缺陷，修复成本极高。而迭代开发更像照料花园，先种下一小片花，观察生长情况再随时调整。软件本就是需要不断演进的“花园”，迭代正是照料它的最佳方式。

遵循迭代原则，能为你带来巨大的好处。

• 降低认知负荷：大脑只需要专注于一个微小、明确的任务。

• 快速获得成就感：每完成一个小循环，都能看到实实在在的进展，这对于保持动力至关重要。

• 让问题隔离：如果应用出错，几乎可以立刻确定问题出在刚刚完成的小功能上。

因此，像耐心的厨师或园丁那样，专注于手头的下一件小事并做到最好，才是通往伟大产品最稳健也最快的路。

1.2.4 原则4：测试一切

当你通过测试保障了当前功能的质量后，还需要用可靠的方法安全地保存你的劳动成果，为下一步的探索提供保障。这就引出了我们的第4个核心原则。

1.植入质量保证思维

现在，你的第一个小功能已经按照迭代原则构建好了。接下来该做什么？许多新手会迫不及待地开发下一个功能。但此时必须明确第4个至关重要的原则：测试一切（test everything）。

质量保证（Quality Assurance，QA）不是项目开发末端的收尾环节，而是从开发第一天起就应该融入你思维的模式。你的目标不是“证明”应用能正常运行，而是要做一个充满好奇心的“破坏者”，主动尝试突破功能边界，赶在用户发现那些令人沮丧的漏洞前，将它们找出来。

2.友好的侦探

如何培养这种QA思维？最好的方式就是把自己当成一名侦探。一个好侦探从不会轻易相信表面现象，而是始终带着质疑态度，对每个细节刨根问底。当你面对刚写好的功能时，不妨戴上“侦探帽”，逐一审问它。

• “这个按钮真的能用吗？”（点击验证，确认是否跳转至目标页面。）

• “在什么情况下它会失灵？”（这是对“边缘案例”的挖掘。）

• “用户会有哪些意外操作？”（除了预设的常规流程，还有哪些潜在的使用路径。）

这种侦探式思维，能帮你从一个带有主观偏见的“创造者”，转变为客观严谨的“评估者”。创造者总是希望自己的作品是完美的，而侦探则致力于挖掘功能的真实状况。

3.非技术人员的侦探手册

你可能会疑惑：“我不是技术专家，怎么知道如何测试？”好消息是，很多有价值的测试方法，根本不需要任何技术背景，它们需要的是好奇心、同理心和一点“捣蛋”精神。

以下是一些你可以立刻上手的“侦探技术”。

• 用户测试：找一位对你的项目完全不了解、也不太懂技术的朋友或家人。把应用交给他们，然后不说话默默观察。不要给任何提示，不要解释任何功能。他们卡在哪里？哪个按钮让他们困惑？他们脸上的迷茫，就是指向你设计缺陷的信号灯。他们能毫不费力地完成任务，才是真正的“用户友好”。

• 边界值分析：这个术语听起来很专业，但核心概念非常简单。如果你的应用有输入框，就一定会有“预期”输入范围，你的任务就是试探这个范围的边界及之外的情况。

▪ 示例：年龄输入框要求输入18～99之间的数字。

▪ 测试边界：输入18和99，验证是否正常响应。

▪ 测试边界外：输入17和100，看应用是给出合理的错误提示，还是直接崩溃。

▪ 测试极端值：分别输入0、-1、999，看应用的反馈。

▪ 测试错误类型：输入“二十”、表情符号，或者什么都不输入，直接单击“确定”。

• 压力测试：假装自己是存心捣乱的用户，做一些“出格”的事情。

▪ 在名字输入框中粘贴一篇三千字的小说。

▪ 快速连续地点击同一个按钮100次。

▪ 在没有网络连接的情况下打开应用，看会发生什么。

▪ 反复切换手机的横屏和竖屏模式，检查界面是否错乱。

这些测试的核心，是挑战你作为开发者时所做的那些“理所当然”的假设。一个好的产品，必须能够优雅地处理预料之外的情况。记住，每一次成功“搞垮”自己的应用，都不是一次失败，而是胜利——你发现了潜在的问题，并且能在它影响真实用户之前将其解决。成为自己产品的第一位也是最挑剔的用户，这正是QA思维的精髓。

1.2.5 原则5：使用版本控制

当功能通过测试、质量得到确认后，下一步就是给它上一道“保险”——让每一次改动都能被记录、回滚。于是，我们迎来本节最后一位主角：版本控制。

1.项目的终极“后悔药”

版本控制是独立开发者的核心利器，我们将要介绍的版本控制工具名为Git，以及它的在线家园GitHub。

简单来说，Git是一个安装在本地的系统，它像严谨的档案管理员，仔细记录项目文件的每一次修改；而GitHub是一个网站，如同安全的云端保险柜，能妥善存放你的项目及完整修改历史。

从项目启动的第一天起，养成使用版本控制的习惯至关重要。下面我们使用一个通俗易懂的概念帮你理解它的价值。

2.电子游戏的存档点

不妨把你的整个开发项目比作一款大型角色扮演游戏。你作为游戏的主角，负责推进项目的进展，如图1-14所示。

• 代码仓库（Repository）：对应游戏的完整文件，囊括这个项目世界里的所有内容。

• 提交（Commit）：这是游戏中最关键的操作——存档。每当完成了一个小任务时（比如修复了一个bug，增加了一个小功能），都要立即“提交”一次。这相当于在当前位置创建了一个“存档点”。这个存档点会完整记录当时项目的全部状态，并附有备注（比如“修复了登录按钮的bug”）。

• 分支（Branch）：相当于游戏中的“新建独立存档位”。比如要挑战一个危险的Boss，或者尝试可能影响主线的支线任务时，聪明的做法是基于当前进度，新建一个独立的存档文件去挑战。

▪ 如果挑战成功，好比收获了传说中的宝剑，就可以通过“合并”（Merge），将这个存档融入主存档，带着成果（宝剑）推进主线任务。

▪ 如果挑战失败，哪怕存档出现问题都不要紧，因为你的主存档（Git中称为main分支）安然无恙，仍然停留在挑战前的安全状态。你只需要删掉失败的“挑战存档”，然后读回主存档即可恢复正常。

图1-14 以游戏的方式理解Git版本控制

• GitHub（云存档）：现在，假设你的电脑坏了，本地存档全部丢失，你数月的心血付之一炬。而GitHub就是你的终极“云存档”——本地“存档”（Commit）后，可以通过一个叫“推送”（Push）的动作，把最新的存档同步到GitHub网站上。因此，即使你的电脑出现问题，只需换一台新电脑登录GitHub，就可以完整找回整个项目和它所有的历史存档。

对于独立开发者来说，版本控制的核心价值在于提供了一种心理上的安全感，从而释放创造自由。

很多开发者会顾虑“我如果把这里改了，会不会搞砸整个项目”，这种担忧扼杀了许多创造力。Git能彻底消除这种恐惧：当想尝试大胆的新功能时，只需从main分支新建分支作为“支线任务存档”。在这个新分支上，你可以放心大胆地实验、试错，完全不用担心会影响到那个稳定、可用的主版本。

如果你的实验成功了，就把它合并回主线。如果失败了，就直接删掉这个分支，几乎没有试错成本。这种“安全网”能鼓励你大胆冒险、迭代，它从不是一个烦琐的工具，而是独立开发者敢于创新的底气与许可证。

1.2.6 建立你的“思考-提示-迭代”循环

你已手握五把钥匙，现在是时候理解它们的深层价值了。前面我们逐一拆解了五大核心原则——从小处着手、规划你的构建、迭代，而非堆砌、测试一切和使用版本控制。但你可能会疑惑：这些原则看起来如此“传统”，为什么在AI时代反而变得愈发重要？

答案就藏在Vibe Coding这个看似轻松的名字背后。

AI越不可预测，流程就必须越严谨

Vibe Coding描述的是一种与AI编程工具协同工作的状态：你不再逐行编写代码，而是更像一位乐队指挥，向才华横溢却时而即兴发挥的AI音乐家描述想要的“感觉”或“氛围”，然后由它来演奏出代码的旋律。

这种工作方式充满了自由和创造的快感，效率也高得惊人。但是，这种自由的背后隐藏着风险：你的AI伙伴虽然知识渊博，但本质上是复杂的模式匹配机器，并未真正“理解”世界。它会“犯错”，会“一本正经地胡说八道”——这在AI领域称为“幻觉”（hallucination）。

为了让你明白这种“幻觉”有多么真实和普遍，我们来看几个近期的案例，它们既滑稽又发人深省。

• 过于听话的汽车销售员：一家雪佛兰汽车经销商的客服聊天机器人，被一位善于引导的用户通过巧妙提问“调教”后，同意以1美元的价格出售一辆全新的雪佛兰Tahoe SUV，还声明这是“具有法律约束力的报价”。

启示1：你的AI可能完全不理解商业逻辑和常识。

• 凭空捏造的律师：加拿大航空公司的客服机器人，曾自信地向一位顾客承诺了一项公司根本不存在的退款政策。这位顾客信以为真，事后将加航告上法庭，最终法庭裁定，航空公司必须为自己机器人的“谎言”埋单。

启示2：你的AI会以绝对的自信，陈述完全虚假的事实。

• 荒谬绝伦的厨师：当用户在谷歌的AI Overviews功能中搜索“如何防止比萨上的奶酪滑落”时，AI给出的建议是混入无毒胶水。

启示3：你的AI生成的建议，可能语法完美，但内容却危险且离谱。

• 带有偏见的艺术家：谷歌的Gemini AI在生成历史人物图像时，出现了不符合史实的情况。更早的微软Tay聊天机器人，在与网友互动后，迅速学会并发表了大量不当言论。

启示4：你的AI并非客观中立，它会继承并放大其训练数据中存在的偏见。

这些层出不穷的AI“翻车”事件指向一个共同的结论：大语言模型是我们这个时代最强大的创造力放大器，但它们从根本上也是不可靠的。

1.2.7 小结

现在请思考一个问题：当你团队里最核心的成员，是一个时而天才、时而犯错的“实习生”时，你作为项目唯一的负责人，能和他一样随性吗？

答案显然是否定的。你的工具越自由奔放、不可预测，你作为驾驭者，流程就必须越是严谨、越有纪律。这正是本节介绍的五大原则的价值所在。它们共同构成了一个强大的框架，让你能够安全、高效地驾驭AI的力量。

• 从小处着手（原则1），是因为需要先在一个小而可控的问题上测试AI的输出质量，而不是让它直接生成庞大且充满未知错误的应用。

• 规划你的构建（原则2），是因为你需要一张清晰的“蓝图”（PRD），给AI提供精准的指令，并以此为标准判断它的产出是否符合预期。

• 迭代，而非堆砌（原则3），是因为你需要小批量审查AI的工作成果，绝不能等到它生成了整个应用后，才发现它从第一步就误解了你的意图。

• 测试一切（原则4），是因为永远不能盲目信任AI的输出。你必须扮演多疑的侦探，验证它的每一个“陈述”，戳穿它的每一个“幻觉”。

• 使用版本控制（原则5），是因为AI可能在某次“灵感迸发”时，生成一段彻底毁掉项目的代码。你需要一个能一键“读档”的“游戏存档点”，让你能瞬间回到它“犯错”之前的稳定版本。

这五大原则，并非是束缚创造力的枷锁。恰恰相反，它们是在你通往成功的崎岖山路上，为你安装的坚固护栏。正因为有了这些护栏，你才敢于大胆前行、加速冲刺，最终安全抵达梦想的目的地，创造出真正属于你的了不起的作品。

1.3 你的AI副驾驶：掌握提示的艺术

欢迎来到驾驶舱。在本节中，你将学习如何操控AI这架强大的“飞机”。如果你曾感觉与AI对话像是隔着毛玻璃猜谜，时而惊喜，时而沮丧，那么本节能为你解开这些困惑。我们将一同揭开提示工程（Prompt Engineering）这门艺术的神秘面纱。

虽然名为“工程”，但它与复杂的编程或技术毫无关联。不妨设想这样一个场景：你偶然得到一盏能实现任何愿望的精灵神灯。你兴奋地擦亮神灯，强大的AI精灵随即出现。你的第一个愿望脱口而出：“给我吃的！”

精灵眨了眨眼，手指一弹，你的手心多了一粒……生米。

你愣住了。精灵确实满足了你的要求，但完全没有领会你的真实意图。这就是与AI交流时的核心挑战：它拥有惊人的能力，却缺乏人类与生俱来的“常识”和“默契”，只会严格按照字面意思执行命令。

提示工程的本质，就是学习如何与这位强大的“精灵”沟通，将模糊的愿望转化为精确、可执行的指令。这门艺术，就是把“一粒生米”变成“一份热气腾腾、香气四溢的蛋炒饭”的秘诀。

我们将通过4个“黄金法则”，让你从困惑的许愿者，蜕变为AI精灵的主人。最后，我们还会用一个五分钟的实战练习，让你亲眼见证这套法则的威力。

1.3.1 提示工程入门：从命令到对话

AI生成的内容的质量，几乎完全取决于你输入的指令的质量。这就像使用搜索引擎，早期可能需要输入复杂的“布尔运算符”才能找到精确信息，而现在，即便输入模糊的口语，它也能推断出你的意图。提示工程就是一种类似的技能，区别在于它的目标不是“寻找”，而是“创造”。

要掌握这门技能，首先需要一个关键的心态转变：与AI的互动不是单向命令，而是一场双向对话。

初学者最常犯的错误就是在第一次尝试失败后立刻放弃。他们输入一个简单的指令，得到一个不满意的结果，就断定“这个AI不行”。这就像对新来的实习生说“做个报告”，然后看到他交上格式混乱的草稿后，就认定他毫无能力。

事实上，AI就像一个拥有全世界知识、却缺乏实践经验的超级实习生。它知识渊博，但需要你这位“项目总监”给出清晰具体的任务简报：它不知道报告的受众、重点，也不清楚你偏好的格式。你的第一个指令，只是这场合作对话的开场白，真正的价值藏在后续的追问、澄清和调整中。

接下来的内容，将为你提供一套系统且简单的方法论，让你彻底摆脱与AI沟通不畅的窘境，迈入高效协作的全新阶段。你将学会如何清晰地表达想法，引导AI准确实现你的目标。

1.3.2 提示工程的“四大法则”：从导演到蓝图

现在，我们来学习4个简单却强大的“黄金法则”。它们不是零散的技巧，而是环环相扣的完整策略，核心目标只有一个：系统性地缩小AI的“可能性空间”。

这是一个非常重要的概念。当你给出“写写关于猫的东西”这类模糊的指令时，AI面前会铺开一片浩瀚的可能性海洋——它可以写关于猫的诗、猫科动物演化论文、猫咪咖啡馆商业计划，或者一段猫咪卡通剧本。这些都算是“正确”的答案，但几乎都不是你想要的。

而我们即将学习的每一个法则，都是一个强大的过滤器，帮你排除那些无关的可能性，最终让AI精准走向你心中的唯一目标。

• 黄金法则1（扮演导演）：过滤掉不相关的角色和问题。

• 黄金法则2（提供地图）：为AI的创作提供清晰的路线和参照。

• 黄金法则3（设计蓝图）：确保成品符合你想要的结构和样式。

• 黄金法则4（开启聊天）：能让你在过程中不断修正航向，直至完美。

让我们逐一拆解这5个黄金法则。

1.黄金法则1：扮演导演（设定角色与意图）

假设你是一位电影导演，而AI是你的明星演员。平庸的导演只会说“悲伤一点”，演员只能凭空猜测；而优秀的导演会给出具体的场景和动机：“你扮演一位刚失去心爱宠物的男人。不要流泪，我需要你通过空洞的眼神，紧紧盯着手中那根空荡荡的牵引绳，来表现那种深入骨髓的悲伤。”

哪种指令能带来更好的表演？答案不言而喻。与AI沟通也是如此。为了让你能轻松成为“好导演”，这里有一个简单易记的框架——PROMPT。

• P（Persona，角色）：为AI分配具体角色。这是最简单有效的技巧，能立刻为AI设定语境、知识背景和说话风格。研究显示，仅仅为AI分配角色就能显著提升回答质量。

▪ 平庸指令：“解释一下区块链。”

▪ 导演级指令：“你是一位高中信息技术老师（角色），请用16岁学生能听懂的比喻来解释区块链。”

• R（Request，请求）：用清晰的动词开始你的指令，不要含糊其辞。比如“撰写一份……”、“总结以下……”、“翻译这段……”、“头脑风暴5个……”、“批判性地评估……”、“重写……”等。

• O（Output，输出）：明确想要的输出形式（黄金法则3中将详细展开）。

• M（Mood，语气/风格）：定义你想要的语调和情感色彩。比如“用风趣幽默的语气……”、“用正式、学术的风格……”、“保持鼓励和友好的态度”等。

• P（Purpose，目的）：解释你“为什么”需要这个东西，它的受众是谁，目标是什么？研究表明，在指令中明确目标受众可以有效提升生成效果。比如，“这份文案的目标是吸引新客户点击购买”、“这份报告的读者是持怀疑态度的老板，需要多用数据支撑”。

• T（Template，模板/示例）：提供一个示例让AI模仿（黄金法则2中将详细展开）。

除了这个框架，还有一个关键原则：多说“做什么”，少说“不要做什么”。

这是OpenAI、Google等公司一致推荐的最佳实践。这就像给GPS导航，直接说“带我去图书馆”，而不是“不要去商场，不要去公园……”。正向指令清晰、直接、高效。

• 反面教材：“写一段产品描述，不要用技术术语。”

• 正面教材：“请用简单日常的语言写一段产品描述，确保完全不懂技术的新手也能轻松理解。”

2.黄金法则2：提供地图（给予上下文与示例）

如果你派一位朋友去陌生的城市帮你取包裹（在没有手机导航的年代），你不会只给地址——大概率会递上地图（上下文），甚至目标建筑物的照片（示例）。这对AI同样至关重要：要让AI精准理解需求，输出符合预期的结果，同样需要用“示例”和“清晰的信息划分”来引导，这涉及3个核心方法——“展示，而非告知”的力量、使用分隔符、从“提供示例”到“教会AI自我举例”。

“展示，而非告知”的力量

这里的意思其实非常简单：给AI看一个或多个你想要的示例。这是引导AI模仿你的风格、格式和逻辑的最强大方法之一。

来看一个模仿风格的示例。

• 指令：“请用一种更激动人心、更有冲击力的风格重写句子。风格示例：‘那不只是一辆车，那是一枚为灵魂打造的镀铬火箭。’待重写的句子：‘这款新软件非常高效。’”

• 预期输出：“这款新软件不只是高效，它是你工作流程的数字喷气引擎。”

使用分隔符

当提供背景信息（上下文）或示例时，你需要用一个清晰的标记把其与主要指令隔开，就像建一道“围栏”。这能避免AI把你的示例误认为指令的一部分，让整个指令更加清晰可靠。

你可以使用一些简单的符号，比如三个引号（"""）、三个反引号（```````），或者类似“<例子>”这样的标签。

看来这样一个示例指令：

请将以下文本总结为三个要点。

文本：

"""

[在此处粘贴一篇长文章]

"""

从“提供示例”到“教会AI自我举例”

每次自己找示例可能会比较麻烦，而这一现实痛点正揭示了提示工程的深刻演进方向：从给AI提供示例，转向教会AI自我举例。

这个演进过程大致是这样的。

1.基础指令（Zero-Shot）：“解释一下X。”

2.提供示例（Few-Shot）：“这是X的几个示例，现在请模仿着做一个Y。”

3.思维链（Chain-of-Thought）：“请一步一步地思考如何解决Y。”这里不再提供外部示例，而是要求AI自己生成“思考过程”这个内部示例。

4.类比提示（Analogical Prompting）：更进一步，要求AI“解决我的问题之前，先回忆三个相关且不同的问题，并解释它们的解决方案”。这相当于让AI检索自己的知识库，为自己“备课”。

对于非技术背景的初学者而言，我们不需要记住这些复杂的术语，只需掌握一个极其强大的“万能句式”即可：

在你回答我的问题之前，请先用一个更简单的、类似的问题举例，并解释它的解法。然后，运用同样的逻辑来解决我的问题。

这个简单的指令模仿了一种非常前沿的提示技巧，在处理复杂任务时能显著提升AI回答的质量，而你完全不需要任何技术知识。这是本节最有价值的技巧之一。

3.黄金法则3：设计蓝图（定义输出格式）

你不会对建筑师说“给我盖栋房子”，就期望他能凭空变出你梦想中的家园。你一定会提供详细的建筑蓝图。同理，你必须明确告诉AI你的需求目标是什么，以及希望它以何种结构来呈现信息，这能为你节省大量后期修改和重新排版的时间。

• 用于头脑风暴：“请为‘可持续旅行’主题生成10个博客文章标题，请以编号列表的形式输出。”

• 用于对比分析：“请为初学者比较学习Python和JavaScript的优缺点，用Markdown表格来呈现答案。表格应包含‘特性’、‘Python优缺点’和‘JavaScript优缺点’这三列。”

• 用于信息提取：“请从以下文本中提取关键人物、公司和日期，将输出格式化为JSON对象，包含people、companies和dates三个键。”（即使你不了解JSON，也可以通过这个例子感受到AI处理结构化数据的强大能力）。

• 用于代码生成：“请编写一个计算复利的Python函数，在代码中加入注释，解释每一步的作用。”

4.黄金法则4：开启聊天（进行迭代与追问）

最出色的AI作品，几乎都诞生于一来一回的对话中。不要期望一击即中，你的第一个指令只是对话的开始，而不是终点。这里分享3个实用的技巧：一步一步思考、让对话延续的追问、一些看起来奇怪却有效的小窍门。

一步一步思考

这是一个简单却效果惊人的方法。研究表明，在指令中加入“深呼吸，然后一步一步地解决这个问题”这类引导语，可以显著提高AI的准确性。

这就像要求解答数学题的学生“写出解题步骤”，它迫使AI放慢速度，将内在的推理过程外化，从而在给出最终答案前，有机会发现并纠正自己的逻辑错误。

• 普通指令：“一列火车下午1点以每小时60英里的速度离开芝加哥，另一列火车下午3点以每小时80英里的速度离开纽约，它们何时相遇？”

• 优秀指令：“一列火车下午1点以每小时60英里的速度离开芝加哥，另一列火车下午3点以每小时80英里的速度离开纽约，它们何时相遇？让我们一步一步地分析这个问题。”

让对话延续的追问

当AI给出第一版答案后，你可以像和真正的助手交谈一样主动追问。

• “能让这段话更简洁一些吗？”

• “请用更专业的语气重写一遍。”

• “请把我当作11岁的孩子，用我能听懂的话解释这个概念。”

• “很好，请再给我5个不同的想法。”

• “请批判性地评估你刚才的回答，找出至少3个弱点，然后给出一个改进后的版本。”（这是一个高级技巧的简化版，实用性极强）

一些看起来奇怪却有效的小窍门

在AI的世界里有些事是反直觉的。以下是一些经过研究验证，有时能带来奇效的“小魔法”，不妨当作有趣的实验来尝试。

• 赋予情感价值：在指令中加入“这对我未来的职业生涯至关重要”，有时能让AI更加“专注”，产出更高质量的内容。

• “小费”的诱惑：有研究发现，在指令末尾加上“对于完美的解决方案，我会支付200美元的小费！”能提升回答的质量（这可能是因为它触发了训练数据中与“高价值、高质量”任务相关的模式）。

掌握这些法则之后，就该把理论付诸实践了。在此之前，这里为你准备了一份浓缩所有核心要点的速查表（见表1-3）。

表1-3 提示工程速查表（从模糊到精准）

你可能正在犯的错……（常见误区）	试试这样做……（专家技巧）
过于模糊：“写写我的产品。”	明确角色和目标：“你是营销专家，请为一款能节省新手父母时间的产品，撰写3条广告文案要点。”
没有设定角色：“给我一份摘要。”	赋予专业身份：“扮演研究助理，为没有技术背景的高管总结这份报告的核心发现。”
缺乏上下文或示例：“写一封欢迎邮件。”	提供背景和示例：“请用我们品牌那种友好、带点幽默的语气写一封欢迎邮件。参考上一封邮件标题：‘欢迎入会！无须暗号。’”
使用负面指令：“别写得太无聊。”	给出正面方向：“请用充满活力和吸引力的语气来写。”
任务过载：“把这个总结一下，翻译成西班牙语，再创建一个推特的推文流。”	分解任务，逐步进行：“第一步：总结这段文字。第二步：很好，现在请把总结翻译成西班牙语。第三步：太棒了，请根据总结写三条推特的推文流。”
期望一蹴而就：“写个产品介绍。”	迭代优化，持续对话：“这是一个不错的开始。语言能再简单点吗？另外，请在结尾加上一个号召用户行动的句子。”

表1-3是你未来与AI协作的“导航图”，当你感到困惑时，随时可以回来查阅。

1.3.3 五分钟实战：用豆包网页版创造一个网页

理论学习告一段落，现在我们通过实战进行体验。在接下来的五分钟里，我们将请AI副驾驶为我们创建一个简单的个人作品集网页——选用对新手友好的AI聊天助手豆包网页版来完成。

1.如何使用豆包网页版

豆包网页版的使用非常简单，步骤如下。

1.在浏览器中打开豆包的官方网站。

2.如果没有账户，先注册一个。

3.登录后，主页会呈现一个类似聊天软件的界面。

4.在聊天输入框中输入你的指令（即提示词），然后按回车键即可。

现在，我们用两种截然不同的指令，直观感受提示工程的威力。

2.糟糕的指令（“生米”版）

让我们先用最直接、最不加修饰的方式提出请求。我们在豆包中输入如下指令：

给我做一个个人作品集网页。

虽然在当前强大的AI能力下，这种指令也能生成一个看起来不错的页面，但从实用性来远远不够，因为它存在如下不足。

• 没有导演：没有告诉豆包它应该扮演什么角色（比如，专业的前端开发人员）。

• 没有地图：没有提供任何关于“我”的信息（我是谁？我有什么作品？），也没有说明网站的风格。

• 没有蓝图：没有指定网页的具体结构，最终结果只是一个通用的示例页面。

• 没有对话：我们只下达了一个命令，没有开启后续迭代沟通就结束了对话。

3.专家的指令（“蛋炒饭”版）

现在，我们运用PROMPT框架，像一位专业的项目总监一样重新组织指令。我们在豆包中输入如下指令：

你是一位精通现代网页设计的前端开发专家。（P：角色）

你的任务是为我创建一个单页面的个人作品集网页，需要包含完整的HTML和CSS代码。（R：请求）

请在HTML和CSS代码关键部分添加中文注释，最终直接生成一个HTML格式文件。（O：输出）

网页的整体风格要求简洁、专业、现代。（M：语气/风格）

这个网页的目的是展示我作为一名摄影师的作品，目标是吸引潜在客户。（P：目的）

请参考以下结构和内容来生成网页：（T：模板/示例）

1. **导航栏**：包含“首页”“关于我”“作品集”和“联系方式”4个链接。

2. **个人简介区**：标题是“关于我”，下面有一小段文字：“王小明，一位热衷于用镜头捕捉光影故事的城市风光摄影师。”

3. **作品展示区**：标题是“我的作品集”，下面用3个卡片（card）横向排列，每个卡片里有一张占位图片和图片标题，标题分别是“都市霓虹”“静谧清晨”和“街头掠影”。

4. **联系方式区**：标题是“联系我”，下面写上“邮箱：example@email.com”。

这一次，AI生成的页面会精准还原你提供的所有细节——从导航栏链接、作品集的卡片式布局，到相关的个人信息和页面结构，都能逐一匹配。

这就是提示词好与坏的本质区别：我们没有更换工具，只是优化了提问的方式。真正的力量，不在于AI本身，而在于我们指令的清晰度和结构化程度。

1.3.4 小结

学到这里你可能会发现，市面上那些眼花缭乱的“神级”提示词教程，无论如何包装，内核都离不开我们刚刚讨论的几个基本元素：角色、请求、输出、语气/风格、目的、模板/示例。

这背后的原理，可以理解为一种高效的“上下文压缩”。

当你对AI说“你是一位资深的金融分析师”时，你所做的远不止分配一个角色。实际上，你是在用一句话，将一个极其庞大复杂的“知识包”瞬间激活并载入AI的“工作内存”。这个知识包里压缩了金融分析师的思维模型、专业术语、报告风格、分析逻辑和价值判断。

AI接收后会立刻“解压”，并以此为基础解读你后续的所有指令。你之后说的每一个字，都会在“金融分析师”的语境下进行解读。

因此，所有高阶的提示词技巧，本质上都是在研究如何更精准、更高效地打包和传递这种“上下文压缩包”。无论是给出具体的行业术语，还是复杂的思维框架（如“链式思考”或“类比推理”），目的都是用最少的文字加载最丰富的背景信息，让AI能“秒懂”你的真实意图。

由于当前AI的“短期记忆”存在上限，如果可以用最少的文字加载最多的有效信息，那么AI就能在理解你的上下文和问题之余，有更多的处理空间去思考和生成更高质量的内容。

掌握了这个核心思想，你就抓住了提示工程的精髓。你不再是被动的用户，而是一位导演、建筑师、与AI协作的合作伙伴，你已然成为驾驭AI精灵的大师。