论文写作AI破局:五源模型高效写作法

978-7-115-68370-0
作者: 郭泽德,李极,宋义平
译者:
编辑: 牟桂玲

图书目录:

详情

本书针对AI时代学术写作面临的机遇与挑战,创新性地提出了“五源模型”高效写作方法论。该模型突破了单纯依赖提示词的局限,构建了以提示词、结构输出、投喂材料、模板定制、人工校准为核心的五大要素体系 ,旨在帮助研究者掌握底层逻辑,实现从“人投喂AI”到“人机深度协同”的范式跃迁 。 全书紧扣学术论文写作全流程,系统拆解了前言、文献综述、理论框架、研究方法、分析论证与结语六大关键模块。针对每个模块,书中不仅剖析了其写作机理,还提供了从结构拆解、文献检索到AI生成、人工校验的可复制解决方案,并配以大量真实案例和结构化提示词模板 。 本书特别强调人的主体性,提出AI生成的初稿应被定义为具备原创性参考价值的“超级参考文献” ,必须经过严格的人工校准与去机器化处理 。本书兼具理论深度与实操性,是高校师生及科研工作者驾驭AI工具、提升学术生产力的实用指南 。

图书摘要

版权信息

书名:论文写作AI破局 五源模型高效写作法

ISBN:978-7-115-68370-0

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

版  权

著    郭泽德 李 极 宋义平

责任编辑 牟桂玲

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315

内容提要

本书针对AI时代学术写作面临的机遇与挑战,创新性地提出了五源模型高效写作方法。该模型突破了单纯依赖提示词的局限,构建了以提示词、结构输出、投喂材料、模板定制、人工校准为核心的五大要素体系 ,旨在帮助研究者掌握底层逻辑,实现从“人投喂AI”到“人机深度协同”的学术写作范式跃迁。

全书紧扣学术论文写作全流程,系统拆解了前言、文献综述、理论框架、研究方法、分析论证与结语六大关键模块。针对每个模块,本书不仅剖析了其写作机理,还提供了从结构拆解、文献检索到AI生成、人工校准的可复制解决方案,并配以大量真实案例和结构化提示词模板。

本书特别强调人的主体性,提出AI生成的初稿应被定义为具备原创性参考价值的“超级参考文献” ,必须经过严格的人工校准与“去机器化”处理 。本书兼具理论深度与实操性,是高校师生及科研工作者驾驭AI工具、提升学术生产力的实用指南。

序  言

大家好,我是大家的老朋友——学君。

你手中这本书,源自我2022年下半年开始接触AI(Artificial Intelligence,人工智能)、2023年开始系统讲授“AI辅助学术写作”课程之后,对30多次授课内容的整理与精练。

我相信,这本书一定会为你了解AI辅助学术论文写作提供非常大的帮助。

在正式开始学习之前,我想先和你分享几条“学习提示”,以帮助你更好地把握本书的节奏与重点。

一、从工具到本质:我的AI辅助学术写作进化之路

AI 对我们来说是新事物,我对它的理解与掌握经历了一个循序渐进的过程。自开始授课以来,这一过程大致可分为4个阶段。

第一阶段:工具驱动

AI刚出现时,最容易上手的就是各种 AI 工具,既易学又易掌握。在这一阶段,课堂内容以工具为核心,现场效果非常好,经常引来学员的惊叹声。

第二阶段:提示词驱动

随着AI技术的发展和我对AI理解的深入,仅靠工具已无法解决更多复杂问题,于是我将研究重点转向提示词,提出了原创的提示词框架和撰写方法,并率先将“结构化提示词”引入学术领域。这一时期,我形成了理解和掌握AI的“提示词 + 工具”双驱动模式。

第三阶段:方法论驱动

在实践双驱动模式一段时间后,我发现,如果始终把解决问题的重点放在提示词上,随着问题愈加复杂,提示词会变得又长又烦琐,这和与 AI 交互的基本原则背道而驰。那么,如何基于 AI 更深入且系统地解决问题?除了提示词和工具,还有哪些关键要素?

围绕这些问题,我经过长期的思考与实践,提出了用 AI 辅助解决问题的五源模型方法论,也就是本书的核心内容。它并非针对某一具体问题,也不是单一要素的应用,而是一套综合运用结构、材料、模板、提示词、人工校准五大核心要素,借助AI系统解决内容生成问题的方法论。

第四阶段:问题本质驱动

我在授课时始终提醒学员:学习五源模型的最高境界,是将它内化为一种解决问题的思维框架——不拘泥于流程与细节,而直达问题的本质。在近期的课程中,我已逐渐从对五源模型操作方法的讲解,转向对问题本质的深入探讨。除了AI辅助学术写作课程,我还设计了专门讲授“论文本质”的课程。参加此课程的前提是学员已学过 AI 辅助学术写作的相关内容。在此基础上,课程将引导学员将工具、方法论与本质思考有机融合,以便更好地解决深层次的问题。目前,我仍在这个阶段持续探索。未来,我或许会写一本“论文的本质”,作为本书理念的深化与延伸。

二、大模型的选择与使用策略

在本书中,我们演示案例时主要采用的大模型是豆包。为什么要选择豆包呢?主要基于以下3方面考虑。

1. 产品与技术优势

豆包在中文语义理解、长文本逻辑推理及内容生成方面表现卓越。基于底层算法的深度优化与千亿级参数的支撑,它能够精准捕捉复杂的学术写作指令,生成结构严谨、表达流畅的高质量文本。同时,通过在推理延迟与并发处理方面的专项技术调优,豆包实现了快速响应与高稳定性,能为用户提供流畅的人机交互体验,其综合性能处于国内大模型领先水平。

2. 用户基础与生态优势

在DeepSeek出现之前,豆包的用户量在国内大模型中位居前列。尽管 DeepSeek 后来居上,豆包依然拥有庞大的用户群体。海量的用户数据不仅推动了豆包的持续迭代和性能优化,还助力豆包构建了独特的生态优势,从而更好地满足用户的多元化需求。

3. 使用便捷性

相较于许多需要特殊条件才能使用的国外大模型,豆包支持直接在线访问或下载客户端,操作便捷,使用门槛低。

当然,豆包并非完美。例如,在理解复杂指令或处理特殊内容时,它偶尔会出现差错。因此,尽管本书主要以豆包进行案例演示,但在实际授课中,我们会同时使用多个大模型。由于不同大模型在各类任务中各有所长,通过利用多个大模型进行交叉验证,我们能有效规避单一模型的盲区,提升内容的准确性与可靠性。

目前市面上的大模型产品非常多,从来源和背景来看,可大致分为3类。

第一类是国外的大模型产品,如 ChatGPT、Claude、Gemini、Grok 等。这类大模型理解与处理问题能力较强,但多数需要付费,并需要特定的使用环境。

第二类是“大厂”的大模型产品,如豆包、通义、元宝、文心一言、讯飞星火等。这类大模型的优势是功能丰富、生态体系完善,劣势是创新不足,部分产品功能繁杂。

第三类是创业公司的大模型产品,如DeepSeek、Kimi、智谱AI、阶跃AI、MiniMax 等。这类大模型的特点是创新性强,在细分领域有优势,但面临较大的生存压力,生态体系不完善。

综合看来,我们可以选择的大模型还是比较多的。在具体运用五源模型时,可以基于相同的方法论、流程和材料,从每种类型中选择1~3个大模型,让它们各生成一个版本或多次生成,最后进行对比分析,择优使用。

除大模型外,还有基于大模型构建的智能体。智能体分为工作流型智能体(如扣子等)和超级智能体(如扣子空间等)。本书对智能体的内容涉及得并不多,但在实际应用中,可以灵活使用智能体。例如,将常用的提示词封装成工作流型智能体,用于提炼结构化提示词、模板提示词等。本书最后一章“五源模型的创新应用”中就介绍了智能体的具体应用。

三、影响五源模型执行效果的关键因素

五源模型是一套系统解决问题的方法论,但在落地到具体情境时,仍有若干因素会直接影响执行效果与效率。在学术写作场景中,影响五源模型表现的关键因素如下。

1.人和AI的关系

在五源模型体系中,AI不再是冰冷的工具,而是与人并列的内容合作者,两者只是分工不同。人负责选题制定、流程设计、素材准备及结果校验;AI 则侧重于执行指令、提炼结构、处理材料与生成内容。最终成果是人与AI共创的产物。在合作过程中,忽视 AI 的主体性、完全凌驾于它之上,或忽视人的主体性、一味屈从于 AI,都是不可取的。

2.选题与材料

五源模型主要适用于内容生成场景,而选题与材料是决定内容生成质量的核心要素。在本书中,我们没有就选题展开讨论。在实际授课中,我们会针对选题提供完整的思路与方案。选题是内容的原点,必须高度重视。

另外,材料的质量也至关重要。正如《舌尖上的中国》中的美食理念:上等的食材只需简单烹饪。有了好材料才会有好内容,所以我们在五源模型实操时倡导的一个基本原则就是宁缺毋滥,材料的质量比数量更重要。这样才能真正保证结果的质量。

3.流程性与灵活性

五源模型为用户提供了结构化思维与流程化操作的完整框架。初学者可严格依照流程练习,以便将思维模式内化。熟练掌握后,则应逐步引入灵活性。例如,根据自己的需求和AI输出的内容,灵活修改甚至创造性地设计提示词;根据自己论文的架构,灵活增加或删减某些既有环节;根据不同工具的特点,选择更合适的工具,如能够支持知识库的ima等。

4.校准与审查

因为选题、材料及大模型等要素各不相同,生成的内容会出现各种各样的问题,这时候就需要人的介入。例如,发送提示词后,AI的回复未达到预期目标,就可以进行追问式提问;又如,审查参考文献的真实性,避免大模型幻觉等。校准与审查的对象不仅仅是内容,还有整个执行流程,因为执行中任何微小的偏差都有可能造成结果的巨大差异。初学者一定要严格遵守流程,熟悉后再根据自己的情况调整。

四、作为“超级参考文献”的初稿

我在线下授课时,不少学员会提出一个疑问:基于五源模型生成的初稿,是否可以直接用来投稿?

对此,我的回答十分明确:不能!

首先,不少期刊已经在投稿环节引入了AI检测机制,人和AI共创的初稿是过不了AI检测的。其次,更核心的原因是,学术论文的真正价值在于原创性与学术深度,而这是现阶段的AI无法实现的。因此,我们将人机协作生成的初稿,定义为“超级参考文献”,要经过深度处理后才能投稿。

所谓“超级参考文献”,一方面与我们在中国知网等数据库下载的论文相似,可以为我们提供观点、素材与论证的灵感;另一方面,又具有不同于已发表文献的独特性——其中有大量内容是由研究者与 AI 共同建构、具备一定原创性的,这种属性是传统文献所不具备的。正因为如此,我们将初稿定义为“超级参考文献”。

在基于五源模型生成内容的过程中,建议使用不同的大模型工具,并尝试投喂多样化的材料,这样就会获得多份“超级参考文献”。对于每一份“超级参考文献”,都要细读并进行辩证分析,从而深化对选题的理解,完善论文架构,并吸收其中的有效观点与论证资源。

最终,论文作者必须基于自身的研究初心,在阅读普通文献与“超级参考文献”的基础上,独立且创新性地从头撰写全文,并在多轮修改与迭代后,才能投稿。

五、如何学习五源模型

系统学习五源模型,可以分为4个阶段:复制、模仿、独立、创新。

阶段一:复制

根据自己的选题,严格按照书中提供的流程,将选题相关材料代入流程模板,完整地走一遍整个过程,不擅自更改步骤。这一阶段的目标是熟悉流程,建立操作感。

阶段二:模仿

完成复制阶段的学习后,你应该已经对五源模型有了初步理解。这时可以对执行流程进行适度调整,例如针对某个环节或某些提示词进行优化和替换,通过这种练习进一步加深对五源模型方法论的理解。

阶段三:独立

经过复制和模仿阶段的学习,你应该已对五源模型的要素和原理非常熟悉了,这时可尝试脱离案例参照,独立完成任务。进入这个阶段,才算真正掌握了五源模型的要领。你会发现它不仅适用于学术论文写作,还可以迁移到公文、新闻稿等多种文本生成领域,展现出广泛的应用价值。

阶段四:创新

进入这一阶段,你将不再受五源模型的束缚,会更深入到问题的原理层面,拆解问题的核心要素,然后再结合AI的特性,深度且高效地解决问题。这时,五源模型其实已成为你的底层思维,能为你持续解决新问题提供方法论支撑。

好了,五源模型的“学习提示”暂告一段落,接下来,我们将正式步入该模型的深度学习之旅。

尽管本书的核心内容我已讲授过数十遍,但从整理到成书仍花费了半年多时间,其间内容经历了数轮打磨和优化。所以,书里的内容比授课内容更系统、更细致。当然,AI发展日新月异,迭代速度非常快,我对五源模型的研究也是与时俱进的,会不断吸收新思想、新工具,使之保持前沿性和活力。如果有条件,欢迎你报名参与线下课程,这种“现场听课+书本学习”的模式,既能保证学习内容的系统性,也能保证学习内容的前沿性。

最后,衷心感谢出版社的编辑老师,感谢学术志团队、“AI富缘俱乐部”团队、所有学员,以及我的家人!

在AI时代,让我们共同进化!

学君

第1章 什么是五源模型

在人工智能(Artificial Intelligence,AI)辅助内容创作日益普及的当下,人脑和AI协作如何高效、精准地完成内容输出,成为亟待破解的关键问题。传统提示词虽然重要,但其效果常受限于提示质量、信息背景和结构表达等多种因素。为更系统地理解并优化AI生成内容的机制,我们提出“五源模型”方法论。该模型从提示词、结构输出、投喂材料、模板定制与人工校准5个关键维度切入,系统梳理影响大语言模型(Large Language Model, LLM,简称“大模型”)输出质量的核心要素,帮助用户更好地驾驭AI,实现高效协同创作。

1.1 人脑和AI协作的黑箱:1000字提示词才能输出好内容吗

大模型推动内容生产模式迈入AIGC时代。AIGC,即人工智能生成内容(Artificial Intelligence Generated Content),是指利用AI技术生成的各类内容,包括文本、图像、音频、视频等。它代表了内容生产方式的一种范式性变革。

在AIGC出现之前,内容生产模式经历了从PGC(Professionally Generated Content,专业生产内容)到UGC(User Generated Content,用户生产内容)的转变。这一过程涉及内容生产理念、技术和平台等多方面的变迁,但始终未变的是,人一直是内容生产的主体。

AIGC的出现将内容生产的主体从人扩展到AI,推动内容生产从以人脑主导思考的时代,迈入人脑与AI协作的全新时代,如图1-1所示。

图1-1 AIGC的出现将内容生产的主体从人扩展到AI

人脑和AI协作的新模式,为内容生产带来了无限的想象空间。以前耗尽脑汁,借助复杂操作才能完成的文本、图像、音视频等多种形式的内容,如今经过AI生成与处理,如魔法般瞬间即可实现。

但是,人脑和AI如何协作?除了显而易见的提示词,还有哪些要素起到关键作用?

这些未知要素就成为人脑和AI协作中的“黑箱”。

要实现人脑和AI协作的最优效果,我们需要更深入地理解这个互动过程中的各个关键环节,并探索突破提示词局限的新思路,从而充分释放AI的潜力。

经过长期的思考与实践,我们发现,目前阶段AI驱动内容生产,尤其是在文字内容生产情境中,至少还受到具体材料、内部结构、外部风格、人工把关这几个要素的显著影响,如图1-2所示。

图1-2  AI驱动内容生产过程中的影响要素

在实际应用中,很多人并没有清晰意识到具体材料、内部结构、外部风格、人工把关这4个要素对输出内容的显著影响,只关注了提示词这一单一要素。

然而,面对复杂的问题,只在提示词上下功夫,解决问题必然会力不从心。一个明显的现象是提示词不得不变得越来越长、越来越复杂。这不仅增加了编写提示词的难度,也降低了解决问题的效率。这与人们对大模型高效解决问题的期待形成了明显的反差。

思考题

除了上文提到的5个要素,人脑与AI协作的“黑箱”里还有可能存在哪些影响要素?

1.2 五源模型的核心要素

我们提炼出人脑和AI协作中起到显著作用的5个要素,并明确了每个要素的独特意义和作用,在此基础上,构建了一个完整的思维模型,即本书重点介绍的五源模型,如图1-3所示。接下来,我们将对五源模型中的5个核心要素进行深入拆解,帮助读者更清晰地理解其内在逻辑和应用价值。

图1-3 五源模型

1.2.1 要素1:提示词

大模型人工智能与传统人工智能(依赖特定接口和固定规则的人工智能系统)之间的关键区别,就在于前者能够通过自然语言与人类进行交互,而后者不能。

自然语言是指人类日常交流中使用的语言。它具有多样性、灵活性和情境性等特点。有效处理自然语言一直是人工智能发展中的一大挑战。

传统人工智能通常依赖特定的接口或限定的输入形式(如指令、按钮或菜单等)来完成与用户的交互,操作方式相对固定且受限。

与传统人工智能相比,大模型人工智能的突出优势在于,它能够以自然语言为媒介,实现与用户更为直观和灵活的交流。这种能力标志着人工智能发展的转折性突破。

大模型人工智能与传统人工智能的区别如表1-1所示。

表1-1 大模型人工智能与传统人工智能的区别

分类

大模型人工智能

传统人工智能

交互方式

通过自然语言与人类进行交互

依赖特定接口和固定规则,如指令、按钮或菜单,无法灵活处理自然语言

交互特征

直观、灵活

固定、受限

技术意义

标志人工智能发展的转折性突破

功能相对单一

核心优势

以自然语言为媒介,实现更自然的交流

专注于特定任务的精确执行

在大模型的交互模式下,提示词作为人类与大模型之间的桥梁,将人类意图转化为系统响应,实现用户需求的有效传递。

提示词是用户为大模型提供的任务指令,用于引导其生成特定类型的内容。为了使模型输出高质量、准确且具有针对性的回应,研究者和用户总结出了一些规律,并基于这些规律制定了一系列优化策略。例如,通过明确问题、精心选择关键词、设置上下文及添加限制条件等,可以显著提高生成内容的质量和实用性。这种对提示词进行设计和优化的过程被形象地称为提示工程(Prompt Engineering)。从事提示词撰写和优化工作的人则被称为提示工程师(Prompt Engineer),提示工程师正逐渐发展为一个独立的职业。

提示词的迭代至少经历了自然语言提示词、框架式提示词、结构化提示词3个阶段。

1. 自然语言提示词

用自然语言与大模型互动,最简单的模式是I/O(Input/Output,输入输出)模式。我们将采用这种模式的提示词称为自然语言提示词。用户用自然语言提示词与大模型互动,大模型直接生成输出内容,没有任何中间步骤。

举个例子。

提问:“今天是星期几?”

结果:“今天是星期一。”

用户就像在和另外一个人说话。

自然语言提示词的优势在于其简单直观,用户只需会说话即可完成互动。不足之处在于大模型对自然语言的识别能力有限,因此模型难以应对复杂问题。

实际上,我们与大模型的互动大多集中在日常生活和工作中的简单问题场景,而这些问题的提示词往往非常简单,只需用日常语言表达即可。特别是随着支持语音互动的大模型的普及,口语化提示词的使用场景越来越广泛,进一步降低了大模型的使用门槛。

2. 框架式提示词

框架式提示词通过预定义的框架结构来组织提示词内容,以便更清晰地向大模型传达任务要求,从而提升模型生成结果的准确性和一致性。

框架式提示词通常包含角色、任务、上下文、输出要求等要素,帮助用户更高效地引导模型完成特定任务。要素的数量和组合方式不同,会形成不同的提示词框架。

在框架式提示词应用中,有多种具体方法可供选择。不管采用哪种方法,实操流程均可分为三步,如图1-4所示。

图1-4 框架式提示词实操流程

第一步:让大模型按照特定的提示词框架生成带有结构词的提示词

第二步:引导大模型去掉结构词,形成一条完整的、基于该框架的提示词

第三步:将完整的提示词输入大模型,让大模型执行相关任务

目前,市面上适合论文写作的提示词框架不下几十种,这里我们列举3种,做简要应用分析。

(1)CRISPE 框架

CRISPE 框架由5个要素构成,各要素描述如表1-2所示。

表1-2 CRISPE 框架的要素及描述

要素

描述

能力和角色(Capacity and Role)

定义大模型应扮演的角色和应具备的能力

见解(Insight)

提供任务要求背后的见解、背景和上下文

声明(Statement)

明确要求大模型执行的任务

个性(Personality)

设定大模型回应时的风格、个性或方式

实验(Experiment)

请求大模型提供多个示例作为回应

下面依据框架式提示词实操流程,以使用大模型辅助规划北京三日游的行程为例,基于CRISPE 框架撰写提示词。

第一步:按照CRISPE 框架生成带有结构词的提示词。

示例提示词

请基于CRISPE 框架,以“北京三日游”为主题撰写提示词。CRISPE 框架的要素及描述如下:能力和角色,定义大模型应扮演的角色和应具备的能力;见解,提供任务要求背后的见解、背景和上下文;声明,明确要求大模型执行的任务;个性,设定大模型回应时的风格、个性或方式;实验,请求大模型提供多个示例作为回应。

输出结果

能力和角色:

你是一位熟悉北京的智能旅行助手,擅长规划行程,并且能够结合用户兴趣和实际需求设计详细的旅行计划。

见解:

我计划去北京玩三天,这是我第一次去北京,希望体验主要的文化历史景点,同时也能感受现代城市的生活。预算中等。希望行程适度紧凑,但不要太累。喜欢美食,但不需要特别奢华。

声明:

请基于我的需求,为我设计一个详细的北京三日游计划,包括每天的行程安排、推荐景点、交通方式和用餐建议。如果可以,请提供多种选择供参考。

个性:

以友好、专业和贴心的方式回应,突出你对北京的深刻了解,同时保持清晰、简洁和条理性。

实验:

为我提供两到三个行程方案,其中一个可以稍微聚焦于历史文化,另一个注重现代感,最后一个可以结合轻松休闲的元素。

以上结果是严格按照CRISPE 框架输出的,其中能力和角色、见解、声明、个性、实验表示CRISPE 框架的要素,在这里充当提示词的结构词。这些结构词能够帮助我们更清晰、更直观地理解输出内容的结构和逻辑。但是这些结构词在具体使用提示词时不起作用,确定输出提示词的质量后,可以在大模型辅助下去掉结构词。

第二步:引导大模型去掉结构词。

引导大模型帮助去掉结构词,形成一条完整的、基于CRISPE框架的提示词。

示例提示词

保持上文内容,仅去掉文中结构词,形成一条完整的、基于CRISPE框架的提示词。

输出结果

你是一位熟悉北京的智能旅行助手,擅长规划行程,并能根据用户兴趣和需求设计旅行计划。我计划去北京玩三天,这是我第一次去北京,希望体验主要的文化历史景点,同时感受现代城市生活。预算中等。希望行程紧凑但不累,喜欢美食,但不需要太奢华。请为我设计一个详细的北京三日游计划,包括每天行程、推荐景点、交通方式和用餐建议,最好提供多种选择供参考。以友好、专业和贴心的方式回应,突出你对北京的深刻了解,同时保持清晰、简洁和条理性。为我提供两到三个行程方案,其中一个聚焦历史文化,另一个注重现代感,最后一个结合轻松休闲的元素。

去掉结构词之后,就得到了一条完整的提示词。再次确定内容质量后,就可以用提示词执行任务。

第三步:将完整的提示词输入大模型,让大模型执行任务。

完成第二步后,在大模型中新建一个对话框,然后将第二步中生成的提示词输入新对话框中,让大模型来执行相关任务。大家可以自行尝试。

(2)RISE框架

RISE 框架由4个要素构成,各要素描述如表1-3所示。

表1-3 RISE框架的要素及描述

要素

描述

角色(Role)

希望大模型扮演的身份或角色

输入(Input)

用户提供给大模型的信息、背景或问题描述

步骤(Steps)

用户希望大模型采取的具体行动或操作步骤

期望(Expectation)

用户对最终结果的具体要求或目标

同样,我们基于RISE框架,在大模型的辅助下,以“北京三日游”为主题,按照上文介绍的3个步骤生成提示词。

第一步:按照RISE 框架生成带有结构词的提示词。

示例提示词

请基于RISE框架,以“北京三日游”为主题撰写提示词。RISE框架要素及描述如下:角色,希望大模型扮演的身份或角色;输入,用户提供给大模型的信息、背景或问题描述;步骤,用户希望大模型采取的具体行动或操作步骤;期望,用户对最终结果的具体要求或目标。

输出结果

角色:

旅游顾问或导游,负责为游客提供详细的旅行计划和建议。

输入:

用户希望制订一份北京三日游计划,包括主要景点、交通方式、饮食推荐和住宿建议。用户可能对历史文化、购物、美食等方面有特别的兴趣。

步骤:

提供一份详细的三日行程安排,包括每天的主要活动。

列出每个景点的开放时间、门票信息和交通方式。

推荐当地特色美食和餐厅,以及适合游客住宿的区域。

提供一些实用的旅游小贴士,如最佳游玩时间、注意事项等。

期望:

用户希望获得一份全面、实用且易于执行的三日游计划,希望这份计划能够帮助他们充分体验北京的文化和魅力,同时确保旅行的顺利进行。

第二步:引导大模型去掉结构词。

示例提示词

保持上文内容,仅去掉文中结构词,形成一条完整的、基于RISE框架的提示词。

输出结果

请扮演旅游顾问或导游,负责为游客提供详细的旅行计划和建议。用户希望制订一份北京三日游计划(包括主要景点、交通方式、饮食推荐和住宿建议),可能对历史文化、购物、美食等方面有特别的兴趣。提供一份详细的行程安排,包括每天的主要活动;列出每个景点的开放时间、门票信息和交通方式;推荐当地特色美食和餐厅,以及适合游客住宿的区域;提供一些实用的旅游小贴士,如最佳游玩时间、注意事项等。用户希望获得一份全面、实用且易于执行的三日游计划,希望这份计划能够帮助他们充分体验北京的文化和魅力,同时确保旅行的顺利进行。

第三步:将完整的提示词输入大模型,让大模型执行任务。

(略。)

从以上案例可以看出,基于CRISPE框架和RISE框架撰写的提示词在结构和设计上存在显著差异,输入大模型后,生成的结果也表现出很大的差别。这两个案例非常直观地体现了不同提示词框架对输出内容的直接影响。

练习题

请在大模型辅助下,以“时间管理”为主题,分别基于CRISPE框架和RISE框架撰写两条提示词,并对比两条提示词的差异。

(3)5W框架

如上所述,CRISPE 框架和RISE框架较为精准地控制了输出结果,但是也存在一个明显缺点:框架名称由一系列英文单词的首字母组成,既难以记忆,也不便于理解。

针对这一问题,我们结合个人经验和理解,拟定了一个5W框架,其要素较为直观,也易于记忆。5W框架的要素和相应描述如表1-4所示。

表1-4 5W框架的要素和相应描述

要素

描述

谁?(Who?)

明确大模型在特定情境中的身份或角色(如顾问、教师、开发者等),设定任务的责任框架

基于什么需求?

(Based on what needs?)

识别并描述问题或需求,阐明采取行动的原因和动机

要完成什么目标?

(What is the goal to be achieved?)

设定具体目标,说明任务的最终目的

采用什么方法?

(Using what method?)

阐明实现目标的策略、步骤或手段,明确任务路径

取得什么效果?

(What results will be achieved?)

描述预期效果、限制条件及任务成功的标准

这次,我们基于5W框架,在大模型的辅助下,仍以“北京三日游”为主题,按照上文介绍的3个步骤生成提示词。

第一步:按照5W框架生成带有结构词的提示词。

示例提示词

请基于5W框架,以“北京三日游”为主题撰写提示词。5W框架要素及描述如下:“谁?”明确大模型在特定情境中的身份或角色(如顾问、教师、开发者等),设定任务的责任框架;“基于什么需求?”识别并描述问题或需求,阐明采取行动的原因和动机;“要完成什么目标?”设定具体目标,说明任务的最终目的;“采用什么方法?”阐明实现目标的策略、步骤或手段,明确任务路径;“取得什么效果?”描述预期效果、限制条件及任务成功的标准。

输出结果

谁?

专业旅游顾问。

基于什么需求?

用户渴望在有限的三天时间内深度体验北京丰富的历史文化、著名景点及特色美食,因此希望获得一些高效游玩的实用建议,以充分利用时间,避免盲目规划和资源浪费。

要完成什么目标?

制订一份详细的北京三日游行程计划,涵盖知名景点、特色美食、住宿推荐及交通指南,确保用户能全面感受北京的魅力,留下深刻而美好的旅行记忆。

采用什么方法?

首先对北京的著名景点进行分类筛选,根据景点的分布、开放时间及用户的体力和兴趣偏好进行合理组合,安排每日行程;深入调研北京特色美食街区和代表性餐厅,将美食体验融入行程之中;查询并对比不同区域的酒店,结合交通便利性和周边环境确定合适的住宿地点;整合各类交通信息,如地铁线路、公交站点、打车软件使用技巧等,为用户提供清晰的出行指引。

取得什么效果?

用户能够依据此行程计划轻松愉快地完成北京三日游,深入了解各景点的历史文化内涵,品尝地道的北京美食,入住舒适便捷的酒店,且在交通出行上不会遇到困扰。任务成功的标准为用户按行程计划顺利完成旅行,且对行程安排的整体满意度达到80%以上,能够在社交媒体上积极分享旅行经历和正面评价。

第二步:引导大模型去掉结构词。

示例提示词

保持上文内容,仅去掉文中结构词,形成一条完整的、基于5W框架的提示词。

输出结果

请扮演专业旅游顾问。用户渴望在有限的三天时间内深度体验北京的历史文化、著名景点及特色美食,获得一些高效游玩的实用建议,避免盲目规划与资源浪费。制订详细的北京三日游行程计划,涵盖知名景点、特色美食、住宿推荐及交通指南,让用户全面感受北京的魅力并留下美好的旅行记忆。先对北京著名景点进行分类筛选,依景点分布、开放时间、用户体力与兴趣偏好合理组合,安排每日行程;深入调研特色美食街区和代表性餐厅,将美食体验融入行程之中;查询对比不同区域的酒店,结合交通便利性与周边环境确定合适的住宿地点;整合各类交通信息,如地铁线路、公交站点、打车软件使用技巧,提供清晰出行指引。用户需能依行程轻松完成北京三日游,深入了解景点历史文化内涵,品尝地道美食,入住舒适便捷的酒店,交通无困扰。任务成功的标准为用户顺利按行程计划旅行且满意度达80%以上,能在社交媒体积极分享旅行经历与正面评价。

第三步:将完整的提示词输入大模型,让大模型执行任务。

(略。)

练习题

请在大模型辅助下,基于5W框架,以“时间管理”为主题撰写提示词,并测试提示词,发现提示词中可能存在的问题,优化迭代出一条满足预期的提示词。

以上是我们拆解的3种提示词框架的具体应用,可以看出,每种提示词框架都有其优缺点,难以做到十全十美。在实际应用中,大家应根据自身需求,选择最适合且最能有效解决问题的提示词框架。

3. 结构化提示词

结构化提示词采用了能提高大模型理解和响应质量的提示词设计方法。它源于云中江树提出的LangGPT(Language for GPT)理念,目标是创造一套专门和大模型对话的语言体系。结构化提示词已获得广泛认可和使用,百度、字节跳动、华为等企业已将结构化提示词应用在智能体平台中。

结构化提示词在形式、结构及应用等方面都和框架式提示词存在较大差异。下面仍以“北京三日游”为主题,来看看如何撰写结构化提示词。

# Role:旅行计划设计师

 

## Profile

- author: LangGPT。

- version:1.0。

- language:中文。

- description:帮助用户设计在北京的三天旅行计划,包括景点推荐、美食体验、交通建议等。

 

## Skills

1. 根据用户的兴趣推荐北京的历史文化、自然景观及现代都市景点。

2. 设计合理的每日行程,包括景点间交通、游览时长及用餐安排。

3. 提供地道美食推荐及购物休闲建议。

4. 考虑旅行期间的天气、预算及个性化需求。

 

## Background(可选项)

用户计划在北京游玩三天,期待深度体验北京的文化、历史、美食及城市特色。

 

## Goals(可选项)

1. 提供完整的三日行程方案,每日3~4个活动/景点。

2. 确保行程连贯、时间安排合理,避免过度奔波。

3. 推荐适合游览的经典和小众景点。

4. 包括美食体验和夜间活动选项。

 

## Rules

1. 每日行程应包含文化景点(如故宫、长城)、美食(如北京烤鸭)体验及轻松活动(如逛南锣鼓巷、798艺术区)。

2. 根据景点地理位置安排行程,减少在交通上花费的时间。

3. 推荐餐厅时要注明价格区间和特色菜。

4. 提供适应天气和意外情况的备用选项。

 

## Workflow

1. 收集用户对旅行风格的偏好,如文化体验、美食探索或现代都市漫游。

2. 确定每日行程主题,如文化之旅、城市探索、自然风光。

3. 设计每日详细行程,包括交通方式和游玩时长建议。

4. 提供每个景点的游玩亮点及特色说明。

 

## Init

用户希望在北京游玩三天,需要详细行程设计。

同样是以“北京三日游”为主题的提示词,结构化提示词与前文介绍的自然语言提示词和框架式提示词相比,具有以下4个特点。

(1)引入Markdown语言

相比于自然语言提示词和框架式提示词主要依赖纯文字表述,结构化提示词则引入了 Markdown 语言,以进一步规范提示词的格式。由于大模型本质上仍是机器,对规律性语言的识别更为精准,因此结构化语言的引入能够显著提升大模型理解和执行的准确性。例如,在上述结构化提示词示例中, “#”表示一级标题,“##”表示二级标题,依此类推,从而使提示词层级更加清晰、结构更为严谨。

(2)模块化配置

结构化提示词被划分为若干模块,并通过特定的词来表示每个模块的核心属性。例如,在上述结构化提示词示例中, “Role”“Skills”“Rules”“Workflow”等词,分别代表角色、技能、规则和工作流等。

小提示

结构化提示词中的模块不是固定不变的,而是可以根据不同的问题和使用习惯灵活调整。此外,由于结构化提示词是面向机器的语言,约定俗成使用英文来标注模块属性,但使用中文也同样可行。

(3)信息组织的逻辑性

结构化提示词强调信息的逻辑组织。首先,各模块之间存在着强逻辑关联。如“Profile”模块提供了整体背景信息,“Goals”模块基于背景信息明确了具体目标,“Workflows”模块则根据背景信息和具体目标制定了详细的工作流程。其次,每个模块内部的信息按照一定的逻辑顺序排列,如“Skills”模块中,技能点从基础的景点推荐到更细致的行程设计、餐饮建议,再到考虑天气和个性化需求,呈现出由浅入深、由大到小的逻辑层次。这种逻辑性的信息组织,有助于用户和大模型更好地理解和把握整条提示词的内容和结构。

(4)自动化处理

结构化提示词看起来特别复杂,但是因为其规范性和模块化的特点,特别适合进行自动化处理,降低用户撰写提示词的难度。例如,可以通过第三方程序、智能体等多种途径生成结构化提示词。这不仅减轻了用户的操作负担,还能提升提示词质量的稳定性。此外,自动化处理能够有效支持大量提示词的批量管理和维护,从而进一步提升操作的便捷性和效率。

在此,我们推荐使用 Kimi 平台上的“提示词专家”功能。该功能是 Kimi 基于 LangGPT 框架开发的智能体,能够自动生成结构化提示词。用户只需访问Kimi 官网,在页面左侧单击 “Kimi+” 按钮,在“办公提效”栏目中找到“提示词专家”,单击即可进入其页面,如图1-5所示。

图1-5 Kimi平台上 “提示词专家”页面

用户只需以自然语言形式表达自己的需求,“提示词专家”即可快速理解用户意图,并生成初版的结构化提示词。实操步骤如图1-6所示。

图1-6 结构化提示词的自动化处理实操步骤

下面以撰写“北京三日游”主题的结构化提示词为例,具体操作步骤如下。

第一步:用自然语言描述需求。

示例提示词

请帮我撰写主题为“北京三日游”的提示词。

输出结果

# Role:旅游规划专家和北京文化历史顾问。

## Background:用户计划在北京旅游三天,希望深入体验北京的文化、历史和现代都市生活。

## Profile:你是一位经验丰富的旅游规划师,对北京的历史、文化、旅游景点和当地生活有深入的了解和独到的见解。

## Skills:你具备出色的组织能力、沟通技巧和创意思维,能够根据用户的需求和兴趣,设计出个性化的旅游路线和活动。

## Goals:为用户提供一份详尽的北京三日游计划,内容包括文化体验、历史探索和现代都市漫游。

## Constrains:旅游计划应兼顾用户的体力和时间限制,确保旅游活动内容充实、节奏舒缓,同时遵守当地法律法规,并尊重文化习俗。

##OutputFormat:提供详细的旅游日程安排,包括每日行程、推荐活动、餐饮选择和住宿建议。

##Workflow

1. 确定用户的旅游偏好和特殊需求。

2. 根据用户的需求,设计个性化的旅游路线。

3. 提供详细的日程安排,包括交通、餐饮和住宿建议。

##Examples

-第一天,故宫博物院深度游,游览太和殿、乾清宫等主要建筑,午餐推荐品尝北京烤鸭,晚上游览王府井大街。

-第二天,长城游,选择慕田峪或八达岭段,体验中国古代军事防御工程的宏伟,晚餐推荐老北京炸酱面。

-第三天,北京现代生活体验,参观国家大剧院、奥林匹克公园,午餐推荐现代中餐,晚上体验北京夜生活,如参观三里屯酒吧街。

## Initialization:欢迎您来到北京,这座古老而又现代的城市。我是您的旅游规划专家,将为您量身定制一个三日的北京之旅。请告诉我您的旅游偏好和任何特殊需求,让我们开始规划您的旅程吧。

第二步:优化提示词。

用户审查提示词初稿,如果有需要优化的地方,可以通过追问的方式调整,直至生成符合预期的提示词。

例如,上述提示词中没有提到旅游的预算,如果需要完善这部分内容,可以通过追问的方式引导大模型优化提示词。

示例提示词

请在以上提示词基础上,帮我增加预算规划方面的内容。

输出结果

#Role: 旅游规划专家和北京文化历史顾问。

##Background: 用户计划在北京旅游三天,希望深入体验北京的文化、历史和现代都市生活,并需要对旅游预算进行合理规划。

##Profile: 你是一位经验丰富的旅游规划师,对北京的历史、文化、旅游景点和当地生活有深入的了解和独到的见解,同时具备财务规划能力,能确保旅游中的花销不超出用户的预算。

##Skills: 你具备出色的组织能力、沟通技巧、创意思维和财务规划能力,能够根据用户的需求和预算,设计出个性化的旅游路线和活动。

##Goals: 为用户提供一份详尽的北京三日游计划,内容包括文化体验、历史探索、现代都市漫游,并合理规划预算

##Constrains: 旅游计划应考虑到用户的体力、时间限制和预算,确保旅游活动内容充实、节奏舒缓,同时遵守当地法律法规,并尊重文化习俗。

##OutputFormat: 提供详细的旅游日程安排和预算规划,包括每日行程、推荐活动、餐饮选择、住宿建议和预估费用

##Workflow

 1.确定用户的旅游偏好、特殊需求和预算范围

 2.根据用户的需求和预算,设计个性化的旅游路线和预算规划

 3. 提供详细的日程安排,包括交通、餐饮和住宿建议,以及各项活动的预估费用

##Examples

 -第一天,故宫博物院深度游,门票等预算约100元;午餐推荐品尝北京烤鸭,预算约150元;晚上游览王府井大街,预算约50元。

 -第二天,长城游,门票和交通预算约200元;午餐推荐老北京炸酱面,预算约50元。

 -第三天,北京现代生活体验,国家大剧院门票等预算约100元,奥林匹克公园免费;午餐推荐现代中餐,预算约100元;晚上体验北京夜生活,预算约200元。

##Initialization: 欢迎您来到北京,这座古老而又现代的城市。我是您的旅游规划专家,将为您量身定制一个三日的北京之旅,并帮助您合理规划预算。请告诉我您的旅游偏好、任何特殊需求及预算范围,让我们开始规划您的旅程吧。

第三步:将完整的提示词输入大模型让大模型执行任务

在大模型中开启一个新对话框,然后将优化后的结构化提示词提供给大模型,让它执行任务。

练习题

请利用“提示词专家”智能体,以“时间管理”为主题,撰写结构化提示词。

我们将提示词的迭代分为3个阶段:自然语言提示词阶段、框架式提示词阶段、结构化提示词阶段。自然语言提示词简单易用,但复杂任务可能难以准确传达。框架式提示词通过引入角色、任务、上下文等要素,提升了模型输出的准确性和一致性,但是用户需要对任务理解得非常透彻。结构化提示词则进一步以模块化的方式组织提示内容,提高了模型的理解能力和执行效率,但是灵活性差一些,对大模型的算力要求很高。每种提示词都有其优缺点,用户应根据自身需求选择最合适的提示方式。我们将提示词迭代过程中3个阶段的特点总结为表1-5。

表1-5 提示词迭代过程中3个阶段的特点

提示词阶段

特点

优点

缺点

自然语言提示词

简单易用

操作方便,容易上手

复杂任务可能难以准确传达

框架式提示词

引入角色、任务、上下文等要素

提升模型输出的准确性和一致性

需要对任务更清晰的梳理和定义

结构化提示词

以模块化的方式组织提示内容

提高模型的理解能力和执行效率

灵活性欠佳,对大模型算力要求高

1.2.2 要素2:结构输出

大模型的工作原理类似于“词语接龙”游戏,其基于逐步生成词语的规则来构建句子并传达完整语义。然而,这种生成方式具有一定的不稳定性,并且在处理未见过的数据时容易出现泛化问题。

例如,当我们输入“我爱”,让大模型续写时,大模型会基于它所学习的上下文和常见搭配生成句子,每一次生成的句子都可能不一样,如“我爱你”“我爱祖国”或“我爱学习”等。如图1-7所示,3次输入同样的提示词“续写:我爱”后,大模型输出了3段完全不同的结果。

图1-7 大模型输出的不稳定性和泛化

为了提高大模型输出的准确性和深度,我们可以为大模型提供结构化的方案,从而对其生成规则进行有效约束。这种方法不仅能够降低输出的不稳定性,还能提升结果的整体质量。

结构指的是事物的组成部分及它们的相互关系或排列方式。结构强调的是“组成”与“关系”,它关注事物内部的元素如何排列和相互作用,从而形成一个完整的系统或实体。

结构是世间万物的本质属性,它是万物差异性的根本所在。从宏观到微观,从社会到自然,万物无一不以其独特的结构形态呈现。结构不仅仅是组成要素的简单排列,更是决定事物本质和特性的关键。

例如,石墨与钻石都是由碳元素构成的,但是因为碳元素连接方式的差异,展现出截然不同的物理性质:石墨内部是层状结构,质地很软;钻石内部是三维网状结构,质地非常坚硬。这正是结构的神奇之处:相同的元素,不同的排布,可以衍生出大相径庭的事物。

不仅自然物质,人类的精神产品也存在结构性的差异。例如,当提到新闻和论文时,人们几乎不会混淆它们,除了应用场景不同,这两种文体在结构上的显著差异更是决定性因素。

当然,也有一些事物,特别是抽象的思想产物,其结构并不能直观地观察到。在这种情况下,只有深入探讨和反复总结,才能提炼出能够揭示事物规律的结构模型。

在应用大模型辅助生成内容时,用户往往会忽视结构的重要性。然而,正是通过精准的结构控制,才能最大化发挥大模型的应用潜力,并最大限度确保输出结果符合用户预期。可以说,结构化是精准控制大模型输出质量的关键变量。

例如,在提示词“续写:我爱”中增加结构方面的内容,就可以进一步约束大模型输出结果,达到控制大模型输出质量的目的,如图1-8所示。

图1-8  通过结构控制大模型输出质量

虽然用图1-8中的提示词生成内容,每次的输出也不一样,但通过在这个简单的提示词中明确结构和目的,能使输出内容更符合用户预期。

因此,提升大模型输出效果的一个有效方法,就是为其提供结构化方案。

在1.2.1小节中,我们介绍了结构化对提示词的影响。接下来,我们将系统介绍结构化方案的类型和来源,并系统分析结构化方案对内容输出的影响。

1. 结构化方案的类型

根据应用场景的不同,我们将结构化方案分为经典理论、思维模型、经典工作方法、提炼结构等4种类型。

第一种:经典理论

经典理论是经过长期验证并被广泛认可的理论框架,具有普遍适用性和较高的价值。经典理论通常由领域内的权威学者提出,并在该领域的发展过程中起到了奠基性作用。例如,福柯的规训理论、布迪厄的场域理论等,都是经典理论的代表。经典理论以强大的解释力著称,能够深入揭示复杂现象的本质。由于其高度抽象的特性,经典理论更多应用于学术研究情境,而较少直接用于解决具体实践问题,但它们依然为问题的解决提供了重要的理论依据。

第二种:思维模型

思维模型是一种用于解释或简化复杂事物的可视化框架,旨在帮助人们在分析、决策和问题解决过程中更高效地思考。相较于经典理论的宏观性和抽象性,思维模型更强调实操性和可视化呈现。思维模型介于宏观和微观之间,是连接理论与实践的桥梁,它不仅帮助人们更清晰地认知复杂事物,而且为解决问题提供了高效的行动框架。思维模型成为现代社会中不可或缺的思维工具之一。

常见的思维模型非常多,例如帮助理解增长规律的复利效应、用于总结和优化的复盘模型及关注用户体验的峰终定律等。这些工具以其强大的理论抽象和应用价值,为人们应对各种挑战提供了有力支持。

第三种:经典工作方法

经典工作方法是基于实践经验形成的一种系统化工具或流程,旨在帮助个人或团队在特定的工作情境中更高效地实现目标并提升工作成果。这些方法通常具有明确的操作步骤和清晰的执行流程,其核心在于将复杂的任务分解为可操作的路径,同时根据不同目标和环境的特点进行灵活优化。

例如,SMART目标设定法以具体性、可量化性、可达成性、相关性和时限性为原则,帮助人们明确目标并提高执行力;SWOT分析法则通过分析优势、劣势、机会和威胁,为战略决策与资源分配提供支持。

第四种:提炼结构

提炼结构是基于特定场景或问题,通过深入观察和思考,总结出其底层规律,从而为问题的解决提供有效的指导。

但是,准确提炼结构并不容易,其中对场景或问题的深入分析、理解、抽象和提炼能力至关重要。同时,提炼出的结构也往往受限于特定情境,其跨场景适用性可能较低。

例如,作者在《写好论文:思维模型与AI辅助应用》一书中提炼出“顶天立地加两翼”和研究问题的OBTQP等模型。这些模型是作者基于文献研究与分析总结出来的,成为解决特定问题的有效框架。

最后,我们将4种结构化方案的特征汇总到表1-6中。

表1-6 4种结构化方案的特征

类型

定义

特点

示例

经典理论

经过长期验证并被广泛认可的理论框架

抽象性强,解释力优,多用于学术研究

福柯的规训理论、布迪厄的场域理论

思维模型

解释或简化复杂事物的可视化框架

实操性强,可视化,连接理论与实践

复利效应、复盘模型、峰终定律

经典工作方法

基于实践经验形成的一种系统化工具或流程

步骤明确,流程清晰,可分解优化任务

SMART 目标设定法、SWOT 分析法

提炼结构

基于特定场景或问题,通过深入观察和思考,总结其底层规律

提炼难,依赖分析等能力,跨场景适用性弱

“顶天立地加两翼”模型、OBTQP 模型

2.结构化方案的来源

在使用大模型的过程中,结构化方案从哪里来?我们可以从以下4种情境出发进行分析。

(1)提问者提供结构

在使用大模型的过程中,用户如果能够清楚地了解解决某问题的适用结构,可以直接为大模型提供相应的结构。用户平时就可以有意识地积累各种结构,主要途径包括:

其一,从教科书、畅销书、杂志和网络资源中广泛学习和整理。

其二,学习经典的结构模型。例如,在撰写叙事类文本时,常用的叙事结构之一是“英雄之旅”(Heros Journey)。可以将“英雄之旅”作为基础框架,通过它来组织内容,从而提升文本的精准性和质量。

为了帮助读者更直观地理解“提问者提供结构”,不妨对比以下两条提示词。

提示词A:

请帮我撰写一个儿童故事样本。

提示词B:

请基于“英雄之旅”(Heros Journey)叙事结构,撰写一个儿童故事样本。

提示词A是未提供结构的指令,提示词B是提供结构的指令。读者可以自行测试,对比两种提示词的效果。

练习题

在借助大模型编写一份项目管理报告时,分别拟定未提供结构和提供 “PDCA(计划-执行-检查-处理)循环” 结构的提示词,并比较二者的优劣。

(2)利用大模型查找并提供结构

当用户不确定解决某个问题需要采用何种结构时,可以借助大模型来查找适配结构,并选择合适的结构解决问题。

例如,目标还是撰写一个故事,但是不知道使用什么结构。这种情况下,可以采用以下3个步骤。

第一步:根据需求,通过大模型查找适配结构。

示例提示词

我想撰写一个儿童故事,故事要能吸引10岁左右的孩子,在内容结构设计或情节设计方面,有哪些比较适用的结构(框架)?

输出结果

撰写针对10岁左右孩子的儿童故事时,可以考虑以下几种内容结构和情节设计框架。

英雄之旅(Heros Journey):这是一种古老且广泛使用的叙事结构,包含英雄从日常世界出发,进入奇异世界,经历试炼,最终获得胜利并返回等要素。这种结构适合冒险故事,可以激发孩子的想象力和探索欲。

问题解决(Problem-Solving):故事开始时呈现一个问题或挑战,主角通过尝试和努力找到解决方法。这种结构适合用来教导孩子面对困难和解决问题的重要性。采用该结构的故事往往与日常生活紧密相关,孩子更易理解和产生共鸣。

成长故事(Coming of Age):聚焦于主角的成长和自我发现过程,通过主角的内心变化和成长,引导孩子理解自我认识、友谊、家庭和社会关系的重要性。

循环故事(Circular Story):故事的结尾回到开始的场景或主题,但主角的经历让他们有了成长或变化。这种结构强调经历和学习的重要性,适合传达生活哲理或教育主题的内容。

对比和转换(Contrast and Transformation):通过对比不同的世界、角色或情境,展现主角的转变和成长。这种结构有助于孩子理解对立和变化,同时体会不同环境和经历对人的影响。

任务驱动(Quest Driven):主角为了达成一个明确的目标或完成一项任务而踏上旅程。这种框架适合构建紧张激烈的情节,培养孩子的目标感和坚持不懈的精神。

第二步:了解并选择适配结构。

如果大模型提供的答案中包含可能合适的结构,用户可以进一步了解这种或这些结构的具体信息。

例如,在上一步中,大模型推荐了“英雄之旅”这一结构。如果用户之前并不了解这个结构,可以通过大模型查询其详细内容,进而判断其适用性。

示例提示词

给我详细解释英雄之旅。

输出结果

英雄之旅是由神话学者约瑟夫·坎贝尔(Joseph Campbell)在《千面英雄》(The Hero with a Thousand Faces)中提出的叙事结构,后来被编剧学者克里斯托弗·沃格勒(Christopher Vogler)提炼成适合故事创作的框架。这一结构适用于冒险、成长类的故事,对10岁左右的孩子很有吸引力。

英雄之旅的12个阶段

1.平凡世界(The Ordinary World)

定义:故事开始时,主角生活在一个普通的环境中,故事会展现他们的日常生活、性格特征,以及他们面临的内心冲突或外部挑战。

作用:让观众了解主角是谁,建立与主角的情感联系。

示例:哈利·波特住在姨妈家,过着受欺负的生活;小木偶匹诺曹生活在简朴的木匠小屋中。

2.冒险的召唤(The Call to Adventure)

定义:一个事件、发现或人物促使主角离开熟悉的世界,开启冒险之旅。

作用:激发故事的主要冲突,驱动主角行动。

示例:哈利收到霍格沃茨的录取信;木匠盖比特告诉匹诺曹要去上学。

3.拒绝召唤(Refusal of the Call)

定义:主角因为害怕、怀疑等,对冒险表示抗拒。

作用:让主角显得更真实,同时加深观众对这次冒险的理解。

示例:哈利起初不相信自己是巫师;弗罗多觉得自己无法承担带指环的任务。

4.遇见导师(Meeting the Mentor)

定义:主角遇到一个导师或指导者,他会向主角提供帮助、建议或道具,赋予主角信心,勇敢踏上旅程。

作用:为主角指明方向,让冒险显得更可行。

示例:邓布利多教导哈利魔法世界的规则;甘道夫指导弗罗多如何承担使命。

5.跨越第一道门槛(Crossing the First Threshold)

定义:主角决定离开熟悉的世界,正式进入冒险的未知领域。

作用:推动故事进入第二幕,展开核心冲突和冒险旅程。

示例:哈利进入霍格沃茨;匹诺曹踏上去学校的路却被狐狸和猫骗到马戏团。

6.试炼、盟友与敌人(Tests,Allies,and Enemies)

定义:主角在冒险中遇到挑战、结识新朋友,同时对抗反派、排除障碍。

作用:通过冲突和互动让主角逐渐成长。

示例:哈利与罗恩和赫敏成为朋友,经历魁地奇比赛,直面斯内普的阻挠。

7.深入洞穴(Approach to the Inmost Cave)

定义:主角接近目标或最终挑战的所在地,那里通常是危险的区域。

作用:让主角面临心理上的抉择或恐惧。

示例:哈利和朋友们进入禁林;弗罗多到达末日火山附近。

8.重大考验(The Ordeal)

定义:主角面临最大的危机,通常是生命危险、重大挫折或内心的挣扎。

作用:故事达到情感和戏剧性的高潮,主角获得深刻的成长。

示例:哈利在密室里面对蛇怪;匹诺曹从鲸鱼腹中逃脱。

9.获得奖励(The Reward)

定义:主角克服挑战,获得成功的象征(物质上的宝物或精神上的成长)。

作用:给观众以暂时的满足,同时暗示故事还未结束。

示例:哈利成功获得魔法石;匹诺曹成为更懂事的孩子。

10.归途(The Road Back)

定义:主角踏上返回普通世界的旅途,可能遭遇新的危险或考验。

作用:表现冒险带来的后续影响,主角开始用新能力或新思想解决问题。

示例:哈利在学年结束后回到姨妈家;弗罗多返回夏尔时发现家园已被破坏。

11.复兴(The Resurrection)

定义:主角经历最后一次考验,这通常是对冒险成果和主角内在改变的最终检验。

作用:完成主角的转变,并向观众传递最终的主题。

示例:哈利意识到爱与牺牲的意义;匹诺曹证明自己够格成为一个真正的男孩。

12.带着宝藏归来(Return with the Elixir)

定义:主角回到普通世界,带回象征成长的“宝藏”——智慧、力量或精神启示。

作用:故事结束,主角的冒险为自己和周围世界带来了改变。

示例:哈利带着友谊和信心回到麻瓜世界;匹诺曹回到家中,成为一个真正的孩子。

这套框架可以灵活调整,适用于奇幻、科幻、冒险、校园等各种题材。你可以根据自己的创意,在某些阶段中加入个性化的情节,让故事更加独特。如果有具体的主题或角色设计,可以与大模型深入探讨如何应用这个框架。

第三步:应用结构。

经过大模型对该结构的详细介绍,用户需要做出判断:如果认为该结构适合用来解决当下问题,则可以继续使用该结构来指导任务的完成;如果判断该结构不适合,则可以进一步了解其他结构,或尝试采用其他解决路径。

例如,在第二步详细了解了“英雄之旅”结构后,我们判断它适合用来指导创作儿童故事,那么我们就可以尝试采用“英雄之旅”作为创作的框架。继续进行以下操作。

示例提示词

请基于以上结构(英雄之旅)帮我撰写一个故事样本。

输出结果

(略。)

通过以上3步,我们可以查找、了解和应用某一结构来解决具体问题。但是,在实际操作中,我们面对的问题往往更加复杂,可能无法一次性找到完全适配的结构方案。因此,我们需要多次尝试,灵活调整,直到找到最合适的指导结构。

练习题

撰写一篇以“未来星际探索”为主题的科幻小说。不确定使用什么结构,请通过大模型查找适配结构。

(3)借助大模型生成结构

对于一个问题,如果既没有现成的合适结构,也未能通过大模型查找到适配的结构,那么可以尝试借助大模型生成特定结构。下面同样以撰写儿童故事为例,演示执行步骤。

第一步:借助大模型生成针对特定问题的结构。

示例提示词

作为一位资深儿童绘本专家,您创作了1000多本儿童绘本作品。现在,我计划创作一本儿童绘本,想请教您:优秀的儿童绘本应具备怎样的内容结构?

输出结果

作为一位资深儿童绘本专家,我很高兴能帮助您!优秀的儿童绘本通常具备以下内容结构和特点。

1.清晰的主题与核心价值观

主题明确:优秀的绘本通常围绕一个简单、容易理解的主题展开,如友情、勇气、爱、好奇心或成长。

价值传递:故事需要传递正向的价值观,但不生硬说教,而是通过情节自然流露。

2.吸引人的开头

快速引入:儿童注意力有限,故事开头要迅速吸引他们。例如,提出一个有趣的问题、讲述某个突发的事件或神秘的设定。

建立情感连接:通过角色或情境让孩子有代入感,能够激发他们的兴趣和共鸣。

3.简单但引人入胜的情节

起承转合:故事通常包含开端(引出问题)、发展(遇到困难或挑战)、高潮(问题解决的关键时刻)和结尾(圆满或启发性的收尾)4个部分。

冲突与解决:冲突应贴近儿童的认知水平,并能通过努力或智慧解决,让孩子感受到希望与成长。

4.丰富的角色设计

独特鲜明的角色:主角通常有明显的特点(如特别勇敢、特别小气、特别聪明),可以是孩子、动物或拟人化的物体。

情感与成长:角色在故事中有情感变化或成长,帮助孩子理解不同情感和行为的意义。

5.语言简洁而富有韵律

语言适合儿童阅读:使用孩子能够理解的简单词汇和句式,避免过于复杂的表达。

节奏感和重复:富有韵律的文字、重复性的句式(如“咚咚咚,谁来了”),既能抓住孩子注意力,也便于记忆。

6.视觉与文字的完美结合

画面主导:绘本中的图片通常比文字更重要,图片需要传递情感、气氛,甚至情节。文字可以是画面的补充,而非详尽描述。

留白与想象空间:画面不必完全填满,适当留白可以让孩子发挥想象力。

7.充满趣味和意外

幽默与惊喜:孩子喜欢有趣的故事,可以通过夸张的画面或角色行为增加趣味性。

意外的结局:设置一个出人意料但让人会心一笑的结尾,提升故事的回味。

8.寓教于乐

隐含教育意义:优秀的绘本让孩子在阅读中潜移默化地学习,如学会分享、解决问题、认识自然等。

激发探索欲:故事可以留下未解答的疑问或未解释的细节,引导孩子去思考或询问。

9.包容多样性

文化与情感包容:现代绘本越来越强调多元文化和个体差异,让孩子学会接纳和理解不同的人和事物。

多维度主题:绘本可适当基于多维度的主题设计情节,结合孩子的日常经历和新奇想象,让他们既感到熟悉又能打开视野。

10.结尾充满余韵

正能量收尾:结尾可以是主角圆满解决了遇到的问题和冲突,也可以是开放式的,让孩子去想象未来的发展。

留下思考:好的绘本不仅让孩子喜欢,还能促使他们与父母或朋友讨论,进一步延展阅读体验。

如果您已经有初步的故事构想,可以分享给我,我们可以一起打磨出一本充满趣味和教育意义的优秀绘本!

第二步:借助生成的结构完成任务。

示例提示词

请基于以上结构帮我撰写一个故事样本。

输出结果

(略。)

通过第一步,我们借助大模型针对特定问题生成了一个结构;然后通过第二步,我们要求大模型以该结构为框架创作内容。但是要注意的是,因为借助大模型生成结构的过程,缺少对问题更深刻的洞察,所以生成的结构通常只能达到平均水平。在面对更复杂的挑战时,需要从其他来源获取结构化方案。

练习题

创作一篇以“校园文化建设”为主题的演讲稿,借助大模型生成演讲稿结构,并写出生成结构的参考提示词。

4)基于目标文本提炼结构

很多时候,我们并不清楚采用何种结构创作比较好,但手头有可以参考的目标文本,并希望模仿它进行内容创作。在这种情况下,可以尝试基于目标文本提炼结构的方法来完成创作。下面以儿童故事创作为例,演示执行步骤。

第一步:提炼目标文本结构。

为了精确提炼目标文本结构,我们设计并撰写了一条“结构提炼”结构化提示词。

# 角色

您是一位专业的文本结构分析师,能够准确且深入地剖析各类文本的结构特征。

 

## 技能

### 技能1: 提取结构特征

(1)仔细分析文本的整体组织方式,包括开头、中间和结尾的衔接与过渡。

(2)明确文本的主要部分,如引言、正文、结论等。

(3)梳理文本的逻辑顺序,是时间顺序、空间顺序还是逻辑推理顺序等。

(4)关注段落分布,如段落的长短、数量和主题一致性。

(5)留意任何显著的格式或标记,如标题、加粗、斜体等。

 

### 技能2: 命名结构

根据提取的结构特征,赋予给定文本的结构一个抽象度高、简洁且能准确概括其特征的名字。

 

### 技能3:提炼通用结构

依据以上分析提炼出一个通用的写作结构,并对结构中的每个要素进行解释(不使用用户下达的任务中的具体案例)。

 

## 限制

- 仅针对给定的文本进行结构分析,不涉及无关内容。

- 输出的结果应清晰、系统,按照给定的格式呈现。

- 命名应简洁、准确,具有较高的抽象性。

将“结构提炼”结构化提示词发送给大模型后,大模型便会提供一段文本。我们尝试将“狼来了”的故事文本发送给大模型,要求它提炼该故事的文本结构。大模型基于“结构提炼”结构化提示词对“狼来了”的故事结构提炼如下。

#结构特征

开头介绍放羊娃日常放羊的情境。

中间部分讲述放羊娃多次撒谎捉弄农夫,农夫们从相信到不再相信他的过程。

结尾是狼真的来了,放羊娃求救但无人理睬,导致羊群损失。

#命名结构:“放羊娃撒谎的后果”

#通用结构

背景介绍:对故事中的主要人物及日常情境进行简要说明。

情节发展:通过一系列的事件推进故事的发展,包括人物的行为和互动。

转折与冲突:出现与之前情节不同的关键转折,引发矛盾或冲突。

结局呈现:展示故事的最终结果。

第二步:基于提炼出的结构进行创作。

通过第一步提炼了目标文本的结构后,接下来便可以基于这个结构进行创作。

示例提示词

请基于以上结构帮我撰写一个故事样本。

输出结果

(略。)

练习题

使用“结构提炼”结构化提示词提炼寓言故事《刻舟求剑》的结构,并在此结构基础上,创作一篇新的寓言故事,题目自拟。

结构化输出是提升大模型生成质量的重要手段。通过为模型提供结构化方案,可以有效降低生成的不确定性,使生成结果更准确、更深刻。结构是万物的本质属性,它不仅决定事物的特性和差异性,也在信息处理与问题解决中扮演关键角色。

在实践中,结构化方案主要有4个来源:提问者提供结构、利用大模型查找并提供结构、借助大模型生成结构或基于目标文本提炼结构。这种方法论能够帮助用户充分发挥大模型的潜力,确保生成结果更符合预期。结构化方案4个来源的详细信息如表1-7所示。

表1-7 结构化方案的4个来源

来源

特点

操作步骤

示例提示词

提问者提供结构

使用者直接提供结构

1. 提供结构作为框架

2. 基于框架组织内容

请基于“英雄之旅”(Heros Journey)叙事结构,撰写一个儿童故事样本

利用大模型查找并提供结构

不确定使用何种结构时,借助大模型查找适配结构

1. 查找适配结构

2. 了解并选择结构

3. 应用结构

我想撰写一个儿童故事,故事要能吸引10岁左右的孩子,在内容结构设计或情节设计方面,有哪些比较适用的结构(框架)

借助大模型生成结构

没有现成结构,通过大模型生成特定结构

1. 生成针对特定问题的结构

2. 借助生成的结构完成任务

作为一位资深儿童绘本专家,您创作了1000多本儿童绘本作品。现在,我计划创作一本儿童绘本,想请教您:优秀的儿童绘本应具备怎样的内容结构

基于目标文本提炼结构

提炼目标文本结构

1. 提炼目标文本结构

2. 基于提炼出的结构进行创作

使用“结构提炼”的结构化提示词提炼目标文本结构

1.2.3 要素3:投喂材料

投喂材料是指向大模型提供特定的背景信息、数据或其他相关材料,以帮助其更好地理解和处理特定任务,确保生成的内容更精准、更相关、质量更高。

在借助大模型创作内容时,人们经常碰到 “大模型幻觉”问题,即大模型在生成内容时输出了不真实、毫无依据或存在逻辑错误的信息。出现“大模型幻觉”的原因是,大模型的运作机制本质上是基于对大量训练数据的学习,预测并生成下一个最可能的词语组合,而非基于对真实世界的理解。

目前,“大模型幻觉”被认为是使用大模型时的一个顽疾,这一问题非常复杂,目前还没有根治的解决方案。但是,业内普遍认为,在具体场景中,通过投喂材料的方式,可以有效降低无关或虚假信息的生成概率,从而最大程度保证生成内容的准确性。

我们可以用以下两个提示词作为范例对比思考。

提示词A:

请撰写一段关于企业数字化转型最新进展的综述。

提示词B:

以下是几篇关于企业数字化转型的文献摘要,请根据这些摘要撰写综述,提炼出研究的最新进展和未来趋势。文献摘要内容如下:###文献摘要1、文献摘要2……###

提示词A表述宽泛,大模型会根据已知信息生成内容,容易出现部分细节与真实研究进展不符的问题,且非常容易引用虚假文献。提示词B通过投喂材料,将大模型生成内容的范围限定为提供的文献,尽管并不能保证生成内容完全真实,但可以显著降低大模型虚构内容的可能性。

向大模型投喂的材料主要是文本。投喂文本涉及以下几个关键问题:文本格式、文本量的大小及投喂路径。下面我们分别进行介绍。

1. 文本形式

文本存在形式多种多样,既可以是纯文字,也可以存储于TXT、DOC、XLS、PPT、PDF、HTML、EPub等格式文件中,甚至嵌入在图片及视频中。

现在主流大模型普遍支持多种形式的文本投喂,比如可以通过上传附件的方式,向豆包投喂PDF、TXT、CSV、DOCX、DOC、XLSX、XLS、PPTX、PPT、MOBI、EPUB、PNG、JPEG(JPG)等格式的文件,如图1-9所示。Kimi则可接受PDF、DOC、XLSX、PPT、TXT等格式的文件投喂。其他大模型的功能大体相近。

图1-9 豆包支持的附件格式

不同的文本形式各有优缺点,适用于不同的场景。以最常见的纯文字文本和PDF文件为例。

纯文字文本仅包含字符内容,不包含字体、颜色、字号等样式信息。它的优势在于样式简洁、操作简单,便于快速复制和传输;缺点是表现力不足、信息结构性较差。

PDF文件能够完整保留文本的各种样式,包括字体、图片、表格、页眉页脚等,确保其在不同设备和平台上的显示效果一致。因此,PDF文件成为正式报告、论文和合同等需要精确排版文件的首选。虽然PDF文件不易编辑,需要借助专门的工具进行修改,但它具备更高的安全性,可通过加密或设置编辑权限的方式,防止未经授权的更改。

总体而言,纯文字文本适合简单的内容传达,而PDF文件更适合需要格式化、保密或长时间保存的正式文件。

为大模型投喂材料时,应根据具体需求和目标来选择合适的文本形式。例如,如果希望大模型理解更为精确、运行速度更快,纯文字文本往往更适合;而如果目标是提供更为丰富的资料,且对精确度要求不高,则可以选择PDF、DOC等格式的文件。

直接为大模型投喂纯文字文本与通过附件上传PDF文件有很大差异,如表1-8所示。

表1-8 直接投喂纯文字文本与上传PDF文件的差异

对比项

直接投喂纯文字文本

上传PDF格式文件

输入形式

直接在文本框中输入文字

上传包含文本的PDF文件

内容解析

无须复杂解析,AI直接处理文本

AI需要先提取PDF中的文本,可能遇到格式问题

文本样式

纯文本,样式简单

包含样式元素(标题、表格、图片等)

处理难度与效率

处理简单、高效,响应时间短

处理复杂,响应时间较长

适用场景

简单任务、短文本创作

复杂文档分析、长篇内容提取

灵活性与精确度

高灵活性,可精确控制输出

受文档格式影响,精确度较低

输出个性化与控制

易于控制输出的风格和内容

输出可能受格式限制,个性化程度较低

对AI能力的要求

较低,多用于处理简单文本任务

较高,多用于处理复杂文件格式及信息提取任务

在学术写作场景中,我们通常推荐使用纯文字文本进行材料投喂,以确保内容解析的准确性。

2. 文本量的大小

在向大模型投喂材料时,通常以token作为文本量的基本单位,而非自然语言中常用的字或词。

token指在文本处理过程中被分割出来的最小语义单元。一个token可以是一个单词、一个标点符号,甚至是词的一部分,具体取决于不同模型的分词方式。大模型的运行机制通常是将文本切分为token,通过对输入的token进行上下文分析,逐步预测下一个token,最终生成连贯的完整文本。

由于分词算法的不同,相同文本对应的token数在不同大模型中可能存在显著差异。例如,“我喜欢学习人工智能”这句话,在ChatGPT中计为6个token,而在通义千问中仅计为4个token。

每种大模型都有一个明确的最大token限制,这决定了大模型在单次输入中能够处理的文本量。如GPT-4 32K版本的最大token限制通常为32768个token,可以换算为24000~32000个汉字。Kimi支持200万个汉字的无损上下文输入,大概可以换算成100万个token。其他大模型能处理的文本长度一般在2万字以上,相当于2万~3万个token,可以满足绝大多数日常需求。

3. 投喂路径

为大模型投喂材料主要有以下4种路径:文字投喂、文件投喂、建立知识库、API(Application Programming Interface,应用程序接口)投喂。

(1)文字投喂

文字投喂是最常见的投喂方式,广泛适用于各种场景。它通过“指令 + 文本分隔符 + 材料”的结构将文本信息传递给大模型。在这一结构中,指令是用户的任务要求,材料则是任务的背景信息,而文本分隔符(通常为“###”)用于区分指令与材料,以帮助大模型更高效地处理信息。

同样以撰写儿童故事为例,展示“指令 + 文本分隔符 + 材料”的投喂结构。

请根据下面的“小兔子种胡萝卜的步骤”,写一篇记叙文,描述春天里我和小兔子一起种胡萝卜的快乐时光。(指令)

小兔子种胡萝卜的步骤:

###小兔子种胡萝卜的步骤是,先在地里挖一个小洞,然后把胡萝卜种子放进去,最后浇水盖土,等待发芽。(材料)###(文本分隔符)

练习题

请采用“指令+文本分隔符+材料”的投喂结构,撰写一篇以“我学会烘焙蛋糕”为主题的记叙文。

(2)文件投喂

文件投喂是指通过上传文件的方式向大模型提供材料,通常适用于需要处理较大文本或更复杂数据的场景。这种方式省去了手动输入的麻烦,更适合在处理报告、论文、书籍等较大篇幅文本时使用。

(3)建立知识库

很多情况下,我们会有比较个性化的需求,需要对某一类型或主题的资料进行专门处理。这时候可以选择建立知识库的方式。如科研工作中,研究者关注某一个领域的动态,就可以针对该领域资料创建一个知识库。

在独立的知识库平台或智能体系统中,用户可以轻松创建个性化的知识库,然后借助大模型基于知识库内容生成内容。

例如,Whismer就是一款创新的知识库平台,用户通过上传资料、添加网页链接和编辑笔记,便能构建属于自己的知识库,并利用知识库内容与大模型互动,从而高效解决各种问题。

此外,秘塔、腾讯的ima平台、扣子、文心智能体等也提供了类似的功能,用户可以根据需求创建和管理个性化的知识体系,进一步提升互动体验和问题解决能力。

基于某个大模型建立专属知识库已经越来越成为大模型产品的标配,用以满足用户对真实性、垂直性和个性化内容的需求。

(4)API投喂

API投喂是指通过专门的应用程序接口实现数据的传输与处理。借助API,用户能够充分利用大模型的强大处理能力,高效便捷地与外部资料库进行互动。

通过 API对接资料库需要一定的技术基础,不过,在实际应用中,很多平台已经完成了和一些外部资料库的对接工作,我们只要使用就可以了,不需要了解技术细节。例如, ChatGPT的GPTs、扣子平台上的智能体,都可以通过API与外部资料库进行连接和交互。

以Consensus GPTs为例。Consensus是一个文献库,包含超过2亿篇论文。通过API,Consensus GPTs可以访问该文献库内容,满足用户在文献方面的需求。在首次通信时,系统会询问用户是否允许对话,用户可以选择“允许”“始终允许”或“拒绝”,如图1-10所示。此外,用户在使用Consensus GPTs时,还可以选择接入公开API或私有API,以根据需求实现定制化的数据处理和互动。

图1-10 Consensus GPTs询问用户权限

不同的投喂路径适用不同的需求和场景。根据任务的复杂性和数据量选择合适的投喂路径,能够显著提升大模型的工作效率和数据处理能力。在学术场景中,我们一般推荐采用文字投喂,其他路径可以作为补充。

投喂材料是指向大模型提供特定的背景信息、数据或其他相关材料,以帮助其更好地理解和处理特定任务,确保生成的内容更精准、更相关、质量更高。其主要目的是避免生成“幻觉”内容,确保输出符合实际需求。向大模型投喂的材料主要是文本。通过合理选择文本形式、文本量的大小和投喂路径,可以显著提升大模型的处理效率与输出质量,确保任务的准确完成。其中,投喂路径主要有以下4种:文字投喂、文件投喂、建立知识库、API投喂。各投喂路径的详细信息如表1-9所示。

表1-9 投喂路径

投喂路径

特点

优势

劣势

文字投喂

采用“指令+文本分隔符+材料”的投喂结构传递文本信息

结构清晰,便于大模型高效处理信息

较适合简单文本需求,不适合复杂场景

文件投喂

通过上传文件的方式向大模型提供材料

适合处理较大篇幅文本,操作相对便捷

文件带有一定的样式,特定模型存在兼容问题

建立知识库

可针对个性化需求,创建专属知识库

满足用户对真实性、垂直性和个性化内容的需求

需花费一定时间精力构建和管理知识库

API投喂

通过专门接口实现数据传输与处理

高效便捷地与外部资料库交互

需要一定技术基础

1.2.4 要素4:模板定制

模板是一种预设的框架、样式或模式,用来规范和引导特定内容的生成或设计。模板定制是指通过提供预设的模板,引导大模型在生成内容时遵循一定的风格和标准,使生成的内容在措辞、语气、逻辑等方面符合要求。模板不干预具体的创作内容,主要是提供一个标准化的框架,引导大模型生成符合特定标准的结果。

模板定制的方法主要包括以下几种。

1.通过提示词设定风格

通过在提示词中精准描述预期内容的风格属性,如语气、情感、深度、温度等,可以有效地控制输出内容的风格。几种典型的设定方式如下。

(1)在提示词中明确语气

示例提示词

请以温暖、友好的语气写一个关于小动物友谊的故事,语言简单且富有亲和力,适合小朋友阅读。

(2)通过细化情感色彩来引导大模型内容输出

示例提示词

请写一个关于小兔子如何克服困难的故事,故事的情感要积极向上,充满鼓励和支持,帮助孩子感受到勇气和希望。

(3)调整内容深度与复杂性

示例提示词

请编写一个关于勇敢的小女孩与魔法龙冒险的故事,情节复杂一些,包含多个小高潮,并通过故事传达友情与合作的重要性。

(4)通过温度控制大模型输出的创意程度

温度(Temperature)是生成式大模型中的重要参数,用于控制大模型输出的随机性和创意程度。通过调整温度,可引导大模型的创意表达,进而影响输出内容的风格。我们整理了不同温度范围的特点、适用场景及示例提示词,如表1-10所示,方便读者快速参考并精准调整参数,以匹配实际需求。

表1-10 不同温度范围的特点、适用场景及示例提示词

温度范围

特点

适用场景

示例提示词

低温度(0.0~0.3)

内容稳定、可预测、精确,创意性较弱,适合理性、正式的表达场景

简单、清晰、富有教育意义的儿童故事,适合年龄较小的孩子

请以低温度写一个关于友谊的儿童故事,简单明了,突出友善和合作的重要性

中温度(0.4~0.7)

内容兼具适度创新性和变化性,表达更具多样性,但保持一定理性

情感丰富、带有轻微的幻想元素的故事,适合稍大一些的孩子

请以中等温度写一个关于勇气和冒险的故事,加入一些魔法元素,让故事有趣但不失教育意义

高温度(0.8~1.0)

内容富有创意,可能呈现新颖观点、独特表达和开放性思考

天马行空的奇幻冒险故事,适合年龄较大或想象力更丰富的孩子

请以高温度写一个关于一只会飞的猫咪的冒险故事,充满奇幻的场景和创意的角色

除了上述风格设定方式,还有许多其他可行的方法。大家可以多加注意和总结,以便通过精确的提示词控制输出内容的风格。

2. 提供示例文本

Zero-shot、One-shot 和 Few-shot 是给大模型提供示例的3种提示策略,它们的区别在于提供示例的数量。

(1)Zero-shot:不给任何示例

【输入】请翻译这句话:“我爱学习”。

【输出】I love studying.

在这个示例中,大模型没有得到“翻译这句话”这个任务的任何示例,完全依赖其预训练的语言能力和对任务描述的理解完成了任务。

(2)One-shot:给大模型提供一个示例

【输入】示例:“我今天很开心”,这句话的情感是积极的。

任务:“我感到很沮丧”,这句话的情感是?

【输出】消极的。

在这个示例中,大模型看到一个情感分析的示例后,能够推断出如何进行情感分析。

(3)Few-shot:给大模型提供几个示例

【输入】示例1:我喜欢看书 → I like reading books

示例2:他是我的朋友 → He is my friend

示例3:今天天气挺好 → The weather is good today

任务:我在公园里散步 → ?

【输出】I am walking in the park

在这个示例中,大模型通过多个翻译示例理解了翻译的规则,并能够完成类似的翻译任务。

提供示例文本也能有效地实现对文本风格的控制。例如,我们在创作儿童故事时,可以将《狼来了》原文作为示例文本,供大模型参照学习。

示例提示词

撰写一个儿童故事,模仿示例文本的风格。核心情节:一个小男孩因多次虚假报警而失去他人的信任。故事应富有节奏感,适合儿童,加入富有创意的童话元素和环境描写。示例文本如下:###《狼来了》原文###

当然,为了更精确地控制大模型的输出风格,可以提供多个示例文本。

3. 基于大模型提炼目标文本逻辑关系

大模型作为一种强大的语言处理工具,能够准确提炼目标文本中的逻辑关系,从而深入解析文本风格的核心特征。无论是简单直白的陈述,还是复杂精巧的论证,逻辑关系的运用都在一定程度上决定了文本的呈现风格。大模型强大的总结与提炼能力,可以帮助我们快速找到文本逻辑关系的核心特征,为后续写作提供有效指导。

提炼目标文本逻辑关系的结构化提示词示例如下。

# Role:语言分析专家。

 

## Profile:xuejun。

- Language:中文。

- Description:擅长对文本进行逐句分析,能够准确指出句子之间的连接关系,并清晰解释其中逻辑衔接的合理性。

 

## Skill

1. 精准分析句子结构。

2. 洞察句子间的连接关系。

3. 用简洁明了的语言解释其中的逻辑衔接。

4. 指出逻辑衔接的优点。

5. 对复杂文本也能进行深入分析。

 

## Goals

1. 逐句分析给定文本。

2. 明确句子间的连接关系。

3. 解释其中逻辑衔接的合理性。

4. 阐述逻辑衔接的优点。

5. 帮助用户更好地理解文本。

 

## Constrains

1. 仅分析给定的文本内容。

2. 解释必须清晰易懂。

3. 不能主观臆断句子之间的连接关系。

4. 分析过程要客观准确。

5. 确保解释符合文本的实际含义。

 

## OutputFormat

1. 列出句子内容。

2. 在括号内给出对逻辑衔接的解释。

3. 说明逻辑衔接的优点。

4.分析要条理清晰。

5. 输出格式规范统一。

 

## Workflow

1. 仔细阅读给定文本。

2. 逐句分析并找出句子间的连接关系。

3. 解释其中的逻辑衔接并说明优点。

4. 整理输出结果。

 

## Initialization

您好!我是语言分析专家。接下来我将按照要求对文本进行逐句分析,找出句子之间的连接关系,并解释其中的逻辑衔接。首先,我会仔细阅读文本内容,然后逐句分析,最后整理输出结果。

实际应用时,只需将以上提示词提供给大模型,大模型便会响应,让用户提供待分析的文本。我们只需按照要求提供文本,大模型便会对该文本进行分析,提炼该文本内在的逻辑关系。具体实操示例可通过扫描二维码1-1查看。

二维码1-1

当然,这只是一个示例,大家可以根据自己的理解和测试,持续迭代出更符合自己预期的提示词。另外,不同大模型执行后的结果也会有差异。大家要灵活应用提示词,在多模型上交叉验证,最终目的就是深入挖掘目标文本的逻辑关系。

4. 基于人的理解和经验提炼目标文本逻辑关系

尽管大模型可以通过深度学习和逻辑推理技术,快速从大量文本中提取出文本逻辑关系,但这一方法也存在一定的局限性。

虽然基于数据和算法的分析精准且高效,但在个性化表达、情感把握和文化背景的理解方面,仍难以完全替代人类的主观经验和情感洞察。这些微妙之处往往隐藏在文本的细节之中,只有具备丰富经验和敏锐直觉,且对领域知识或特定任务足够理解的人,才能捕捉并加以提炼和总结。这样总结出的文本逻辑关系通常具有较强的个性化特征,能够为特定目标读者群体提供更具指导性和创意性的建议或创作灵感。

例如,我们可以根据自己的理解,基于《狼来了》的故事提炼、总结出一个用以指导写作的模板。

一、开头

在一个 [具体的地点或环境设定,比如宁静的小山村、美丽的草原等],生活着一个 [主要人物身份,如调皮的小男孩、贪玩的小姑娘等],他平日里总是 [人物的主要性格特点或日常习惯,如爱开玩笑、做事有些粗心大意等]。

二、事件发展

有一天,这个 [人物] 遇到了一个情况,那就是 [引出一件会引起他人关注或紧张的事情,比如发现远处有异常的动静或看到了不寻常的景象等]。他灵机一动,想到了一个主意,于是便 [具体写出他采取的错误行为,如大喊大叫、谎称发生了危急情况(类似“狼来了”的场景),目的是引起别人的注意,或者出于调皮捣蛋的心理]。周围的人们听到他的呼喊,都 [描述人们的反应,比如纷纷放下手中的活儿,着急地赶过来,满脸担忧地询问发生了什么事等]。可是当大家赶来后,却发现 [点明实际上并没有发生危急情况,只是这个人物在夸大其词,如原来是一只小兔子跑过所致,根本不是什么可怕的事情等]。

三、重复事件发展(可根据需要设置一到两次重复情节,强化故事冲突感)

过了不久,同样的情况又发生了。这个 [人物] 再次因为 [类似的原因,比如觉得无聊,想逗大家玩等],故技重施,又开始 [具体写出他的错误行为,如大喊有危险等]。人们依旧 [描述人们再次焦急赶来的样子],然而结果还是 [说明依旧是一场虚惊,根本没有真正的危险]。

四、高潮转折

终于,真的发生了危险 [比如狼真的来了、暴风雨来临、有坏人真的出现等]。这一回,这个 [人物] 害怕极了,他 [写出人物此时真实的害怕表现,如脸色苍白、声音颤抖等],拼命地 [描述人物为了求救而做的努力,如大声呼救等]。

五、结尾

可是,之前被他多次欺骗的人们,以为这次他还是在开玩笑,所以 [写出人们不再相信他的反应,比如只是摇了摇头,没有理会,继续做自己的事情等]。最后,这个 [人物] 只能眼睁睁地看着 [危险情况造成的后果,比如庄稼被破坏、自己陷入困境等],他后悔极了,心里想着:[写出人物内心的悔恨,如“要是我当初不撒谎就好了”之类的话语]。从此,他明白了一个道理,那就是 [点明故事要传达的道理,如诚实是多么重要,不要随意撒谎欺骗别人等]。

基于人的理解和经验提炼目标文本逻辑关系的特点之一就是:不同的人对同一文本的理解不同,提炼出来的逻辑关系也是不一样的。

练习题

以《桂林山水》为示例文本,在提示词中设定风格为清新秀丽、富有诗意,控制大模型的温度范围为 0.4~0.7,让大模型创作一篇关于家乡美景的短文。短文中要有家乡的河流、山峦、古桥等元素。运用基于大模型提炼目标文本逻辑关系的方法,分析《桂林山水》中描写山水形态与色彩的逻辑关系,要求大模型生成的短文在描写家乡美景时借鉴这种逻辑关系,使描写更具层次感和美感。最后对生成结果进行评价与优化分析。

模板定制通过预设模板引导大模型生成符合特定标准和风格的内容,主要有4种方法:一是通过提示词设定风格,如语气、情感色彩、内容深度与复杂性、温度;二是提供示例文本,用One-shot或Few-shot提示策略引导大模型生成内容;三是基于大模型提炼目标文本逻辑关系;四是基于人类的理解和经验提炼目标文本逻辑关系,如表1-11所示。模板定制不直接干预内容的创作,而是通过设定标准化的框架,帮助生成符合特定要求的内容。

表1-11 模板定制的4种方法

模块定制方法

具体做法

示例

作用

通过提示词设定风格

在提示词中精确描述预期内容的风格属性,如语气、情感色彩、内容深度、温度等

请以温暖、友好的语气写一个关于小动物友谊的故事,语言简单且富有亲和力,适合小朋友阅读

有效控制输出内容的风格

提供示例文本

采用One-shot、Few-shot 的提示策略,通过示例文本控制输出文本风格

【输入】示例:“我今天很开心”,这句话的情感是积极的。

任务:“我感到很沮丧”,这句话的情感是?

【输出】消极的。

实现对文本风格的控制,帮助大模型理解任务并完成类似任务

基于大模型提炼目标文本逻辑关系

通过在结构化提示词中对角色、技能、目标等各方面进行设定,让大模型按流程分析文本

【输入】请分析以下内容的逻辑:“时间就像海绵里的水,只要愿意挤,总还是有的。”

【输出】这句话用类比推理,将“争取时间”类比为“挤海绵取水”,从而论证“主观努力可挖掘潜在时间”的结论。

快速找到文本风格的核心特质,为后续写作提供有效指导

基于人的理解和经验提炼目标文本逻辑关系

依靠人类的丰富经验和敏锐直觉,捕捉并提炼文本中的逻辑关系

将《狼来了》的故事按个人理解提炼为写作模板

为特定目标读者群体提供更具指导性和创意性的建议或创作灵感

1.2.5 要素5:人工校准

近期,某大学教授署名的论文中出现疑似ChatGPT常用语,作者被质疑借助AI代写论文,此事引起广泛关注。这次舆情中,人们聚焦的核心是人工智能伦理问题。

这里我们想强调一贯立场:尽管大模型在辅助人类完成特定任务时有着不可替代的优势,但其作用始终应限于辅助范畴,而非取代人类的主体性角色,绝不能越俎代庖。

当大模型以助理身份完成前期基础任务后,作为任务主体的人类必须做好最后的把关工作,包括细化和调整提示词、AI自检、补充资料、手动调优及确认质量等。

我们将这部分工作称为“人工校准”(Manual Calibration)。

1. 细化和调整提示词

即使经过反复的测试和调整,在执行具体任务时,提示词也可能出现各种意想不到的问题。所以,我们要根据具体任务情境,对未能成功执行或执行不彻底的提示词进行细致分析,找出其不足之处,并据此,通过追问的方式补充和调整提示词内容,以引导大模型完成预期任务。

例如,撰写儿童故事,初始提示词如下:

“写一个关于动物互相帮助的故事,主角是小兔子、狐狸和小鸟。”

基于这条提示词输出的内容非常宽泛,结构和细节都不够具体。对这条提示词进行分析,可能存在的问题有:“动物互相帮助”这一概念较为宽泛,需要具体化为故事情境;没有说明角色的性格特征和互动方式,会影响故事的丰富性;任务不明确,“互相帮助”如何展开不清楚;缺少对故事传达情感的描述。

基于对初始提示词的分析,通过追问的方式,补充更多细节,以便更好地完成任务。

示例提示词

请在上文基础上,帮我添加以下细节:请帮我撰写一个关于小兔子、狐狸和小鸟在森林中帮助迷路的小松鼠找到回家的路的故事。小兔子聪明且善良,狐狸有点儿狡猾但最终愿意帮助别人,小鸟非常勇敢和乐于助人。小松鼠迷路了,大家决定一起帮它找到回家的路。小兔子利用自己的记忆力记住路线,狐狸用聪明的头脑解决途中遇到的难题,小鸟则飞上天空侦查方向,最终大家合作成功实现了目标。故事的最后,小松鼠终于回到家,大家一起庆祝并分享帮助他人的快乐。小兔子、狐狸和小鸟也从中学到了团队合作的重要性。

通过对提示词的细化和调整,将能得到比原始提示词更符合预期的输出结果。

练习题

你想让大模型生成一篇关于 “志愿者在山区支教的经历” 的文章,初始提示词为 “写一篇关于志愿者在山区工作的文章”。请对该提示词进行细化和调整,使生成的文章更符合预期。

2. AI自检

AI自检是指利用人工智能技术,让大模型充当一个特别的角色或根据特定标准对初稿进行检查与评估,进而提出改进建议,用户可以考虑基于建议进行迭代。在实践中,我们总结出两种有效的AI自检方式。

第一种方式:让大模型充当一个特别的角色进行审查

以审查儿童故事为例,可以使用以下示例提示词。

示例提示词

请作为儿童文学专家,审查以下儿童故事,确保其符合儿童文学创作的基本原则。检查故事情节是否清晰、连贯,并具有吸引力,能够引发孩子的兴趣和共鸣。确保语言简洁易懂,避免使用复杂的词汇和句式,使故事符合目标年龄段孩子的理解水平。故事应具备正面的教育意义,能够帮助孩子理解基本的价值观或情感表达。

第二种方式:生成特定标准进行审查

这种方式是要求大模型生成特定的准则、指标等,并以此为基础对内容进行详细检查和评估,目的是判断内容是否符合要求,是否存在潜在问题,或者是否需要改进。在大模型执行过程中,审查所依据的准则、指标等尤为关键。大家可以通过以下示例提示词,引导大模型生成相应的审查标准。

示例提示词

我基于大模型撰写了一篇[内容性质,如儿童故事、论文等],请以详细、苛刻、批判性的视角设计一套审查标准,对生成的内容进行审查。具体要求如下。

-设计10个一级审查指标,每个一级审查指标下至少包含3个二级审查指标。

-详细说明每个一级审查指标的含义,并且为每个二级审查指标提供清晰的评价标准。

-根据以上审查标准,对这篇[内容性质]的内容进行全面审查,给出每个二级审查指标的分数,最终计算出总分(满分100分)。

-在审查过程中,请确保不轻易给出满分,重点发现内容中潜在的、可能被忽视的问题或不足之处。

-提供基于审查结果的具体反馈,包括哪些方面表现优秀,哪些方面需要改进,并给出改进建议。

我们基于上述示例提示词,生成了一套针对儿童故事的审查标准。可以扫描二维码1-2,查看实操过程。

二维码1-2

大家可以逐条分析上述标准的适用性,根据分析结果,对具体标准进行迭代和完善,最终形成效果最佳的标准体系。

练习题

假设你基于大模型撰写了一篇题为《传统手工艺品制作 —— 剪纸艺术》 的文章,请设计一条生成审查标准的提示词。要求这套审查标准包含 5 个一级审查指标,每个一级审查指标下至少有 2 个二级审查指标,对文章中的剪纸艺术历史渊源阐述、剪纸技艺介绍、剪纸作品风格与特色、剪纸艺术传承意义,以及文章语言表述准确性等方面进行审查。

3. 补充资料

根据上一步审查所发现的问题,对初稿内容进行进一步优化和完善。例如,在儿童故事中,可以进一步加入有趣的情节转折或细节描述,以吸引孩子的兴趣和注意力。在学术写作中,可以进一步补充引用文献或具体案例,以提高内容的说服力和专业性。由于内容性质的不同,补充材料的形式和种类差异很大,后面的章节会详细介绍,这里就不再过多讨论。

4. 手动调优

手动调优是指作者通过人工方式对文本内容进行精细修改和优化的过程。

对作者而言,手动调优是极其重要且值得花费时间和精力去完成的优化过程,因为只有通过人的深度理解、感知和推敲,内容才能具备温度与灵魂,才能尽可能降低AI率、淡化“机器味”,显得更加真实、更有质感。

可以通过以下几个步骤进行手动调优。

第一步:逐句审读与修改。

逐句阅读文本,依据自己的理解和语感,斟酌每个字词和句子,并进行相应修改,确保内容逻辑合理,阅读体验流畅。这一步尤为关键,因为修改的颗粒度越细,完成后的内容往往在写作水平和风格上越贴合作者。

第二步:段落通读与调整。

修改完字词、句子细节后,要通读每个段落,分析其内在逻辑和思想表达,确保内容连贯且表达完整。在此基础上,可精炼段落语言、调整句式结构、去除冗余部分,进一步提升段落的凝聚力和阅读流畅度。

第三步:朗读测试。

朗读是验证文本通顺性与清晰性的有效方法。如果朗读一篇文章,听起来顺畅自然,说明该文章的语言表达和思路组织较为成功。朗读过程中若出现“卡顿”或不连贯,应及时对相关部分进行调整,确保语句流畅、逻辑清晰。

第四步:总体审查与细节优化。

在完成一节或一章内容的修改后,需从整体上对文本进行全面审查与优化,宏观审视文本的逻辑结构和各部分衔接,确保整体连贯且思路清晰。

5. 确认质量

在完成所有修改步骤之后,就要对文本进行最终审查,最后评估内容是否符合预期。如果内容符合预期,则定稿;如果不符合预期,可以根据具体问题再次对内容进行审查和修改,直到内容符合预期为止。

需要重点审查和确认的项目如下。

(1)验证关键信息和数据的准确性

核实所有数据、引用内容和事实性信息,确保使用的资料准确无误,不会误导读者。作者可以通过人工检索验证,也可以借助一些工具辅助验证,如秘塔写作猫、Genspark等平台提供了事实核查功能,可以快速高效地辅助检查。

(2)文字校对

检查拼写、语法和标点符号等方面可能存在的错误。文字校对可以借助爱校对、讯飞智检、Grammarly等工具辅助完成。

(3)AI率检测

识别文本是否由AI生成,或判断其原创性。可以通过Copyleaks AI Detector、GPTZero、中国知网个人AIGC检测服务等工具辅助AI率检测。

除以上几项外,还建议进行格式、版权、伦理等方面的审查和确认。

人工校准是确保AI生成内容符合预期、体现人类创作价值的关键环节。通过细化和调整提示词、AI自检、补充资料、手动调优和确认质量等步骤,人类可以提升AI辅助创作内容的质量,同时避免伦理争议和“机器味”。只有经过严格的人工校准,AI辅助撰写的内容才能向外传播或发表。人工校准的各个步骤如表1-12所示。

表1-12 人工校准的各个步骤

方法名称

操作方式

目的

优势或特点

细化和调整提示词

分析提示词不足,通过追问的方式补充和调整提示词内容

引导大模型完成预期任务

让大模型输出的内容更符合预期,弥补初始提示词宽泛等问题

AI 自检

让大模型充当特别角色或依据特定标准对初稿进行检查和评估,并提出改进建议

帮助用户迭代内容

提供客观视角的检查,有不同的实施方式,利于发现潜在问题

补充资料

依据审查发现的问题,针对不同性质的内容补充相应材料,完善初稿

优化和完善初稿内容

可根据内容性质灵活补充不同形式、种类的材料

手动调优

通过逐句审读与修改、段落通读与调整、朗读测试、总体审查与细节优化等步骤精细修改文本

提升内容真实性和质感,使其具备温度与灵魂

通过人的深度理解、感知和推敲,对文本进行精细修改,使其贴合作者风格,保证内容质量

确认质量

对文本进行最终审查,通过检验关键信息和数据准确性、文字校对、AI 率检测等多方面评估内容是否符合预期

确保内容符合预期,方可定稿

借助多种工具辅助审查,确保审查全面,涵盖多个重要审查点

1.3 五源模型的实操案例

如上所述,五源模型由提示词、结构输出、投喂材料、模板定制和人工校准5个要素构成,将5股力量共同作用于一个对象,引导输出内容最大程度上符合使用者的预期。实际上,五源模型所涉及的要素和操作方法并非我们的独创,我们只是对零散的方法进行了系统化、模型化整合,形成一个清晰明了的操作框架。

1.3.1 五源模型的优势

和其他基于大模型生成内容的方法相比,五源模型的优势体现在以下3个方面。

1. 广泛的适用性

五源模型的适用性非常广泛,能够在多种文本生成场景中应用。无论是在学术写作、公文写作,还是文案写作、自媒体写作等领域,五源模型都能提供有效的支持。五源模型是一个通用工具,适应各种不同的文本创作需求。

2. 模型的灵活性

五源模型具有很强的灵活性。在实际应用中,用户可以根据具体的需求和场景选择不同数量的要素进行操作。例如,完整地使用5个要素,或者根据具体的目标调整至4个、3个,甚至2个要素。这种灵活性使得五源模型能够适应多变的写作需求。

3. 操作的流程性

五源模型的操作流程清晰且易于理解。这种流程化的步骤使用户可以更高效地进行文本创作。具体流程包括:首先进行结构输出,然后投喂所需的材料,再根据需要进行模板定制,通过提示词进行整合,最后通过人工校准定稿。这种步骤化的操作便于复用和优化,确保了整个创作过程的条理性和可操作性。

1.3.2 五源模型的实操逻辑

为了更形象地理解五源模型,可以将五源模型的5个要素类比为建筑设计与施工的过程:提示词扮演着建筑师的角色,它负责提出具体的创意和方案,是整项工作的核心和灵魂;结构输出相当于设计图,它提供了清晰的框架和逻辑,是整个建筑的蓝本;投喂材料就像施工用的原料;模板定制则相当于建筑外观和内饰风格,决定了建筑最终的视觉效果;最后,人工校准起到了验收的作用,通过严格的检查与调整,保证交付符合预期的产品。

五源模型的实操流程,可以拆解成5个关键步骤,如图1-11所示。

第一步:结构是什么?提供结构。
第二步:材料在哪里?提供材料。
第三步:模板什么样?提供模板。
第四步:如何做整合?提供提示词。
第五步:怎样优化好?进行人工校准。

图1-11 五源模型的实操流程

在实际操作中,有许多细节需要特别注意。为了使讲解更容易理解,我们选择以难度较低的“生成儿童绘本故事”为例,故事的主题定为“妈妈,我爱你”。我们选择在豆包中进行操作,并逐步展示每一个操作环节。

第一步:确定目标文本结构。

我们采用“提问者提供结构”的方案,选择“英雄之旅” 作为绘本创作的叙事结构。

实操中,先让豆包详细介绍“英雄之旅”叙事结构,如图1-12所示。然后将豆包输出的内容复制到一个文档中,将该文档命名为“五源模型素材”。后续素材也保存到该文档中。

图1-12 豆包介绍“英雄之旅”叙事结构

第二步:确定具体投喂材料。

检索和主题相关的3~5篇儿童故事作为材料投喂给大模型。

首先,根据“妈妈,我爱你”的主题,在豆包等大模型中进行初步信息检索,如图1-13所示。接着,根据提示,前往当当网等平台购买正版电子版或纸质版绘本。最后,将绘本内容整理为文字形式,添加到“五源模型素材”文档中。

图1-13 豆包初步检索的相关信息

第三步:确定目标文本风格。

通过模板定制的方法来确定目标文本风格。模板定制的4种方法可参见本书的1.2.4小节,这里我们选择“基于大模型提炼目标文本逻辑关系”方法。首先,选择第二步中准备好的某一本绘本的内容,使用提炼目标文本逻辑关系的结构化提示词,在豆包中提取该绘本的逻辑关系,如图1-14所示。然后,将提炼出来的文本逻辑关系放入“五源模型素材”文档中。

图1-14 豆包大模型提炼出的某绘本的逻辑关系

第四步:基于提示词进行内容整合。

在完成前面步骤的准备工作后,“五源模型素材”文档中已经保存了以下内容:“英雄之旅”叙事结构、3~5本绘本内容、基于其中一本绘本提炼出的逻辑关系。接下来,我们分别将这些内容提供给大模型学习。每完成一部分的学习后,都单独为这部分学习内容命名,方便后续操作。

为学习内容命名的提示词如下。

示例提示词

以上内容命名为“[具体名字]”(如“妈妈爱你!”),当用户输入“[具体名字]”时,即调用以上内容。

提示词中[ ]内是为上一部分学习内容起的名字。这个名字不用很正式,但是为了使用方便,建议尽量选用与学习内容相关的名字。

具体操作顺序为:先学习结构,然后命名;投喂材料1,然后命名;投喂材料2,然后命名;依此类推,直至所有材料投喂完毕;最后学习模板,然后命名。部分操作如图1-15~图1-20所示。

图1-15 学习“英雄之旅”结构

图1-16 为“英雄之旅”结构的学习内容命名

图1-17 学习投喂材料

图1-18 为投喂材料命名

图1-19 学习目标文本逻辑关系

图1-20 为目标文本逻辑关系的学习内容命名

完成以上步骤之后,要通过一条核心提示词对以上内容进行整合式创作。

示例提示词

您是一位顶级[绘本作家],具备丰富的绘本设计与写作经验,曾出版过多部广受欢迎的儿童绘本作品,擅长将复杂的主题以简单且富有情感的方式传达给读者。

我是一名[绘本创作者],目前正在构思一个面向儿童的绘本故事,主题为“[请填写绘本主题,例如‘勇气与成长’]”。希望您能协助我完善绘本的故事情节与叙事结构。操作步骤如下。

-请参考[结构学习内容的名称,如“绘本结构”]中的叙事结构,基于[投喂材料的名称,如“妈妈爱你1”“妈妈爱你2”]中的内容,模仿[文本逻辑关系学习内容的名称,如“绘本模板”]中的叙述逻辑和风格。

-故事需围绕[请填写核心主题,例如“小狐狸寻找勇气”]展开,包含[请填写关键情节,如遇到挫折、获得启发、最终成长等],并通过拟人化角色或生动的情景传达情感与价值观。

-请确保情节设计符合[目标读者年龄段]的认知水平,语言简洁、生动、富有感染力,适合绘本插图的呈现。

-字数要求:不少于300字,情节描述需完整连贯,适合绘本分段绘制。

-故事需包含明确的主题与教育意义,但避免直接说教。

-无须提供插图设计,仅需撰写文字故事内容。

将以上提示词中[ ]内的文字替换为具体内容,便可以通过该提示词,引导大模型基于对前面学习内容的理解,按要求创作一段全新绘本内容,如下所示。

输出结果

妈妈,我爱你

在一个美丽的森林里,住着小熊和熊妈妈。小熊每天都很快乐地玩耍着,熊妈妈呢,总是温柔地陪伴着小熊。

可是有一天,小熊看到小兔子给兔妈妈送了一大束胡萝卜花,小猴子给猴妈妈摘了好多果子,小熊就迷茫了,它想:“我要怎么表达对妈妈的爱呢?”小熊在森林里走来走去,它看到鸟儿为妈妈筑巢,小蚂蚁帮妈妈搬运食物,它好像突然确认了自己要做的事。

小熊开始行动啦!它先跑到河边,想给妈妈抓一条大鱼。可是它太小了,费了好大的劲才抓到一条小小的鱼。它没有气馁,又跑到树林里,找了好多漂亮的树叶和花朵,想给妈妈做一个漂亮的花环。

回到家后,小熊把小鱼和花环送给妈妈。熊妈妈开心地笑了,把小熊紧紧抱在怀里。小熊在妈妈的怀里,感受到了满满的爱,它知道,爱不需要很复杂,只要真心地为妈妈做一些事就好。

从那以后,小熊每天都会帮妈妈做一些力所能及的小事,森林里的动物们都夸小熊是个懂事的好孩子,小熊和熊妈妈的爱也在这些点点滴滴中越来越深厚啦。

第五步:人工校准。

将基于以上操作创作的儿童绘本内容命名为“初稿”,然后进入人工校准环节。这一阶段涉及细化和调整提示词、AI自检、补充资料、手动调优、确认质量等步骤。

下面我们仅演示使用1.2.5小节生成的儿童故事审查标准对“初稿”内容进行AI自检。

示例提示词

请用以下标准来审查“初稿”内容:###儿童故事审查标准,具体内容(略。)###

提示词发出后,豆包便会根据儿童故事审查标准的内容,对“初稿”进行逐项审查,并给出具体建议和分数,如图1-21所示。

图1-21 对“初稿”进行审查

最后,豆包提供了一个总体审查结论,以概括整体表现和改进方向,如图1-22所示。

图1-22 对“初稿”的总体审查结论

我们要仔细斟酌审查结论。如果审查结论较为合理,可以选择采纳其中的建议,并通过提示词对“初稿”进行优化。

示例提示词

请参考以上审查结果,修改并优化“初稿”内容。

进行以上几步操作后,豆包就会根据审查建议,完成对“初稿”的优化处理,如图1-23所示。

图1-23 基于审查建议对“初稿”进行优化

如果想对比优化前后内容的区别,明确这样修改的理由,也可以追问一句“请帮我标注出修改的内容和修改理由”,如图1-24所示,大模型便会分析具体的优化细节和优化理由,帮助我们做判断。

图1-24 初稿优化细节和优化理由

其余步骤,如补充资料、手动调优和确认质量等,可以根据具体需求和实际情况灵活执行,以确保最终内容的质量和适用性。

以上案例的完整互动过程可以扫描二维码1-3查看。

二维码1-3

本章以绘本创作为例,为大家展示了基于五源模型完成具体任务的完整实操过程。需要说明的是,绘本故事作为一种相对简单的文本形式,其内容逻辑相对直观,创作难度相对较低,因此非常适合作为初学者的实践案例。相比之下,论文写作复杂度更高,需要更强的逻辑性、严谨的结构及丰富的学术材料支撑,分析和表达也会更细腻。在后续章节中,我们将基于五源模型,深入解析论文写作的各个部分,逐步拆解其核心内容与逻辑框架,并为大家提供清晰的指导,帮助大家掌握论文写作的具体操作方法,最终提升写作能力。

也许,还有读者会有疑惑:为什么要分几个部分撰写论文?不是有很多网站,只要输入一个题目,就可以自动生成一篇完整论文吗?在使用大模型的过程中,有一个关键概念——鲁棒性。所谓“鲁棒性”,指的是大模型在面对不同输入条件或干扰时,仍能保持输出的稳定和可靠。为了提升鲁棒性,在解决复杂问题时经常采用“分治法”,即将复杂问题拆分成若干子问题,并针对每个子问题提供标准化解决方案,最后通过协调和整合这些子问题的解决方案,解决复杂问题。

在后续章节中,我们将以实证性论文结构为例,分别从前言、文献综述、理论框架、研究方法、分析论证、结语这6个部分,基于五源模型,在大模型的辅助下,分别展示各个部分的实操过程。

相关图书

秒懂 Excel(全彩版)
秒懂 Excel(全彩版)
秒懂WPS演示文稿
秒懂WPS演示文稿
秒懂PPT(全彩版)
秒懂PPT(全彩版)
赢在表达:AI时代职场沟通指南
赢在表达:AI时代职场沟通指南
秒懂WPS文字处理
秒懂WPS文字处理
AI数字人原理与实现
AI数字人原理与实现

相关文章

相关课程