智慧教师AI工具箱:助教+助学+助研+助管+助育

978-7-115-68537-7
作者: 周城兵秋叶
译者:
编辑: 刘雅思

图书目录:

详情

本书通过丰富的案例,帮助教师快速上手使用AI工具,实现教学创新。本书共9章,全面探讨AI在教学中的应用与实践。第1章介绍教学中常用的AI工具,包括AI综合类、图片类、图表类、PPT类等,帮助教师快速掌握各类AI工具的基本操作。第2章重点讲解如何通过优化提示词,让AI更懂教师的需求,从而提升AI的应用效果。第3章~第7章分别从助教、助学、助研、助管、助育等方面,详细阐述如何利用AI工具提升教学效率与管理水平。第8章探讨AI赋能创新教学的未来趋势,如数字人、知识图谱等技术的应用。第9章则聚焦AI时代教师角色的转型与突破,探讨如何在AI时代保持教育伦理与个性化教学的平衡。 本书面向中小学教师、大学教师等所有教师群体,尤其是对AI技术感兴趣,希望借助AI工具提升教学效率的教育工作者。无论是初次接触AI的教师,还是已有一定AI使用经验的教师,都能从本书中获得实用的操作技巧和创新的教学思路。

图书摘要

版权信息

书名:智慧教师AI工具箱:助教+助学+助研+助管+助育

ISBN:978-7-115-68537-7

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。


版  权

著    周城兵 秋 叶

责任编辑 刘雅思

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315

内 容 提 要

本书通过丰富的案例,帮助教师快速上手使用AI工具,实现教学创新。本书共9章,全面探讨AI在教学中的应用与实践。第1章介绍教学中常用的AI工具,包括AI综合类、图片类、图表类、PPT类等,帮助教师快速掌握各类AI工具的基本操作。第2章重点讲解如何通过优化提示词,让AI更懂教师的需求,从而提升AI的应用效果。第3章~第7章分别从助教、助学、助研、助管、助育等方面,详细阐述如何利用AI工具提升教学效率与管理水平。第8章探讨AI赋能创新教学的未来趋势,如数字人、知识图谱等技术的应用。第9章则聚焦AI时代教师角色的转型与突破,探讨如何在AI时代保持教育伦理与个性化教学的平衡。

本书面向中小学教师、大学教师等所有教师群体,尤其是对AI技术感兴趣,希望借助AI工具提升教学效率的教育工作者。无论是初次接触AI的教师,还是已有一定AI使用经验的教师,都能从本书中获得实用的操作技巧和创新的教学思路。

前  言

未来的课堂是什么样的

作为一名长期关注教育领域并致力于知识传播的作者,我深知教育对个人成长、社会发展乃至国家进步的重要性。教育不仅是传递知识的桥梁,更是启迪智慧和塑造灵魂的手段。

然而,在传统的教育模式中,我们常常面临诸多问题:如何因材施教,满足每个学生的个性化需求;如何提升教学效率,让教师有更多精力关注学生的全面发展;如何实现教育资源的均衡配置……这些问题如同一座座大山,横亘在教育工作者面前。

在当今的AI(artificial intelligence,人工智能)浪潮下,很多问题有了解决的希望。

2025年4月,《教育部等九部门关于加快推进教育数字化的意见》明确提出“全面推进智能化,促进人工智能助力教育变革”,为教育现代化指明了方向。

这一政策导向背后,是全球教育领域对AI技术应用的共同探索——当清华大学的学生AI助手“清小搭”成为学生的24小时智能学伴,当北京市朝阳区的某数学课堂在AI助手的3次反馈中完成从教师主导到师生交互的转型,我们清晰地看到,未来课堂的底层逻辑,正从“标准化灌输”向“个性化成长”跃迁。

那么,未来的课堂具体会呈现怎样的图景呢?我认为,AI将从“助教”“助学”“助研”“助管”“助育”5个维度,深刻地改变我们的教学生态。

首先是“助教”。AI工具将成为教师得力的教学伙伴。它可以帮助教师快速备课,生成多样化的教学素材,甚至模拟课堂情境进行试讲。AI工具让教师能够将更多的精力投入更具创造性和启发性的教学环节。例如,设计项目式学习、组织深度讨论、关注学生的情感需求等。AI工具还能辅助教师进行学情分析,生成可视化学情报告,让教师更清晰地了解班级整体和学生个体的学习状况,从而调整教学策略。

然后是“助学”。这是AI赋能最直接、学生感受最明显的方面。AI工具可以为每个学生打造个性化的学习路径。通过学情分析,AI工具能识别出学生学习的薄弱环节,从而推送有针对性的学习资源。某些“学科智能体”可以像一位耐心的私人教师一样,24小时在线,随时为学生答疑解惑。对于学习上存在困难的学生,AI工具可以提供更细致、更缓慢的指导;对于学有余力的学生,AI工具可以发布拓展性挑战任务。我们注意到,擅长使用AI工具学习的学生,学习参与度和积极性都有显著提高。

其次是“助研”。对教师的专业发展和教育科研来说,AI是强大的助推器。AI工具可以快速检索、筛选、分析海量的教育文献和研究数据,帮助教师追踪前沿动态,发现研究空白。在教育实验中,AI工具可以辅助收集和分析数据,验证教学假设。AI工具还可以帮助教师总结教学经验,形成可复制、可推广的教学模式。对于需要持续输出教育内容、研究教育新趋势的教师,AI工具在信息搜集、数据分析方面提供的支持是具有革命性的,它能让教师更快地把握教育趋势,深化教学思考。

再次是“助管”。教育管理中的许多烦琐事务,如考勤统计、作业批改、成绩统计、家校沟通等,都可以由AI来完成。某些AI工具甚至可以自动批改试卷,让教师从繁重的试卷批改工作中解脱出来。AI的数据分析功能还能帮助学校管理者更科学地评估教学质量,优化教育资源配置。这些“助管”功能,虽然不直接作用于课堂,但它们优化了教学的外部环境,让教师能更专注于核心的教学工作,也能让学校管理更加精细化、智能化。

最后是“助育”。这是教育的根本所在,也是AI可以发挥其独特价值的领域。AI工具可以通过数据统计,预测学生的问题,辅助教师及时发现学生的心理困扰,从而进行干预和疏导。AI工具还可以构建虚拟的角色扮演场景,帮助学生练习沟通技巧、解决冲突、培养同理心。在德育和美育方面,AI工具可以向学生推荐优秀的文艺作品、历史故事,引导学生形成正确的价值观和审美观。当然,在“助育”方面使用AI仍需谨慎,并且需要人类智慧加以引导,但它无疑为教师提供了新的教学视角和工具,可以帮助教师更全面地关注学生的成长。

这5个维度相互交织,共同构成了未来教学的丰富图景。在未来的教学中,教师不再是单一的知识传授者,而是学生学习的设计者、引导者和陪伴者;学生不再是知识的被动接受者,而是积极的知识建构者和问题解决者;教学也不再局限于物理空间,而可以拓展到线上线下融合的广阔天地。

总之,未来的教学,将是AI与教育深度融合的教学。在未来的教学中,学生能够享受到更加个性化、智能化的学习乐趣;教师能够借助AI的力量,实现更加高效、精准的教学;学校管理者能够通过AI提供的数据支持,做出更加科学、合理的决策。这不仅是一场技术的变革,更是一场教育理念的革新。

需要注意的是,AI很强大,但它终究是工具。教育的本质,仍是人与人的联结。

习近平总书记曾指出:“现在,一方面,有了智联网、人工智能,教育的工具和方法会发生变化,学生能力培养会有变化,这些正需要与时俱进地进行改革。另一方面,对于学生的启智、心灵的培养和基本的认知能力、解决问题能力的培养,是不能放松的。基本功还得有。”

是的,技术的进步并不意味着人类教师可以完全被取代。正如我们在书中反复强调的一样,AI不是来“抢”教师饭碗的,而是来为教师赋能的。当人机协作达到最佳状态时,才能真正实现教育质量的飞跃式提升。

注意,读者在探索本书内容时,可能会发现一些AI工具的界面与书中展示的界面不一致,这属于正常现象,建议读者理解功能意图,而非死记步骤,本书旨在为读者提供入门指导与思路启发。

资源与支持

本书由异步社区(https://www.epubit.com)出品,社区为您提供相关资源和后续服务。

提交勘误

作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。

当您发现错误时,请登录异步社区,按书名搜索,进入本书页面,点击“发表勘误”,输入勘误信息,点击“提交勘误”按钮即可(见下图)。本书的作者和编辑会对您提交的勘误进行审核,在确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。

与我们联系

本书责任编辑的联系邮箱是liuyasi@ptpress.com.cn。

如果您对本书有任何疑问或建议,请您给我们发邮件,并请在邮件的标题中注明本书书名,以便我们更高效地做出反馈。

如果您有兴趣出版图书、录制教学视频,或者参与图书的技术审校等工作,可以给我们发邮件。

如果您来自学校、培训机构或企业,想批量购买本书或异步社区出版的其他图书,也可以给我们发邮件。

如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接通过邮件发给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。

关于异步社区和异步图书

“异步社区”(https://www.epubit.com)是由人民邮电出版社创办的IT专业图书社区。异步社区于2015年8月上线运营,致力于优质学习内容的出版和分享,为读者提供优质学习内容,为作译者提供优质出版服务,实现作者与读者的在线交流互动,实现传统出版与数字出版的融合发展。

“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书品牌,依托于人民邮电出版社计算机图书出版的积累和专业编辑团队,相关图书在封面上印有异步图书的Logo。异步图书的出版领域包括软件开发、大数据、人工智能、测试、前端、网络技术等。

第1章 教学中常用的AI工具

1.1 综合类——必须掌握的AI工具

综合类AI工具是指以文本处理与生成为核心能力,同时整合多种功能的智能平台,其常用于写作、翻译、互动聊天等,以文生文功能为基础,同时附带一些其他功能。这一类AI工具的使用逻辑是:用户输入问题或需求,AI工具给出回答。

01 综合类AI工具

综合类AI工具有很多。其中,DeepSeek作为国产AI工具的领军者,与ChatGPT、文心一言等共同构成了当前最受瞩目的AI矩阵。接下来对这几个AI工具进行介绍。

① ChatGPT

AI工具的爆火是从ChatGPT开始的。作为AI领域的里程碑式突破,由OpenAI研发的ChatGPT自2022年11月问世以来,通过持续迭代已演进至GPT-5(截至本书完稿时)。这款现象级AI工具凭借其卓越表现,将人工智能生成内容(artificial intelligence generated content,AIGC)技术推向公众视野,在全球范围内掀起了AI应用热潮。ChatGPT的图标如图1-1所示。

图1-1 ChatGPT的图标

ChatGPT的优势有:功能全面,可以生成文字、图表、图片、代码,甚至视频;具有丰富的语言知识和对话背景,支持使用多种语言进行提问;生成能力强,理解能力强,互动和对话能力强。

② 文心一言

百度研发的文心一言是基于文心大模型技术的生成式对话系统,作为国产AI代表产品,其核心优势在于跨模态语义理解与强大的内容生成能力。与ChatGPT类似,文心一言支持智能对话、信息检索及多类型内容创作,在提升用户工作效率方面表现突出。文心一言的图标如图1-2所示。

图1-2 文心一言的图标

文心一言的优势有:在国产AI大模型中起步较早,综合能力较强,支持生成图片、表格、代码等多种类型的内容;插件功能丰富,延伸功能多,可生成思维导图、PPT等;内置各种场景和职业的提示词参考,用户使用方便。

③ DeepSeek

2025年初,DeepSeek在美国区苹果App Store中的下载量超越ChatGPT,引起国际上的广泛关注,国产AI工具开始真正爆发,DeepSeek成为AI行业热点。DeepSeek的图标如图1-3所示。

图1-3 DeepSeek的图标

DeepSeek AI大模型诞生于2023年,这款国产AI新星诞生于AI工具爆发发展后的红海市场,此时AI市场上各种文本、图片、视频类AI工具层出不穷,但DeepSeek却能凭借其核心文本推理能力,在众多AI工具中脱颖而出。

DeepSeek功能强大,在多个领域表现亮眼。它不仅能生成高质量文本,包括故事、诗歌和专业报告等,还能根据需求灵活调整创作风格和字数;其代码生成与调试能力突出,可高效辅助开发者编写代码、调试纠错;面对复杂问题,DeepSeek能深度思考与多步骤推理,清晰展示解决思路;同时,DeepSeek支持多模态交互,能够融合图文等信息,实现视觉问答与文档处理。

④ 其他综合类AI工具

除了ChatGPT、文心一言、DeepSeek,还有许多综合类AI工具,如表1-1所示。

表1-1 其他综合类AI工具

工具名称

开发者

简介

通义

阿里云

基于云计算和大数据技术的智能问答系统,深入融合大语言模型和检索增强生成技术,能够快速响应用户的查询,并提供准确、相关的答案;

具备文档和图片解析功能

腾讯元器

腾讯

基于腾讯混元大模型的智能体开发与应用平台;

提供丰富的插件体系、可编排的任务流程及多场景AI助手能力;

能够帮助用户构建智能问答、办公辅助、业务流程自动化等应用

Kimi

月之暗面

擅长长文档解读、超长文本处理(不超过200万字)、多格式文件解析

智谱清言

智谱AI

当前版本基于GLM-4.5模型,结合多模态交互与智能体技术,以通用对话的形式为用户提供智能化服务;

具备免费画图、长文档解读、数据分析、联网功能

豆包

字节跳动

支持语音转文字输入和多种音色的自然语音输出,同时允许用户定制个性化的智能体;

侧重轻量化应用,例如在办公场景下,可快速生成文档摘要、精准处理数据、提供各类写作模板、辅助生成会议纪要等

天工AI

昆仑万维

擅长多语言交流、知识查询;

场景细分,覆盖创作、办公、学习等多场景;

功能丰富,综合性强,支持代码编写、多语言翻译、PPT生成、专业问答等任务

Copilot

微软

应用于Microsoft 365,如Word、Excel等,向用户提供实时写作和编程建议。可利用GPT系列模型的自然语言处理能力,理解用户意图并生成相应内容

Claude

Anthropic

支持代码生成、数据分析、虚拟人交互,最新版本可通过API[1]实现计算机操作自动化(如文件管理、数据录入);

提供预设或自定义对话风格,以满足企业文档标准化或个人创作需求

[1] API:应用程序接口(application program interface),用于不同软件间的交互和通信。

02 为什么DeepSeek如此火爆

DeepSeek作为我国AI领域颇具代表性的产品,具备以下四大核心优势。

① 推理能力与成本优势

DeepSeek是深度求索公司推出的大语言模型系列,而DeepSeek-R1是DeepSeek 家族中专门优化推理性能的模型。作为推理模型,DeepSeek-R1的独特之处在于它不仅会向用户提供答案,还会展现推理过程,即推理用户的问题,展示其内部思考逻辑和信息关联过程,再总结出答案。

DeepSeek-R1的设计逻辑定位为“能力极强但需明确目标的员工”,即用户需清晰表达需求(如“用鲁迅文风分析2025春节档电影”),模型才可自主完成资料检索、逻辑梳理与风格适配。

更重要的是,DeepSeek相比OpenAI研发的同类模型,其API价格低得多,训练成本也大幅降低,这极大地推动了我国AI工具应用的普惠化。

② 技术突破,性能更强

在中文环境中,DeepSeek-R1模型的推理分析与文本创作能力远超同类模型。用户无须使用复杂的提示词,DeepSeek-R1模型就能按照用户的期望生成相应内容。

例如,用户只需给出像“按照苏轼的风格创作一首七言律诗”之类的简单指令,DeepSeek-R1模型就能创作出符合古典诗词格律、文风高度接近苏轼风格的作品。当然,也能模仿李白、李煜等古代名家的风格进行创作。

DeepSeek的文本生成能力不但能用于创作诗词,还能用于创作儿童故事,如“小熊阿布的诚实教育故事”,甚至能用于对学术概念进行解读,例如对“反身性”概念进行深入浅出的阐释。DeepSeek的这种能力大大降低了教师备课的创作难度。

此外,与通用型AI工具不同,DeepSeek聚焦于“专业领域认知增强”,从复杂问题拆解、行业知识积累、国产化适配这3个维度构建起竞争壁垒。其技术路径的选择,展现了开发者对AI价值落地的前瞻性思考,尤其是在高知识密度场景的工业化应用方面,DeepSeek正逐步成为行业的新典范。

③ 开放生态布局

DeepSeek-R1模型采用开源模式,吸引了全球开发者参与其生态建设,使其迅速在多个应用平台中具备了一定的社区影响力。

对开发者来说,DeepSeek提供了功能强大的API,能够轻松地被集成到现有系统中。例如,用户在搭建扣子智能体时,就可以调用DeepSeek的模型。DeepSeek的这一设计使得现有系统的开发难度和成本大幅降低,不仅让专业人士能够便捷使用,即便是普通用户在进行日常操作时也毫无压力,极大地优化了用户使用体验。

④ 出色的用户隐私与信息安全体系

在当前数据驱动的时代背景下,数据安全和隐私保护是用户极为关注的问题。DeepSeek在这两方面表现出色。

DeepSeek采用了多层次的安全防护机制,以保证用户数据无论是在传输过程中还是在存储过程中,都能得到充分、有效的保护。DeepSeek的服务器还配备了先进的防火墙以及加密技术,可以有效抵御黑客攻击,防止数据泄露。

除此之外,DeepSeek严格遵守相关的隐私保护法规,以确保用户的个人信息不会被滥用或泄露。用户还能够依据自身需求,设置不同的权限和访问控制策略,为数据安全提供更进一步的保障。DeepSeek对数据安全和隐私保护的重视,让用户在使用时更加安心,无须担忧数据安全问题。

总之,用户可以将DeepSeek想象成一个全能助理,这个助理既能帮用户写代码(其效率比普通程序员高很多),又能给孩子讲解数学题(自带解题步骤),还特别省钱(开发成本低于行业平均水平),这就是DeepSeek实现技术突破的体现。

那么,DeepSeek-R1模型在诞生之初,与其他AI大模型相比,其用户体验强在哪里呢?表1-2总结了DeepSeek-R1模型比较有代表性的用户体验优势。

表1-2 DeepSeek-R1模型比较有代表性的用户体验优势

优势

描述

过程

先推理,再给答案

结果

能给出详细的、具体的、可落地的方案

准确性

有一定参考依据,搜索模式下的答案有来源

风格

弱化了“AI感”和“机械感”,用户与其沟通会有与人沟通的真实感

03 DeepSeek基础操作

DeepSeek不仅功能强大,操作也非常简单,其操作步骤与其他AI工具无明显差异,只需按照“注册—登录—提问”的流程操作,就能使用。

具体来说,用户可通过以下步骤快速掌握DeepSeek的核心功能。

用户在网页端找到DeepSeek官方网站,注册和登录后即可进入主页,目前该平台可供用户免费使用。主页底部是提问区,提供【深度思考】、【联网搜索】和【上传附件】3项功能。

① 深度思考

用户在提问区选择【深度思考】即可切换至DeepSeek-R1模型,进入R1模式,如图1-4所示。此时,用户提出问题后,DeepSeek能够提供更具专业性和结构化的深度解析。

图1-4 DeepSeek的【深度思考】功能

R1模式特别适用于以下场景:

复杂逻辑推理(如数学证明、哲学思辨);

多步骤问题求解(如代码调试、学术研究方案设计);

专业领域分析(如金融建模、法律条款解读、医学文献综述编写)。

在R1模式下,DeepSeek将自动启用增强型知识图谱,通过多层注意力机制对问题要素进行关联分析,响应时间可能会延长,但输出内容的信息密度将显著提升并附带置信度标注。

② 联网搜索

用户在提问区选择【联网搜索】后,就能激活实时信息检索模块,使用【联网搜索】功能生成带有溯源标注的整合答案。该功能特别适用于追踪热点事件(如科技突破、政策变更)、获取实时数据(如金融市场动态、气象预警)或验证时效敏感信息(如法律法规修订),【联网搜索】功能应用示例如图1-5所示。

图1-5 DeepSeek的【联网搜索】功能应用示例

除此之外,移动端的DeepSeek支持语音交互与离线缓存,用户可以直接通过语音提问,操作更便捷。

③ 上传附件

用户在提问区右下角点击【上传附件】图标()后,可上传本地文档(支持PDF、DOCX、TXT等格式),DeepSeek将通过语义理解自动提取核心内容,并生成结构化摘要或定位用户关心的问题的相关段落。

此功能尤其适用于以下场景:

教学资料整合(如快速提取教案重点、跨文献对比分析);

学术论文精读(如自动生成研究框架、术语解释与参考文献溯源);

作业智能批改(如批量解析学生文档、定位逻辑漏洞或格式问题);

知识库管理(如企业或学校私有资料库的跨文件检索与知识关联)。

1.2 图片类——无须四处找课件素材

在之前的教学中,教师想要用一张图片作为课堂素材时,要么上网搜索,要么自己设计和绘制,无论采用哪种方式,都需要付出较大的时间成本。

而现在,通过AI工具,教师只需要下达一项指令,就能生成对应的图片。图片类AI工具实现了从文本到图片的跨模态生成。

01 常见的图片类AI工具

前文提到的文心一言、豆包、智谱清言等综合类AI工具都具备文生图功能,这里不赘述,仅对以图片生成功能为主的AI工具进行介绍。

① Midjourney

Midjourney作为全球知名的图片类AI工具,擅长生成具有艺术质感的超现实画面,它通过用户输入的英文关键词即可输出惊艳的视觉作品。Midjourney的图标如图1-6所示。

图1-6 Midjourney的图标

对比其他图片类AI工具,Midjourney生成的图片内容在质量上处于顶尖水平。除了基本的图片生成功能,Midjourney还向用户提供了丰富的编辑和定制选项,使用户能够对自己的作品进行进一步的完善、优化和转变。这种高度的灵活性和可定制性,使得Midjourney成为深受艺术家和设计师喜爱的创作工具。

Midjourney主要的功能特点有:快速生成图片,允许用户像使用调色板一样调整自己的作品。用户可以修改图片的颜色、形状,甚至选择自己喜欢的艺术风格,例如达·芬奇的细腻画风或者毕加索的立体主义风格。

② 通义万相

通义万相是由阿里云开发的一款先进的AI绘画创作平台,和“通义”是“一家人”,同为“通义大模型家族”成员,只不过通义万相的功能以图片生成为主。通义万相的图标如图1-7所示。

图1-7 通义万相的图标

通义万相主要的功能特点有:能依据用户对颜色、构图、背景等复杂细节的要求,生成风格各异、细节丰富的绘画作品,涵盖从写实到抽象、从古典到现代的各种艺术流派;具备基于已有图片进行衍生创作的能力,即图生图。图生图功能表现为用户上传一张参考图片后,通义万相能据此进行风格迁移、内容扩展、细节调整等操作。

③ 其他图片类AI工具

作为AIGC领域中极为重要的一个板块,图片生成AI技术已较为成熟,国内外也出现了许多各具特色的图片类AI工具。表1-3展示了几款目前较为成熟的其他图片类AI工具。

表1-3 几款目前较为成熟的其他图片类AI工具

工具名称

开发者

简介

可灵AI

快手

支持文生图、文生视频(清晰度最高可达1080p)、图生视频;

提供角色模型训练、首尾帧控制等功能,开放API服务;

新增对口型功能,支持真实/虚拟角色口型同步

即梦AI

剪映

(字节跳动)

强调“从文字到视频”的全流程创作,适用于短视频及故事创作;

支持文生图、文生视频、图生视频;提供智能画布与故事创作功能,集成社区以激发创作灵感

WHEE

美图

面向新手用户,提供预设风格模板,适合快速生成基础创意图像(如插画、海报),操作简单;

用户无须具备专业技能即可轻松编辑、拼图、制作证件照、设计海报等,实现创意表达与视觉内容创作

Stable Diffusion

Stability AI

强大的开源AI绘画工具,为许多其他AI工具提供技术支持,支持本地部署与模型自定义;

提供文生图、图生图、图片修复及视频生成等功能,自由度极高

Liblib AI

奇点星宇

基于Stable Diffusion的AI绘画模型资源平台,提供丰富的模型资源和图片灵感;

支持多种主题和风格,如建筑设计、插画设计、摄影、游戏等

一般来讲,这些工具都会提供使用手册与官方教程,并提供有限的免费体验机会。用户可以尝试自由地生成几张图片,通过实际操作感受这些工具的具体功能和内容生成效果。用户可以通过浏览、欣赏其他用户生成的图片以及对应的提示词来初步了解图片类AIGC技术。

图1-8展示了即梦AI的主页,可以看到,该工具主页展示了用户生成的丰富的图片内容,点击这些图片,还能看到用户使用的提示词。

图1-8 即梦AI的主页

02 基本操作

利用图片类AI工具生成图片的基本操作并不难,用户输入一段文字描述后,AI工具便能自动生成对应的视觉图片。这种生成方式的核心在于,用户需精准地向AI工具描述自己想要的图片画面和风格类型,考验的是用户“白描”的能力。下面将对利用图片类AI工具生成图片的基本操作进行简单介绍。

① 基础文生图

目前,综合类AI工具都能实现基础的文生图功能,如文心一言、腾讯元器、智谱清言、豆包等。

以豆包为例,我们在其对话框中直接输入“帮我生成一张关于XX的图片”,通常可在一分钟内得到对应的图片。图1-9是由提示词“帮我生成一群孩子在操场上踢足球的图片,全景,写实风格”生成的。

文生图功能是一种非常依赖提示词的功能。只有精心打磨提示词,较为精细地描述画面,才能让AI工具理解用户意图并生成符合要求的图片。

图1-9 使用豆包的文生图功能生成的图片

随着AI功能的不断完善,我们还可以尝试生成一些复杂的教学素材图片。例如,在智谱清言中输入“请根据二次函数方程y=-x^+x-10,x的取值范围为-10~10,生成一张二次函数图”,即可得到图1-10所示的结果。

图1-10 智谱清言生成的二次函数图

② 精细文生图

以即梦AI为例,我们通过浏览器注册并登录即梦AI后,在其主页顶部点击【图片生成】标签,然后在提示词输入框中输入文字描述即可,如图1-11所示。

图1-11 【图片生成】标签和提示词输入框

下面是进行精细文生图操作的步骤。

步骤1:输入精准提示词。

内容描述:在提示词输入框中用中文详细描述画面,例如“古风少女,穿着淡绿色汉服,手持团扇站在江南水乡的石桥上,背景有垂柳和乌篷船,夕阳暖色调,工笔画风格”。

图片画面的描述技巧可以参考这些元素:主体(人物/景物)+细节(服装/道具)+环境(场景/光影)+风格(如工笔画、胶片风)。描述越具体,生成的图片越精准。

用户在输入提示词、生成图片的过程中,也可通过导入参考图进行辅助:点击,上传类似风格的图片。当用户想让AI工具自由发挥时,可不提供参考图。

步骤2:优化参数设置。

模型:选择使用【图片2.0 Pro】,如需使用特定风格可切换模型。

图片比例:根据用途选择图片比例(如用于社交媒体推荐比例为3∶4,手机壁纸可选比例9∶16)。

步骤3:生成与调整。

点击,等待10~30秒,一次可输出4张预览图。

若对生成的图片不满意,可在图片右侧的图片编辑区中点击【细节修复】和【局部重绘】等,如图1-12所示,或修改提示词以增加细节(如“增加水面倒影”)。

图1-12 图片编辑区

③ 智能画布

部分AI工具还具备智能画布功能,即用户可以先用“画笔”描绘轮廓或形状,AI工具再根据用户描绘的轮廓形状生成图片,这样生成的图片内容更为精准。

以即梦AI为例,进入即梦AI主页后,点击主页左侧导航栏中的【智能画布】,即可进入画布操作区,如图1-13所示。

图1-13 即梦AI智能画布

在画布操作区可以进行如下操作。

步骤1:设置画布。

点击【新建】,在上方操作区选择画笔进行描绘。用户还可以上传参考图(可选),也可以拖曳本地草图或灵感图片至画布。

步骤2:核心创作。

绘图完成后,可在左侧选择【文生图】或【图生图】功能,进一步描述想要生成的图片内容。描述完成后,点击底部的【生成】即可生成对应的图片。在右上角的【图层】里,可以看到4张图片的缩略图,如图1-14所示,选择合适的图片后,点击右上角的【导出】,即可将之保存到本地设备。

图1-14 生成的4张图片

1.3 图表类——快速生成各类图表

思维导图、流程图、树状图、条形图等,都是课堂上常涉及的图表类型。现有的AI工具已经可以做到在用户对AI工具输入文字指令后的短短几秒内生成图表。

01 图表类AI工具

目前,通用的AI工具基本上都有文生表功能,包括文心一言和ChatGPT,这里不赘述,仅介绍以生成图表功能为主的AI工具。

① 知犀思维导图

知犀思维导图是一款集成AI技术的效率工具,其优势在于可以用自然语言指令自动生成结构化思维导图。知犀思维导图的图标如图1-15所示。

图1-15 知犀思维导图的图标

知犀思维导图以生成思维导图为主要功能,附带散点图、流程图、鱼骨图等类型的图表生成功能。用户输入主题或关键词后,知犀思维导图会自动分析语义逻辑,生成多层节点并智能优化布局与配色。例如,输入“科幻故事框架”,该工具即可快速生成包含世界观、角色设定等分支的完整思维导图。

知犀思维导图主要的功能特点有:图表类型丰富,模板丰富;支持文档智能转换功能,可将Word文档、PDF文件或图片中的文字直接提炼为思维导图;自动翻译外文内容,可大幅提升学习笔记整理、项目规划等的效率。

②Xmind AI

Xmind AI是Xmind推出的智能增强功能模块,结合了AI技术,为用户提供更为智能、高效的思维可视化解决方案。

利用Xmind AI,用户可以通过自然语言输入快速生成思维导图,减少手动创建节点和连线的工作量。Xmind AI能够识别并解析用户的意图,智能推荐相关的主题分支、连接关系以及合适的图标、标签等元素,从而提高用户思维梳理的速度和质量。Xmind AI的图标如图1-16所示。

图1-16 Xmind AI的图标

Xmind AI主要的功能特点有:AI辅助思维导图创作,可在数秒内自动生成一整张完整的思维导图;支持多人实时协作和编辑思维导图;可以生成可视化报告;可以添加图片、文字、图标等多种元素。

③ 其他图表类AI工具

图表类AI工具非常丰富,功能也各有侧重。常见的其他图表类AI工具如表1-4所示。

表1-4 常见的其他图表类AI工具

工具名称

开发者

简介

百度文库

AI助手

百度

可生成思维导图,支持读取文档;

支持通过输入文本自动生成PPT结构框架,智能匹配图文素材,提供语音输入与排版优化功能,适用于教育培训、企业汇报等场景

TreeMind

树图

上海聚石塔网络科技

提供智能思维导图制作工具和丰富的模板,支持思维导图、逻辑图、树形图、鱼骨图、组织架构图、时间轴、时间线等

Sheet Chat

Refector

支持智能创建和编辑表格,可以生成图表、翻译内容,甚至可以通过表格进行对话,获取洞察和帮助

MindMaster

亿图软件

结合AI的思维导图工具,提供模板库,提供OCR[2]文字转换、项目规划框架生成等功能,支持与Office文档双向联动

[2] OCR: 光学字符识别(optical character recognition)。

02 操作方法

① 基础操作——文生表

借助文心一言、智谱清言等综合类AI工具,可以生成部分简单的图表。例如,我们在网页端登录文心一言,输入提示词,就能得到对应的表格形式的内容,如图1-17所示。

图1-17 使用文心一言的文生表功能生成的表格

如果有现成的文字内容需要整理成表格,如学生成绩分布信息,可以直接将这些信息复制到AI工具的对话框中(或以文档形式上传),并加上一句“请帮我将以上/以下内容整理成表格”,就可以得到一份比较清晰的表格。

除此之外,我们还可以直接上传包含数字信息的某些适合制作成表格的内容(图片),让AI工具读取其内容并将其整理成表格。如图1-18所示,我让AI工具将我提供的电子发票信息整理成一个表格。

图1-18 AI工具根据文本生成表格示例

② 精细化操作——生成各类图表

当前的AI工具各有所长,因此我们将介绍多款AI工具的操作。

➢ 文心一言——条形图+饼状图+折线图。

假设要生成关于学生成绩分布情况的图表,教师可以将基础数据信息(如班级学生成绩情况)输入文心一言,结合文心一言的智能体功能,让文心一言生成一个成绩分布条形图。

操作步骤可以分为两步:选择智能体+输入提示词。

在主页面左侧导航栏的上方【更多】菜单下,找到【智能体广场】,即可看到多种智能体,找到【E言易图】,点击后进入该智能体的提问界面。输入提示词“以下是五年级同学的语文成绩分布情况,请你根据这些情况帮我生成一个条形图。60分以下—3人,60分~69分—9人,70分~79分—13人,80分~89分—23人,90分~95分—11人,95分以上—3人。”然后就能得到条形图,图1-19所示。

图1-19 文心一言生成的条形图

在此基础上,我们可以继续追问,如“请将以上条形图改成饼图”“请将以上条形图改成折线图”等,就可以得到对应的图表,如图1-20所示。总体而言,使用文心一言生成图表的操作简单、便捷,但需要用户提出清晰的需求。

图1-20 文心一言生成的饼图和折线图

总之,在文心一言中生成图表的操作可以总结为:使用【E言易图】+精细化的图表数据描述。

➢ 知犀思维导图——各类导图。

我们以知犀思维导图为例,来演示如何生成思维导图。在PC(personal computer,个人计算机)上通过浏览器访问知犀思维导图官方网站,注册并登录后,在主页可以看到两种操作方式:【开始新建】和【知犀AI生成】,如图1-21所示。

图1-21 知犀思维导图的两种操作方式

【开始新建】用于非AI操作的思维导图类的创建和编辑,其功能更加丰富,操作也不复杂,用户可以选择合适的图表类型(如气泡图、鱼骨图等),并填充对应的文字来生成相应图表。这种操作方式操作灵活,还可以一键更换图表类型和风格。

【知犀AI生成】是针对图表生成的AI操作,用户点击【知犀AI生成】后可以看到4个选项:【一句话生成】【文档总结】【图片转导图】和【链接总结】。其中,【一句话生成】适用于仅有较为模糊的思维导图想法的场景,【文档总结】适用于已具备思维导图内容的场景,【图片转导图】适用于需要提取图片内容并生成思维导图的场景,【链接总结】适用于需要对网页内容进行总结并生成思维导图的场景,如图1-22所示。

图1-22 【知犀AI生成】的选项

例如,用户点击【一句话生成】后,在对话框中输入“生成关于八年级历史(上)的考试重点图”,就能看到AI生成的思维导图了,如图1-23所示。用户可以直接在AI生成的思维导图上进行修改,增加或删减内容,还可以在右侧的编辑区切换思维导图风格和思维导图结构,既方便又快捷。

图1-23 AI生成的思维导图(截取部分,未指定教科书版本,仅用于AI工具功能展示)

可以发现,使用【一句话生成】功能生成的思维导图,不需要用户进行详细的内容描述,AI就能补充具体的内容,这不仅能节省用户制作思维导图的时间,还能拓展用户关于某个关键词或知识点的思维,具有“知识图谱”的作用。这一功能不仅适合教师使用,也适合学生进行知识点的联想与记忆。但该工具目前仍具有一定的局限性:以思维导图类图表为主要图表,暂不支持其他类型的图表,如流程图、饼状图等。

➢ Kimi——流程图。

目前Kimi支持绘制多种图表,但需要用户进行较为清晰的图表描述并使用特定的格式语言,相比其他AI工具会稍显复杂。这里仅演示Kimi的流程图生成操作。

我们以“如何用即梦AI生成数字人”的流程为例,使用Kimi生成流程图。在浏览器中搜索Kimi,注册并登录后,在其主页的对话框中输入以下提示词,便可以得到图1-24所示的流程图。

请帮我绘制一个流程图,用Mermaid输出,内容如下。

1.**登录即梦平台**:

-访问即梦AI官方网站。

2.**进入数字人生成界面**:

-点击首页顶部“数字人”按钮,进入数字人生成界面。

3.**导入角色图片**:

-导入想要开口说话的“角色图片”,可以直接本地上传自有的图片,也可以导入即梦AI生成的图片(画面中尽量只有一个角色)。

4.**输入数字人说话的内容**:

在文本输入框中,填写数字人需同步表达的说话内容。

5.**上传或选择系统内置的音频**:

-可上传录制好的音频,也可选择系统内置的音频。

6.**生成数字人**:

确认没有问题后,点击“生成”按钮。

图1-24 Kimi生成的流程图

Kimi生成图表的局限性在于,如果用户描述不精准,或者没有使用特定的表格生成格式语言,那么Kimi就可能显示“无法直接生成图表”,或者出现生成的图表内容不准确的情况,甚至会出现输出内容不稳定的情况,这就对用户的描述能力提出了更高的要求。

1.4 PPT类——做课件再也不用套模板

你以前是如何制作教学课件的?

是不是要花半个小时找PPT模板?找到模板后,还需要根据教学内容进行调整和修改,如插入文字、图片、图表等,然后花一个小时来调整风格和布局?

于是,制作一节课的课件,你可能需要一天,若换一门课程,你又要从头开始,找模板……

现在,有了AI工具后,教师们制作课件,再也不用到处找模板,AI工具就能够直接生成课件!

01 PPT类AI工具

前文提到的文心一言、讯飞星火等综合类AI工具都可以借助插件功能生成PPT,这里不赘述。本节仅介绍以生成PPT功能为主的AI工具。

① Ai PPT

AiPPT是一款典型的PPT类AI工具。用户只需输入主题关键词或概述演讲内容,AiPPT便能在短时间内自动生成一套完整且结构严谨的PPT。AiPPT的图标如图1-25所示。

图1-25 AiPPT的图标

AiPPT主要的功能特点如下。

操作简单,支持一键生成PPT,还支持根据特定内容生成PPT。

AiPPT生成的PPT不仅涵盖相关的文字叙述、数据图表,还包含丰富的视觉元素与设计布局,确保内容与形式的和谐统一。

支持多种文档格式的上传,无论是Word文档、Excel数据表还是PDF报告,都可以作为AI工具生成PPT的原始素材。

② Gamma

Gamma是一款较为领先的AI驱动型PPT生成工具,它将复杂的PPT制作过程转化为简单的操作步骤,为用户提供了一个快速、高效的PPT创建平台。Gamma的图标如图1-26所示。

图1-26 Gamma的图标

Gamma主要的功能特点如下。

模板丰富:内置多种PPT模板和设计风格,涵盖各种主题和场景,如商务、教育、科技、创意等,用户可以根据自己的需求选择合适的模板和风格,使PPT具有专业的外观和布局。

设计出色:能够智能调整文字、图片的布局,保证每一页幻灯片都美观大方,省去了用户手动调整的烦恼。同时,支持内容输入自适应排版,用户只需聚焦内容输入,PPT排版美化可交给Gamma来完成。

快速生成:可以根据用户提供的内容自动生成PPT的标题、文字、图片和图表等元素,大大节省用户的时间和精力。同时,还提供多种快速生成PPT的方法,包括粘贴文本、主题生成、导入文件等,可适配多种使用场景。

③ 其他PPT类AI工具

除了AiPPT和Gamma,还有一些成熟的PPT类AI工具,这些工具各有特色与优劣。常见的其他PPT类AI工具如表1-5所示。

表1-5 常见的其他PPT类AI工具

工具名称

开发者

简介

WPS AI

金山办公

完整生成逻辑:输入主题→自动生成大纲→逐页创作图文内容;

多模态输出:可生成文案、匹配图片、绘制图表(如输入数据后自动生成折线图)

Tome Ai

Tome

提供个性化的PPT设计服务,支持快速生成PPT内容并对其进行优化,支持高度定制,能够灵活添加表格、动画、图片等各类元素

WPS灵犀

金山办公

集成于WPS Office中的AI助手,提供生成与编辑PPT的功能;

根据关键词推荐模板和段落,提供基础文案优化(如精简句子)建议

闪击PPT

长沙千泽盛信息技术有限公司

通过目录大纲快速生成PPT,支持程序自动排版。虽然目前只提供简约风格,但模板丰富

iSlide

艾斯莱德网络科技有限公司

PPT插件,提供海量模板、图标、设计工具,可一键优化布局与统一风格,提升制作效率

02 基础操作

无论使用哪种PPT类AI工具,用AI生成PPT的使用逻辑都是一样的,即输入提示词,等待生成。本节以AiPPT这一工具为例来讲解生成PPT和编辑PPT的步骤。

① 生成PPT

注册并登录AiPPT官方网站后,在其主页可以看到【AI新增PPT】【AI生成自由画布】【导入文档生成】等功能模块,如图1-27所示。

图1-27 AiPPT主页中的两个选项

点击【AI新增PPT】后,可以看到AiPPT支持【AI智能生成】【文档生成PPT】【导入PPT生成】【链接生成PPT】和【自由画布】这5种生成方式,如图1-28所示。

图1-28 AiPPT的PPT生成方式

点击【AI智能生成】后,就可以在对话框中输入提示词,例如“帮我生成一份关于四年级班主任的年终总结PPT”,然后可以看见AI工具开始运行,它会首先生成课件的基础框架,这个过程大概需要两分钟。

课件框架完成后,我们可以编辑、修改,也可以直接应用。然后点击底部的【挑选PPT模板】,选择适合场景风格的模板后,将其转化为PPT,整个等待过程大概需要3分钟。至此,一份基础的PPT就完成了,如图1-29所示。

图1-29 AI工具生成的基础PPT

总的来说,目前的AI工具一般可以提供表1-6所示的PPT生成方式。

表1-6 PPT生成方式

生成方式

适用场景

无内容生成

用户无须供任何具体内容或大纲,仅提供关键词或主题,AI工具便可自由发挥,生成整套PPT,并且会注重内容的连贯性和创新性

有大纲生成

用户提供完整的PPT大纲,AI工具根据大纲填充具体的幻灯片内容

根据文档资料生成

用户上传或输入已有的文档资料,AI工具分析并提取关键信息,自动生成对应的PPT,保留原文的逻辑结构和要点

根据思维导图生成

用户提供思维导图文件,AI工具根据思维导图的层级结构和内容,自动生成对应的PPT

② 编辑PPT

用户在生成PPT以后,如果对PPT的内容或者风格不满意,可以直接在AiPPT中进行编辑和修改。

在生成PPT后的界面,点击界面下方的【编辑】,即可进入编辑界面。在这一界面中可以进行快速更换主题、排版与编辑、扩写与简化内容、生成演示备注等操作,如表1-7所示。

表1-7 编辑PPT的几种操作

操作

描述

快速更换主题

轻松更换整套PPT的主题,无须逐页调整,快速实现整体视觉效果的统一

排版与编辑

根据提示词自动调整幻灯片布局,同时向用户提供便捷的编辑工具,使用户能够轻松调整幻灯片细节,如字体、颜色等

扩写与简化内容

智能分析幻灯片中的文字内容,根据提示词进行内容扩写或简化,帮助用户更精确地传达意图

生成演示备注

基于幻灯片内容生成详细的演示备注,为演讲者提供有力的支持

编辑完成后,将PPT保存到本地即可。除了AiPPT这一AI工具,WPS AI也支持智能化的PPT编辑美化功能,其PPT编辑美化界面如图1-30所示。

图1-30 WPS AI的PPT编辑美化界面

最后,给大家提供一个用AI工具生成高质量PPT的小技巧,即利用DeepSeek生成PPT的内容大纲和设计建议,然后用AiPPT生成PPT,最后进行编辑和美化。这样,便能得到一份拥有高质量内容和精美版式的课件,可以帮助教师节省大量时间。

1.5 搜索类——学术素材一搜就有

当用户开始使用AI工具制作内容后可能会发现,AI工具虽然可以高效、快速地生成内容,但生成的内容不一定准确,甚至有时候还会出现“凭空捏造”的情况。

例如,用户向某AI工具下达“请给我10个与教书育人相关的名人名言,并给出出处”的指令后,发现AI工具给出的部分答案是“合成”的,即某人并没有说过某话,这时,AI工具生成内容的真实性就需要用户进一步验证。

虽然AI工具生成内容的真实性有待验证,但AI工具在搜索内容方面仍具备明显优势。当用户需要准确的、有依据的内容,尤其是涉及数据、新闻、史实类内容时,便可以使用搜索类AI工具。

01 搜索类AI工具

前文提到的DeepSeek、文心一言、豆包等综合类AI工具,都可以进行AI搜索,这里不再赘述,以下主要介绍几个以搜索功能为主的AI工具。

① 秘塔AI搜索

秘塔AI搜索是一款前沿的搜索类AI工具,它基于大模型技术,通过深度理解用户的搜索意图,为用户提供无广告、高质量、结构化的搜索结果。秘塔AI搜索的图标如图1-31所示。

图1-31 秘塔AI搜索的图标

秘塔AI搜索主要的功能特点有:不仅可以提供简单的文字答案,还可以通过智能分析,将信息以思维导图、大纲和在线PPT的方式呈现给用户,让用户可以更加直观、清晰地理解并获取所需信息;具有多种搜索模式,用户可以根据需求选择【简洁】、【深入】或【深度研究】模式,以满足不同场景下的搜索需求。例如,用户需要快速获取基本信息时,可以选择【简洁】模式;需要深入了解某个主题时,可以选择【深入】模式;进行学术研究或撰写报告时,使用【深度研究】模式能提供更加详尽和专业的搜索结果。

② 天工AI

天工AI是一个综合类AI工具,集成了文本内容生成、图片生成、PPT生成、文档分析等多种功能,搜索功能只是其亮点之一。天工AI的主页如图1-32所示。

图1-32 天工AI的主页

天工AI的搜索功能深度融合了传统搜索引擎与生成式AI技术,能够基于对用户意图的精准理解,快速整合实时信息与结构化知识库,提供兼具时效性和准确性的搜索结果。天工AI搜索功能的核心优势在于,通过自然语言处理技术将碎片化信息转化为逻辑清晰的答案,并支持多轮交互式搜索,用户可通过与天工AI的对话逐步细化需求,天工AI则根据需求动态调整检索策略,实现从“关键词匹配”到“问题解决”的升级。

此外,天工AI的智能搜索覆盖学术研究、商业分析、生活服务等多元场景,不仅能直接回答复杂问题(如对比分析、数据推算),还能自动生成摘要、图表或代码,帮助用户高效获取整合后的高价值信息。

③ 开搜AI

开搜AI是一款面向大众的免费AI语义搜索引擎,它能够精准理解用户搜索意图,从学术文献、文档等多渠道整合信息,提供结构化答案。开搜AI还支持一键生成答案大纲、思维导图,并可以导出为Word或PDF文档,尤其适用于学术研究、职场分析和日常信息查询等场景。开搜AI的搜索界面如图1-33所示。

图1-33 开搜AI的搜索界面

开搜AI主要的功能特点有:展示部分搜索过程,与DeepSeek展示推理过程有异曲同工之处;有基础搜索和专业搜索两种类型,答案中包含图片、思维导图等多元内容;支持在生成的答案上进行编辑,如添加图片或二次问答,还支持将搜索结果转化为图文笔记或协同知识库,可以满足从大学生论文写作到企业决策分析的多维度需求。

02 操作技巧

用户在使用过搜索类AI工具后可以发现,相比于传统的搜索引擎,搜索类AI工具的优势体现为以下几点。

① 去广告,无干扰信息,搜索效率高。

传统搜索引擎的前两页搜索结果中存在很多广告,用户需要翻好几页才能找到有用的信息,搜索效率较差。

搜索类AI工具可以直接屏蔽广告和营销信息,用户所搜即所得。例如用户使用秘塔AI搜索来搜索“2025高考新政策”,搜索结果首页不会出现培训机构广告,而是直接显示相关文件和行业报告,数据来源也会标得清清楚楚,用户点击相关超链接就能跳转以进一步查看。

② 结构化信息整合,来源清晰。

搜索类AI工具能把零散信息整理成知识框架。例如用户使用天工AI搜索“碳中和”,其搜索界面左边栏会总结出技术路线、经济影响、国际案例等板块,右边栏会展示政策原文、知识点大纲、相关数据图表,甚至还能关联到最新论文。

以前,用户查资料可能需要打开多个网页做笔记,现在使用搜索类AI工具可大大提高效率,特别适用于查资料、写论文、做汇报。

③ 功能扩展,不只是搜索。

在基础搜索之上,搜索类AI工具还支持生成思维导图、时间线、知识图谱等,或导出结果至Word/PDF,以满足用户的深度研究需求,例如用户使用天工AI搜索“新能源汽车产业链”后,可一键导出包含上下游企业、技术瓶颈、政策节点的可视化图谱。

那么,用户应该如何使用好搜索类AI工具呢?

首先,操作上其实没有什么难度和门槛,只需要注册并登录搜索类AI工具官方网站,进行提问即可。

其次,用户要想搜索到合适的答案,关键在于用检索式思维向AI描述问题。这类描述不同于一般的对话和长段落,而应提炼核心关键词,组成目的明确的检索语句。例如,使用秘塔AI搜索来搜索“学生因为考试成绩下降很受打击,我该怎么安慰他”时,这种描述就不如“有效安慰学生,让学生减轻应试压力的办法”这样目的明确的关键词组合搜到的结果精准。

最后,选择对应的搜索类型。例如,秘塔AI搜索提供了全网、文库、学术、图片、播客、工作流等搜索类型,用户在使用该工具搜索时,应根据搜索内容选择不同的搜索类型,这样可以搜索到更精准的内容。

1.6 视频类——课堂也可以如此好玩

以前制作一个视频,需要完成撰写脚本、拍摄、剪辑等多个复杂操作,现如今,视频类AI工具能够直接将用户输入的文字或图片信息转化为生动、逼真的视频,省去了构图、灯光布景等传统视频拍摄的烦琐工作。

尤其是对教师群体来说,可将某些课堂知识点、某些抽象的理念,通过视频的形式展示给学生,从而让课堂更生动、更好玩。

01 视频类AI工具

目前,豆包、智谱清言、文心一言、通义等AI工具都具备基础的文生视频功能,能满足用户相对简单的视频生成需求。这里介绍一些以生成视频功能为主的AI工具。

① 剪映

剪映是一款功能全面的视频编辑工具,由抖音推出,旨在帮助用户轻松剪辑和创作视频。在“短视频”时代,很多抖音用户选择用剪映创作视频。剪映的图标如图1-34所示。

图1-34 剪映的图标

在AIGC的浪潮下,剪映率先增加了AI功能。剪映不仅支持一键成片、视频文案生成、AI剪视频、AI配音等功能,还支持文生视频以及简单的数字人功能,可以满足用户基础的视频创作需求。

剪映主要的功能特点有:玩法多样,且对应抖音的潮流玩法,可以匹配各种网络热梗和热门背景音乐等;操作简单,AI剪视频和图文成片功能操作都较为方便、快捷,但目前只能生成较为简单的视频画面;多数功能都免费,综合功能强大,更新快。

② Sora

Sora是由OpenAI研发的一款开创性视频类AI工具,它的出现标志着AI技术在视频内容创作领域实现了重大突破。自发布以来,Sora以其独特的功能特性与强大的生成能力,引发了全球各行业用户的广泛关注与热烈讨论。Sora的图标如图1-35所示。

图1-35 Sora的图标

不同于传统的视频合成技术,Sora能够根据用户提供的文字、脚本生成连贯、多镜头的视频内容,也就是用户只需输入详细的文字描述或故事脚本,Sora即可将文字或脚本转化为生动的视频画面。Sora生成的视频画面如图1-36所示。

图1-36 Sora生成的视频画面

Sora主要的功能特点有:生成的视频可精确再现物体间的动态关系、光影效果以及环境变化等高度拟真的细节;相比其他视频生成工具目前仅支持生成数秒视频长度的视频,Sora生成的视频长度可达1分钟以上。

③ 其他视频类AI工具

目前常见的视频类AI工具的功能主要集中在视频生成和视频编辑这两个领域,由此诞生了许多各具特色的工具,如表1-8所示。

表1-8 常见的视频类AI工具

工具名称

开发者

简介

Runway

Runway AI,Inc.

支持文本生成图片、视频局部无损放大、动态追踪、智能调色等

可灵AI

快手

支持文生图、文生视频(清晰度可达1080p)、图生视频;

提供角色模型训练等功能,开放API服务;

新增对口型功能,支持真实/虚拟角色口型同步

即梦AI

字节跳动

强调“从文字到视频”的全流程创作,适用于短视频及故事创作;

支持文生图、文生视频、图生视频;

提供智能画布与故事创作功能,集成社区以激发创作灵感

元镜

智灵动力(北京)科技有限公司

支持一句话生成视频,用户输入简短描述,元镜AI即可自动完成分镜、素材匹配等流程,实现零门槛高效创作;

提供定制元素与多风格模板,可上传品牌专属元素,支持卡通风、中国风等多种风格

Stable Video

Stability AI

提供图生视频和文生视频功能,支持对生成视频的参数编辑

万彩微影

广州万彩信息技术有限公司

支持AI自动生成动画短视频,提供大量短视频模板;

企业及个人可以高效、快速、智能地制作短视频作品

一帧秒创

新壹(北京)科技有限公司

支持图文转视频;

通过快速识别语意、划分镜头与匹配素材,1分钟左右便可生成视频;

支持智能数字人、智能配音

02 基础操作

下面以剪映为例,介绍文生视频的基础操作。

① 剪映的AI功能

以移动端的剪映为例,用户在注册和登录剪映后,在其主页上方可以看到如下AI功能。

AI剪视频:根据用户本地素材,智能剪辑视频并配上旁白。

AI图文成片:可以根据文字描述或者主题关键词,智能生成文案,再生成视频。适用于生成简单的视频。

一键成片:可以将手机上的照片、视频等直接上传到剪映,剪映智能识别后,会配上合适的背景音乐和滤镜并自动剪辑成片。

AI故事成片:适用于生成小说、故事类题材的视频,用户可上传文案或字幕(也可智能生成),剪映根据内容生成视频。

营销视频:适用于生成商品推荐类视频。剪映可以根据用户提供的素材(照片、视频等),自动生成商品文案,再生成视频。

其他AI功能:如AI作图、AI视频翻译、数字人等延伸性AI功能。

② 剪映生成视频的操作步骤

这里主要为大家介绍【营销视频】和【图文成片】的操作步骤。

【营销视频】的操作步骤如下。

在剪映移动端主页找到【营销视频】功能按钮,如图1-37(a)所示,点击后用户需要进行如下操作。

第一步,添加素材。添加与商品相关的视频素材等,可以添加多个视频素材,视频素材的总时长需要超过10秒。

第二步,选择推广类型。在【商品推广】和【门店推广】中进行选择,假设选择【商品推广】。

第三步,描述商品。可以简要描述商品名称、商品卖点、适用人群、优惠活动等。

第四步,选择视频效果并设置参数。根据需求选择是否开启“效果增强版”,然后点击【补充更多】,可以设置视频尺寸、时长、口播文案(支持提取上传视频中的文案)等,如图1-37(b)所示。

图1-37 营销视频生成功能

第五步,点击底部的【开始生成】,大约等待1分钟就可以生成视频。视频生成后,我们还可以进行二次编辑和修改,包括编辑和修改画面时长、字幕台词、特效、配乐等。

【图文成片】的操作步骤如下。

在剪映移动端主页找到【图文成片】功能按钮,点击后即进入图1-38所示的创作界面。

图1-38 图文成片创作界面

第一步,选择编辑文案方式。这里有3种选择,一是手动输入文案;二是导入链接(支持头条、抖音、西瓜视频的链接),系统自动提取文案;三是AI生成文案,即系统自动生成文案。这里我们选择【AI生成】。

第二步,生成文案。在文案创作界面(见图1-39),用户可在对话框内输入关于视频文案的想法(如主题、核心观点、风格等),系统会生成适配的文案内容;也可点击【主题生文】,系统会提供“情感关系”“励志鸡汤”“美食教程”“旅行感悟”“家具分享”“生活记录”等多种常见的视频类型,用户可以根据需求选择对应的主题后输入关键词,系统也会生成契合主题与关键词的文案。

图1-39 文案创作界面

第三步,确认文案。用户可浏览系统生成的文案。如果不喜欢,可点击【智能修改】按钮,对生成文案进行润色、扩写、缩写等。如果喜欢,可点击【应用】按钮。

第四步,匹配素材并设置参数。用户可选择【智能生成】,即系统根据文案内容来生成视频素材;也可选择【相册上传】,即手动添加本地的视频或图片素材。同时,用户还需要根据需求设置视频配音的风格和视频比例,设置参数界面如图1-40所示。

图1-40 设置参数界面

第五步,生成视频。视频文案、素材和参数确定后,点击底部的【生成视频】按钮,系统就开始生成视频,整个过程需要等待1分钟左右。在系统生成的视频基础上,我们可以进行二次剪辑,如添加画面素材、编辑文本内容、修改背景音乐等。

【图文成片】的优点在于智能化程度较高,用户可以不用准备文案甚至视频素材就可以生成视频;缺点是生成的视频的质量一般,部分画面是图片轮播式画面,画面的鲜活感不够。

1.7 智能体——用教师“分身”和学生对话

智能体(agent)是一种利用AI技术实现的软件程序,它能够在特定的环境或情境中自主地或交互地执行任务,最终达到特定的目标或解决特定的问题。

简单来讲,可以把智能体视为一种拥有某一专长,可以解决特定问题的智能助手。在教育教学领域,智能体可以辅助教师进行教学活动,提高教学效果,实现个性化教育,例如“家庭教师智能体”“语文学习小助手”,或是模仿李白创作风格的“李白智能体”。

智能体可以帮助用户实现定制化的AI功能。例如,我们在豆包的搜索框中搜索“作文”这类关键词,就可以看到多个跟作文学习相关的智能体,选择其中一个,就可以与之进行对话,在对应的对话场景中已经预设了与作文相关的功能与内容,操作起来简单、方便。豆包中的“作文”“作文修改”相关智能体如图1-41所示。

图1-41 豆包中的“作文”“作文修改”相关智能体

01 普通AI工具与智能体的区别

普通AI工具与智能体的区别如表1-9所示。

表1-9 普通AI工具与智能体的区别

普通AI工具

智能体

任务处理能力

单线程处理简单任务(如文本生成/图片生成二选一)

多模态协同处理综合性任务(如同时生成文案+设计+排版)

领域适用性

通用型解决方案(如问答、翻译等基础功能)

更适合处理特定领域和主题的问题;

垂直领域专家(如法律文书撰写、心理咨询疗程设计)

用户针对性

面向广泛用户群体,涵盖各行各业

精准服务特定人群,有一定针对性,如针对心理咨询领域、针对法律领域等

交互

模式

需精确输入指令

支持模糊需求解析+主动追问澄清

持续学习能力

依赖系统等级更新

具备会话记忆与个性化调适能力

我们可以通过一个案例来感受普通AI工具与智能体的区别。例如,假设用户需求为:生成一个班级植树节活动的海报,要包含精美背景图片、活动信息、扫码报名等内容。

使用普通AI工具的处理流程可能为:用Midjourney生成海报背景图→用DeepSeek撰写活动信息→用Photoshop合成图文,添加二维码→人工整合各环节成果。此流程还可能存在风格不统一、细节冲突等问题。

使用智能体的解决方案可能为:用户输入活动主题关键词与关键活动信息,添加二维码,然后等待智能体直接生成一张完整的活动海报。

因此,如果用户想解决单一性问题,直接使用普通AI工具会更方便,如果面临的是综合性任务,或者特定领域的问题,使用智能体会更合适。

02 智能体搭建平台

随着AIGC技术的持续发展,个人用户现在也能通过易于使用的智能体搭建工具和平台,根据自己的需求定制个性化的智能体。这里为大家介绍几个能提供智能体搭建服务的平台。

① 扣子

扣子(英文名为Coze)是由字节跳动推出的AI聊天机器人开发平台,它让用户能够轻松地打造和部署个性化的聊天机器人,用户无须编程。这个平台的特点是操作简单,适合所有人使用。扣子的界面如图1-42所示。

图1-42 扣子的界面

扣子内置超过90种插件,涵盖了新闻、旅行规划、职场工作等多个应用场景,让机器人的功能更加丰富。用户可以根据自己的需求,像搭积木一样为机器人添加新功能。扣子还提供了工作流、知识库等高级功能,使得机器人能够与用户进行数据互动,并且具备长期记忆能力,能够记住对话内容,提供连贯的个性化服务。

在扣子的主页面中,我们可以看到其他用户创建的各种智能体,例如一键生成表情包的“表情包生成器”,研究养生之道的“张仲景”,可进行哲学讨论的“格物致知猫”。这些智能体主题多样,风格独特,展现了用户在搭建智能体时的创造力。

扣子还有一个特色功能——作品社区。在该商店中,用户不仅可以自己制作智能体,还能将它们分享到商店,供其他人使用。这种共享模式激发了社区的创造力,推动了AIGC技术的普及和应用。通过扣子,智能体的创造和使用变得更加便捷和有趣。

② 腾讯元器

腾讯元器是腾讯基于混元大模型打造的一站式智能体创作与分发平台。它致力于让用户无须编写代码即可快速创建功能丰富的智能体,并通过腾讯生态实现多场景分发,覆盖客服、教育、娱乐、金融等垂直领域,成为AI时代的应用开发新范式。腾讯元器的图标如图1-43所示。

图1-43 腾讯元器的图标

腾讯元器内置多种大模型,包括具备超强推理能力的DeepSeek-R1,可处理复杂任务规划与进行逻辑推理。此外,腾讯元器整合了图片创作、视频生成等工具链,支持开发兼具对话与视觉交互能力的智能体。

腾讯元器生成的智能体可一键发布至微信公众号、QQ、微信客服等腾讯全域渠道。以微信公众号渠道为例,用户通过授权过往文章构建知识库,即可打造24小时在线的智能客服,满足自动问答、用户引导等高频率需求,显著减轻人工运营压力。

③ GPTs

GPTs是由OpenAI基于ChatGPT开发的智能体工具,它允许用户根据自己的需求和偏好定制个性化的AI助手,其核心特征在于高度的可定制性。用户可以通过上传资料来训练GPTs,从而创建出符合个人或专业需求的AI助手。例如,用户可以使用GPTs开发一个专注于英语口语练习的机器人,或者一个能够提供创意灵感的写作伙伴。GPTs的图标如图1-44所示。

图1-44 GPTs的图标

使用GPTs不需要用户具备编程能力或深厚的技术背景。通过简单的步骤,即可创建一个专属的AI助理,并可将其应用于多种场景。目前,GPTs的使用权限仅限于ChatGPT Plus的订阅用户。OpenAI还推出了GPT Store,一个类似应用商店的平台,用户可以在上面分享自己创建的GPTs,甚至可能实现收益分享,为用户和OpenAI带来新的收入来源。

④ 智谱AI开放平台

智谱AI开放平台是由北京智谱华章科技股份有限公司推出的综合性AI大模型开放平台。它被称为“开放平台”,是因为其旨在为开发者和企业提供丰富的AI技术接口和工具。该平台通过集成多种AIGC技术,包括自然语言处理、语音识别、图像识别和机器学习等,使用户能够轻松地构建属于自己的AI应用,再将其集成到自己的应用程序和业务领域中。

智谱AI开放平台的应用场景非常广泛,包括智能客服、语音助手、内容审核、个性化推荐等。开发者和企业可以利用这个平台,快速开发出具有竞争力的AIGC产品和服务,推动业务创新和智能化升级。智谱AI的图标如图1-45所示。

图1-45 智谱AI的图标

03 搭建智能体的基础操作

教师可以搭建属于自己所在学科的智能体,并将其应用到教学中。例如,小学班主任可以通过搭建以自我形象为原型的师生交流智能体,让学生在智能体中与“自己”对话、咨询问题,而“自己”则可以解答疑惑等。

接下来,我们以扣子为例,讲解智能体的搭建步骤。基础的智能体搭建,可以分为以下几个步骤。

第一步,注册与创建。

访问扣子的官方网站,完成注册流程。注册成功后,登录进入扣子的管理界面。

在管理界面中,点击左上角的【+创建】选项,在打开的界面中选择【创建智能体】,如图1-46所示,进入创建流程。

图1-46 选择【创建智能体】选项

为智能体设置一个简洁明了且具有辨识度的名称,方便后续管理和使用,这里设置为“初中英语小达人”。同时,在【智能体功能介绍】中,可以添加一些简要的描述,说明智能体的主要功能或应用场景。

完成后,点击【确认】,系统将创建一个基础的智能体。

因此,在开始搭建智能体之前,首先要想清楚我们希望智能体完成的任务(如帮助本学科学生提高成绩),也就是它需要执行的功能(如英语口语对话练习、知识点测试或作业提交等)。明确需求有助于选择合适的智能体插件和功能,并有助于指导后续的设计和开发。

第二步,细化描述。

对设计智能体来说,最重要的还是描述好功能、设计好提示词。

完成上一步后,即可进入图1-47所示的扣子的智能体编辑界面,在这个界面中我们要进行进一步的细化设置。

图1-47 扣子的智能体编辑界面

在左侧的【人设与回复逻辑】界面,用户可以根据自身需求仔细调整与设计智能体的功能、限制甚至性格。设计智能体的提示词,可以从“人设”“功能”和“约束”3个方面着手。

人设。

为智能体设定明确的角色和职责,是设计提示词的第一步,也是最关键的一步。

这涉及智能体的身份设定,例如它是英语小达人、古诗词小助手、心理学专家等;或让智能体扮演某一著名人物,如李白、鲁迅、乔布斯等;或赋予智能体某一性格特质,如开朗、沉稳、可爱等。这些设定将指导智能体的回复风格和内容。智能体的人设三大角度如图1-48所示。

图1-48 智能体的人设三大角度

确定“人设”,可以从“角色扮演”这个维度来编写提示词。提示词示例如下。

你是一位热情的新闻播报员,专注于用生动有趣的方式介绍各类新闻。

你是一个英语小达人,精通初中英语的学习技巧。

功能。

设计好智能体的人设后,便要详细设计智能体具备的功能或工作具体流程,这将直接影响用户实际使用智能体时的操作体验。智能体功能的提示词示例如下。

你具备如下功能。

功能1:英语口语对话

1.能够用标准的英式口音与用户进行自然对话。

2.根据用户提供的对话内容,进行话题延伸,激发用户的表达兴趣。

功能2:英语测试题生成

1.基于课程要求和用户需求,生成对应的英语测试题,用于用户自测,从而分析自己的知识点掌握情况。

2.能够帮助用户形成错题集,从而查漏补缺。

功能3:英语词汇扩充

1.为用户提供关于某些方面的词汇,形成知识图谱。

2.设置每日词汇打卡练习,生成关于词汇量的评分。

约束。

为了避免智能体提供不相关或不准确的信息,需要约束智能体回复的范围。这包括明确指出智能体应该回答的问题类型,以及在什么情况下应该拒绝回答。通过这种约束,可以保证智能体的专业性,避免误导用户。对智能体进行约束的提示词示例如下。

只提供与英语学习相关的内容,拒绝回答其他干扰性问题。

所输出的内容必须按照给定的格式进行组织,不能偏离框架要求。

此外,对于功能复杂的智能体,推荐使用结构化格式来编写提示词,以增强可读性和对智能体的约束力。结构化提示可以使用Markdown语法,以清晰地组织不同功能和对应的操作指令。例如,初中英语小达人智能体的提示词可以设计如下。

# 角色

你是一个专业的英语小达人,专门帮助初中生用户提高英语水平,擅长英语口语交流。

## 功能

### 功能1:英语口语对话

1.能够用标准的英式口音与用户进行自然对话。

2.根据用户提供的对话内容,进行话题延伸,激发用户的表达兴趣。

### 功能2:英语测试题生成

1.基于课程要求和用户需求,生成对应的英语测试题,用于用户自测,从而分析自己的知识点掌握情况。

2.能够帮助用户形成错题集,从而查漏补缺。

### 功能3:英语词汇扩充

1.为用户提供关于某些方面的词汇,形成知识图谱。

2.设置每日词汇打卡练习,生成关于词汇量的评分。

## 限制

-只提供与英语学习相关的内容,拒绝回答其他干扰性话题。

-所输出的内容必须按照给定的格式进行组织,不能偏离框架要求。

第三步,配置核心功能。

除了基础描述,为了使搭建的智能体更实用、功能更全面,扣子还提供了许多其他功能,力图打造高质量智能体的用户应该深入探索并利用这些功能。

智能体的配置有很多,其中,知识库和功能模块是必须配置的。

配备知识库。

在智能体编辑界面的【知识】模块,为智能体配置知识库。根据智能体的应用场景,筛选和导入相关领域的知识数据。知识数据可以来源于公开数据集、专业书籍、网络文章等,还可以是用户上传的本地文本、表格或图片形式的内容,让智能体参考。形成关于智能体的知识库是很有必要的。以英语老师为例,无论是课本文档和知识点,还是用于日常练习的习题、试卷、学生情况分析等,都有必要上传到智能体的数据库中,这相当于为智能体赋予一定的知识储备。上传的内容越丰富,智能体的功能应用效果越理想。

用户需要对知识库进行分类和标签化处理,便于智能体在回答问题时快速定位相关知识点。用户也需要定期更新和维护知识库,确保智能体的知识储备始终处于最新状态。

设置插件功能。

包括扣子在内的智能体搭建平台大部分都会提供【插件】功能。借此,智能体便能够调用外部API。例如英语对话、搜索信息、生成图片等的API,以拓展智能体的能力和使用场景。扣子的插件选择界面如图1-49所示。

图1-49 扣子的插件选择界面

例如,若智能体需要实现语音交互,则需添加具备语音识别和语音合成功能的插件。

我们可以配置功能参数,如识别率、响应速度、工作流、开场白等。总之,技能配备得越完善,智能体越能满足不同场景的需求,用户的体验感就会越好。

第四步,测试与发布。

在完成智能体的配置后,在“预览与调试”界面,以用户视角与智能体进行对话,对智能体进行功能测试,检查智能体是否能正确回答问题、是否具备预期功能等。

扣子支持将智能体部署到豆包、飞书和微信公众号等平台。发布前,需确保对智能体进行了充分的测试,以避免在实际环境中出现问题。扣子的智能体发布界面如图1-50所示。

图1-50 扣子的智能体发布界面

预览与调试完成后,就可以将其分享给目标用户,同时需要持续关注用户反馈,收集意见和建议,根据用户需求不断优化智能体的功能、提升用户体验。

至此,一个具备基本功能的扣子智能体就搭建完成了。在实际应用过程中,可根据需求对智能体进行持续优化和升级,使其更好地服务于用户。

1.8 数字人——微课原来如此简单

数字人是一种基于AI技术创建的虚拟人,它能够通过语音识别和合成功能与人类进行交互,并在多种场景中替代人工进行工作。图1-51展示了知识网红秋叶大叔的数字人。

可以看到,当前在AI加持下的数字人技术,几乎可以做到以假乱真,在声音、形态等方面几乎与真人无异。

数字人技术有广泛的应用场景,包括客户服务、教育培训、娱乐互动、直播带货等。随着数字人技术及使用普及和使用成本的降低,教育行业的数字人应用将越来越广泛,教师也可以搭建以自我形象为原型的数字人来录制视频课程(微课),为课堂增加趣味,进一步拉近和学生之间的距离,实现更加“人性化”的教学。

图1-51 秋叶大叔的数字人

目前常见的数字人平台如表1-10所示。

表1-10 常见的数字人平台

名称

开发者

功能特点

局限性

万彩AI

广州万彩信息

技术有限公司

通过一张照片生成会说话的数字人;

支持自定义配音风格(多语言、方言);

适用于教学、营销等场景

免费版限制较多;

数字人动作较基础

剪映

字节跳动

支持文本驱动数字人视频生成;

可选择不同的数字人形象、音色、景别;

适用于短视频配音

数字人景别固定,无法动态调整;

有“AI生成”水印

闪剪

深圳市闪剪智能科技有限公司

数字人1∶1克隆(形象+声音);

照片数字克隆人(让照片开口说话);

支持直播快剪、数字人直播

高级功能需付费;

免费版有水印

即梦AI

剪映

(字节跳动)

支持“图片+音频”生成动态数字人;

可模拟演讲、唱歌、乐器演奏等动作

主要聚焦动态形象生成,功能较单一;

有“AI生成”水印

魔珐

有言

魔珐(上海)

信息科技有限公司

3D超写实虚拟人;

文字驱动动画(自定义动作、表情、场景);

多语言支持

免费版限制较多;

商用需订阅

下面我们以万彩AI为例,介绍数字人的生成。万彩AI中有两种方式可以生成数字人,即照片生成数字人和视频生成数字人。

01 照片生成数字人

使用照片生成数字人方式,操作比较方便、快捷,用户只需要上传本人照片就可以完成数字人的生成。

首先,在PC上登录万彩AI,在其主页中找到【AI照片数字人制作工具】,如图1-52所示。

图1-52 万彩AI的【AI照片数字人制作工具】

点击后便可进入图1-53所示的照片数字人编辑界面。

图1-53 照片数字人编辑界面

在该编辑界面,用户可以进行如下操作。

首先,上传带有脸部的图片。将光线清晰、背景干净的个人正面照片(脸部占比50%以上)上传至照片数字人编辑界面。如果用户不想使用个人照片,还可以选择虚拟形象,其中包括“真人形象”和“卡通形象”。

其次,上传音频或输入文字。用户可以选择上传用自己的声音录制的音频,也可以直接输入文字后选择平台自带的声音类型,如普通话女声、新闻男声等。前者的数字人的声音会更接近本人。

最后,点击【立即生成】,就能得到所需数字人了。

02 视频生成数字人

相较于用照片生成的数字人,用视频生成的数字人会更贴合人物形象,数字人状态更自然。

首先,在PC上登录万彩AI,在其主页中找到【AI数字人分身克隆(视频对口型)】,如图1-54所示。

图1-54 万彩AI的【AI数字人分身克隆(视频对口型)】

点击后便可进入图1-55所示的视频数字人编辑界面。

图1-55 视频数字人编辑界面

视频生成数字人的操作方式与上述照片生成数字人类似,只需要将照片替换成视频,在此不再赘述。

需要说明的是,目前该平台的部分功能只能会员使用。除此之外,大家也可以用剪映、即梦AI等工具来生成数字人,其基本操作相差不大。

1.9 那些好用的“AI神器”

除了以上列举的8类常见的AI工具,还有许多教师在日常工作中能够用到的极具实用性的AI工具。

01 文生音乐AI工具

在学校活动、课堂互动中,播放一首学校、班级甚至是个人专属歌曲,想象一下,会让人多么惊喜。

过去,想要制作一首专属歌曲,需要找到作曲人、制作人、演唱歌手,还需要配音、制作CD等,成本很高。如今,我们只需要用AI工 具,短短两分钟,就可以生成任何主题的歌曲,且几乎不需要付费。这里将为大家介绍几个能生成音乐的AI工具。

① Suno

Suno是一款基于AI技术打造的专业级音乐创作平台,用户可以通过简单的文本输入,在Suno平台上表达自己的音乐构思,无论是情感色彩、特定的音乐流派、艺术家风格,还是具体的旋律走向,Suno 都能够智能解析这些提示,并据此生成原创的音乐片段或者完整的歌曲结构。Suno 的图标如图1-56所示。

图1-56 Suno 的图标

Suno 主要的功能特点有:操作简单,只需要输入简单的提示词,就能快速生成两个版本的歌曲;支持对歌曲进行二次创作与编辑。

② 网易天音

网易天音是网易云音乐开发的一款一站式AI音乐创作平台。这个工具集合了多项AI功能,包括但不限于AI作词、AI编曲和AI演唱等核心模块。

用户只需输入简单的灵感关键词、情感基调、主题内容,网易天音就能够快速生成初步的词曲,且支持用户对生成的内容进行进一步的个性化调整和优化。网易天音的图标如图1-57所示。

图1-57 网易天音的图标

网易天音主要的功能特点有:提供丰富的音乐风格选项,用户可以一键选取不同的音乐类型,网易天音就能依据选定的风格完成专业的编曲工作。另外,网易天音也允许用户将生成的音乐作品一键导出和分享至多个社交平台。

③ 其他音乐类AI工具

除了Suno 和网易天音这两款成熟的音乐类AI工具,国内外还有许多工具与平台可供选择,其他常见的音乐类AI工具如表1-11所示。

表1-11 其他常见的音乐类AI工具

工具名称

开发者

简介

TME Studio

腾讯音乐娱乐集团

专业音乐创作与制作平台,整合了AI技术,赋能音乐创作者进行高效的音乐制作、混音、智能谱曲等操作

Mubert

Mubert Inc.

融合AI技术与专业音乐制作人的智慧,具有庞大的音乐素材库,内含数百万种音乐元素。生成的音乐是免版税的,可以自由地使用它们来制作视频、播客、广告、游戏等内容,无须担心版权问题

ACE Studio

时域科技

免费的AI音乐合成工具,让用户可以通过输入歌词和旋律来生成高度拟人化的歌声,提供实时合成和高品质输出功能,适合音乐爱好者和专业用户制作虚拟歌曲

BGM猫

北京灵动音

科技有限公司

在线背景音乐生成器,用户可以根据不同场景、风格和情绪标签,一键生成与之匹配的背景音乐,无须下载软件,在线即可完成定制化音乐的制作,尤其适用于视频制作、广告配乐等应用场景

Soundraw

SOUNDRAW Inc.

可以选择不同标签快速生成音乐,支持众多音乐流派、主题、音乐长度与旋律速度,免费生成次数不限

这些工具的功能各有侧重,包括专业的音乐编曲、自动化的歌声合成以及便捷的背景音乐生成等。这些功能极大地拓宽了音乐表达的可能性,降低了创作门槛,让音乐世界变得更加多元且触手可及。

02 办公类AI工具

在AIGC技术诞生前,办公会议工具就形成了一定的市场规模。而自ChatGPT等AI工具涌现后,曾经的办公会议工具纷纷自我突破、研发创新,积极融合AIGC技术,推出了许多结合自身特长的AI助手产品。表1-12展示了市面上常见的办公类AI工具。

表1-12 市面上常见的办公类AI工具

工具名称

开发者

简介

腾讯会议

AI小助手

腾讯

基于腾讯自研的通用大语言模型“混元”,覆盖会议全流程,能实时记录会议纪要、提炼议题,支持会后整理重点跟进事项,进而提升开会和信息流转效率

飞书妙记

字节跳动

通过语音识别技术将会议内容实时转换为文字,并生成会议纪要。支持多语种识别,能自动区分发言人,提供会议摘要和关键词提取功能

麦耳会记

思必驰科技股份有限公司

提供实时语音识别转写、关键词提取、会议纪要自动生成等功能。支持多种会议场景,如线上会议、研讨会等,并可与多种办公软件无缝对接

通义听悟

阿里云

提供实时录音记录、实时语音转文字功能,同时提供全文摘要、章节速览、发言总结等功能,以帮助用户高效“阅读”音视频内容。适用于会议录音记录、课堂记录、语音转文字等场景

讯飞听见

科大讯飞

基于科大讯飞领先的智能语音技术,实现会议内容的实时转写、翻译和摘要生成。支持多语种识别,提供丰富的会议管理功能,如发言人识别、关键词标注等

钉钉AI助理

阿里巴巴

作为钉钉平台的智能助手,提供语音识别、语义分析等功能,支持会议内容的实时转写、整理和总结。同时,能够结合钉钉的工作流,自动提醒待办事项,以提升团队协作效率

这些办公类AI工具的主要功能大同小异,可以总结为以下几个方面。

实时语音识别与转写。

大部分办公类AI工具都具备实时将会议语音内容转换为文字的功能。这有助于参会者更好地理解会议内容,尤其是对那些听力不佳或需要查看记录的人来说。

会议纪要自动生成。

这些工具能够根据转写后的文字内容,自动提取关键信息,生成简洁明了的会议纪要。这大大减轻了人工整理会议内容的负担,提高了工作效率。不止如此,用户还可以在聊天界面用提问的方式直接与工具互动,询问与会议内容有关的事项,节省自己检索信息的时间和精力。

腾讯会议AI小助手在其官方网站中展示的会议纪要与互动问答示意如图1-58所示。

多语种识别与翻译。

一些高级的办公类AI工具支持多种语言的识别与翻译,这使得跨国会议或涉及多种语言的会议变得更加便捷。参会者无须担心语言障碍,能够更专注于会议内容。

图1-58 腾讯会议AI小助手的会议纪要与互动问答示意

发言人识别与标注。

通过语音识别技术,这些办公类AI工具能够区分不同的发言人,并在转写文本中进行标注。这有助于参会者快速定位每个发言人的内容,更好地理解会议中的讨论和决策过程。

关键词提取与总结。

办公类AI工具能够自动提取会议中的关键词和关键信息,生成会议总结或摘要。这有助于参会者快速把握会议要点,回顾和跟进会议内容。

与办公软件的无缝对接。

大部分办公类AI工具能够与主流的办公软件进行无缝对接。这使得会议内容的分享、保存和后续处理变得更加便捷。

03 论文辅助类AI工具

前面介绍的综合型AI大模型,像ChatGPT、文心一言、智谱清言等,都可以辅助用户写论文。下面主要介绍几个以论文辅助功能为特色的AI工具。

① 橙篇

橙篇是百度推出的一款专注于学术写作的AI工具。它利用了百度强大的搜索引擎技术,能够帮助用户快速检索相关领域的文献资料,提供论文写作的灵感和素材。此外,它还包含语法检查、论文结构建议等功能,以提高论文的质量和写作效率。橙篇的主页如图1-59所示。

图1-59 橙篇的主页

② 星火科研助手

星火科研助手是中国科学院文献情报中心和科大讯飞共同研发的智能知识服务平台,旨在为科研人员提供全方位的写作支持。

星火科研助手集成了文献管理、数据分析、图表制作等多种功能,能够根据用户提供的关键词或主题,自动生成论文的大纲、引言、方法论、结果分析等内容,可以大大减轻科研人员的工作负担。星火科研助手的优势在于其背后强大的自然语言处理技术,能够理解用户的意图并提供精准的建议。星火科研助手的主页如图1-60所示。

图1-60 星火科研助手的主页

04 其他AI工具

下面介绍一些适合教师用的、有AI功能的实用平台或工具。

① 国家智慧教育公共服务平台

国家智慧教育公共服务平台是由中华人民共和国教育部指导、教育部教育技术与资源发展中心(中央电化教育馆)主办的智慧教育平台,平台细分为国家中小学智慧教育平台、国家高等教育智慧教育平台、国家职业教育智慧教育平台、国家终身教育智慧教育平台等,不同学校的教师群体都可以有针对性地使用。

平台覆盖全国32个地方平台,提供丰富教育资源。在“教师+AI”方面,平台提供了海量学习资源,可支持教师教学与专业发展,如人工智能教育、院士讲堂、名师优质课程等在线培训资源,有助于教师提升教学水平和AI教学的应用能力。未来,随着平台发展,AI技术有望更多地应用于教师教学支持、学情分析等方面。国家中小学智慧教育平台的人工智能教育专栏界面如图1-61所示。

图1-61 国家中小学智慧教育平台的人工智能教育专栏界面

② 学堂在线

学堂在线是清华大学于2013年10月发起建立的我国首个慕课平台,也是教育部在线教育研究中心的研究交流和成果应用平台,在线运营了来自国内外一流大学的超5000门优质课程。

为了适应智能时代的教育需求,学堂在线不断探索AI赋能课程改革的可能性,推出了24小时智能学伴、智能讲伴、知识引擎等功能。截至2025年年初,清华大学已有113门课程、147个教学班应用了“AI助教”。这些AI助教不仅能帮助教师处理重复性机械工作,如批改作业、分析学情等,还能提供精准的教学建议,使得教师能够专注于更具创造性和情感的教学活动。与此同时,学堂在线还积极拓展国际合作,通过世界慕课、在线教育联盟与其他国家和地区分享优质的教育资源,共同推进全球高等教育的发展。学堂在线官方网站主页如图1-62所示。

图1-62 学堂在线官方网站主页

③ 老师帮

老师帮是好未来旗下九章爱学产品体系中,一款专为教师打造的AI全能型助手。它融合AI大模型能力和优质教学资源,为全学段、全学科教师提供覆盖教学全周期的智能辅助,涵盖100多个实际教学环节。通过AI备课助手,教师能快速生成教案、进行跨学科设计、快速出题等,优化备课流程。在作业管理环节,老师帮能实现分层作业、智能组卷、批改作文等,并精准、高效评价教学。在课堂上,老师帮能提供AI点名、朗读分贝检测等互动工具,以提高学生的课堂参与度。此外,老师帮还为教师搭建了教学经验沉淀与知识共享平台,助力教师专业成长。老师帮官方网站主页如图1-63所示。

图1-63 老师帮官方网站主页

④ 小猿AI

小猿AI是由猿辅导集团开发的一款智能教育产品,最初名为小猿口算,现已发展成一个集成了DeepSeek-R1深度推理大模型的强大工具,具备解题、翻译、写作、问答等多种功能,旨在为学生提供个性化的学习体验。然而,从教师的角度来看,小猿AI同样具有极大的价值。例如,教师可以利用它的拍照搜题功能检查学生的作业,获取学生详细的解题步骤和答案解析,这有助于教师更好地理解和解决学生遇到的问题。

此外,小猿AI还能自动收集错题,生成错题本,并提供相似题目以供练习,帮助学生巩固知识点。对于希望提升英语听说读写能力的学生而言,小猿AI提供的英语学习功能是一大助力。同时,教师也可以借助这一功能布置针对性练习,促进学生的全面发展。小猿AI的App主页如图1-64所示。

图1-64 小猿AI的App主页

相关图书

动手构建大模型
动手构建大模型
揭秘大模型:从原理到实战
揭秘大模型:从原理到实战
龙芯之光:自主可控处理器设计解析
龙芯之光:自主可控处理器设计解析
动手学大模型智能体
动手学大模型智能体
动手学计算机视觉
动手学计算机视觉
MindSpore科学计算
MindSpore科学计算

相关文章

相关课程