AI 短视频脚本创作指南:TikTok 与 YouTube Shorts

AI 短视频脚本创作指南,覆盖 TikTok 和 YouTube Shorts 两大平台的爆款脚本写法。教程拆解六大短视频脚本类型的结构模板、前三秒钩子设计公式、节奏把控和转场技巧,以及如何用 AI 提示词批量生成不同风格的脚本变体。附跨平台适配策略帮你针对不同平台算法偏好微调脚本结构和时长,解决大多数人卡在不知道写什么的脚本困境。

AI 短视频脚本创作指南:TikTok 与 YouTube Shorts

爆款短视频的脚本平均只有 200 字,但这 200 字花的时间比拍摄还长。大多数人卡在「不知道写什么」,而不是「不会拍」。

这篇指南覆盖从脚本类型选择到 AI 提示词设计再到平台适配的全流程,帮你把 AI 变成随时待命的编剧搭档。

要点速览

  • 爆款脚本 6 大类型:钩子型、故事型、教程型、对比型、情感型、争议型,每种有对应的 AI 提示词模板
  • 脚本平均只有 200 字,但结构比长度重要:开头钩子 + 中间递进 + 结尾行动号召
  • TikTok 和 YouTube Shorts 的脚本策略完全不同:TikTok 要快节奏多反转,Shorts 要信息密度高
  • AI 脚本写作最常见误区:直接让 AI 写脚本而不给它平台规则和受众画像

2026 年的关键数据:短视频仍是流量之王

指标 数据 意义
YouTube Shorts 日均播放 2000 亿次 短视频市场仍在膨胀
病毒视频平均留存率 76%(普通 73%) 3% 的留存差距 = 巨大的推荐差距
Shorts 互动率 5.91% 高于 TikTok(5.75%)和 Reels(~2%)
最佳 Hook 时间 前 2-3 秒 超过 3 秒没抓住 = 被划走
平台推荐留存提升 10% 曝光增加 25% 留存是最核心的算法信号
短视频占全球互联网流量 82% 短视频已经是信息消费的主要形态
用户平均注意力时长 8.2 秒 比金鱼还短,Hook 必须精准

翔宇的核心认知:短视频的成败在前 3 秒。这不是夸张——TikTok 用户的平均注意力不到 2 秒,YouTube Shorts 稍长但也不超过 5 秒。你的开场必须是一个让人停下拇指的理由。

翔宇要强调一个被严重低估的事实:短视频脚本写作是一项独立的专业技能,和写文章、写长视频脚本完全不同。长内容可以慢慢铺垫,短视频必须在第一句话就抓住观众。每一个字都必须「有用」——没有任何空间留给废话、过渡句和"大家好今天我们来聊聊"这类开场白。AI 可以帮你快速产出脚本框架,但你必须理解短视频脚本的底层逻辑,才能给 AI 正确的指令。

全景地图:短视频脚本的 6 大类型

脚本类型 核心特征 适合场景 难度 爆款概率
解说旁白 画外音 + 信息密度高 知识科普、新闻解读、教程 中高
剧情小剧场 故事冲突 + 反转 搞笑短剧、品牌营销、情感片
产品测评 真实体验 + 优缺点分析 开箱、好物推荐、对比评测
趣味科普 化繁为简 + 寓教于乐 冷知识、科学实验、历史解读
情感故事 情感张力 + 共鸣 亲情/励志/治愈短片 很高
列表体/操作说明 结构清晰 + 信息直接 技巧清单、步骤教程、榜单

脚本类型不是非此即彼。很多爆款短视频融合了多种类型——比如用剧情包装产品测评,或者在科普里穿插情感故事。混合类型往往比纯类型更容易出爆款。

翔宇的选择建议:如果你是新手,从列表体和解说旁白类开始。这两种类型结构最固定、AI 辅助程度最高、试错成本最低。等你积累了五十条以上的创作经验,再尝试剧情和情感类——这两种类型对创作者的故事感知力和节奏控制力要求很高,不是 AI 能完全代劳的。


六大短视频脚本类型

解说旁白类:信息密度的艺术

这是最常见的短视频脚本类型,也是无脸频道(Faceless Channel)的首选格式。核心是用语言驱动内容,画面作为视觉补充。

结构公式:Hook(前 3 秒抓注意力)→ 核心信息(密集输出价值)→ CTA(引导行动)

Hook 的 7 种写法

Hook 类型 示例 适合主题
反直觉事实 "90% 的人不知道,手机充电其实不需要充满" 科普、冷知识
直接提问 "你知道为什么刷到的视频越来越准吗?" 算法、技术解读
悬念 "接下来这个方法,可能改变你用 AI 的方式" 工具教程
数字冲击 "这个 AI 工具帮我每月节省 40 小时" 效率提升
痛点共鸣 "你是不是也经历过写了一天脚本结果一条没用上?" 创作技巧
争议观点 "日更短视频其实是最大的误区" 运营策略
紧迫感 "这个免费工具下个月就要收费了" 工具推荐

翔宇的深度解析:Hook 不是随便一句开场白,而是经过精心设计的「注意力陷阱」。翔宇在实际操作中发现,最有效的 Hook 类型因平台而异——TikTok 上「反直觉事实」和「争议观点」效果最好,因为它们制造认知冲突;YouTube Shorts 上「数字冲击」和「直接提问」效果最好,因为 Shorts 的观众更偏理性和求知。在写 Hook 时,翔宇的做法是每条视频准备三到五个不同版本的 Hook,然后选择最短、最有冲击力的那个。记住,Hook 的字数不能超过十五个字——超过的部分观众来不及处理就划走了。

AI 提示词示例

你是一位短视频脚本作家。为我写一段 60 秒的 TikTok 解说旁白脚本。
主题:[填入主题]
目标受众:[填入人群]
要求:
- 前 3 秒必须有强力钩子(提问/反直觉事实/悬念)
- 提供 3 个不同的 Hook 版本供选择
- 每句话不超过 15 个字
- 信息密度高但不堆砌
- 在第 20 秒和第 40 秒各设置一个"小钩子"防止观众划走
- 结尾有明确的行动号召
- 口语化,像朋友聊天
- 标注每句话的预估时间(秒数)

翔宇的实操要点

  1. 每句话不超过 15 个字。短视频的信息传递速度约每分钟 180-200 字,长句子观众来不及消化。
  2. 每 15-20 秒设置一个"小钩子"。"但这还不是最厉害的部分"——这种过渡句能让正要划走的人留下来。
  3. 口语化。把"我们将讨论"改成"我来说说",把"值得注意的是"改成"你注意到没"。
  4. 节奏感。长句+短句交替,快节奏+停顿交替。单调的节奏催眠。

翔宇额外补充一个容易被忽略的技巧:画面转场节奏必须和口播节奏同步。每当口播内容切换到一个新观点时,画面也应该同时切换。这种"视觉节奏"是留存率的隐形杀手——如果口播在讲新内容但画面没有变化,观众的注意力会在一到两秒内涣散。翔宇在写脚本时会在每个观点切换处标注[切画面],拍摄和剪辑时严格执行。


剧情小剧场类:微型叙事的力量

短剧在各平台的爆发已经证明——观众永远需要故事。一个好的短剧脚本在 30-60 秒内完成起承转合。

结构公式:设定(谁 + 困境)→ 冲突升级 → 反转/解决 → 情感落点

AI 提示词示例

为我构思一个 45 秒的 TikTok 短剧大纲。
类型:[搞笑/温情/反转/职场]
核心冲突:[一句话描述]
要求:
- 角色不超过 3 个,每个角色用一句话定义性格
- 有一个清晰的情绪转折点(标注在第几秒)
- 结尾出人意料或令人回味
- 对话自然口语化,每句不超过 10 个字
- 提供画面描述和表演指导
- 适合手机竖屏拍摄

翔宇的剧情结构模板(45 秒版)

时间段 内容 目的
0-5 秒 设定:人物+困境 建立共鸣
5-15 秒 冲突展开 制造张力
15-25 秒 冲突升级 情绪推高
25-35 秒 转折/反转 情绪爆点
35-45 秒 情感落点 + CTA(行动号召) 留下余韵

翔宇的创作心得:剧情类脚本最难的部分不是写故事,而是「压缩故事」。你需要在四十五秒内让观众经历一次完整的情绪波动——从共鸣到紧张到释放。翔宇的技巧是先写一个两分钟的完整故事,然后反复删减到四十五秒。删减的标准是:每一句话如果去掉后剧情仍然成立,就必须去掉。这个过程虽然痛苦,但出来的脚本信息密度极高。


产品测评类:信任感的构建

产品测评的核心不是「说产品好」,而是「让观众相信你说的是真的」。AI 能帮你搭建测评框架,但真实体验必须由你来填充。

结构公式:痛点共鸣 → 产品展示 → 优缺点并列 → 使用场景 → 购买建议

AI 提示词示例

帮我生成一个 [产品名称] 的短视频测评脚本框架。
目标平台:[TikTok/YouTube Shorts]
要求:
- 开头用一个真实痛点场景切入
- 列出 3 个优点和 1-2 个缺点(保持客观)
- 语气像普通用户分享,不像广告
- 在介绍每个优点时配一个使用场景
- 结尾给出明确的「适合谁/不适合谁」建议
- 如果有竞品对比,用简短的一句话带过
- 总时长控制在 45-60 秒

翔宇的测评内容可信度清单

可信度因素 加分 减分
提到缺点 大加 只说优点 = 广告感
真实使用场景 念参数 = 无聊
和竞品对比 攻击竞品 = 失分
具体数据 大加 模糊描述 = 不专业
个人体验故事 纯搬运官网 = 没价值

翔宇在做产品测评时有一条铁律:必须真正使用过产品至少一周才拍测评。AI 能帮你写框架和话术,但「真实的使用体验」是无法伪造的。观众对测评类内容的嗅觉非常灵敏——到底是真的用过还是照着宣传材料念,三句话之内就能听出来。翔宇的做法是先用产品一周,记录真实的使用场景和遇到的问题,然后把这些素材喂给 AI 让它帮你组织成脚本框架。这样出来的内容既有 AI 的结构性,又有真人的体验感。


趣味科普类:知识翻译官

把复杂概念讲到小学生都能懂——这就是趣味科普的核心能力。AI 在这里的角色是「知识翻译官」,帮你把专业内容转化为生动比喻。

AI 提示词示例

用一个生动的比喻,向完全没有背景知识的人解释「[复杂概念]」。
要求:
- 比喻取材于日常生活(做饭、运动、坐地铁等)
- 控制在 100 字以内
- 准确性优先,趣味性其次
- 适合做成 15 秒的短视频画面
- 提供 3 个不同角度的比喻让我选择

科普脚本的"三层翻译法"

层级 表达方式 示例(以"机器学习"为例)
专业层 术语+公式 通过训练数据优化损失函数
通俗层 去术语 AI 通过大量例子学会了判断规律
比喻层 生活类比 就像小孩看了 1000 只猫的照片后能认出新的猫

短视频科普用比喻层。观众不需要记住术语,只需要"哦,原来是这么回事"。

翔宇的补充经验:科普类短视频最容易犯的错是「想讲太多」。一条四十五秒的视频只能承载一个核心概念。如果你发现自己需要解释三个以上的专业术语才能讲清主题,说明这个主题不适合做成单条短视频——要么拆成系列,要么换一个更聚焦的切入角度。翔宇做科普短视频的标准是:看完后观众能用一句话复述核心信息。如果做不到,说明脚本太复杂了。


前3秒Hook设计

情感故事类:共鸣的杠杆

情感类短视频的传播力往往是其他类型的数倍。核心在于找到一个「很多人有过但没说出来」的情感触点。

AI 提示词示例

构思一个 30 秒的情感短片大纲。
主题:[填入情感主题,如「一次意外的善举」]
要求:
- 主角有一个明确的情感困境
- 设计一个清晰的情感转折点
- 结尾留白,不要说教
- 画面建议简洁,聚焦面部表情和细节动作
- 配乐建议(节奏和情绪)
- 标注哪些画面适合用慢镜头

情感短视频的 4 个高传播触点

触点 案例主题 传播力
意外的善良 陌生人帮助 极高(分享率最高)
失而复得 多年后重逢
逆境反转 从谷底到成功
跨代情感 父母与子女 极高(保存率最高)

翔宇的观察:情感类短视频的分享率通常是其他类型的三到五倍。人们分享视频的动机是「这个视频能代替我表达某种情感」。一条关于父母默默付出的短片之所以被疯狂转发,不是因为视频本身多精良,而是因为转发者想通过这条视频告诉自己的父母「我看到了你的付出」。理解了这个底层心理,你就知道情感类短视频的选题标准——不是「什么故事最感人」,而是「什么情感是大多数人想表达但不好意思直接说的」。


列表体类:最容易上手的格式

如果你刚开始做短视频,列表体是门槛最低的格式——结构固定、逻辑简单、AI 就能生成 80% 的内容。

AI 提示词示例

为我生成一个「[主题] 的 5 个技巧」的短视频脚本。
平台:YouTube Shorts
要求:
- 开头用一个反直觉的事实做 Hook
- 5 个技巧按重要性从低到高排列(最重要的放最后留悬念)
- 每个技巧用一句话概括 + 一句话解释
- 每个技巧之间用过渡句衔接
- 结尾 CTA 引导关注
- 总时长 45-60 秒

翔宇的提升技巧:列表体虽然简单,但很多人做出来的效果是「无聊的清单」而不是「有趣的盘点」。差别在哪?在于每个列表项之间的「情绪递进」。翔宇的做法是把最震撼或最反直觉的一项放在最后,中间用"但接下来这个更厉害"这样的过渡句制造递进感。观众看列表体内容时心理上有一个「越来越期待」的预期——如果你的内容从头到尾都是平的,他们在第二项就划走了。


跨平台适配策略

跨平台适配策略

同一个脚本不能直接发所有平台。翔宇的平台适配规则:

维度 TikTok YouTube Shorts 小红书 抖音
最佳时长 15-30秒 30-60秒 20-40秒 15-30秒
语言风格 极度口语化 稍正式但仍口语 闺蜜/朋友感 地道中文口语
Hook 方式 视觉冲击+文字 提问+悬念 痛点+解决方案 视觉冲击+热点
CTA 风格 "关注看更多" "订阅+小铃铛" "收藏+关注" "关注+点赞"
字幕位置 画面中央偏上 底部 1/3 可选 画面中央

翔宇的高效做法:先写一版 YouTube Shorts 的 60 秒脚本(信息量最大,标题可参考YouTube 标题创作方法),然后:

  • 删减到 30 秒 → TikTok 版
  • 改口语风格 → 抖音版
  • 提取要点做图文 → 小红书版

翔宇的补充:很多创作者犯的错误是把同一条视频原封不动发到所有平台。这样做效率看似最高,但每个平台的观众期待是不同的。翔宇亲测的数据是:做过平台适配的内容比直接搬运的内容,在目标平台上的平均播放量高出百分之四十到六十。适配不需要重新拍摄——调整开场方式、改变语气、优化字幕位置和时长,十分钟就能完成一个平台的适配。


AI 脚本写作的常见误区

误区 后果 正确做法
让 AI 直接写完整脚本 千篇一律的 AI 味 让 AI 搭框架,你填灵魂
不给 AI 受众信息 内容对不上人群 明确描述目标受众
一条提示词搞定 质量不可控 分步:先选题→再大纲→再脚本
不修改 AI 初稿 缺乏个人风格 至少改 30% 的措辞
忽略画面描述 拍摄时不知道拍什么 脚本中加入画面建议
不做平台适配 同一内容效果差异大 每个平台一个版本
忽视口播节奏 内容单调导致划走 长短句交替,快慢节奏对比
不做数据分析 无法优化迭代 每条视频记录核心数据

翔宇的深层思考:AI 脚本写作最大的陷阱不是「写不好」,而是「写得太顺畅」。AI 生成的内容往往语法完美、逻辑通顺,但恰恰因为太「完美」而缺乏真实感。短视频观众喜欢的是有温度、有个性、甚至有小瑕疵的内容——因为这些特征意味着「真人在说话」。翔宇的做法是拿到 AI 初稿后刻意加入一些口语化的表达、个人化的吐槽和非标准的说法。比如把 AI 写的"这个方法非常有效"改成"翔宇试了一下,确实好使"——就是这种小改动让脚本从「AI 味」变成「人味」。


延伸阅读

常见问题

AI 能完全替代人类写短视频脚本吗?

目前不能,翔宇判断至少三到五年内也不行。AI 擅长搭建结构框架、生成多个版本的 Hook、整理信息要点,但「什么选题能引起目标受众的共鸣」「怎么把一个普通观点讲出新意」「怎么用一句话让人笑出来或红了眼眶」——这些能力目前仍然是人类创作者的核心竞争力。翔宇的定位是把 AI 当成高效的编剧助手,而不是编剧替身。

一天能用 AI 写多少条短视频脚本?

如果流程熟练,一天写十到十五条初稿是完全可以做到的。但翔宇建议不要追求数量——每条脚本的人工优化和打磨至少需要十五到二十分钟,所以实际上一天能产出的高质量脚本大约五到八条。把时间花在优化上比花在批量生成上值。

新手应该从哪种脚本类型开始?

列表体是最佳入门类型。原因有三个:第一,结构完全固定(Hook + 列表项 + CTA),AI 辅助程度最高;第二,不需要故事创作能力,只需要信息整理能力;第三,列表体的数据反馈最清晰——哪个列表项让观众划走了一目了然。翔宇建议用列表体练手二十条以上,建立对短视频节奏的感觉后,再尝试解说旁白和剧情类。

怎么判断一条脚本写得好不好?

翔宇有一个「三秒测试」:把脚本的前三句话读给一个完全不了解主题的朋友,问他想不想听下去。如果他说"然后呢?"——恭喜,Hook 有效。如果他面无表情或者说"哦"——需要重写 Hook。第二个测试是「朗读测试」:把整条脚本大声读一遍,任何需要吸一口气才能读完的句子都太长了,任何读到一半想停下来的地方都说明节奏出了问题。

AI 写的脚本拍出来效果不好怎么办?

百分之九十的情况下问题不在脚本,而在「执行」。检查三个点:第一,口播节奏是否和脚本设计一致(很多人读得太快或太慢);第二,画面切换是否跟上了信息节奏(画面静止超过三秒观众就会走);第三,音量和背景音乐是否平衡(人声必须比背景音乐至少大六到八分贝)。如果这三个点都没问题但效果还是不好,再回头看脚本——大概率是 Hook 不够强或信息密度不够高。


到这里,你已经搞懂了 6 种短视频脚本类型和对应的 AI 协作方法

关键收获:

  • AI 是编剧搭档,不是编剧替身。它擅长搭框架、找角度、生成初稿,但灵魂(你的真实经验和个人风格)必须由你注入。
  • 提示词的质量决定产出的质量。越具体的指令,越精准的结果。给 AI 受众信息、风格要求、时长限制——细节越多,初稿越能用。
  • 平台适配很重要。TikTok 节奏更快、更娱乐化;YouTube Shorts 观众接受稍深度的内容。同一个主题,不同平台的脚本应该有差异。
  • 前 3 秒决定一切。花 80% 的时间打磨 Hook,剩下 20% 写正文——这个时间分配没有夸张。

到了这里

选一个你最擅长的脚本类型,用上面的 AI 提示词模板生成 3 个版本,挑一个拍出来发。不用追求完美——发出去才能收到反馈,反馈才是真正的老师。


下一步

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

订阅成功!请到邮箱查收确认链接。

操作成功。

操作已取消。