Skip to content
🌊海洋蓝
🌸樱花粉
🍃森林绿
🔮幻夜紫
🌙暗夜黑

小米 MiMo 发福利了?AI 视频创作者该动手了

万少:华为HDE、鸿蒙极客

个人主页:https://blog.zbztb.cn/

2025年参与孵化了20+鸿蒙应用、技术文章300+、鸿蒙知识库用户800+、鸿蒙免费课程2套、付费课程1套;

如果你也喜欢交流AI和鸿蒙技术,欢迎扣我。

**一句话结论:**MiMo-V2.5 降价不是简单的“模型更便宜了”,而是让 Codex 写脚本 + HyperFrames 生成视频 + MiMo TTS 配音 + 字幕生成 这类组合工作流,变得更适合个人创作者折腾。

小米 MiMo 发福利了?AI 视频创作者该动手了

今天大模型圈一个值得关注的消息:小米 MiMo-V2.5 系列降价了。

根据小米 MiMo 开放平台公告,MiMo-V2.5 系列价格最高下调 99%,Token Plan 额度提升 5 到 8 倍,生效时间是 2026 年 5 月 27 日 00:00,GMT+8

如果只把它看成“大模型又卷价格”,其实有点可惜。对内容创作者来说,更关键的是:脚本、配音、字幕、视频画面这些环节,正在被串成一条低成本生产线。

MiMo 降价窗口:反复试错成本下降


真正便宜的不是聊天,而是“反复试错”

普通用户一天问几十次,降价体感不会特别强。

视频创作者不一样。一条教程视频背后,可能要反复生成:

  • 标题和开头
  • 口播脚本
  • 分镜结构
  • 配音版本
  • 字幕文案
  • 视频模板

以前贵的是“每改一次都要成本”。现在 MiMo 文本模型降价,TTS 又在官方计费页显示 限时免费,创作者就可以更大胆地试多个版本。

这才是这次降价最值得关注的地方:AI 内容生产开始从“偶尔调用”,变成“流程调用”。


小米 TTS 声音生产工具

目前可以直接通过调用小米TTS的方式来动态生成语音,这个步骤你可以交给你的AI去操作即可>

https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/speech-synthesis-v2.5

小米 MiMo-V2.5-TTS 系列目前主要有三类:

模型模型 ID用途
MiMo-V2.5-TTSmimo-v2.5-tts使用内置音色生成语音
VoiceDesignmimo-v2.5-tts-voicedesign用文字描述定制声音
VoiceClonemimo-v2.5-tts-voiceclone基于音频样本克隆声音

MiMo TTS 声音实验室

它的意义不只是“把文字读出来”,而是让视频创作者可以控制:

  • 语速
  • 情绪
  • 角色感
  • 方言/风格
  • 系列内容的统一音色

比如做教程视频,你可能需要的是“清晰、稳定、不抢内容”的声音;做短视频口播,则可能需要更快节奏、更强重点。TTS 能调风格,内容生产的空间就大很多。


Codex + HyperFrames + MiMo TTS:组合出视频、音频、字幕

把几个工具串起来,流程大概是这样:

AI 视频流水线:从选题到成片

这条链路里:

  • Codex:负责写脚本、拆分镜、生成代码和配置;
  • HyperFrames:负责把 HTML/CSS/JS 渲染成视频画面;
  • MiMo TTS:负责把文案变成旁白音频;
  • 字幕:可先由脚本生成,再按音频校准。

这套组合工作流的目标产物是:视频 + 音频 + 字幕

注意,这不是某一家平台提供的“官方一键生成功能”,而是把多个工具按生产流程串起来。

这不是科幻,也不是 PPT 式概念。对标准化教程、知识卡片、工具介绍类视频来说,这套流程已经很适合落地。

使用方式:

打开你的 codex终端,然后输入提示词

使用 HyperFrames 这个skill  和 MiMo TTS 帮我  xxxxx

万少的视频就是这样产生的;


一个例子:万少的 Claude Code 入门教程

比如万少发布在 B 站的合集:

《万少的 claude code 入门教程》
https://www.bilibili.com/video/BV14jGR6PEJv/

这个合集由 HarmonyOS-万少 发布,合集名为 《万少的claude code 入门教程》,当前显示 15 个分集,内容覆盖安装、模型配置、VS Code 插件、权限模式、Skill、MCP、SubAgents、Hooks、Plugins、AgentTeams 等主题。

这类内容特别适合 AI 视频流水线,因为它有几个特点:

  1. 结构固定:每集讲一个知识点;
  2. 画面可复用:标题页、代码页、步骤页都能模板化;
  3. 配音要统一:系列教程最好保持同一个声音风格;
  4. 字幕天然可生成:脚本就是字幕的基础。

换句话说,AI 不是替你“随便生成视频”,而是替你处理重复劳动:排版、配音、字幕、模板化渲染。


最后

这次 MiMo 降价,真正值得盯住的不是“又便宜了多少”,而是它给个人创作者打开了一个窗口:

一个人,也可以用工程化方式生产技术视频。

当 Codex 负责脚本和代码,HyperFrames 负责画面,MiMo TTS 负责声音,字幕可从脚本生成并校准,AI 视频的门槛就不再是“剪辑软件有多熟”,而是:

你能不能把一个知识点讲清楚、讲持续、讲成系列。

这才是 MiMo 发福利背后,最值得技术创作者动手的地方。


参考来源

万少建立了一个专门讨论AI的微信群,大家可以互相交流和分享关于AI生态的资讯消息。

目前人已经超过400人了,私聊我进群。

关注我,持续分享鸿蒙开发 + AI 提效的实战技巧。

Released under the MIT License.