MCP实战:在扣子空间用扣子工作流MCP,一句话生成儿童故事rap视频

news2025/7/12 16:22:30

扣子最近迎来重要更新,支持将扣子工作流一键发布成MCP,在扣子空间里使用。

图片

这个功能非常有用,因为我有很多业务工作流是在扣子平台上做的,两者打通之后,就可以在扣子空间里直接通过对话方式调用扣子工作流了,体验会更加丝滑。

这次我是想将一个儿童故事绘本的工作流发布成MCP,在扣子空间里使用,最终效果就是通过一句话就能生成一个有背景音乐,有人声朗读的儿童故事绘本视频。

在尝试过程中,发现扣子空间的能力和Manus相比还有进步空间,毕竟现在还是beta版本,进展并不如想象中顺利。

最终生成的是一个rap版本的故事绘本视频(至于为什么会做成rap版本,我这里先卖个关子,后面会有解释),这是其中一段:

武松打虎rap视频-b546a90b27

下面详细介绍我的制作过程,其中有不少技巧(坑),也算是摸索了一下当前扣子空间的能力边界。

测试视频生成能力

在正式进行之前,我先做了一个验证测试,确认扣子空间是否有生成视频的能力。

我上传了一张火车票的图片,让扣子空间生成一段音乐,和图片一起合成一段视频。

可以看到扣子空间自己安装了ffmpeg,这个是用来生成视频的软件

图片

Tips: 在我多次尝试过程中,发现并不是每次扣子空间都可以成功安装ffmpeg,如果没有安装成功,可以这样输入指令:

用这个命令安装ffmpeg:apt-get update && apt-get install -y ffmpeg

这样基本上就都能安装成功了。

接下来遇到另外一个坑,生成的视频大小为0,无法播放,经过反复试错,发现可能是因为视频时长过长。

于是修改指令指定生成一段15s长的音乐:

生成15s的舒缓音乐,和附件的图片一起生成一段mp4格式的视频,视频长宽都是720

果然,这样就可以生成有效的视频了,如下:

video3

Tips: 现在扣子空间到底能支持多长的视频生成,我还没有测试过边界,我现在生成过的最长视频是30s

好了,经过以上测试,算是验证了扣子空间生成视频的能力。

可以进行下一步了:将儿童故事绘本工作流引入扣子空间使用

这个过程分为两步:

  1. 将扣子工作流发布成扣子空间的MCP扩展

  2. 在扣子空间中使用这个MCP扩展进行视频创作

下面详细说明如何操作。

发布扣子工作流MCP扩展

说明一下,目前扣子平台只支持将扣子应用发布成MCP(据称后面马上会支持直接将工作流发布成MCP),所以这里我们要多走一步,先创建一个扣子应用。

创建扣子应用

图片

然后将工作流加入应用,界面部分不用管,添加了工作流就可以直接发布成MCP了。

图片

儿童故事绘本的工作流如下,因为这篇文章重点不是介绍扣子工作流,就不展开介绍了,有需要的朋友可以给我留言。

图片

发布成MCP服务

点击右上角的发布进入发布界面以后可以看到,在最右侧有一个MCP服务的选项,点击它就会跳到底部MCP服务那里

图片

这里需要先配置一下,点开配置,勾选全部即可

图片

发布完成

图片

发布完成后,就可以在扣子空间使用了。

扣子空间生成故事视频

按以下步骤操作:

添加扩展

在扣子空间的自定义扩展里可以看到我们刚在扣子平台里发布的这个MCP服务:儿童故事绘本,点击添加。

图片

然后再添加另外两个扣子空间自带的MCP扩展:语音合成(用于生成朗读音频)和音乐生成(用于生成背景音乐),一共3个扩展,如下:

图片

输入指令

这个是我尝试了很多次,才找到的可以成功生成视频的提示词。

图片

相比 Manus 扣子空间的大模型能力还不够强大,遇到问题不太会自己处理,有时候反而需要我给它指令来帮助它解决问题。

比如这里的坑主要是在图片处理上,需要告诉扣子空间将图片下载到本地,否则后面合成视频的时候,无法正确提取到图片。

我之前也测了不少Manus的案例,如果是Manus,这种问题它应该会自己搞定。

终于,视频成功生成了

图片

但是还有个问题,生成的背景音乐,无论我怎么修改提示词(试了差不多十遍),它始终会有人声,无法生成纯音乐,这个就很无语了,效果是这样滴:

武松打虎绘本视频-1bd6b01b1f

所以我最后只能选择不要朗读音频或者不要背景音乐。

然鹅,我突然灵机一动,如果把故事内容作为音乐的歌词呢?这不就完美解决了朗读和音乐结合的问题嘛,而且还颇有新意,于是开头的那个rap视频就是这么来的~~

当然还是期待将来会有支持生成纯音乐的扩展。

写在最后

这算是一次有趣的尝试,对扣子空间当前的能力做了一次探索。虽然说不算完美,但是整个流程是跑通的,这个非常重要。

扣子空间有自己的平台优势,因为它有扣子平台巨量的用户和工作流,这两者打通以后,会产生巨大的化学反应。

扣子空间现在还在beta版本,不能苛求它多完美,但是未来绝对可期。

比如,将来如果把图生视频的MCP接入进来,那么在现在这个demo基础上,我就可以通过一句话做出有动画效果的故事视频了,想想都非常期待~~

更多精彩内容推荐:

-> AI智能体学习&实战

-> 私域AI机器人

-> 自媒体AIP打造

-> AI应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2379666.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot基础项目搭建

资料链接:https://download.csdn.net/download/ly1h1/90855288?spm1001.2014.3001.5501 1.准备工作 1.1 安装IntelliJ IDEA 2023.3.4 (Ultimate Edition) 1.2 采用apache-maven-3.6.3 1.2.1 maven配置文件设置 1.2.2 IDEA配置maven 1.3 JDK采用17版本 2.手动创建…

【拥抱AI】Deer-Flow字节跳动开源的多智能体深度研究框架

最近发现一款可以对标甚至可能超越GPT-Researcher的AI深度研究应用,Deer-Flow(Deep Exploration and Efficient Research Flow)作为字节跳动近期开源的重量级项目,正以其模块化、灵活性和人机协同能力引发广泛关注。该项目基于 La…

前端获取用户的公网 IP 地址

可以使用免费的免费的公共服务网站 一:https://www.ipify.org/ 获取 JSON 格式的 IP 地址 // 旧地址不好使 // https://api.ipify.org/?formatjson // 新地址 https://api64.ipify.org/?formatjson 二:https://ipinfo.io/ https://ipinfo.io/ 三&a…

云电竞服务器 工作原理

云电竞服务器工作原理详解 一、核心架构原理 虚拟化资源池‌ 通过 ‌KVM/VMware‌ 等虚拟化技术将物理服务器(含NVIDIA GPU集群)抽象为可动态分配的算力资源池,每个用户独享独立虚拟机实例,实现硬件资源的按需分配与隔离运行。 …

【数据结构】线性表--队列

【数据结构】线性表--队列 一.什么是队列二.队列的实现1.队列结构定义:2.队列初始化函数:3.队列销毁函数:4.入队列函数(尾插):5.出队列函数(头删):6.取队头元素&#xff…

[Vue3]语法变动

Vue3的语法相对比Vue2有不少改变,这篇讲一下基础语法在Vue3里的形式。 创建Vue对象 在脚手架项目中,index.html等资源不再编写代码,只作为一个容器。所有的页面代码都在.vue相关文件中进行编写,由main.js引入各个.vue文件渲染出页…

Ubuntu服务器开启SNMP服务 监控系统配置指南 -优雅草星云智控简易化操作

Ubuntu服务器开启SNMP服务 & 监控系统配置指南 -优雅草星云智控简易化操作 一、Ubuntu服务器开启SNMP服务 步骤1:安装SNMP服务 sudo apt update sudo apt install snmp snmpd snmp-mibs-downloader -y 步骤2:配置SNMP(编辑配置文件&am…

linux本地部署ollama+deepseek过程

1.Tags ollama/ollama GitHub 选择一个版本下载,我下的是0.5.12 2.tar解压该文件 3.尝试启动ollama ollama serve 4.查看ollama的版本 ollama -v 5.创建一个系统用户 ollama,不允许登录 shell,拥有一个主目录,并且用…

从零开始实现大语言模型(十五):并行计算与分布式机器学习

1. 前言 并行计算与分布式机器学习是一种使用多机多卡加速大规模深度神经网络训练过程,以减少训练时间的方法。在工业界的训练大语言模型实践中,通常会使用并行计算与分布式机器学习方法来减少训练大语言模型所需的钟表时间。 本文介绍PyTorch中的一种…

OpenCV进阶操作:指纹验证、识别

文章目录 前言一、指纹验证1、什么是指纹验证2、流程步骤 二、使用步骤(案例)三、指纹识别(案例)1、这是我们要识别的指纹库2、这是待识别的指纹图3、代码4、结果 总结 前言 指纹识别作为生物识别领域的核心技术之一,…

网络安全-等级保护(等保) 2-5 GB/T 25070—2019《信息安全技术 网络安全等级保护安全设计技术要求》-2019-05-10发布【现行】

################################################################################ GB/T 22239-2019 《信息安全技术 网络安全等级保护基础要求》包含安全物理环境、安全通信网络、安全区域边界、安全计算环境、安全管理中心、安全管理制度、安全管理机构、安全管理人员、安…

3D生成新突破:阶跃星辰Step1X-3D开源,可控性大幅提升

Step1X-3D 是由 StepFun 联合 LightIllusions 推出的新一代 高精度、高可控性 3D资产生成框架。基于严格的 数据清洗与标准化流程,我们从 500万 3D资产 中筛选出 200万高质量数据,构建了 标准化的几何与纹理属性数据集,为3D生成提供更可靠的训…

MySQL数据类型之VARCHAR和CHAR使用详解

在设计数据库字段时,字符串类型算是最常见的数据类型之一了,这篇文章带大家深入探讨一下MySQL数据库中VARCHAR和CHAR数据类型的基本特性,以及它们之间的区别。 VARCHAR类型 VARCHAR(Variable Character,可变长度字符…

《Docker 入门与进阶:架构剖析、隔离原理及安装实操》

1 docker 简介 1.1 Docker 的优点 Docker 是一款开放平台,用于应用程序的开发、交付与运行,能将应用和基础架构分离,实现软件快速交付 ,还能以统一方式管理应用和基础架构,缩短代码从编写到上线的时间。其核心优势如…

基于Akamai云计算平台的OTT媒体点播转码解决方案

点播视频(VOD)流媒体服务依赖于视频流的转码来高效分发内容。在转码工作流程中,视频被转换为适合观看设备、网络条件和性能限制的格式。视频转码是计算密集型过程,因此最大化可用硬件上可转码的视频流数量是首要考虑因素。不同基础…

【MySQL】02.数据库基础

1. 数据库的引入 之前存储数据用文件就可以了,为什么还要弄个数据库? 文件存储存在安全性问题,文件不利于数据查询和管理,文件不利于存储海量数据,文件在程序中控制不方便。而为了解决上述问题,专家们设计出更加利于…

选错方向太致命,华为HCIE数通和云计算到底怎么选?

现在搞HCIE的兄弟越来越多了,但“数通和云计算,到底考哪个?”这问题,依旧让不少人头疼。 一个是华为认证的老牌王牌专业——HCIE数通,稳、系统、岗位多; 一个是新趋势方向,贴合云原生、数字化…

经典启发算法【早期/启发式/HC爬山/SA模拟退火/TS禁忌搜/IA免疫 思想流程举例全】

文章目录 一、早期算法二、启发式算法三、爬山法HC3.1 基本思路3.2 伪代码 四、模拟退火SA4.1 算法思想4.2 基本流程4.3 再究原理4.3.1 Metropolis准则4.3.2 再理解 4.4 小Tips4.5 应用举例4.5.1 背包问题:分析:求解: 4.5.2 TSP问题&#xff…

IntraWeb 16.0.2 + Bootstrap 4 居中布局实战(附源码+效果图)

前言 最近在优化一个 IntraWeb 16.0.2 项目时,发现默认布局方式不够灵活,尤其是在不同屏幕尺寸下对齐效果不佳。于是,我决定引入 Bootstrap 4 来实现 完美居中布局,并成功落地!今天就把完整的 源代码 实际效果图 分享…

【Java ee初阶】jvm(3)

一、双亲委派机制(类加载机制中,最经常考到的问题) 类加载的第一个环节中,根据类的全限定类名(包名类名)找到对应的.class文件的过程。 JVM中进行类加载的操作,需要以来内部的模块“类加载器”…