AI一键让照片说话,无限且免费!

熟悉我的小伙伴,应该知道我一直在关注AI生成图片领域,也一直在持续分享相关教程。最近关注点稍微侧重到了LLM(大语言模型)上,回头一看,AI绘画又进化了。今天带来一款超强AI绘画模型,能一键让照片说话、唱歌。以下是生成的视频:

安装SadTalker

这款AI一键让照片说话的模型叫SadTalker,是由西安交通大学的研究人员提出的,它可以让照片里的人物跟随音频的输入动起来,且头部运动、面部表情比较真实,下图是官方展示的效果图,还在等什么呢,即刻拥有它!

AI一键让照片说话,无限且免费!

①建议先部署SD(stable-diffusion-webui),可以参考以下文章:

AI杀疯了 | 从0开始学AI绘画

因为SD已经支持了SadTalker的插件了,后续从SD生成的图片,都可以直接一键生成说话、唱歌视频。

(当然了,你也可以不部署SD,直接使用SadTalker)

②安装SadTalker插件:

打开并运行SD webui,然后选择“扩展”,在“从网址安装”里,输入以下地址:

点击安装,需要等待3~5分钟。

AI一键让照片说话,无限且免费!

安装完成后,重启一下SD webui,即可在功能栏里看到“SadTalker”插件栏了。

 

安装FFmpeg

FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序,是SadTalker运行的必要支持程序。可以从以下网址下载获得:

https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z

解压后,需要将FFmpeg的bin文件夹路径添加到系统环境变量里:

AI一键让照片说话,无限且免费!

手动添加环境变量:控制面板→系统→高级系统设置→环境变量→Path→编辑→添加

AI一键让照片说话,无限且免费!

 

下载模型

运行SadTalker,还需要下载一些模型,可以从以下链接获得:

将上面下载的10个模型文件复制进去,其中BFM_Fitting和hub两个压缩文件还需要解压到checkpoints文件根目录中。

至此,你已经拥有了一键让图片说话的能力了。

 

试试效果

在SD webui的功能栏里,选择“SadTalker”,然后将图片(支持从SD中加载)和音频传入,音频建议在10秒以内,不然显卡压力有点大。点击“生成”按钮,即可一键使照片说话。

相关设置项说明:

  • corp:图片被裁剪为方形(运算速度快,但如果传入的图片不是方形,最终视频会变形)
  • resize:重新调整尺寸,可以使脖子和头部衔接自然,但代价是口型可能不太准
  • full:完整体验(基本就是选它了)

同时记得勾选“面部增强”,使整体面部效果更加自然些。

AI一键让照片说话,无限且免费!

最终得到了文章开头的会说话、唱歌的小姐姐了,她还会很自然地眨眼睛呢,成就感满满有木有!感兴趣的小伙伴快去试试吧~

免责说明

本站资源部分来自网友投稿,如有侵犯你的权益请联系管理员或给邮箱发送邮件PubwinSoft@foxmail.com 我们会第一时间进行审核删除。
站内资源为网友个人学习或测试研究使用,未经原版权作者许可,禁止用于任何商业途径!请在下载24小时内删除!


如果遇到评论下载的文章,评论后刷新页面点击对应的蓝字按钮即可跳转到下载页面
本站资源少部分采用7z压缩,为防止有人压缩软件不支持7z格式,7z解压,建议下载7-zip,zip、rar解压,建议下载WinRAR

温馨提示:本站部分付费下载资源收取的费用为资源收集整理费用,并非资源费用,不对下载的资源提供任何技术支持及售后服务。

给TA打赏
共{{data.count}}人
人已打赏
人工智能

Stable Diffusion绘图的平台,这么强的Ai绘画,居然全免费?

2023-6-13 10:00:28

Code开源推荐开源源码

开源推荐:物联网一体化平台,高性能、高吞吐量、高扩展性的物联网平台

2023-6-13 12:00:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
有新私信 私信列表
搜索