网问答>>微软炸裂级单图生数字人,Sora同款思路,网友:“比AI刘强东还真”
问题
已解决

微软炸裂级单图生数字人,Sora同款思路,网友:“比AI刘强东还真”

时间:2024-08-12 18:50:07
微软炸裂级单图生数字人,Sora同款思路,网友:“比AI刘强东还真”
最佳回答
微软发布了一项革命性的技术,名为VASA-1,它能通过单张图片生成逼真的数字人视频。网友们对这一成果惊叹不已,称其为“炸裂级效果”,甚至有人表示它比AI刘强东的形象更为真实。这项技术突破了传统界限,仅需上传人脸图片和音频,即使是非真人内容也可实现高度模拟,如让蒙娜丽莎说唱或模仿名人场景。视频中的数字人表现出丰富的性别、年龄和种族特征,且口音各异,动作流畅自然,包括眼神交流和微表情,尽管眼睛细节仍有破绽,但已被赞誉为目前最佳演示。VASA-1的关键技术包括潜空间动作编码、人脸潜编码学习和头部运动生成模型,其中后者采用与Sora相似的Diffusion Transformer架构。该系统能实时生成高质量视频,如512x512分辨率,使用RTX4090显卡即可达到40fps。然而,随着技术的发展,人们对AI生成内容的伦理问题产生了质疑,尤其是考虑到诈骗和误导的风险。微软团队强调,他们的研究旨在创造具有视觉情感的数字人,而非用于欺骗,但警告可能被滥用。目前,VASA-1仅限于论文发布,暂无Demo或开源计划,且技术仍有改进空间。面对AI造假成本的降低,公众和业界都在思考如何在科技进步与伦理道德之间找到平衡。尽管如此,正如网友所述,我们无法阻止技术的进步,只能适应并管理其潜在影响。论文和更多详情可参考相关链接。
时间:2024-08-12 18:50:11
本类最有帮助
Copyright © 2008-2013 www.wangwenda.com All rights reserved.冀ICP备12000710号-1
投诉邮箱: