腾讯大模型团队致谢阿里云,AI开源再立功

发布时间:2024-06-09 06:41

[团队建设]如何建立良好的团队文化 #生活技巧# #团队建设技巧#

一张图就能生成一段舞蹈视频。近日,腾讯音乐娱乐Lyra实验室公开了全新的图生视频框架MusePose,补齐了其虚拟数字人模型家族的最后一环。

根据腾讯公开的项目信息显示,该模型可生成人物、卡通、动漫等形象视频,视频时长大约在10秒左右。但有意思的是,细心的网友发现,在MusePose的报告中,腾讯特别致谢了阿里的AnimateAnyone和其他开源组件。



对比阿里的Animate Anyone和腾讯的MusePose后,两款模型生成的效果极其相似,展示的demo也几乎一致,不难看出,腾讯的这一框架确实有参考、借鉴阿里的技术路线。

AnimateAnyone是何方神圣?

这是阿里通义实验室自研的一款视频生成模型,同样是输入一张图,就能将静态图像转换成连贯、可控制的视频。不同的是,阿里公开AnimateAnyone论文和多个开源文件的时间也追溯到去年11月。这一模型在当时被国内外开发者广泛关注,仅仅数日GitHub上就斩获了超1万个Star,更是在推特、YouTube等海外社交媒体平台上迅速蹿红,相关视频播放量超1亿。


今年1月,AnimateAnyone技术正式在通义App上线,直接向全民开放,用户仅需上传一张照片,就能让一个毫无舞蹈经验的人立刻跳起“科目三”,多数用户体验过后给出评价称,“科幻得夸张”、“有点强”。彼时网络疯传的兵马俑或马斯克跳“科目三”、奶牛猫跳洗澡舞等视频,背后使用的技术便是来自AnimateAnyone。


在当下的AI大模型领域中,视频生成是最热门的研究方向之一,OpenAI、谷歌、Meta等公司都在积极布局。但如何保证人物形象一致、动作流畅可控、时序细节完美重现等难题,依旧颇令业内头疼。在这一背景下,AnimateAnyone投下了曙光,成为这一领域的标杆之作,尽管Animate Anyone项目已公开近10个月,但时至今日,其对开源社区的价值依然在延续。


通向“科技普惠”的开源之路

开源还是闭源?这一直是人工智能领域中争论不休的一个问题。

站在当前时点,AI大模型之战开始向“更大、更强、更多模态”演进,但随之而来的是大幅攀高的成本。而开源大模型就可以极大降低应用开发的门槛,用户只需下载完成预训练的模型并进行微调,便可以搭起高质量模型或应用。换句话说,在大模型时代,开源路线能帮助更多中小企业组建大规模大模型,这对行业整体技术推进、生态繁荣发展、实现“科技普惠”极为重要。

不过,从0研发一款参数规模大、性能顶尖的大模型需要巨大的算力和人力成本,开源意味着把这些成果免费共享给所有人,纵观全球,能坚持回馈开源社区的科技公司并不多。“国内这方面阿里云做得比较好,肯把比较最好的模型开源出来,”有业内人士表示,“这很难得。”

从全球市场来看,阿里云是国内早期开源自研大模型的科技企业,也是全球开源全尺寸、全模态大模型的云厂商。就在今天,阿里还发布通义千问Qwen2大模型,在Hugging Face和ModelScope上同步开源,其性能超越美国最强的开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等一众闭源模型。据悉,阿里开源的Qwen系列模型的下载量已超1600万,目前全球已有1500款基于Qwen二次开发的模型。


海量资讯、精准解读,尽在新浪财经APP

网址:腾讯大模型团队致谢阿里云,AI开源再立功 https://www.alqsh.com/news/view/22838

相关内容

腾讯大模型团队致谢阿里云,AI开源再立功
大模型应用加速“出海”:企业级SaaS将被重塑 AI训练师成新工种
字节跳动打响大模型价格战?价格比同行低99.3%,称不用亏损换收入
中国创业者,不敢追Sora
大消息!阿里突然宣布了
骄傲!国际奥委会点赞中国AI技术,在巴黎奥运上创造历史
支付宝推出AI毛发自测工具 上传照片可测脱发程度
缺钱的AI独角兽们,再无力抵抗华尔街的“诱惑”
阿里京东走过最长的弯路:从争夺商家到回归用户
全球最大超算中心开始运转,马斯克的AI野心显露