AI新闻

RunwayML发布新功能:文本转视频AI服务引入运动功能,创造更高分辨率的影像体验

RunwayML,一家专注于文本转视频的初创公司,最近推出了名为“Motion Brush”的新功能。这一功能使用户能够选择图像中的特定区域并使其动起来。同时,Runway的Gen-2模型也经过了重大升级,提升了保真度和一致性。更新后的Gen-2模型还支持更高分辨率的处理,达到了2,816 x 1,536像素,超过了目前广泛使用的全高清分辨率。

S-LORA:实现可扩展服务的AI系统

S-LORA是一种旨在实现高效部署大量适配器的AI系统。它通过最小的开销在单个GPU上或跨多个GPU运行,并引入统一分页来优化GPU内存使用。该研究通过量化、稀疏化和细化模型架构等方法来提高性能,并开发了自定义CUDA内核。S-LORA解决了LLM服务中的自回归功能和参数适配器,并弥合了当前模型服务系统中的优化差距。该研究提供了一种可扩展的LORA方案,解决了大规模服务微调变体的挑战。

腾讯Angel机器学习框架再创新,训练效率提高2.6倍

腾讯于11月23日宣布其自主研发的机器学习框架Angel再次升级,成功将大模型训练效率提高到主流开源框架的2.6倍,为使用Angel框架训练千亿参数级模型的用户带来了50%的算力成本节省。新版本的Angel支持单任务万卡规模的超大训练,大幅提升了腾讯云的大模型训练性能。该框架提供了一体化平台,从研发到实际应用,通过API等方式快速应用腾讯混元模型,目前已有300多个腾讯产品接入。

谷歌AI发布Mirasol3B:突破多模态学习的新典范

谷歌AI团队推出了Mirasol3B,一款创新的多模态自回归模型。该模型通过巧妙处理音频、视频和文本等多种输入,成功解决了同步挑战,并在处理较长视频输入方面表现卓越。Mirasol3B采用了独特的多模态自回归架构,将时间对产模态和上下文模态分开建模,带来了全新的视角。

AI机器人化学家成功在火星陨石中合成自主催化剂,开启外星行星探索新纪元

研究人员利用AI机器人化学家在氧气生产自主催化剂合成方面取得重大突破,通过理论计算和实验优化了火星陨石的析氧反应(OER)。借助神经网络模型,他们成功预测了催化性能,采用贝叶斯优化确定了最佳金属成分,证明其在有限实验数据下的优越性。这一研究为利用火星殒石进行催化剂设计提供了宝贵见解,突显了计算方法在材料科学中的潜力。

字节跳动旗下大模型产品“ChitChop”在海外上线,提供多达200+智能机器人服务

字节跳动旗下的大模型产品“ChitChop”由POLIGON开发和运营,近日在海外上线。该产品提供多达200+智能机器人服务,涵盖创作、工作、AI画画、娱乐、AI学习和生活等六大场景。ChitChop利用云雀大语言模型创建的AI工具合集,旨在为用户提供创新灵感和提高工作效率,与用户共同度过工作和生活的各个方面。

AI智能扩图在抖音引发热潮,但生成图像真实性有局限性

一位博主在抖音上发布使用AI智能扩图生成的照片走红,引起了近40万次点赞和5万多次转发。尽管AI智能扩图取得了巨大的关注度,但一些作品凸显了生成图像的不足,可能与训练和生成过程的问题有关。训练数据不足、过度拟合、训练目标不明确等因素可能导致生成图像缺乏真实感。然而,随着技术的不断发展和改进,未来有望解决这些问题,使AI智能扩图在更广泛的应用场景中发挥其优势。