🎥 Midjourney计划推出“文本转视频”模型,扩展AI形象生成器到视频创作领域。
📚 小说展厅:官网推出小说展厅,用户可舒适浏览推荐小说,比Discord阅读更便捷。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
类似GPT-4的全部功能将开源,而且速度更快、成本更低。这和GPT-5一样让我兴奋。
站长之家(ChinaZ.com)1月4日 消息:HandRefiner是一种可以修正形状不正常的手部图像的方法。在生成图像方面,目前的图像生成模型已经非常出色,但是在生成人类手部的图像时常常会出现问题,例如手指数量不对或者手形怪异。