【AiBase提要:】“头号AI玩家”整理汇总了近期海内外各大AI公司、AI研究者、风险投资人、科技媒体的主要观点,他们就生成式AI的未来、AI Agent、多模态、开源和闭源模型之争、AI安全等话题给出了自己的预测。尽管每个人的看法不同,但有一点可以确定:2024年有望成为生成式AI的决定性一年。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
据了解,Zara的这场直播一改传统直播间的紧凑,而是将整个秀场搬到了直播间,用户不仅可以看到Zara以T台走秀的形式演绎讲解多款Zara秋冬新品,还可以看到模特更换妆造、摄影师跟拍这些镜头外的场景,沉浸感拉满。
2. 斯坦福研究人员利用维基百科数据训练大模型WikiChat,成功减轻了幻觉问题,并在事实准确性和对话性方面超过了其他模型。