ai人工智能

最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。论文主页: https://madaoer.github.io/projec...
编辑丨&科技的发展目的是服务于人,故而高新技术的应用也应当以人为本。目前人工智能驱动的可穿戴电子系统没有充分考虑盲人的适应状况,导致采用率很低。上海交通大学、上海人工智能实验室等开发了一种多模态可穿戴系统,通过融合软件和硬件创新来提...
从 OpenAI o1 到 DeepSeek R1,推理模型进入到了全新的发展阶段,展现出来的「慢思考、强推理」能力正在加速从语言智能到认知智能的进程,并构筑起未来 AGI 的重要基石。同时,学界对大语言模型范式的探索仍在继续,扩散模型不断...
当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率,这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力...
深夜,OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。该系列模型经过训练,会在响应之前进行更长时间的思考。OpenAI 表示,这是他们迄今为止发布的最智能模型,也标志着 ChatGPT 能力的巨大飞跃。这次新发布的推...
文章分类
联系我们
联系人: 透明七彩巨人
Email: weok168@gmail.com
网址: ai.tmqcjr.com