ai人工智能
263
2025-04-17
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。论文主页: https://madaoer.github.io/projec...
259
2025-04-17
AI强化的人性化多模态视觉辅助系统,上交大开发智能便捷的穿戴设备,登Nature
编辑丨&科技的发展目的是服务于人,故而高新技术的应用也应当以人为本。目前人工智能驱动的可穿戴电子系统没有充分考虑盲人的适应状况,导致采用率很低。上海交通大学、上海人工智能实验室等开发了一种多模态可穿戴系统,通过融合软件和硬件创新来提...
260
2025-04-17
本周日不见不散!ICLR 2025北京论文分享会最后报名了
从 OpenAI o1 到 DeepSeek R1,推理模型进入到了全新的发展阶段,展现出来的「慢思考、强推理」能力正在加速从语言智能到认知智能的进程,并构筑起未来 AGI 的重要基石。同时,学界对大语言模型范式的探索仍在继续,扩散模型不断...
257
2025-04-17
4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理
当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率,这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力...
261
2025-04-17
刚刚,OpenAI发布最强推理模型o3!图像深度思考首秀,开源编程智能体已揽5k+star
深夜,OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。该系列模型经过训练,会在响应之前进行更长时间的思考。OpenAI 表示,这是他们迄今为止发布的最智能模型,也标志着 ChatGPT 能力的巨大飞跃。这次新发布的推...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |
网址: | ai.tmqcjr.com |