ai人工智能
264
2025-04-04
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
这会是 DeepSeek R2 的雏形吗?本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。当前,强化学习(RL)已广泛应用于大语言模型(LLM)的后期训练。最近 RL 对 LLM 推理能力的激励表明,适当...
268
2025-04-04
思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套
人工智能站报道,编辑:蛋酱。自去年以来,我们已经习惯了把复杂问题交给大模型。它们通常会陷入「深度思考」,有条不紊地展示思维链过程,并最终输出一份近乎完美的答案。对于研究人员来说,思考过程的公开可以帮助他们检查模型「在思维链中说过但在输出中没...
267
2025-04-04
250多篇论文,上海AI Lab综述推理大模型高效思考
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。但随之而来的是一个日...
263
2025-04-04
多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限
第一作者为哈尔滨工业大学(深圳)博士生王霄和华为大模型研究员佀庆一,该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成,佀庆一的研究方向为多模态理解、LLM post-training和高效推理。随着视频内容的重要性日益提...
288
2025-04-03
实测完即梦3.0,我后悔大学选了设计专业……
编辑 | 杨文自从 GPT-4o 出了「吉卜力」滤镜后,社交媒体上简直是人均宫崎骏。而这股「吉卜力热」也让 ChatGPT 圈了一大波粉,甚至一小时狂揽百万用户。友商们也坐不住了。Midjourney CEO 跳出来一顿阴阳,还放出自家模型...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |
网址: | ai.tmqcjr.com |