ai人工智能

638 2025-04-04

这会是 DeepSeek R2 的雏形吗？本周五，DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。当前，强化学习（RL）已广泛应用于大语言模型（LLM）的后期训练。最近 RL 对 LLM 推理能力的激励表明，适当...

645 2025-04-04

人工智能站报道，编辑：蛋酱。自去年以来，我们已经习惯了把复杂问题交给大模型。它们通常会陷入「深度思考」，有条不紊地展示思维链过程，并最终输出一份近乎完美的答案。对于研究人员来说，思考过程的公开可以帮助他们检查模型「在思维链中说过但在输出中没...

668 2025-04-04

最近，像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型（Large Reasoning Models，LRMs）通过加长「思考链」（Chain-of-Thought，CoT）在推理任务上表现惊艳。但随之而来的是一个日...

625 2025-04-04

第一作者为哈尔滨工业大学（深圳）博士生王霄和华为大模型研究员佀庆一，该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成，佀庆一的研究方向为多模态理解、LLM post-training和高效推理。随着视频内容的重要性日益提...

694 2025-04-03

编辑 | 杨文自从 GPT-4o 出了「吉卜力」滤镜后，社交媒体上简直是人均宫崎骏。而这股「吉卜力热」也让 ChatGPT 圈了一大波粉，甚至一小时狂揽百万用户。友商们也坐不住了。Midjourney CEO 跳出来一顿阴阳，还放出自家模型...

文章分类

联系我们