ai人工智能

723 2025-04-09

从 OpenAI o1 到 DeepSeek R1，推理模型进入到了全新的发展阶段，展现出来的「慢思考、强推理」能力正在加速从语言智能到认知智能的进程，并构筑起未来 AGI 的重要基石。同时，学界对大语言模型范式的探索仍在继续，扩散模型不断...

726 2025-04-09

自 Deepseek-R1 发布以来，研究社区迅速响应，纷纷在各自任务中复现 R1-moment。在过去的几个月中，越来越多的研究尝试将 RL Scaling 的成功应用扩展到视觉语言模型（VLM）领域 —— 刷榜、追性能、制造 “Aha ...

655 2025-04-09

4 月 8 日，以 “乘数黔行，智华未来” 为主题的可信 AI 数据空间价值共创（贵州）高峰论坛成功举办。论坛齐聚政府机构、头部企业以及专家学者等政产研多方代表，围绕数据与 AI 协同发展进行深度探讨，共话可信数据空间发展趋势与未来机遇，助...

725 2025-04-04

「下一代默认 AI 大模型工具」的竞争开始了。本周五凌晨，OpenAI CEO 山姆・奥特曼宣布了一个令人兴奋的消息。从现在开始，ChatGPT Plus（原价每月 20 美元）面向美国和加拿大的大学生免费了，时长持续一个月。只要是美国和加...

638 2025-04-04

Attention 还在卷自己。当上下文包含大量 Token 时，如何在忽略干扰因素的同时关注到相关部分，是一个至关重要的问题。然而，大量研究表明，标准注意力在这种情况下可能会出现性能不佳的问题。标准多头注意力的工作原理是使用点积比较当前查...

文章分类

联系我们