ai人工智能
277
2025-04-09
全日程揭晓!ICLR 2025论文分享会我们北京见
从 OpenAI o1 到 DeepSeek R1,推理模型进入到了全新的发展阶段,展现出来的「慢思考、强推理」能力正在加速从语言智能到认知智能的进程,并构筑起未来 AGI 的重要基石。同时,学界对大语言模型范式的探索仍在继续,扩散模型不断...
282
2025-04-09
从零搭一套可复现、可教学、可观察的RL for VLM训练流程,我们试了试
自 Deepseek-R1 发布以来,研究社区迅速响应,纷纷在各自任务中复现 R1-moment。在过去的几个月中,越来越多的研究尝试将 RL Scaling 的成功应用扩展到视觉语言模型(VLM)领域 —— 刷榜、追性能、制造 “Aha ...
266
2025-04-09
华为云发布Stack可信数智空间解决方案,赋能可信数据空间探索
4 月 8 日,以 “乘数黔行,智华未来” 为主题的可信 AI 数据空间价值共创(贵州)高峰论坛成功举办。论坛齐聚政府机构、头部企业以及专家学者等政产研多方代表,围绕数据与 AI 协同发展进行深度探讨,共话可信数据空间发展趋势与未来机遇,助...
282
2025-04-04
ChatGPT会员北美大学生全免费,持续一个月,AI帮你过期末考试
「下一代默认 AI 大模型工具」的竞争开始了。本周五凌晨,OpenAI CEO 山姆・奥特曼宣布了一个令人兴奋的消息。从现在开始,ChatGPT Plus(原价每月 20 美元)面向美国和加拿大的大学生免费了,时长持续一个月。只要是美国和加...
268
2025-04-04
Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer
Attention 还在卷自己。当上下文包含大量 Token 时,如何在忽略干扰因素的同时关注到相关部分,是一个至关重要的问题。然而,大量研究表明,标准注意力在这种情况下可能会出现性能不佳的问题。标准多头注意力的工作原理是使用点积比较当前查...
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |
网址: | ai.tmqcjr.com |