论文解读、算法突破、架构分析
传统AI聊天机器人只能被动应答,但CogniFold构建了一种“始终在线”的主动记忆系统,能自动消化碎片化信息、发现用户意图,甚至提前提出建议。它模仿人脑三层架构,不仅压缩4.6倍记忆量,还能用低成本小模型实现超强性能。
AI 智能体框架越来越多,选择比技术本身更让人头疼。Google 在 2025 年推出 ADK,开源、代码优先、专为多智能体场景设计,深度绑定 Google 生态。本文带你快速了解它的核心思路与定位。
Claude Code 的 Agent 机制常被误解为更聪明的技能。本文从零讲起:子代理拥有独立上下文、工具权限和系统提示,独立运行并返回结果。理解这一点,才能真正用好这个功能。
HCA Healthcare 宣布,一项发表在《新英格兰医学杂志》的研究显示,CRISPR 基因编辑疗法在 5 至 11 岁重度镰状细胞病和输血依赖性 β 地中海贫血儿童中取得积极成果。所有入组患儿在治疗后均实现至少 12 个月的输血独立或无严重疼痛危机,标志着该疗法在更年轻群体中的首次数据验证。
OpenAI工程师借用流行病学思维,通过系统收集和分析核心转储数据,将看似不可能的崩溃拆解为两个独立问题:一个硬件故障和GNU libunwind中隐藏18年的竞态条件。最终修复了这个影响ChatGPT数据基础设施的棘手bug,展示了数据驱动调试的力量。
随着 AI 工厂从试点转向生产,基础设施决策从芯片规格转向每 token 成本。NVIDIA 的推理软件栈通过多层优化和开源生态,在 Blackwell 平台上将 DeepSeek V4 模型 token 成本降至原来的五分之一,助力企业实现更低成本、更高效率的推理。
NVIDIA Isaac ROS 团队负责人 Jaiveer Singh 分享如何通过开源软件加速机器人开发。从 LEGO Mindstorms 到领导 Isaac ROS 项目,他致力于让开发者利用 CUDA 加速的库和 AI 模型构建机器人,推动物理 AI 时代到来。
中国AI系统在漏洞发现上追平Anthropic的Mythos模型。智谱GLM-5.2开源模型在安全基准测试中与Anthropic和OpenAI打平,成本仅一半。360发布“中国版Mythos”工具,已发现数千漏洞。与此同时,Anthropic指控阿里对Claude进行大规模蒸馏攻击。
中国科学院合肥物质科学研究院宣布,中国“人造太阳”项目两套关键超导磁体通过专家评审和全参数测试。其中极向场磁体重582吨,体积是国际热核聚变实验堆同类磁体的1.3倍,储能是其3倍,可稳定运行60年。另一高溫超导中心螺管线圈也达国際领先水平。所有材料实现完全国产化。
天文学家利用哈勃望远镜发现了一个距大爆炸仅14亿年的星系,它发出的紫外光正在驱散早期宇宙的中性氢“雾气”。这一发现将已知最早的电离光子源向前推进约2亿年,为理解宇宙再电离时代提供了新线索。
Hugging Face 分享了如何结合 AI 生成发布说明、开源 CI 工具和人工审核,实现本周发布一次的高效和可靠发布流程。
IBM 开源了 CUGA 智能体框架,它提供一套轻量级“工具带”,替你处理规划、工具调用和状态管理。开发者只需定义工具列表和提示词。文章通过 24 个单文件应用演示了 CUGA 如何让一个智能体从笔记本轻松迁移到生产级主权部署。
Transformers.js 正在实验跨源存储(COS)API,通过哈希索引实现跨源文件共享,避免 AI 模型和 Wasm 运行时的重复下载与缓存,大幅提升 Web 应用性能。
NVIDIA Rubin架构实现100%液冷,冷却液高达45°C,无需风扇,可减少40%能耗,节约数百万美元电费,并将水耗降至零。这一创新为AI工厂冷却树立新标准。
洛斯阿拉莫斯国家实验室(LANL)将采用NVIDIA Vera CPU构建三台新超算——Mission、Vision和Veritas,用于加速科学AI代理。Vera CPU在URSA工作负载上性能达x86的7倍,将推动材料模拟、分子设计等前沿研究。
Hugging Face 博客介绍了如何使用 Llama 3.1 等本地开源模型对 OpenClaw 仓库的 Pull Request 进行自动分类,无需支付 API 费用,且保护代码隐私。实验证明本地模型在效率和准确性上表现良好。
现代深度学习模型普遍过参数化,却能良好泛化。本文解析Sharpness-Aware Minimization优化器如何通过寻找平坦极小值,提升模型在测试集上的表现,打破经典机器学习理论中过拟合必然泛化差的预言。