论文解读、算法突破、架构分析
CERN于周一关闭了大型强子对撞机,开启为期四年的升级改造,项目耗资15亿美元。升级后对撞机将大幅提高粒子碰撞率,预计2030年重启。
Hugging Face 分享了如何结合 AI 生成发布说明、开源 CI 工具和人工审核,实现本周发布一次的高效和可靠发布流程。
IBM 开源了 CUGA 智能体框架,它提供一套轻量级“工具带”,替你处理规划、工具调用和状态管理。开发者只需定义工具列表和提示词。文章通过 24 个单文件应用演示了 CUGA 如何让一个智能体从笔记本轻松迁移到生产级主权部署。
Transformers.js 正在实验跨源存储(COS)API,通过哈希索引实现跨源文件共享,避免 AI 模型和 Wasm 运行时的重复下载与缓存,大幅提升 Web 应用性能。
NVIDIA Rubin架构实现100%液冷,冷却液高达45°C,无需风扇,可减少40%能耗,节约数百万美元电费,并将水耗降至零。这一创新为AI工厂冷却树立新标准。
洛斯阿拉莫斯国家实验室(LANL)将采用NVIDIA Vera CPU构建三台新超算——Mission、Vision和Veritas,用于加速科学AI代理。Vera CPU在URSA工作负载上性能达x86的7倍,将推动材料模拟、分子设计等前沿研究。
Hugging Face 博客介绍了如何使用 Llama 3.1 等本地开源模型对 OpenClaw 仓库的 Pull Request 进行自动分类,无需支付 API 费用,且保护代码隐私。实验证明本地模型在效率和准确性上表现良好。
现代深度学习模型普遍过参数化,却能良好泛化。本文解析Sharpness-Aware Minimization优化器如何通过寻找平坦极小值,提升模型在测试集上的表现,打破经典机器学习理论中过拟合必然泛化差的预言。
传统上,轻量化CNN意味着牺牲精度。CSPNet打破了这个规律——它能在显著降低计算量的同时,保持甚至提升准确率。本文带你拆解其核心架构与PyTorch实现。
波士顿儿童医院等机构利用OpenAI o3 Deep Research模型,重新分析376例未确诊罕见病病例。AI辅助专家从海量数据中发现线索,最终确诊18例(4.8%),其中7例为信息碎片化导致的漏诊。研究表明,AI可帮助专家在知识不断更新的背景下实现更高效的再分析流程。
OpenAI 提出一种名为'部署模拟'的新方法,通过重放真实对话并用新模型重新生成响应,在发布前预测模型在真实世界中的行为。该技术能发现未知风险、提高频率估计准确性,并减少模型对测试的感知,为AI安全部署提供更可靠的评估手段。
LifeSciBench是一个由专家科学家设计的新基准,包含750个任务、1062个附属资料,覆盖七种工作流程和生物学领域。它评估AI系统能否处理真实研究中的复杂性,如解读不完整证据、设计实验等。初步测试显示,前沿模型在科学沟通和转化方面有进步,但在处理附图、设计任务上仍显不足。
Hugging Face 的 PEFT 基准测试揭示,LoRA 虽是最流行的参数高效微调技术,但在图像生成等任务上并非最优。OFT 等方法在性能和内存占用上均超越 LoRA。PEFT 库提供统一 API,让用户轻松切换和比较不同技术,避免固守默认选项。
AWS 开源 Strands Robots SDK,将 LeRobot 的工具链封装为 AgentTools,通过一条自然语言指令即可完成从模拟演示、数据集推送、策略推理到物理机器人部署的完整流程。模拟与硬件共享同一数据格式,无需额外转换。
Coherent在德克萨斯州Sherman动工扩建制造工厂,生产用于AI系统的磷化铟晶圆和光学组件。黄仁勋出席仪式,强调光互连是大规模AI基础设施的关键。美国CHIPS法案提供5000万美元拨款,推动先进半导体制造回流。
科学家推出无创胎儿测序技术(NIFS),只需母亲抽血就能检测近23,000个胎儿基因,准确率高达95%至99%,有望替代羊膜穿刺等有创产检。
扩散模型正成为AI运行的核心引擎,尤其在边缘设备上,速度就是生命。本文拆解扩散模型在图像生成、视频处理等场景的颠覆性优势,并探讨中国科技公司如何借势突围。