论文解读、算法突破、架构分析
传统Next-Token Prediction训练大模型时,一次只预测下一个词。多Token预测(MTP)则一次性预测多个未来词,加速学习并提升推理能力。本文拆解MTP原理,探讨它对大模型训练效率与泛化能力的影响。
天文学家利用詹姆斯·韦伯太空望远镜首次测量了遥远宇宙中一个休眠超大质量黑洞的质量。该黑洞约60亿倍太阳质量,位于100亿光年外的星系MRG-M0138中心,通过引力透镜和恒星动力学技术实现精确称量,为早期宇宙黑洞与星系共同演化提供了新视角。
临床试验显示,在放疗基础上联合病毒免疫疗法CAN-2409,可将局部前列腺癌患者进展或死亡风险降低30%。两年时80%治疗组患者活检阴性,安全性良好。数据发表于《柳叶刀》,有望成为20年来首个全新治疗范式。
NASA 的南希·格雷斯·罗曼太空望远镜通过主镜最终检查,计划于 8 月 30 日搭乘 SpaceX 猎鹰重型火箭发射,前往日地 L2 拉格朗日点,开展暗能量、暗物质和系外行星研究。
Google 启动秘密试点项目,向 Android 开发者付费获取源代码,用于改进其 AI 编程工具。开发者保留知识产权,非独家许可。此举因公开代码不足,且竞争对手 Anthropic、微软等已领先。
纽约大学朗格尼健康中心科学家发现海马体中约25%的神经元充当生物“交换板”,通过改变放电模式实现新记忆编码与旧记忆保护并行的机制,为神经退行性疾病和AI防止遗忘提供新思路。
NASA朱诺号探测器在木星弓形激波上游的前震区域捕获了电子加速到接近光速的直接证据,揭示宇宙射线形成的可能机制。
艾伦研究所宣布启动总投入4亿美元、为期14年的全球脑健康加速器计划,旨在绘制神经退行性疾病的细胞根源,并开发靶向基因疗法。目标是在五年内推进至人体临床试验。
詹姆斯·韦伯空间望远镜在距大爆炸仅15亿年的星系GN20中探测到一条恒星棒,其规模堪比银河系。这一发现颠覆了星系棒需要数十亿年才能形成的传统认知,对早期宇宙星系演化模型提出重大挑战。
华为轮值董事长徐直军公开感谢美国半导体出口管制,称其推动了中国芯片自主化。华为同时公布Tau Scaling架构和LogicFolding技术,目标在2031年实现1.4nm等效密度,绕开EUV光刻机限制。
中国华东师范大学团队利用量子光——明亮压缩真空态,在不增加平均能量的情况下,将超快激光的非线性作用增强20倍。该成果发表在《自然》杂志,有望降低阿秒科学等领域的实验能耗和损伤风险。
欧洲核子研究中心(CERN)的LHCb实验发现B介子衰变异常,与标准模型预测偏差达4个标准差,物理学家称可能指向新物理。同时英国削减超过2.5亿英镑资金,威胁后续研究。
大模型推理速度慢,很多人怪算力不够。但真相是:数据在内存和计算单元之间的搬运,才是最大的拖累。减少数据移动,不降低精度,才是当前推理优化最务实的路径。
中国神舟二十一号宇航员张陆、吴飞、张洪章在轨210天后安全返回,创中国最长太空驻留纪录。因飞船故障,任务延长一个月,最终乘坐神舟二十二号返回舱着陆。
中国研究人员开发了一个基于大语言模型的AI系统,能够自主分析卫星图像并识别空中目标,无需人工干预。该系统采用“大脑+工具集群”架构,显著缩短分析时间,但也引发关于自主武器治理的讨论。
当相册不再只是存照片的地方,而是一个能主动帮你回忆、整理、决策的AI代理。本文揭秘如何用本地模型实现这一转变,并探讨个人数据主权与边缘AI的未来。
一项发表于《科学》的研究揭开了鸽子感知地磁场的奥秘:肝脏中的巨噬细胞富含氧化铁纳米颗粒,能像指南针一样响应磁场,并将信号传递给大脑,帮助鸟类在阴天导航。