前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

AI 前沿

前沿技术与落地实践,追踪 AI 领域最新动态

全部大模型应用技术提示词工程前沿趋势
AI
2026年6月4日

用30亿参数模型打造多智能体经济模拟

在Hugging Face黑客松中,一个团队用仅30亿参数的小模型构建了多智能体经济模拟“千Token木”。10个AI智能体在虚拟世界中自主生产、交易、协作,展示了小模型也能支撑复杂多智能体交互,为低资源部署Agent经济提供了思路。

GPT-Rosalind 更新:专为生命科学打造的新能力
2026年6月2日

GPT-Rosalind 更新:专为生命科学打造的新能力

英伟达在CVPR发布三项研究:抓取、自动驾驶与智能体训练
2026年6月2日

英伟达在CVPR发布三项研究:抓取、自动驾驶与智能体训练

DPO新应用:用模型自身错误优化OCR文本退化

2026年6月2日
DPO新应用:用模型自身错误优化OCR文本退化

Holo3.1 发布:快速本地化计算机操作 AI

2026年6月1日
Holo3.1 发布:快速本地化计算机操作 AI

NVIDIA Cosmos 3:让物理AI先思考后行动

2026年5月31日
NVIDIA Cosmos 3:让物理AI先思考后行动

NVIDIA发布Cosmos 3:首个物理AI开源全模态模型

2026年5月31日
NVIDIA发布Cosmos 3:首个物理AI开源全模态模型

JetBrains发布12B参数MoE模型Mellum2

2026年5月31日
波士顿儿童医院借助AI诊断40余种罕见病

波士顿儿童医院借助AI诊断40余种罕见病

波士顿儿童医院将AI深度融入临床和运营,成功诊断了40多种此前无法解决的罕见病,同时通过自动化流程节省了6万小时工时和700多万美元人力成本。该院超过三分之一员工每天使用AI,重新定义了医疗的可能性。

2026年5月28日
OpenAI 启动 Rosalind Biodefense 计划

OpenAI 启动 Rosalind Biodefense 计划

OpenAI 宣布启动 Rosalind Biodefense 计划,为受信任开发者提供 GPT‑Rosalind 模型访问,用于构建生物防御和流行病防备工具。同时扩大对美国政府及盟友的信任访问,支持公共卫生与生物防御任务,旨在利用前沿 AI 加速防御能力,增强社会韧性。

2026年5月28日
可信第三方AI评估指南:OpenAI的经验与建议

可信第三方AI评估指南:OpenAI的经验与建议

OpenAI发布第三方评估可信指南,分享从GPT-5等模型评估中积累的经验。文章强调,评估应明确测试的claim、选择合适的harness(环境配置),并检查奖励黑客、污染、拒绝、沙袋等有效性风险。这为前沿AI模型评估标准提供了重要参考,帮助决策者理解评估结果背后的假设与局限。

2026年5月28日
英伟达ICRA论文:仿真到现实机器人新突破

英伟达ICRA论文:仿真到现实机器人新突破

在ICRA 2025上,英伟达研究团队展示了8篇聚焦仿真到现实(sim-to-real)迁移的论文,涵盖多臂协调、通用导航、杂波抓取、精密装配和视觉-语言-动作模型。这些成果正推动机器人从受控演示走向可靠自适应实体自主。

2026年5月27日
ITBench-AA基准:前沿模型企业IT任务得分不足50%

ITBench-AA基准:前沿模型企业IT任务得分不足50%

Artificial Analysis与IBM联合发布ITBench-AA基准,专门评估AI智能体在企业IT运维中的表现。首轮SRE任务测试中,Claude Opus 4.7以47%得分领先,但所有前沿模型均未超过50%。该基准模拟真实Kubernetes故障诊断,对模型的多步推理和精准定位能力提出严峻挑战。

2026年5月26日
AI Agent术语解析:Harness与Scaffold区分指南

AI Agent术语解析:Harness与Scaffold区分指南

AI Agent领域术语混乱,Harness、Scaffold等概念常被误用。本文由Hugging Face发布,系统定义模型、脚手架、框架、智能体等核心术语,明确它们之间的关系与差异,帮助开发者精准沟通,避免概念混淆。

2026年5月24日
Nemotron-Labs Diffusion:并行生成文本的新范式

Nemotron-Labs Diffusion:并行生成文本的新范式

NVIDIA 发布 Nemotron-Labs Diffusion 系列模型,融合自回归与扩散生成方式,支持三种推理模式:自回归、扩散、自推测。在保持精度的同时,扩散模式实现2.6倍、自推测模式实现6倍以上的令牌生成效率,为开发者提供灵活的文本生成加速方案。

2026年5月22日
专业化胜过规模:企业AI采购忽略的关键变量

专业化胜过规模:企业AI采购忽略的关键变量

一项新研究显示,一个30亿参数的专用OCR模型在质量、成本和稳定性上全面超越GPT-5.4、Claude Opus 4.6等前沿API,成本仅为后者的五十分之一。这表明分布对齐比参数规模更关键,企业AI采购策略需要重新审视。

2026年5月21日
从Prompt、Context到Harness,工程的三次进化与终局之战

从Prompt、Context到Harness,工程的三次进化与终局之战

注:本文有使用 AI 进行辅助写作,特此说明。   引言:一个令人不安的问题OpenAI 内部的一支 3 到 7 人小团队,在短短五个月内,让 AI 生成了将近 100 万行生产级别的代码。据称全程,没有一个工程师亲手写过一行业务逻辑代码。你的第一反应是什么?兴奋?恐慌

2026年5月21日
重新定义Skill开发:保姆级教程&一站式开发助手发布

重新定义Skill开发:保姆级教程&一站式开发助手发布

从入门到蒸馏,20 分钟以内学会创建、管理和发布你的第一个 Skill —— 让 AI Agent 真正成为你的超级助手。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)零、写在最前:Skill 会替代我吗?每当我向同事介绍 Skill 时,最常被问到的一个问题是:&quo

2026年5月21日
Google design.md 实战:让 AI 帮你做出 99.99% 的人做不出的设计

Google design.md 实战:让 AI 帮你做出 99.99% 的人做不出的设计

最近我一直在琢磨一件事:为什么 vibe coding 这么火,但十个 AI 一键搓出来的产品,有九个长得像同一个?紫色渐变、玻璃拟态、首屏 hero 大字加一句不痛不痒的 slogan——你刷到第二个就想关掉。Google 上个月开源了一个叫 design.md 的新东西,目的

2026年5月21日
Qwen3.7-Max 重新定义 AI Agent 基座

Qwen3.7-Max 重新定义 AI Agent 基座

很多开发者对 AI Agent 的真实体验是:“Demo很惊艳,一上生产就崩溃。”任务稍长就丢上下文,换个框架就性能暴跌,跑几轮就开始“自我循环”……我们需要的是一个能理解意图、规划路径、持续迭代并可靠交付的智能体基座。今天,我们正式发布 Qwen3.7-Max 它在多项权威评测

2026年5月21日
刚发布的Antigravity 2.0:从开发到管理的一跃

刚发布的Antigravity 2.0:从开发到管理的一跃

给一个已经延期的软件项目增加人手,只会延期更严重。——Fred Brooks,《人月神话》记得多年前第一次读到这句话的时候,觉得好反直觉——人多反而拖累项目。昨天凌晨的谷歌 I/O 2026 上,Sundar Pichai 演示 Antigravity 2.0 用 93 个 subAgent 在 1

2026年5月21日
AI

2026 年真正好用的 30 个提示词技巧

有个叫 @zodchiii 的博主写了一篇长文,把他每天用 Claude 4.6 写代码积累的 30 个提示词技巧全盘托出了。原文翻译如下:市面上大多数提示词工程指南都过时了。它们还在教你「扮演一个资深专家」,然后写一大堆文字。那是 2024 年的玩法。Claude 4.6 完全不一样。它会逐字理解

2026年5月21日
从手写 Prompt 到可复用 Skills:AI Agent 的“技能包”

从手写 Prompt 到可复用 Skills:AI Agent 的“技能包”

[ 导读 ] .本文将带你看懂:Skills 为什么会出现,它和 Prompt、RAG、Plugin 有什么不同,以及它为什么可能成为 AI Agent 走向工程化的重要一步。01 Skills背景  .当前 AI Agent 落地中的一个核心矛盾:模型越来越强,但组织化、流程化

2026年5月21日
没更新Antigravity的先别动,更新了的我先替你们哭一会

没更新Antigravity的先别动,更新了的我先替你们哭一会

昨天凌晨Google I/O 2026刚开完,Antigravity 2.0作为重头戏之一正式发布。台上演示得很漂亮,93个subAgent并行跑,12小时从零搭了个操作系统出来,成本不到1000美金。弹幕和推特都在刷太猛了。但是,如果你今天手贱点了更新,你大概率已经在骂娘了。因为这次更新,Goog

2026年5月21日
前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款
JetBrains发布12B参数MoE模型Mellum2

企业AI规模化为何依赖Agent逻辑

2026年5月31日
企业AI规模化为何依赖Agent逻辑
//

24小时热榜

美国陆军:禁用中国设备或拖累军事数据中心
TOP1

美国陆军:禁用中国设备或拖累军事数据中心

TOP2

AI产品经理指标手册:五层、四实践、一清单

3

Neuralink植入装置恢复瘫痪患者语言与艺术能力

7小时前
Neuralink植入装置恢复瘫痪患者语言与艺术能力
4

画面党该醒醒了,用户一直在调音量

7小时前
5

流式传输:让AI响应快到飞起

7小时前
6

SkillOpt:从提示工程到技能训练

7小时前
7

分层架构正在瓦解:自治领域能力崛起

7小时前
分层架构正在瓦解:自治领域能力崛起
8

轨道清洁战:近地轨道上万亿美金的博弈

7小时前
轨道清洁战:近地轨道上万亿美金的博弈