前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

什么是AI PaaS?一文读懂AI开发新未来:AI PaaS在AI开发中的作用

NEXTECH
Last updated: 2025年11月3日 上午8:06
By NEXTECH
Share
27 Min Read
SHARE

什么是AI PaaS?一文读懂AI开发新未来

AI应用部署面临复杂挑战。AI PaaS作为平台级解决方案,抽象AI基础设施和功能,简化AI应用构建、部署与运行,加速生产级AI开发。Heroku提供此类服务。

Contents
什么是AI PaaS?一文读懂AI开发新未来什么是AI PaaS以及为何它是必需的?现代PaaS的核心基础最小可行AI PaaS的基本功能企业级AI PaaS的期望Heroku如何提供全面的AI PaaS赋能下一代AI开发者

部署AI驱动的应用程序不仅仅是调用模型。开发者必须处理推理基础设施、版本化数据管道并集成外部工具,同时还要找到方法来监控或管理更可能出现幻觉的输出。当团队试图超越基本原型时,他们突然被迫在编排、合规性和AI架构方面发展专业知识。

随着AI能力在各种模态(例如:文本到图像到音频)中爆发式增长,开发者体验却未能跟上步伐。团队正在将跨云提供商、大型语言模型 (LLM)API、向量数据库和脆弱的控制循环的解决方案拼凑在一起。即使是拥有强大工程实力的公司也难以保持开发速度。

缺少的是一种平台级解决方案,它能像传统 平台即服务 (PaaS)抽象基础设施一样,抽象这些AI相关的关注点。

这正是 AI平台即服务(AI PaaS) 旨在填补的空白。它将PaaS的简洁性、可扩展性和开发者优先工具的核心原则带入现代AI构建模块。

本文将探讨什么是AI PaaS,以及它如何帮助开发者无需重新发明整个技术栈即可交付生产级的AI应用程序。

You Might Also Like

Agentic AI与AI Agent:核心区别、特征及应用策略
MCP上下文爆炸怎么办?Anthropic给出了新答案(图文示例) 介绍 MCP 上下文爆炸问题及 Anthropic 给出的代码执行模式解决方案
阿里巴巴AI大突破:Aegaeon系统GPU需求狂降82%!
OpenAI发布“AI原生版”Sora:重塑短视频社交,Sora 2模型深度解析

什么是AI PaaS以及为何它是必需的?

AI PaaS正如其名:它是一个平台,帮助开发者在云端构建、部署和运行AI驱动的应用程序,而无需自行管理模型、编排、管道或基础设施。它建立在传统PaaS的基础上,但通过模型访问、检索管道、代理编排和评估工具等AI原生功能对其进行了扩展。

这些平台填补了一个关键空白,因为许多AI项目从未投入生产。Gartner预测,到2027年,多达 40%的代理AI计划将失败,这通常是由于集成成本、缺乏可观测性或部署复杂性。AI PaaS通过提供有主见且可扩展的默认设置来应对这些挑战。

那么AI PaaS由什么构成?它从PaaS的基础开始,然后添加AI特定的功能。

现代PaaS的核心基础

无论是构建CRUD应用还是对话代理,每个PaaS都需要做好几件核心事情。它们是:

  • 可扩展性:基础设施可以轻松扩展,以处理计算密集型AI工作负载的变化。
  • 安全性:所有租户都通过适当的访问控制进行隔离,以确保模型、数据和代理保持安全。密钥都遵循最小权限原则并得到安全管理。
  • 容器化:代理和工具都在容器中,以实现一致的部署。
  • 编排:无需手动配置基础设施。代码自动构建和部署。
  • 数据:数据库自动配置、可扩展并提供安全访问。这可能意味着向量数据库、客户数据或AI所需的任何其他内容。
  • 可观测性:延迟、使用模式和错误管理通过OpenTelemetry或类似工具可见。AI工作流也需要在提示流和结果中具有可观测性,以便调试LLM结果。

这些是基本要求。然而,使用AI进行构建会引入一层新的复杂性。接下来,本文将探讨AI PaaS所需的特定功能。

最小可行AI PaaS的基本功能

AI模型和推理选项

AI驱动的功能以LLM为中心。LLM提供对话式生成AI,自2022年ChatGPT发布以来已变得普遍。AI PaaS应提供对各种机器学习 (ML) 模型的无缝访问。所有模型都有不同的优缺点,因此访问多个模型为构建AI代理的团队提供了最大的灵活性。

这种多样性还可以用于降低成本,其中一些服务需要复杂(且昂贵)的模型,而复杂度较低的服务可以使用更小、更便宜的模型。

AI质量和可靠性的控制循环

当LLM提供响应时,应建立一个控制循环来监控响应并验证其质量。开发者可以创建客户定义的启发式和规则,用于评估响应。这可能涉及硬编码的防护措施,或者比较多个LLM的结果以达成共识。

如果响应不符合质量标准,查询可能会被重新表述并再次查询。如果响应通过评估,控制循环将把响应传递给模型的下一步。

Image 62: 一个闭环通过将输入发送到循环中以产生输出,然后将输出作为输入返回,从而监控响应。

一个闭环通过将输入发送到循环中以产生输出,然后将输出作为输入返回,从而监控响应。

连接数据和工具的模型上下文协议

LLM是强大的工具,可以与用户就许多不同的话题进行对话。为了支持对组织有用的生成式AI,必须不断提供额外数据,以确保及时准确的响应。

MCP是一种标准化方法,用于将外部工具连接到AI系统,以提供额外的数据或知识。MCP服务器使得安全地连接现有数据工具(内部和外部)以整合新数据变得容易。

MCP可以提供与API的连接,用于频繁变化的数据(“纽约皇后区目前的交通状况如何?”),或与包含企业数据的数据库的连接(“2021年第二季度签署了多少笔交易?”)。这些数据存储支持并增强了模型的输出。

此外,MCP还充当服务目录。当查询发送到AI时,它会根据了解数据位于 何处 以及如何检索并格式化为响应来构建其响应。这允许现有应用程序和代理连接到MCP。

Image 63: MCP处理来自应用程序和LLM的请求,然后从外部源馈送数据。

MCP处理来自应用程序和LLM的请求,然后从外部源馈送数据。

MCP还可以用于将AI应用程序作为工具暴露给其他 代理系统使用,允许其他代理使用AI系统完成任务。

例如,Audata构建了Aura(一个AI支持代理),利用Heroku Postgres的实时数据和来自 Salesforce Agentforce的企业数据来回答日常问题。如果案件升级到支持团队,则会向代表提供现有聊天的概要,从而加快工单解决速度。

企业级AI PaaS的期望

一个可靠的AI PaaS不仅仅是推理,它还帮助团队负责任地构建、快速迭代并自信地扩展。以下是企业从支持长期、生产级AI使用的平台中可以期望的功能:

检索增强生成

一种常用的外部知识数据存储工具是 检索增强生成 (RAG)。RAG数据库通常是一个向量数据库,包含专门编码用于快速与LLM交互的企业数据。例如,Heroku的 Postgres pgvector提供了无缝的向量数据库支持,无需额外的数据库工具。

当向AI模型发出查询时,LLM会提供数据库中的相关数据来构建响应。RAG架构允许组织插入定制数据来影响LLM的响应。

例如,1West的贷款处理和审批是一个缓慢的手动过程。在使用Heroku的AI PaaS训练一个机器学习模型以处理大量数据源后,贷款处理时间从几天缩短到几分钟。

Image 64: 简化的RAG架构,包括用于上下文数据的数据管道。

简化的RAG架构,包括用于上下文数据的数据管道。

用于更新RAG数据库的RAG数据管道

正如LLM本身可能很快过时并提供不正确或陈旧的响应一样,RAG数据库中的数据也可能发生同样的情况。为了保持AI应用程序的准确性,RAG数据库必须不断刷新以反映新的或变化的数据。这需要自动化文档处理工作流。这些工作流应与现有系统无缝集成,并高效处理所有处理步骤。

例如,在Heroku生态系统中,Heroku Scheduler可以定期运行工作流以访问文档并将处理后的数据插入到pgvector数据库中。所有处理都在安全环境中进行,保护企业数据。

Heroku如何提供全面的AI PaaS

随着公司将AI驱动的工具集成到其技术栈中,许多开发团队缺乏在生产环境中部署AI所需的MLOps、治理和编排技能。使用Heroku的AI PaaS可以启动构建、部署、操作和扩展AI驱动应用程序的过程。

借鉴Heroku在构建云架构方面的经验和开发者优先方法意味着企业团队可以专注于构建服务,而不是管理服务器、网络、安全和构建编排工具。

Heroku 氛围编程AI代码生成允许开发者使用自然语言创建并部署到Heroku。Heroku的托管推理和代理提供了精选的AI模型供开发者构建。Heroku的MCP服务器使得代理能够轻松访问Heroku资源,如日志、配置附加组件和扩展应用程序。部署在Heroku上的自定义MCP服务器可以为AI服务提供对现有系统的访问权限。

  • LLM支持由 Heroku托管推理和代理提供,可访问多个LLM推理模型。
  • Heroku AppLink提供与Agentforce(Salesforce平台的代理层)的安全连接,并与Salesforce Flows、Apex和 Data Cloud连接。
  • Heroku的 AI原生工具集成使开发者能够构建新应用、增强现有应用并使用AI生成的代码创建新的AI代理。这意味着运行在Heroku上的AI代理可以安全地与敏感企业数据交互,利用最先进的AI同时确保数据安全。

赋能下一代AI开发者

部署AI应用应该像推送Web应用一样简单。凭借有主见的默认设置和托管服务,Heroku持续与开发者共同发展,提供流线型、集成的平台体验。

Heroku正将其数十年的云端应用部署专业知识带入,以帮助开发者快速推出AI技术。要了解更多关于Heroku和AI PaaS的信息,开发者可以参考其YouTube演示或在LinkedIn上关注更新。

TAGGED:AI PaaSAI开发AI技术RAG大模型
Share This Article
Email Copy Link Print
Previous Article 关税政策对经济的影响示意图 关税震荡:特朗普政策对美国经济的深远影响
Next Article AI浏览器深度解析:澄清与操作系统的混淆,引入“代理操作层”概念
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

图片1:GPT-5智能体
大模型与工程化

构建GPT-5智能体:赋能AI应用的未来

2025年11月12日
DeepSeek-OCR文字识别示例
AI 前沿技术

DeepSeek-OCR用户测评:文字、图表识别与提示词效果实测

2025年11月1日
CodeBuddy Code多模型集成界面
AI 前沿技术

腾讯版CodeBuddy实测:微信登录,畅用GPT5、Claude4、Gemini 2.5 Pro,构建本地AI画廊界面

2025年10月8日
示意图:Prompt只是上下文冰山一角
AI 前沿技术

Claude Code实践揭示:上下文工程是AI智能体成功的生死线,超越Prompt限制

2025年10月5日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up