前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

实时脱敏AI语音转录开源模型发布

洞察2024年11月21日· 5 分钟阅读7 阅读

订阅我们的每日和每周通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多 对于希望利用人工智能模型 […]

订阅我们的每日和每周通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多

对于希望利用人工智能模型转录音频,特别是来自高管、员工和客户的人类语音的企业来说,可能对人工智能程序监听和记录敏感信息的想法感到担忧。

然而,以色列音频人工智能初创公司 aiOla 推出了一个新的模型,旨在解决这一问题。该模型名为 Whisper-NER,基于 OpenAI 的行业标准开源模型 Whisper,本身也是完全开源的,现在已在 Hugging Face 和 Github 上提供给企业组织和个人使用、调整、修改和部署。

它将自动语音识别 (ASR) 与命名实体识别 (NER) 相结合。这一创新旨在通过在转录过程中自动识别和屏蔽敏感信息(如姓名、电话号码和地址)来增强隐私。

用户可以在 Hugging Face 上试用演示模型,录制语音片段,并让模型在生成的文字转录中屏蔽他们输入的特定单词。在我的简短测试中,该模型成功地屏蔽了我的语音中的“VentureBeat”一词,这是一个专有名词。

Whisper-NER 解决了一个重大挑战:确保语音内容转录的隐私和数据保护法规合规性。该模型处理音频文件,并同时应用 NER 在转录管道中直接标记或屏蔽特定类型的敏感信息。与传统的多个步骤系统不同,传统的多个步骤系统在中间处理阶段会暴露数据,Whisper-NER 消除了对单独的 ASR 和 NER 工具的需求,从而减少了数据泄露的风险。

“我们将其设计为一个开源工具,以促进人工智能领域的隐私,”aiOla 研究副总裁吉尔·赫茨 (Gill Hetz) 在最近的一次视频通话采访中对 VentureBeat 表示。“它帮助用户屏蔽敏感数据,无需额外的软件步骤。”

此前,aiOla 因发布能够准确可靠地识别行业特定术语并进行转录的 Whisper 变体以及速度更快的语音转文本和语音识别模型而闻名。

Whisper-NER 完全开源,并根据 MIT 许可证提供,允许用户自由采用、修改和部署它,包括用于商业应用。

该模型可以在 GitHub 和 Hugging Face 上访问,确保其先进功能广泛可用。还提供了一个演示,帮助用户探索其功能和适应性。

开源发布符合 aiOla 促进协作和创新的理念。

“当人们协作时,人工智能才能向前发展,”赫茨说。“这就是我们使该模型开源的原因——鼓励社区采用和改进它。”

Whisper-NER 基于 OpenAI 的 Whisper 框架构建,在合成语音和基于文本的 NER 数据集的合成数据集上进行训练。这种独特的训练方法使该模型能够同时处理转录和实体识别任务,从而提供更高的准确性。

“我们没有将 ASR 转录和 NLP [自然语言处理] 实体提取分开,而是在一个模块中解决了这两个问题,”赫茨说。“在提取文本时,该模型会同时识别指定的实体。”

这种集成方法(在发布到开放访问、非同行评审网站 arXiv.org 的研究论文中进行了描述)不仅简化了工作流程,而且显着增强了数据安全性。

此外,Whisper-NER 支持零样本学习,使其能够识别和屏蔽在训练期间未明确包含的实体类型。

Whisper-NER 的灵活性使其适用于各种用例,包括合规性监控、库存管理、质量保证等等。

对于不需要屏蔽的应用程序,可以将该模型配置为仅标记敏感实体,为组织提供可定制的选项以满足其需求。

“医疗保健和法律等高度监管行业从我们的隐私优先方法中获益最多,但即使是敏感数据有限的公司也可以使用这项技术,”赫茨说。

Whisper-NER 代表了道德人工智能开发的进步,它使安全、以隐私为中心的转录成为可能。其开源可用性确保开发人员、研究人员和组织可以自由地将该模型纳入其运营中。通过降低与数据泄露相关的风险,它符合医疗保健、法律和客户服务等行业对安全、人工智能驱动的解决方案日益增长的需求。

“这个基于 Whisper 构建的版本最适合英语,但支持多种语言。开源贡献者可以进一步调整它以适应不同的语言和术语,”赫茨解释说。aiOla 鼓励全球贡献,以扩展该模型的覆盖范围和功能。

随着 Whisper-NER 现在向公众开放,aiOla 重申了其致力于创建负责任的人工智能工具的承诺,这些工具优先考虑用户隐私和安全,同时通过开放访问促进协作和创新。

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

黄仁勋苏姿丰同抵台湾备战Computex
TOP1

黄仁勋苏姿丰同抵台湾备战Computex

苹果 iOS 27 大更新:AirPods、Siri、图像生成齐变
TOP2

苹果 iOS 27 大更新:AirPods、Siri、图像生成齐变

3

黄仁勋每月飞台湾催单台积电

1小时前
黄仁勋每月飞台湾催单台积电
4

iOS 27 泄露细节显示 Siri 将全面重写

1小时前
iOS 27 泄露细节显示 Siri 将全面重写
5

以太坊Glamsterdam升级后交易量创新高

1小时前
以太坊Glamsterdam升级后交易量创新高
6

稳定币主导AI智能体支付

1小时前
稳定币主导AI智能体支付
7

iOS 27 将原生支持 Google Cast

1小时前
iOS 27 将原生支持 Google Cast
8

Anthropic安全模型Mythos短暂现身开发工具

1小时前
Anthropic安全模型Mythos短暂现身开发工具
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款