AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

🤖AI应用

百度发布超级助理插件

百度智能云发布基于文心一言的AI浏览器插件“超级助理”,以Web Copilot形式提供智能助理服务,涵盖复杂问题解析、文案创作辅助、智能文档处理等场景,支持个性化行业版,助力专业人士提升工作效率。

【AiBase提要】

Web Copilot服务: 百度超级助理以浏览器插件形式出现,随时感知用户需求,在多个场景中提供智能助理服务。

‍ 多场景应用: 从新人职场适应到业务专家的市场调研,超级助理覆盖简历优化、方案创作、翻译等多方面,提高工作效率。

行业定制版本: 将推出针对工业、金融、教育等领域的行业版,为专业人士提供个性化、定制化的工作助手服务。

支付宝发布首个用户资产模型

支付宝全域数据营销产品【棋盘密云】升级,推出首个用户资产模型5C,为商家提供更高效的支付宝内用户运营支持,通过五个层级划分用户,提供运营策略,同时支持横向对比,已有超1400商家使用。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

【AiBase提要:】

用户资产模型升级: 支付宝棋盘密云上线首个用户资产模型5C,为商家提供更高效的支付宝内用户运营支持。

五层级用户划分: 模型基于商家和用户关系,将用户分为C1至C5五个层级,帮助商家发现高价值用户并提供运营策略。

横向对比支持: 支持商家与同行业、同级别商家进行横向对比,帮助发现运营短板,提升运营效率。

🤖大模型动态

美图自研AI视觉大模型MiracleVision发布4.0版本

今日,美图自研AI视觉大模型MiracleVision(奇想智能)发布4.0版本,最新版本带来了两大新能力:AI 设计和 AI 视频。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

【AiBase提要:】

AI设计功能: 包括矢量图形、文字特效、智能分层和智能排版,通过自然语言交互实现快速设计。

AI视频能力: 提供文生视频、图生视频、视频运镜和视频生视频四大功能,适用于电商和广告行业。

视觉模型商店: 推出全新的视觉模型商店,用户可选择不同模型创造各种前所未有的视觉效果。

Runway与Getty合作推出生成式AI视频模型RGM

Runway ML与Getty Images合作推出新生成式AI视频模型RGM,为企业提供基础模型,支持微调,定制化视频生成工作流,服务好莱坞和广告行业。

【AiBase提要:】

🤖 创新合作: Runway ML与Getty Images共同开发生成式AI视频模型RGM,突破边界,为视觉媒体行业提供专业、创意丰富的内容。

定制化能力: RGM基础模型允许企业使用自有数据集微调,提升创意能力,满足不同行业的定制化需求。

行业领导: 合作强化了Runway在AI视频领域的领导地位,预计RGM将在未来几个月内商业化使用。

Meta推出分解式生成文生视频模型Emu Video

Meta最新发布文生视频模型 Emu Video,采用分解式生成方法,先生成图像再生成视频,提高效率降低成本。Emu Video在人类评估中优于Gen-2等商业模型,展示出更高质量和语义一致性。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

论文:https://emu-video.metademolab.com/assets/emu_video.pdf

在线demo:https://emu-video.metademolab.com/#/demo

【AiBase提要:】

Meta发布Emu Video,采用分解式生成方法,先生成图像再生成视频,降低文生视频生成成本。

Emu Video核心技术包括文本到图像和图像到视频两个模块,以及多阶段训练策略和零终端信噪比的散度噪声计划。

在人类评估中,Emu Video生成的文生视频质量和语义一致性超过Gen-2、Pika Labs等商业模型,显示出领先水平。

聚焦开发者

字节跳动开源基于SD1.5的 MagicAnimate

字节跳动开源的MagicAnimate利用先进的扩散模型,只需一张照片和一组动作,即可生成逼真的真人舞蹈视频。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

项目地址:https://top.aibase.com/tool/magicanimate

【AiBase提要:】

MagicAnimate是基于SD1.5的创新项目,通过扩散模型生成逼真人体图像动画。

️ 使用简便,用户只需提供一张照片和一组动作,AI即可生成舞蹈视频。

MagicAnimate提供了稳定的V1.5和MSE微调的VAE基础模型,确保生成内容的时间一致性。

Mozilla推出llamafile,将大模型转化为单文件可执行文件

Mozilla的llamafile是一种开源工具,能将大型语言模型(LLMs)的权重转换为单一可执行文件,使其在六种操作系统上无需安装即可运行,从而简化了模型的分发和运行。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

【AiBase提要】

简化分发与运行: Mozilla发布llamafile,通过将LLMs权重转化为单文件可执行文件,极大简化了这些模型的分发和运行。

跨平台支持: llamafile支持六种操作系统,包括macOS、Windows、Linux、FreeBSD、OpenBSD和NetBSD,提供跨平台的可执行文件。

🧩 提高可重现性: 这项创新不仅使LLMs的使用更为便捷,还确保特定版本的模型在不同系统上具有一致性和可重现性。

Mamba新架构挑战Transformer:性能全面超越

Mamba是一种新的AI模型架构,通过选择性状态空间模型在语言建模等领域取得了优越性能,能够线性扩展至百万token长度序列,并实现5倍推理吞吐量提升。

【AiBase提要:】

选择性状态空间模型: Mamba引入了选择性SSM架构,有效解决了Transformer自注意力机制的计算效率问题。

跨模态性能: Mamba在语言、音频和基因组学等多个领域都取得SOTA性能,媲美或击败同等规模的Transformer模型。

硬件感知算法: 通过硬件感知算法,Mamba实现了高效计算,比基于卷积的SSM模型更快,在A100GPU上可达3倍速度。

🤖AI新鲜事

给ChatGPT“小费”可改善回答质量

一些用户发现,给ChatGPT“小费”可能改善其回答质量,引发讨论和研究。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

【AiBase提要】

🤖 小费优化表现: 网友测试显示,提及小费时,ChatGPT的回答字符数相对更多,且模型在某些情况下自发添加额外信息。

🤔 潜在金钱激励: 讨论中涉及对模型的金钱激励,引发网友担忧和反思,提出未来可能需要付费的疑虑。

社交媒体讨论: 现象在社交媒体引起关注,探讨模型行为是否与“小费文化”相关,吸引大量关注和评论。

Amazon Q 或存在严重幻觉和数据泄露问题

一份新报告指出,亚马逊最新推出的企业级 AI 聊天机器人 Amazon Q 存在严重幻觉和数据泄露问题,引发质疑。

【AiBase提要:】

🤔 质疑出现: Amazon Q 面临准确性和隐私问题,包括严重幻觉和数据泄露,使其在企业环境中可能不适用于决策。

亚马逊回应: 亚马逊发言人表示,Q 并未泄露任何机密信息,通过内部渠道的反馈并未识别出安全问题。

挑战与调整: 分析人士建议在商业发布之前进行更广泛的内部测试,强调对高质量数据和透明的训练的必要性。

OpenAI竞争对手Mistral融资近5亿美元

Mistral AI最近筹集了近5亿美元资金,得到英伟达和Salesforce等投资者支持,使其估值达到20亿美元,成为OpenAI的强大竞争对手。

【AiBase提要:】

Mistral AI最终获得来自英伟达和Salesforce等投资者近5亿美元,估值达20亿美元。

🤝 这轮融资将使 Mistral 成为 OpenAI 的强大竞争对手,得到业界巨头的支持,包括英伟达和Salesforce。

此举突显人工智能领域的投资热潮,Mistral 在全球商业市场引起关注。

AI入侵B站鬼畜区

11月27日,B站UP主“女孩为何穿短裙”突破传统,投稿一则使用AI合成语音制作的鬼畜视频,标志着AI视频制作正式进入B站鬼畜区。视频播放量截至目前已达167.3万,获得14.5万的点赞和2.8万个投币。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

【AiBase提要:】

🤖 B站UP主“女孩为何穿短裙”于11月27日发布使用AI合成语音的鬼畜视频,标志着AI视频制作正式进入B站鬼畜区,引起热议。

️ 传统鬼畜视频制作相对繁琐,依赖UP主的调音技术,而AI语音技术的崭露头角使视频制作者能更轻松实现声音的高度还原。

🤔 尽管AI配音在还原度上有优势,但有网友表示其过于自然缺乏传统鬼畜视频的荒诞美感,引发对AI配音与传统制作方式的对比。

DeepMind新人工智能系统可直接向人类学习任务

谷歌子公司DeepMind发布的人工智能代理系统通过观察和模仿人类行为,实现了文化传递的模仿学习,不依赖预先收集的人类数据,在培训机器人系统方面取得了重要进展。

【AiBase提要】:

模仿学习进阶: DeepMind的新人工智能代理系统采用文化传递的模仿学习形式,能够直接从人类教师那里学习任务。

不依赖人类数据: 通过在模拟环境中进行观察和模仿,系统无需大型数据集,解决了昂贵的人类数据收集和任务固有变化的挑战。

🤖 广泛应用前景: 该创新方法有望简化机器人系统培训,扩展到客户服务系统,为更有效且注重隐私的人工智能培训铺平道路。

Meta 、IBM等联合50多家公司结构成立 AI 联盟

Meta和IBM合作发起AI联盟,由50多家公司组成,旨在推动人工智能领域的开放模型,并计划推出人工智能安全和模型验证的基准测试工具。

【AiBase提要:】

Meta和IBM联合发起AI联盟,50多家成员支持开源方法。

联盟关注六个领域,计划推出人工智能安全和模型验证基准测试工具。

成立AI联盟是为了反映人工智能生态系统的多样性,提供更分布式和弹性的发展方式。

英伟达计划在日本建立半导体工厂

英伟达首席执行官宣布在日本建立半导体工厂,与日本公司合作支持人工智能图形芯片需求,符合日本半导体基础设施复兴计划。

【AiBase提要:】

工厂计划: Nvidia计划在日本建立一系列半导体工厂,以满足不断增长的人工智能图形芯片需求。

🤝 合作关系: 与日本公司紧密合作,支持先进人工智能应用的图形芯片需求,符合日本政府半导体基础设施复兴计划。

全球供应支持: Nvidia承诺支持日本培养人工智能技术,强调人工智能在各社会领域的深远影响,以满足全球对先进半导体的需求。

AI视频聊天应用Call Annie爆火

一款名为CallAnnie的AI视频聊天应用正变得异常火爆。用户可以通过该应用与虚拟女性Annie进行视频通话,由OpenAI旗下的ChatGPT模型驱动,可进行多种语言实时交流。除视频通话外,Call Annie还支持讲故事、模拟面试和规划旅行等功能。用户可以在Discord频道中交流,提高准确性,并享受社区支持。

AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量

体验地址:https://callannie.ai/

【AiBase提要:】

多功能接入点: 可通过电话、实时视频、iPhone应用或网络音频呼叫Annie。

🤖 标准功能: 提供提醒、回答查询,并提供各种主题的指导。

社区支持: 提供Discord频道,用户可联系其他人并讨论AI工具的性能和功能。

来源:站长之家

本文来自互联网,不代表前途科技立场,如若转载,请注明出处:https://accesspath.com/ai/5888254/

(0)
NEXTECH的头像NEXTECH
上一篇 2023年12月6日 上午1:25
下一篇 2023年12月6日 上午1:26

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注