最新消息:关注人工智能 AI赋能新媒体运营

降低幻觉新方法,Google推Data Commons MCP服务器

科技智能 admin 浏览

重点新闻(0926~1002)

?幻觉 ??? Google ??? MCP ?

降低幻觉新方法,Google推Data Commons MCP服务器

Google日前推出Data Commons MCP服务器,用户能通过MCP开放协议实时访问Data Commons庞大的公开统计数据,让AI代理能以自然语言快速获取可追溯的数据,进一步降低LLM出现幻觉的风险。

Data Commons是由Google主导并与多方合作建立的公开数据平台,整合全球各地的统计资料与官方数据集,并通过知识图进行标准化。该平台涵盖人口、健康、教育、经济、环境等多领域,来源包括世界银行、OECD与WHO等可靠组织。而MCP服务器提供了标准化的数据调用方式,AI代理可直接连接Data Commons而不必自行编写与维护复杂的底层API,开发者也更容易完成各类查询,从数据探索到统计比较,再到生成简要报告,都能在同一流程内完成。

首波应用实例来自Google与国际非营利组织ONE Campaign的合作,双方打造一款ONE Data平台,并基于MCP服务器开发了The ONE Data Agent,用来处理健康金融(Health Financing)数据,能以自然语言在数秒内搜索数千万条数据,并支持可视化与下载干净的数据集。(详全文)

?共通模型 ??? 经济部 ??? 八大产业 ?

经济部推AI应用跃升计划,要借共通模型带动跨产业落地

日前,经济部宣布启动「AI应用跃升计划」,旨在让AI能够快速导入、易于扩散,加速各行各业落地应用。该计划以法人机构和系统集成商(SI)开发的AI共通模型为核心,企业可直接套用已有模型,无需从零开始开发,降低使用成本和导入周期。

该计划补助分为两类:导入型,鼓励企业委托SI或法人机构导入AI,单案最高补助2000万元,若后续能扩散至4家以上企业,SI企业还可额外获得1000万元;扩散型则由SI主导申请,单案上限2000万元,需扩散至至少8家企业。目前法人科专已开发31个共通模型,导入279家企业使用,并将针对20个行业类别进行定制化。

计划首波聚焦八大产业(但不限于):半导体、金属加工、精密机械、医疗护理、零售与食品加工等。启动现场也展示了法人研发成果,如工研院的瑕疵影像生成技术、金属中心的锻造力AI分析、纺织所的AI验布。该计划受理至11月28日。(详全文)

? Meta ??? CWM ??? 代码 ?

Meta发布320亿参数CWM模型,专攻代码生成和推理

Meta FAIR CodeGen研究团队最近发布一款自回归语言模型Code World Model (CWM),拥有320亿参数,专为代码生成和推理设计。不同于一般侧重自然语言的大型语言模型(LLM),CWM特别在程序执行状态上下功夫。在训练过程中,CWM学习了大量Python解释器和容器环境的交互模式,团队也在后期通过多任务强化学习,来增强模型的解题能力,包括代码验证、数学和多轮软件工程等任务。

CWM模型文件已在Hugging Face上开放下载,包括预训练版本、监督式微调(SFT)和后训练版本,可在单张80GB VRAM GPU上运行。Meta强调,CWM仅限非商业研究用途,只支持英文和代码,不适合作为通用聊天助手。Meta还在CWM Preparedness Report中指出,CWM风险水平与现有开源模型相近,并建议用户搭配Llama Guard、Prompt Guard、Code Shield等防护机制使用。(详全文)

? 代理 ?? 微软 ? ?? 办公软件 ?

微软把代理模式引入Office软件

日前,微软在其Microsoft 365的Word和Excel中推出代理模式(Agent Mode),用户可以通过自然语言下达指令,由Copilot代理执行任务,如更新月报、摘要项目重点,或在Excel创建财务月报、贷款计算器与家庭账本。此功能先在Web版提供,之后将推广至桌面版,目前开放给Frontier Program早期测试者,以及M365 Personal、Family、Premium等订阅用户。

同时,微软也推出以Anthropic模型驱动的Office Agent,即可交互对话的Office助手,能根据指令创建PowerPoint演示文稿或Word文档。Office Agent会澄清需求并生成结构化内容,例如市场趋势报告、商业计划或退休规划。

微软此举也呼应此前媒体报道,正通过引入Anthropic资源来分散对OpenAI的依赖。与Google Workspace Duet AI相比,微软更强调「代理」可持续处理跨文档和研究型任务。(详全文)

?

?

? OpenAI ??? 视频生成 ??? Sora 2 ?

OpenAI推出新版视频生成模型Sora 2

OpenAI在9月30日发布视频生成模型Sora 2,还开始预览以Sora 2驱动的社交应用和Sora网站,不过目前仅支持美国与加拿大市场。OpenAI在2024年2月首次披露Sora模型,去年12月推出首个正式版本,此次发布的最新Sora 2模型可完成传统视频生成中的困难任务,如奥运体操动作、立桨冲浪板上的后空翻等,能更精准执行多镜头和复杂指令,改善了旧版Sora模型的不足。

OpenAI此次还特别设计了一款同名的Sora社交应用,可用于创建或混搭与好友的AI生成图像,还能通过「客串」(Cameo)功能将自己或朋友融入已有场景中。Cameo只需一次性的音视频录制验证,就能模拟用户的外貌及声音,并直接进入任何Sora场景。不过Sora应用目前仅支持iOS,其他用户可通过sora.com测试新功能。(详全文)

? 机器人 ??? Nvidia ??? 物理 ?

Nvidia披露一系列机器人AI模型更新,主打物理引擎Newton

最近,Nvidia披露一系列机器人AI更新,不仅在Isaac Lab中新增Newton物理引擎,还推出新一代机器人“大脑”Isaac GR00T N1.6模型、全新的Cosmos WFM世界基础模型,以及更擅长抓取的机器人工作流程等。

具体来说,Newton由Nvidia、Google DeepMind和Disney Research共同开发,能搭配不同类型的物理求解器,更精确模拟极其复杂的人形机器人动作,如在雪地或碎石上行走及拿放杯子与水果。至于新一代机器人“大脑”Isaac GR00T N1.6模型,则整合了Cosmos Reason推理模型,可让机器人结合常识与物理知识、分解复杂指令,更精准执行移动、抓取等多任务动作。

Nvidia也同步更新Cosmos WFM世界基础模型,包括即将推出的Cosmos Predict 2.5,整合了3种Cosmos WFM的功能,最长可制作30秒的视频,以及多视角摄像头输出,实现更丰富的世界模拟。另一款即将推出的是Cosmos Transfer 2.5,比前代模型更轻更快,能生成更逼真的合成数据。Nvidia还在Isaac Lab 2.3开发者预览版中新增更灵巧的抓取工作流程,同时预告,他们近期将推出可更有效评估机器人表现的Isaac Lab - Arena开源策略评估框架,让开发者无需从头搭建系统,就能在模拟环境中执行大规模复杂的评估。(详全文)

? 代码 ??? Claude Sonnet 4.5 ??? VS Code ?

Anthropic推出最新代码模型Claude Sonnet 4.5

Anthropic宣布推出最新AI模型Claude Sonnet 4.5,号称是全球最好的代码模型和最强代理工具。官方表示,该模型在推理、数学和长时任务管理方面均有显著提升。

新版本与前一代Sonnet 4的API定价相同,标准使用每百万tokens 3美元、扩展使用为15美元,但新版API增加了上下文编辑功能和记忆工具,可支持更长的任务处理。该模型也整合进Claude Code应用,支持checkpoints保存进度或还原、全新终端界面和VS Code原生扩展。(详全文)

? 智能车电 ??? 供应链 ??? 自动驾驶 ?

AI Automotive产业大联盟成军,产研合力推智能车电国际化

经济部推动电电公会(TEEMA)与台湾车辆移动研发联盟(TARC)合作,正式成立AI Automotive产业大联盟,聚焦智能座舱、自动驾驶和车联网领域,要加速我国智能车电落地并拓展国际市场。

电电公会指出,联盟将从三大方向推进:集聚能量,打造完整供应链,凝聚领军企业和资源;开创车用AI新价值,结合我国AI半导体优势,深化智能驾驶与座舱应用;链接国际,带动核心企业与全球产业链合作,抢占万亿元级车用AI市场。TARC则提出三大行动:聚合科研,整合跨法人的研发力量,强化AI驾驶与车控技术;产学研合作,通过自主乘用车与电动物流车、巴士示范创新;国际接轨,构建AI车辆虚拟验证平台与验证体系,为产业提供支撑。(详全文)

? AI趋势近期新闻?

1. 微软推出新Microsoft Marketplace,单一入口整合云端与AI应用

2. Google推出AI驱动的勒索软件检测功能,能自动停止电脑版云盘的文件同步,还能快速还原

资料来源:iThome整理,2025年10月