微软Foundry Local正式版发布,支持将本地AI推理集成到应用程序中
admin 2026-04-14 183浏览
微软Foundry Local正式推出,这是一套跨平台的本地端AI推理方案,让开发者通过SDK将AI模型直接嵌入应用程序,在用户设备上离线执行推理,无需云端连接,也不会产生额外的Token计算费用...
admin 2026-04-14 183浏览
微软Foundry Local正式推出,这是一套跨平台的本地端AI推理方案,让开发者通过SDK将AI模型直接嵌入应用程序,在用户设备上离线执行推理,无需云端连接,也不会产生额外的Token计算费用...
admin 2026-02-15 121浏览
Modal Labs:AI推理赛道的隐形冠军 当所有人都在谈论GPT-5和多模态大模型时,一家名叫Modal Labs的初创公司,正在悄悄改变AI运行的方式。据四位知情人士透露,Modal正在与包括General Catal...
admin 2026-02-06 101浏览
Positron 推出 Asimov 芯片,直指英伟达软肋 在全球AI算力竞争白热化的当下,一家名不见经传的初创公司Positron突然亮出底牌——一款名为Asimov的专用AI推理芯片。它不谈浮夸的“颠覆”,...
admin 2026-01-23 212浏览
vLLM 团队创立 Inferact,获 1.5 亿美元种子轮融资 继 vLLM 在开源社区掀起热潮后,其核心开发团队正式成立初创公司 Inferact,并宣布完成 1.5 亿美元种子轮融资,投前估值达 8 亿美元。本轮...
admin 2026-01-23 221浏览
vLLM背后的团队,正式成立AI基础设施公司Inferact 当多数人还在讨论GPT-5或Gemini Ultra的参数规模时,一群真正解决实际问题的工程师,已经悄悄把AI推理的成本砍掉了70%以上。他们不是来自...
admin 2026-01-20 110浏览
Gemini加速,谷歌云的翻身仗打到了关键一役 过去一年,AI圈的风向变了。不再比谁的模型参数更大,而是看谁能把技术真正卖出去、用起来、赚到钱。谷歌没再喊“我们有多强”,而是...
admin 2026-01-04 190浏览
AI推理新纪元:英伟达Blackwell GB200 NVL72如何彻底改写性能格局 国际权威机构Signal65最新发布的AI推理芯片性能报告,掀起了一场行业地震。英伟达最新推出的Blackwell GB200 NVL72系统,在Mo...