开云(中国)Kaiyun·官方网站-登录入口

新闻
你的位置:开云(中国)Kaiyun·官方网站-登录入口 > 新闻 > kaiyun中国登录入口登录这也再次突显了投资机构对 AI 基础设施领域-开云(中国)Kaiyun·官方网站-登录入口

kaiyun中国登录入口登录这也再次突显了投资机构对 AI 基础设施领域-开云(中国)Kaiyun·官方网站-登录入口

发布日期:2025-10-09 10:59    点击次数:138

「奔向 AGI」栏目聚焦 AI 大模子、AI agent、AI 应用、芯片、机器东谈主等前沿、热点的 AI 技巧和贸易创新。

作家丨巴里

剪辑丨关雎

图源丨 Fireworks AI 官网

又一位华东谈主女性行将在好意思国科技领域书写新据说。

据科技媒体 The Information 音问,东谈主工智能云就业初创公司 Fireworks AI,正设想启动新一轮融资,指标估值达 40 亿好意思元(约合 288 亿元东谈主民币,该估值已包含本轮融资金额)。

现在,闻名风投契构 Lightspeed Venture Partners(好意思国光速创投)与 Index Ventures 等正就领投事宜张开深入权谋。

若这次融资奏凯达成,Fireworks AI 的估值将在短短一年内完结超 7 倍的飞跃。这也再次突显了投资机构对 AI 基础设施领域,终点是推理就业赛谈的浓厚兴致。

值得一提的是,这家公司已获取多家顶级投资机构的深爱。此前,红杉成本、Benchmark 等硅谷老牌风投,以及英伟达、AMD、Databricks Ventures 和 MongoDB Ventures 等产业成本均已参与其早期融资。

复旦才女创业

帮企业低成本、高效定制开源大模子

这位复旦设想机系学友正悄然改写 AI 基础设施的竞争轨则。

乔琳(Lin Qiao)在复旦大学设想机本硕连读毕业后,便远赴加州大学圣巴巴拉分校(UC Santa Barbara)攻读设想机博士学位。

她的奇迹生计始于 IBM 担任商讨职位,专注于数据基础设施和数据库技巧,随后在 LinkedIn 担任技巧期骗,最终在 Meta(原 Facebook)担任 AI 平台架构关节雅致东谈主,曾疏浚卓越 300 东谈主的工程师团队,主导大家 PyTorch 框架的基础设施研发及大领域部署。

尔后,她提示团队得胜鼓动 PyTorch 成为行业标杆的开源框架,并将其部署至 Meta 的大家数据中心、出动开辟和 AR/VR 平台。

Fireworks AI 谀媚创始东谈主兼首席奉行官乔琳(Lin Qiao),图源:The Information

这段在科技巨头打磨的阅历,为乔琳积存了深厚的 AI 底层架构研发教育。

行为大家主流开源机器学习框架 PyTorch 的关节开发者,她提示团队攻克的技巧穷苦,如今正改革为 Fireworks AI 的中枢竞争力。

畴昔在 Meta,乔琳见证了一个热切规章:PyTorch 之是以能在数十个同类框架竞争中胜出,关节在于 " 把复杂留给团队,把肤浅带给用户 " 的设想玄学。

尽管背后是数百名工程师构建的复杂技巧体系,但开发者只需肤浅调用即可获取矫健功能——这种用户体验至上的理念,成为她创立 Fireworks AI 的初心。

" 真确的创新不在于功能堆砌,而在于让技巧纪念骨子。" 乔琳将这种念念考注入创业现实。

2022 年,Fireworks AI 在好意思国加州雷德伍德市创立。Fireworks AI 的创始团队号称 " 梦之队 ":六位参与过 Meta PyTorch 技俩的资深工程师与一位前谷歌 AI 内行构成中枢技巧班底,他们延续着乔琳在 PyTorch 时间千里淀的措施论——前端保握极致简陋,后端承载海量优化。

Fireworks AI 创始团队,图源:Fireworks AI 官网

就像畴昔 Meta 干涉数百名工程师构建 PyTorch 生态却闪开发者感受不到复杂度那样,Fireworks AI 团队缄默攻克着散播式推理引擎等 8 万多种成立组合的技巧难关,却将通顺体验留给末端用户。

在乔琳看来,现时 AI 领域的变革深度远超以往任何技巧创新。" 这不仅是肤浅的产业升级,而是统共这个词技巧底座的地壳重构。"

她历害细察到生成式 AI 带来的范式迁徙:传统机器学习期间,企业需要从零搭建模子;而通用东谈主工智能(GenAI)的出现,让创新焦点从 " 构建 " 转向 " 应用 "。

这种养息催生了爆炸式的市集机遇——大家 AI 初创企业如棋布星陈般涌现,传统企业与数字原生势力也争相涌入,试图通过 AI 重构家具体验与就业经由。

市集调研自满,尽管生成式 AI 技巧门槛大幅镌汰,但企业仍濒临基础设施、专科东谈主才与算力资源的三大瓶颈。

恰是对准这个弘大的市集,Fireworks AI 首创了特有的贸易模式——"推理就业提供商"(inference provider)。

Fireworks AI 中枢在于匡助企业用更低的成本、更高的效劳启动和定制开源大模子,比如深度求索的   DeepSeek、阿里云的   Qwen,还有   Meta   的   Llama。

这些模子原来可能需要企业我方购买   GPU   就业器来启动,但   Fireworks   换了个更机动的样子——他们租用第三方的英伟达就业器,然后通过   API   接口径直给开发者提供这些开源模子的推明智商。开发者用起来就像调用   OpenAI   的   GPT-4o   雷同便捷,无用费神底层就业器的事情。

他们的中枢上风还在于对   GPU   资源作念了深度优化:通过自研的   Fire Attention   推理引擎等技巧,能让模子推理更快、更省资源,最终匡助客户镌汰使用成本。

在这背后,是乔琳对行业趋势的真切判断。

" 当基础模子的质地与领域逐步趋同期,企业级相反化竞争的关节,在于如何用专少见据铸造特有价值。"

她指出,非论是开源如故闭源的大讲话模子,其底层架构与数据范畴终将管理,而真确构筑护城河的,是如何通过模子微调将企业的贸易模式、运营逻辑与 AI 智商深度交融。

这恰是 Fireworks AI 致力措置的中枢命题——让每家企业皆能基于自身数据泥土,接济出独具竞争力的 AI 应用之花。

让 AI 编程用具效劳升空

说句话就能让 AI 改好代码

具体来说,Fireworks AI 的家具体系分为多个技巧层级,最底层是自研的散播式推理引擎,这个引擎是特意为生成式 AI 打造的,就像是为 PyTorch 量身定作念的推理基础设施。

这个引擎设想得相等机动,像搭积木雷同不错摆脱组合,这样 Fireworks AI 就能在新开源模子发布确今日就快速上线。

之是以能作念到这样快,是因为 Fireworks AI 模仿了 PyTorch 的设想理念,把系统作念得模块化且可机动成立。

在就业模式上,Fireworks AI 不会用 " 一刀切 " 的有接洽——不存在一个能措置统共问题的全能模子,也不会有妥当统共使用场景的最好成立。

每个用户的需求皆不雷同,就像买一稔要选合适的尺码雷同,Fireworks AI 为用户提供的是不错凭据质地、速率和成本这三个维度来定制的措置有接洽。

比如有的用户更敬重恢复质地,有的需要更快的反应速率,还有的要推敲成本限度,系统会帮他们找到最妥当我方需求的均衡点。

为了完结这个指标,Fireworks AI 开发了一个叫 Fire Optimizer 的用具。这个用具就像是个智能助手,能凭据用户的具体需求(比如想要更快的反应如故更高的质地),自动调整模子的成立和部署有接洽。

这个用具粗俗会在现存的数百个模子中收受一个合适的,然后通过各式措施来优化,比如:

1.   量化技巧:用更低的精度启动模子(比如用 8 位甚而 4 位数字代替原来的 16 位),这样能大幅晋升设想效劳,就像把高清视频压缩成通顺的短视频雷同;

2.   推测奉行:让模子一次预测多个谜底(比如一次猜 4 个词而不是 1 个),使推理速率成倍晋升;

3.   模子组合:用小模子先快速给出谜底,若是不细目再让大模子来证明,兼顾效劳与准确性。

这些优化措施有许多细节和技能,比如量化不错应用在模子的不同部分(权重、激活值等),每种措施对最终收尾的影响皆不雷同,需要凭据用户的具体需求来收受。

固然这些选项听起来有点复杂,但 Fireworks AI 的指标即是让用户不必费神这些技巧细节,系统会自动帮他们找到最好的措置有接洽。

贸易化上,Fireworks AI   近期的年化收入依然冲破   2   亿好意思元(约合 14 亿元东谈主民币),即每月近   1,700   万好意思元(约合 1.22 亿元东谈主民币),公司瞻望年底将增至 3 亿好意思元(约合 22 亿元东谈主民币)。

其业务推广离不开自身就在快速增长的   AI   原生应用公司,举例 AI 编程独角兽 Cursor、AI 搜索独角兽 Perplexity 等快速崛起的客户复古。

那么,AI 编程用具 Cursor 是怎么借助 Fireworks AI 的技巧,让写代码比平淡措施快好几倍呢?

Cursor 是个特意给措施员用的智能编程用具,能预测你的操作(比如刚改几行代码,它就能猜到你下一步想干啥)、用当然讲话改代码(比如跟它说"把这部分改成 xxx ")、一键把生成的代码丢进文献里用,还能"看懂"统共这个词技俩的代码并径直帮你改好。

但措施员用这类用具时有个大缺乏:想让 AI 改一大段代码(比如几百行),现存的 AI 模子(像 GPT-4、GPT-4o)继续改得慢、不准,甚而越改越乱,终点影响效劳。

为了措置这个穷苦,Cursor 特意考研了一个新模子,特意处理"快速改代码"的任务(称作" Fast Apply "),在 700 亿参数的大模子上每秒能生成约 1000 个 token(偶然 3500 个字符),比 GPT-4 和 GPT-4o 快多了,考研数据用的是措施员平时用指示改代码的输入和着实操作数据,针对性很强。

不外光有强横的模子还不够,还得让它跑得更快。Fireworks 给 Cursor 提供了底层复古,用了两个关节技巧:

一是把 Cursor 的模子部署到我方的推理引擎上,还针对"改代码"任务作念了性能优化;

二是用了推测解码技巧——平淡 AI 生成代码得一个 token 一个 token 冉冉算,但推测解码能"猜"接下来可能出现的多个 token(比如一次猜好几个词),然后一次性考证这些臆度对不合,对的就径直用,错的再调整,这样就能同期处理好多 token,速率径直升空。

Cursor 还搞了个升级版"推测剪辑",特意针对改代码的场景,比如改一大段笔墨时,AI 能凭据你之前的操作果敢猜"你可能想把这几行改成 xxx ",然后一次性生成好长一段再快速考证,Fireworks 用这个技巧让 Cursor 的模子速率飙到每秒 1000 个 token,比平淡推理快 13 倍,比之前用 GPT-4 的版块也快了 9 倍。

成果即是措施员改几百行代码几秒钟就能出收尾,无用等半天,并且固然猜得快,但终末还会用"严格模式"搜检一遍,确保代码是对的。

不错说,如今措施员点个按钮就能把 AI 生成的代码径直丢进技俩里,或者一句话让 AI 改好代码,效质径直拉满。

英伟达投资 Fireworks AI 后

躬行杀入推理就业

现时竞争口头中,Fireworks AI 的径直敌手包括 Together AI 和 Baseten。

以 Together 为例,其本年 3 月年化营收达 1.5 亿好意思元(约合 11 亿元东谈主民币),即每月约   1250 万好意思元(约合 9000 万元东谈主民币),估值 30 亿好意思元(约合 216 亿元东谈主民币)。

但统共这个词赛谈濒临更矫健的敌手——英伟达本年 3 月收购推理就业商 Lepton 后,强势推出 GPU 云就业市集,径直切入了 Fireworks AI 的中枢业务领域。

投行分析指出,若大型云就业商为镌汰 AI 考研推理成本、提供定制化就业而整合产业链,这类初创企业很有可能成为潜在收购指标。

同期,Fireworks 也濒临盈利挑战:虽毛利率约 50%(与同业十分),但低于订阅制软件常见的 70% 水平。

这主要因为需预留大皆就业器支吾需求峰值,同期承受来自 CoreWeave 等 GPU 云商家的廉价竞争。为此,公司正通过握续优化 GPU 资源效劳晋升毛利率至 60%,并将此列为重神思策地点。

尽管如斯,投资机构仍然看好 Fireworks AI 的后劲。

睿兽分析自满,Fireworks AI 诞生于今依然完成觉得 7,700   万好意思元的两轮融资。B 轮融资事后,公司估值达到 5.52 亿好意思元(约合 40 亿元东谈主民币),投资方包括红杉成本、Benchmark 等顶级风投,以及英伟达、AMD、Databricks Ventures 和 MongoDB Ventures 等产业成本。

不错说,乔琳是被英伟达创始东谈主兼 CEO 黄仁勋和"芯片女王" AMD 董事长兼 CEO 苏姿丰同期看中的创业者。

乔琳表示,FireworksAI 将来一年的核神思策是强化 Fire Optimizer 系统——该智能优化用具能在模子质地、反应速率、成本之间自动寻找最优解。

现在,Fire Optimizer 依然在反应速率和成本限度上作念的宽裕好,接下来会终点强化在推理质地上的智商。通过个性化定制,能够让模子成果比通用模子或平淡 API 强得多,终点是当加入客户我方的业务数据后,成果会更为出色。

尽管用户体验容易被复制,但真确拉开差距的护城河是企业我方积存的数据和用户使用习气——这些数据酿成的反馈轮回终点热切,会径直反哺到他们使用的 AI 模子里。

乔琳预测,2025 年将成为 "Agent 年 " 和 " 开源模子年 "。

各行业将涌现大皆措置垂直问题的 AI 智能体,同期开源模子将迎来井喷式发展——就像 DeepSeek 那时发布仅一个月,Hugging Face 上就出现了 500 多个优化版块,还得胜将其适配到各式开辟和云平台上,Perplexity 和她的客户 Linnk 还开发了针对金融就业的定制版块。

不外,她也指出,将来最大的挑战在于:

如何让快速发展的 AI 智能体和开源模子更好地结合,在终末一公里完结质地优化,为用户提供更好的及时体验。这亦然 FireworksAI 公司本年要重心措置的问题——简化开发者在这方面的责任经由。

在 4 月纽约举办的行业峰会上,乔琳展示了团队的终极愿景:" 咱们赌定那些真确懂家具的开发者。谁能玩转我方的数据、调教出更智谋的模子,谁就能赢到终末。"

FireworksAI 要作念的,即是提供用具与基础设施,匡助开发者定制模子、注入数据,全面晋升推理质地、速率与并发智商——让每个经心打磨家具的团队,皆能站上 AI 期间的聚光灯下。

本文为创业邦原创kaiyun中国登录入口登录,未经授权不得转载,不然创业邦将保留向其精致法律牵涉的权益。如需转载或有任何疑问,请关系 editor@cyzone.cn。



Powered by 开云(中国)Kaiyun·官方网站-登录入口 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024