竞争加重+成本下降 Token迎降价潮
发布日期:2026-06-18 15:04 点击次数:199
本年以来一皆走高的Token(词元)价钱迎来回转。参加6月,全球多家大模子厂商开动从头调度Token价钱,包括OpenAI在内,多家大厂先后被曝将下调Token价钱,以回答企业用户对AI成本暴涨的不悦。
但是,相较此前威望强盛的引申潮,这次Token价钱下调更像是行业新一轮暴戾竞赛的序幕。多位阛阓东谈主士分析称,跟着OpenAI及Anthropic等一批头部AI厂商连续鼓动IPO,阛阓对AI公司的估值模子正在调度,能否用更低成本握续赢得更多用户,成为每家公司必须面对的磨练。
竞争加重 Token迎降价潮
参加6月,Token价钱开动逆势下落。日前,头部AI公司OpenAI被曝将于6月启动新一轮调价,经营大幅下调Token计费圭臬。关于这次降价,外界合计将是一地点向对标竞品Anthropic的行动,方向在于争夺企业级客户。因此,不少业内东谈主士预测,Anthropic或将跟进降价。
事实上,不仅是国外AI巨头,本月初国产大模子DeepSeek肃肃执行V4系列模子调价,将Token价钱下调至原标价的1/4。按照官方公告,DeepSeek-V4-Flash的输入缓存射中价钱是每百万Token 0.02元;V4-Pro每百万价钱为0.025元。
“这成本真实比坐褥对应Token所需要的电费还低廉。”一位资深AI创业者告诉上海证券报记者,手脚比拟,在本年4月前,Open AI最新模子每百万Token的概括成本是30好意思元,“前者价钱特殊于后者的百分之一,是量级的辞别了”。
紧随后来,小米晓喻MiMo-V2.5系列大模子完成调价,部分版块降幅高达99%,同期取消按险阻文窗口分段计价的端正,况且Token Plan用量径直进步到正本的5倍至8倍,这意味着其每百万Token成本基本看皆DeepSeek。
6月16日,字节逾越旗下火山引擎上线Seedance 2.0 mini视频生成模子,其图生视频订价为每千Token 0.023元,视频生视频订价为每千Token 0.014元,这一订价较Seedance 2.0较着缩短。此外,近期腾讯云也发布公告,大模子行状平台TokenHub将于6月15日起下调MiniMax-M3模子价钱,推理输入、推理输出及缓存射顶用度均下调50%。
罕见念念的是,本年4月,小米MiMo团队负责东谈主罗福莉曾公开反对打价钱战。她合计,廉价卖Token并树立第三方框架的行为,看似吸援用户,最终会毁伤用户体验。
不外,也有技巧工程师告诉记者,此轮Token价钱的下调与罗福莉的不雅点并不矛盾:“她强调的是之前模子自身性能不及,不顾成本破费Token的行为,但面前通过模子和险阻文压缩等技巧,Token的恶果有所进步。”
价钱大考驾临 行业洗牌加速
从某种敬爱敬爱上讲,人摸人人人澡人人超碰97此轮降价更像是行业行将濒临的一场交易大考。多位业内东谈主士暗意,跟着越来越多AI公司步入本钱阛阓,用户范围、骨子效益等要道数据的重量越来越重。
“本年以来最较着的变化等于,企业端关于AI的信得过需求在变多,它组成了信得过的交易订单。”北京某AI大模子独角兽公司寰宇事务负责东谈主对记者暗意,尤其是本年以来Cloud Code崛起,大模子“编程才略”被越来越多企业看到,催生了这一轮Token用量的暴增。
以Open AI败露的数据为例,该公司最大的Token破费者每月使用量约为1000亿Token,而在6年前,这一数据仅为10万。但是,在企业信得过需求增长的同期,Token价钱高企的问题日益突显。据报谈,不少好意思国互联网巨头在近几个月纷纷收紧了对Token使用的预算放手。
记者珍惜到,不少国内头部互联网公司对Token使用的魄力也开动转向:从放手用量到对Token使用仅提供部分报销,较着端淑的成本让不少大公司都有些吃不用。
“模子竞赛基本到了头部决胜阶段,本钱需要看到增长,这内部很进击的等于企业端用户范围。”上海某券商策划机首席分析师告诉记者。另一位某头部互联网公司AI负责东谈主对记者坦言,竞争走到这一步,性能之争基本收尾,性价比将成为要点。
但罕见念念的是,对不少头部公司而言,这场降价并非出乎预感,相背更像一场预言的齐备。多位技巧东谈主士告诉记者,刻下影响Token价钱的成分无外乎两个:模子自身技巧才略、硬件侧成本限定。脚下,这两个方面都在连忙打破。
在技巧侧,对稀少珍惜力等技巧的握续优化,正在让Token破费不休缩短。以DeepSeek为例,这次最新模子公布的技巧打破中就包括压缩稀少珍惜力机制(CSA)和高压缩珍惜力机制(HCA),这两者都能大幅优化Token在单次任务中的使用。
记者珍惜到,包括月之暗面KiMi、小米MiMo在内,近期多款国内大模子败露的居品革命性论文中均有访佛技巧。
在硬件侧,按照业内共鸣,Token在硬件端最终的变数取决于两方面:芯片成本和电力成本。跟着国度“东数西算”工程的握续鼓动,在不少绿电动力丰富的节点城市,电价和机房租用的成本都在大幅下降。以内蒙古乌兰察布为例,记者调研发现,包括华为、阿里、快手等国内厂商均在加速布局。
某算力中心当地运营负责东谈主败露,由于厂商与算力中心的行状合约中电费占据大头,且多为常年条约,跟着电价以及概括行状成本的快速下降,厂商Token坐褥的骨子成本较着回落。此外,多位算力中心东谈主士对记者暗意,本年以来国产芯片产能冉冉进步,其价钱也在回落,带动Token成本进一步下降。
但较着,并非通盘的大模子公司都能撑住此轮的价钱冲击。有AI行业资深不雅察东谈主士直言,部分企业骨子上是在被迫降价。

