智谱AI一个月两次降价？《红楼梦》写两遍只需要1毛钱

郭晓静腾讯科技 2024-06-06 07:43

大模型开始进入应用深水区，一方面，很多大模型公司开始推出AI智能助手等TOC端应用；另外一方面，企业开始探索如何应用大模型，对自己的业务进行重构。6月5日智谱AI举办OpenDay，在活动现场公布了几组数据：截至今日已经有超过30万专业客户在开放平台使用，每日模型调用量已经超过了400亿token；过去6个月API每日消费量增长了50倍以上；而过去四个月，增长曲线更加陡峭，有超过90倍的增长。

一、智谱AI再降价，《红楼梦》写两遍只需要1毛钱

虽然这仅为智谱AI一家企业的数据，但是从某种程度也能看出，AI的落地应用，开始进入加速阶段。这一段时间，大模型企业的价格战引起了行业的关注。大模型究竟应该卷价格还是卷性能？智谱AI COO张帆在活动现场表示：“今年大家开始有了新的期待，一方面大家希望能够得到更加强大、更加快速的模型，以及更低的成本，因为随着我们的应用使用的消耗的量也会快速激增，所以大家对成本开始变得敏感。同时，越来越多的企业希望自己有一个独立的私有模型，能够将自己的数据转化为自己的竞争力，并且越来越多的企业要把模型融入到业务当中，真正从算力转变为生产力。”

性价比和成本敏感成为企业对大模型的成本期待的关键词，把算力转换为生产力成为企业使用大模型的刚需。

基于此，智谱AI在宣布最新模型产品的同时，也宣布全面降价：

①最能打的小模型ChatGLM3-6B开始全部升级为9B，综合能力比上一代提升了40%。在开放平台变为GLM-4-flash版本，提供API，价格相较于GLM-3 Turbo降价10倍。现在仅仅需要1毛钱我们可以拥有100万token，100万token可能能够写两本四大名著，《红楼梦》写两遍也只需要1毛钱。

②GLM-4更加便宜，在开放平台上为GLM-4-Air版本，1元/百万 token，性能比肩原来的GLM-4，价格仅为原来的1%。

③推出极速版，提升速度变相降价，推理的速度增加162%，相当于71个token/秒，就意味着每秒钟可以展示出100多个汉字。

④最近降价的GLM-3-Turbo以及多模态模型CogView-3进一步降价，GLM-4V降价50%，只有原来的一半的价格。Cogview3降价将近60%，可以做到一毛钱一张图片。

二、大模型降价背后：AI增长进入全新阶段

行业还在发展初期，这样的价格战，对于行业的发展是否百害而无一利？这波价格战，也许有些不太一样。

首先，行业还在发展初期，很多企业听闻大模型的成本“高到难以承受”，对大模型的尝试望而却步。降低价格可以从心理上降低很多企业的决策门槛，在某种程度上，提高“拉新”的效果。

强调性价比，除了基础价格的下降，更有目标的去争取核心用户，智谱AI提出了企业权益的服务。根据企业的使用的规模快速调整价格和并发，分为v0、v1、v2、v3四个版本。完成企业级认证就能继续享受全场9折，达到v3版本价格可以继续6折，并能最高提供1500个并发。

从低门槛拉到目标用户，到“高诱惑”留住核心用户。大模型企业的“降价”营销，其实并不全是红海拼杀。

另外，企业很多应用已经开始从浅水区走入深水区，很多的企业场景不再是简单的一个AI+一个场景，+一个行业，今天已经开始深入到每一个垂直场景当中。价格可能是每个企业在AI落地时候考虑的一个因素，但绝对不是第一因素，效果和落地才是第一因素。

很多企业希望能够把大模型的能力变为核心能力，构建私有模型。智谱的开源生态，也开始基于这个需求探索商业化的闭环。

绝大多数企业从部署私有化模型到落地验证，可能需要几十个步骤，智谱将这个步骤简化到三步：准备数据——创建微调任务——部署训练之后的模型，在微调阶段，还提供了LoRA微调和全参微调。简单来讲就是可以用简单的步骤、大幅降低成本，拥有私用模型。

5月7日，知名私募巨头幻方量化旗下的大模型DeepSeek宣布将旗下大模型的价格降到1元/百万token（输入）、2元/百万token（输出），价格仅为GPT-4的近1%，拉开了大模型价格战的序幕。

智谱AI为第一个跟进价格战的大模型企业，5月11日调整了旗下入门级大模型GLM-3-Turbo（上下文长度128k）的价格，从0.005元/千tokens降低到0.001元 / 千tokens，而GLM-3 Turbo Batch批处理API还将进一步便宜50%，也就是1元200万tokens。

这次OpenDay，是短短一个月内第二次宣布降价。智谱AI CEO张鹏正面回应了降价：“相信大家对前一阵的大模型价格战都有所了解，也很关心智谱相应商业化的策略，在这里我们可以很自豪地跟大家说，我们切切实实通过模型核心技术的迭代和效率的提升，通过技术的创新来实现了应用成本的持续降低，以及客户价值的持续升级，并不是简单的价格战。”

在2024年年初，张鹏就高调提出，2024年是AGI元年，在这次OpenDay上，张鹏表示，“我们看到大模型的Scaling Law并未失效，AI技术的增长进入了一个全新的阶段。也就是说大模型技术的创新依旧是突飞猛进地进行时，甚至还有速度越来越快的迹象。”

在如此快速发展的“蓝海”中打起价格战，大模型行业看起来有些不按常理出牌。Lepton. AI创始人贾杨清前一段时间在朋友圈中对大模型价格战做过精要的短评：

● 价格战无可厚非，但是观众应该把它认为是一种市场营销行为。今天 API的营收对于国内各家大厂都不多，因此对营收影响非常有限。

● 对于 C 端用户没有影响。C 端并不是大模型 API 的受众，而各种聊天平台本身就是免费的。

● API 降价对于 B 端用户暂时影响有限，首先降价的款式并没有带大量高并发低延时的 SLA，其次部分主力大模型依然没有降价。对于需要高 SLA 保证的企业服务而言，有降价，但是和以前云厂商降价类似 - 还是主要是抓眼球。这点做过 toB sales 的同仁估计都有体会。

● 更重要的一点，今天 B 端客户并不是价格敏感，而是对于效果、落地更重视，参考我的前一条朋友圈。尤其是，对于很多垂直企业应用，使用微调的模型以及 dedicated 的部署模式更加能够体现效果，而这不是 api 服务所覆盖的范畴。

● 大模型价格战所带来的 marketing 心智，会让更多企业投入和尝试大模型，由此带来的对基础设施的需求，对于 AI infra 公司来说是一个利好，只要能够有足够的产品竞争力。就像滴滴快的打架，比亚迪赚钱。

● AI infra 依然需要打磨自己的高精尖能力。价格只是一个因素，怎么实现低价、高速、高并发，或者说所谓的经典的 car salesman problem: fast, cheap, good，是一个核心能力，不是所有人都能做到的。

价格战不是目的，通过技术、市场、核心用户的良性增长，打造商业化闭环才是目的，张鹏表示，智谱AI通过模型核心技术的迭代和效率的提升，以技术创新实现应用成本持续降低，并非简单的价格战。（转载自：腾讯科技）

扫码下载app 最新资讯实时掌握

智谱AI

上一篇字节的AI要跳动向何方

下一篇OpenAI CEO豪投400多家公司，持股200亿，AI芯片成重点