当地时间周四早晨,美国人工智能初创公司OpenAI宣布,正式上架价格显著下降的新一代入门级别人工智能“小模型”GPT-4o mini。
(来源:OpenAI)
OpenAI在今年5月发布公司迄今为止速度最快、综合能力最强,同样也是最贵的GPT-4o模型。最新上架的GPT-4o mini则是一个规格更小、更便宜的变体,通过兼具“能力和性价比”,拓展低价位市场的竞争。
根据OpenAI披露,GPT-4o mini的API价格将会是15美分/100万Tokens输入,以及60美分/100万Tokens输出。上下文窗口依然是12.8万个Tokens,知识截止日期为2023年10月。公司拒绝透露新模型的参数量大小,仅表示与市面上类似的AI小模型(Claude Haiku、 Gemini 1.5 Flash等)处于同一个级别。
作为对比,GPT-4o的百万Tokens输入/输出价格是5美元/15美元,之前的入门款模型GPT-3.5 Turbo定价是0.5美元/1.5美元。所以最新的“迷你模型”要比GPT-4o便宜了96%-97%,比起GPT-3.5 Turbo也要便宜60%-70%。正因如此,随着GPT-4o上架,GPT-3.5 Turbo的历史使命到此结束。
(OpenAI模型定价,来源:官网)
根据Artificial Analysis的统计,GPT-4o mini已经达到美国AI公司主流“小模型”里面价格最低的位置,比起Anthropic、谷歌的同类型竞品都要便宜一截。当然,即便是OpenAI,也无法与“来自东方的力量”比拼价格。例如知名私募幻方旗下DeepSeek-V2模型的Token输出价格,还能比GPT-4o mini便宜一半。
(价格比较,来源:Artificial Analysis)
在比较价格的同时,GPT-4o mini的能力也能拿得上台面。OpenAI介绍称,在MMLU(大模型多任务语言理解)测试中,GPT-4o mini的评分能够达到82%。目前在这项测试中,“刷分”最高的是谷歌的超大模型Gemini Ultra-1760B(90%),GPT-4o得分是88.7%。
而在“小模型”对照组中,Gemini 1.5 Flash得分是79%,而Claude 3 Haiku的分数是75%。虽然对于大模型测试基准的认可程度因人而异,但这个比较大概能体现出GPT-4o mini处于一个什么样的位置。
(来源:OpenAI)
OpenAI表示,GPT-4o mini在上线初期只能处理文字和图像生成任务,最终的目标是支持所有其他类型内容的处理。从周四开始,OpenAI将逐步向ChatGPT的免费/付费用户推送这个新模型,取代GPT-3.5 Turbo的位置,企业用户将在下周用上新产品。
有关这个新模型还有一个安全层面的变化。OpenAI披露,GPT-4o mini是公司首个使用全新安全策略—— “指令层次结构”的AI 模型。这种策略要求AI系统优先考虑一些指令——例如来自OpenAI公司的预设命令,从而使得恶意用户更难让这种工具执行“本不应该执行的操作”。
竞争压力巨大
虽然OpenAI嘴上喊着“让尽可能多的人访问AI”,但这个定价足以反映出AI云服务供应商之间的激烈竞争。
OpenAI 产品经理Olivier Godement介绍称,之所以价格便宜,是因为公司改进了模型结构、优化训练数据和训练计划,但他也强调GPT-4o mini在市面上常见的基准测试中优于竞品的同类“小”模型。
对于OpenAI来说,压力最大的挑战将来自于下周——根据多个消息源报道,Meta公司将在7月23日发布Llama 3开源大模型的最大参数量版本,据称拥有4000亿个参数。目前并不清楚这个模型的能力到底有多强。