OpenAI发布GPT-4o mini,奥尔特曼称两年时间模型成本下降了99%

科技 2024-07-19 11:35 阅读:2

虽然OpenAI迟迟未发布下一代模型GPT-5,但在现有能力基础上,仍在更新模型,继续推动大模型成本下降。

当地时间7月18日,OpenAI发布了新款轻量级的大模型GPT-4o mini。据介绍,GPT-4o mini即日起将在问答机器人ChatGPT中取代GPT-3.5 Turbo,企业用户则能从下周起访问GPT-4o mini。

“我们预计GPT-4o mini将扩大人工智能的应用,让人工智能变得更实惠。”OpenAI官网文章称,GPT-4o mini的输入价格为15美分/百万tokens,输出价格为60美分/百万tokens,比GPT-3.5 Turbo便宜60%。

从模型能力看,OpenAI称,GPT-4o mini在行业基准测试MMLU中获得82%的分数,低于GPT-4o的88.7%,高于77.9%的Genmini Flash、73.8%的Claude 3 Haiku和69.8%的GPT-3.5 Turbo。GPT-4o mini在MGSM测试和MMMU测试中,分别得分87%和59.4%,均超过Gemini Flash和Claude 3 Haiku,但低于GPT-4o。

OpenAI发布GPT-4o mini,奥尔特曼称两年时间模型成本下降了99% 第1张

此外,GPT-4o mini上下文窗口为128K tokens,支持输出16K tokens,知识更新至2023年10月。OpenAI介绍,GPT-4o mini还改进了处理非英语文本时的成本效益。GPT-4o mini能以较低成本和延迟执行广泛任务,如链接或并行多个模型调用、将大量上下文输入给模型、通过快速的实时文本响应与人交互。

目前,GPT-4o mini可以生成文字和图像,未来将支持视频和音频。OpenAI计划还在未来几天推出GPT-4o的微调。

目前来看,GPT-4o mini的主要作用可能是取代GPT-3.5 Turbo,并通过降低价格吸引用户。

OpenAI称,公司还将在提高模型性能的同时继续降低成本。相比2022年的text-davinci-003型号,GPT-4o mini的成本下降了99%。

“2022年全世界最先进的模型还是text-davinci-003,这个模型比现在的新模型差了很多,却贵了100倍。”OpenAI CEO萨姆·奥尔特曼在社交平台上表示。

其他大模型厂商今年也在推动模型轻量化,追求“小而美”。此前有大模型业内人士告诉记者,参数较小的大模型今年来展现了颇高的潜力,通过加大数据量而不是加大参数量的方式训练,模型性能还有很大提升空间,好处则在于轻量大模型的使用成本低,可以扩大使用。

谷歌今年5月也发布了轻量级模型Gemini 1.5 Flash。Anthropic 3月发布的Claude 3系列中,则包括轻量级的Claude 3 Haiku,在多项基准测试中Claude 3 Haiku的得分高于GPT-3.5、低于GPT-4。微软今年也在推动部署轻量级AI模型系列Phi。微软此前称,今年4月推出的Phi-3系列是市面上性能最强、最具性价比的“小语言模型”,最小版本的Phi-3-mini性能可超过参数规模高出一倍多的模型,成本可能只有类似功能的模型的十分之一。

从价格上看,Gemini 1.5 Flash每百万tokens起始价格为0.35美元,输出为1.05美元,Claude3 Haiku每百万tokens价格0.25美元,输出为1.25美元。GPT-4o mini的价格相对更便宜。