价格骤降96%~97%!OpenAI“杀入”小模型,GPT-4o mini功能更强、成本更低

美东时间7月18日(周四),OpenAI正式推出新一代入门级别人工智能模型“GPT-4o mini”,称这款新模型是“功能最强、性价比最高的小参数模型”,旨在服务更广泛的客户群体。这也意味着开发人员如今有了一种轻量级且廉价的工具,让他们能够以更低的成本构建AI应用程序。

外媒报道中称,目前,GPT-4o mini模型的应用程序编程接口支持文本和视觉,未来将支持文本、图像、视频和音频的输入和输出。

更重要的是,最新的“GPT-4o mini”比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,随着GPT-4o mini上架,GPT-3.5 Turbo的历史使命到此结束。OpenAI还表示,GPT-4o mini是首个使用其全新安全策略“指令层级”的AI模型。

对于为何未能更早推出“小而精”的AI模型,OpenAI的API产品负责人Olivier Godement表示,这纯粹是“优先级”的问题,而随着时间的推移,OpenAI注意到开发人员越来越渴望使用较小的模型,这也让公司决定投入资源开发GPT-4o mini。

GPT-4o mini:比GPT-4o便宜96% 将取代GPT-3.5 Turbo

据OpenAI,GPT-4o mini的API价格将会是15美分/100万Tokens输入,以及60美分/100万Tokens输出。上下文窗口依然是12.8万个Tokens,知识截止日期为2023年10月。公司拒绝透露新模型的参数量大小,仅表示与市面上类似的AI小模型(Claude Haiku、 Gemini 1.5 Flash等)处于同一个级别。

作为对比,GPT-4o的百万Tokens输入和输出价格分别是5美元和15美元,之前的入门款模型GPT-3.5 Turbo定价分别是0.5美元和1.5美元。这就是说,最新的“迷你模型”的价格比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,随着GPT-4o mini上架,GPT-3.5 Turbo的历史使命到此结束。

根据Artificial Analysis的统计,GPT-4o mini已经达到美国AI公司主流“小模型”里面价格最低的位置,比起Anthropic、谷歌的同类型竞品都要便宜一截。

OpenAI称,最新的GPT-4o mini从周四起向ChatGPT的免费用户以及ChatGPT Plus和ChatGPT Team的订阅用户开放,并将在下周向ChatGPT Enterprise用户开放。GPT-4o mini将取代ChatGPT中的旧模型GPT-3.5 Turbo。

OpenAI表示,GPT-4o mini目前在聊天偏好上表现优于GPT-4,在大规模多任务语言理解测试(MMLU)中的得分为82%。(注:MMLU是一个文本智能和推理基准,用于评估语言模型的能力。MMLU分数越高,表明该模型可以更好地理解和使用各种领域的语言,从而增强现实世界的应用。)

而在这项测试中,同为小参数模型的谷歌Gemini Flash得分为77.9%,Claude Haiku得分为73.8%。在更大参数的模型中,GPT-3.5在这项测试中的得分为70%,GPT-4o得分为88.7%,谷歌Gemini Ultra据称取得了有史以来最高分(90%)。

值得注意的是,研究人员对像MMLU这样的基准测试持谨慎态度,因为不同公司的管理方式略有不同,因此不同模型的得分难以比较。还有一个问题是,模型的数据库中可能有这些答案,也就是说其可以作弊,而且通常没有第三方评估人员参与这个过程。

入局小模型的背后

外媒报道中称,GPT-4o mini的推出也是OpenAI推动“多模态”(multimodality)技术发展努力的一部分,多模态指的是在一个大模型中提供多种类型的AI生成媒体,如文本、图像、音频和视频。

不仅如此,这一全新小模型也承载着帮助OpenAI走入更广泛的客户群体的希望。OpenAI在今年早些时候的最新一轮融资过后,估值已经超过800以美元。虽然是全球生成式AI估值最高的独角兽,但OpenAI仍面临着压力:一方面要保持其在生成式AI市场的领先地位,另一方面,由于其在AI基础设施上投入了大量资金以构建和训练模型,因此还要想方设法盈利。

GPT-4o mini为开发人员提供一种轻量级且廉价的工具,让他们能够开发出所有的应用程序和工具,相对而言,GPT-4这种更大、更昂贵的模型是他们无法负担得起的。此前,许多开发人员会转向Claude 3 Haiku或Gemini 1.5 Flash,而不是支付运行最强大的模型所需的高昂计算成本。

而且,GPT-4o mini是首个使用OpenAI全新安全策略“指令层级”的AI模型。这种方法的目的是使AI系统优先处理某些指令——例如来自公司的指令——以使人们更难让工具做不该做的事情。

OpenAI的API产品负责人Olivier Godement在接受媒体采访时解释了为何该公司未能更早推出“小而精”的AI模型,他说,这纯粹是“优先级”的问题,因为OpenAI专注于创建更大、更好的模型,如GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI注意到开发人员越来越渴望使用较小的模型,因此公司决定现在是投入资源开发GPT-4o mini的时机。

“我们的使命是使最前沿技术、构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步,”OpenAI的API产品负责人Olivier Godement在接受媒体采访时说。“但我们也希望拥有最好的小模型,我认为它会非常受欢迎。”

“我认为GPT-4o mini真正体现了OpenAI让AI更加普及的使命。如果我们希望AI惠及世界的每一个角落,每一个行业,每一个应用,我们必须让AI更加实惠。”Godement说道。

目前,金融科技初创公司Ramp已经使用GPT-4o mini构建了一个工具,可以提取收据上的费用数据。用户无须费力地浏览文本框,只需上传一张收据的图片,该模型就会进行分类。

电子邮件客户端Superhuman也对GPT-4o mini进行了测试,并用它创建了一个自动建议邮件回复的功能。

记者|蔡鼎

编辑|程鹏 兰素英 杜恒峰

校对|何小桃

|每日经济新闻 nbdnews 原创文章|

未经许可禁止转载、摘编、复制及镜像等使用

每日经济新闻

主题测试文章,只做测试使用。发布者:读懂财经,转转请注明出处:https://www.cnust.com/19/14/5174.html

(0)
读懂财经的头像读懂财经
上一篇 2024 年 7 月 19 日
下一篇 2024 年 7 月 19 日

相关推荐

  • 《魔兽世界》重启,服务器被挤爆!暴雪中国最新回应!

    暴雪旗下经典游戏《魔兽世界》国服正式服最近终于重启。 热情的玩家挤爆了服务器。近期,《魔兽世界》国服排队成了常态。一些玩家甚至需要排队数小时,才能进入游戏。 8月4日,《魔兽世界》官方宣布已对部分正式服服务器完成扩容,优化游戏体验。 “一直以来,国服玩家们对《魔兽世界》的热忱,让我们深受感动和鼓舞。《魔兽世界》最近的重新上线也让我们激动万分,因为我们的国服玩…

    行业 2024 年 8 月 5 日
    4300
  • A股午评:指数窄幅震荡沪指涨0.09%,猴痘概念拉升,AI眼镜概念股强势!超3000股下跌,成交3706亿;机构解读

    8月16日消息,。板块方面,AI眼镜概念股延续强势,联合光电(300691)、格林精密、思泰克20cm涨停;消费电子概念跟涨,凯旺科技盘中涨停;猴痘概念盘中拉升,透景生命(300642)20cm涨停,亚太药业(002370)、合富中国触及涨停;贵金属板块下挫,玉龙股份(601028)跌超6%;养殖板块集体走低,神农集团领跌;环保板块调整,清研环境跌超10%。…

    行业 2024 年 8 月 16 日
    2200
  • 硅谷公司SF Compute发力“共享算力”,阿尔特曼亲弟弟领投

    每经记者 蔡鼎 每经编辑 兰素英 人工智能热潮席卷全球,但时至今日,该领域的一个核心挑战仍是价格高昂的算力,能否获得相关芯片成了决定公司成败的关键。 为了帮助规模相对较小的公司获得所需的算力资源,美国一家名为San Francisco Compute Co.(以下简称SF Compute)的初创公司搭建了一个平台,帮它们找到了近乎完美的解决方案:算力租赁。 …

    行业 2024 年 7 月 24 日
    5400
  • 主播连续32小时“肝”黑神话 音浪收入或超1700万

    凤凰网科技讯(作者/于雷) 8月21日,中国3A游戏大作《黑神话·悟空》上线后在全球引发热议。名为“杨齐家”的博主在游戏上线后在抖音开始连续直播,截至发稿,该博主已连续直播超32小时,直播间观看人数超3000万,涨粉近46万。 直播间截图 直播间主播公屏上打了一行字表示“不通关不下播”,中间会让助理帮忙打一会儿,自己休息。目前主播的游戏直播还在进行中。 网传…

    行业 2024 年 8 月 21 日
    1600
  • A股收评:三大指数集体收涨,移动支付掀涨停潮,互联网电商大涨!近4000股上涨,成交5348亿;机构解读

    9月5日消息,三大指数集体收涨,沪指午后震荡回暖。板块方面,互联网电商午后大涨,星徽股份、跨境通(002640)(维权)双双涨停;移动支付概念掀涨停潮,神思电子(300479)、创识科技、飞天诚信(300386)20cm涨停;游戏板块走高,名臣健康(002919)涨停;中船系概念集体回调,昆船智能领跌;电池股走弱,鹏辉能源(300438)逼近跌停;化工概念股…

    行业 2024 年 9 月 5 日
    1300

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信