“今天,有大约200万开发者在使用我们的API进行各种用例的开发。超过92%的财富500强公司正在使用我们的产品进行构建,而现在ChatGPT每周活跃用户大约有1亿。”
北京时间11月7日凌晨,在OpenAI的首次开发者大会上,SamAltman公布了过去一年中OpenAI的骄人成绩。
如会前流传的消息,本次大会上推出了ChatGPT的最新版本GPT-4Turbo,以及众多全新功能。更重要的是,OpenAI宣布要围绕GPT打造AI平台,推出GPTStore,并提出了GPTs的概念,用户可以利用GPTBuilder工具,创建自己的GPT。
从ChatGPT被比喻为AI的iPhone时刻,恐怕SamAltman就已经把目标瞄准了苹果。不过,他的野心更大,不仅要把ChatGPT做成下一个iOS,还要进一步加强与用户的绑定,让每个用户都有机会成为开发者。
王炸:GPT-4Turbo
本次发布的LLM(大语言模型)更新主要包括:
最新的GPT-4Turbo,支持128k上下文窗口,且价格更低,输出更快。
全新的AssistantsAPI,使开发人员更容易构建自己的人工智能应用程序。
新的多模态功能,包括视觉、图像创建(DALL·E3)和文本转语音(TTS)。
OpenAI开发者大会的发布的重要更新
长上下文
长上下文正在成为百模大战的“主战场”。对比众多新模型,GPT-4的32ktoken上下文窗口已不那么出色。此次GPT-4Turbo更新的上下文窗口达到128k,是GPT-4的四倍,且超过了竞对Anthropic此前推出的100ktoken的Claude2。
SamAltman在演示中称128ktoken大约相当于300页纸的文字量,英国版的《哈利·波特与魔法石》差不多就是300页,指环王三部曲平均每本是400页。
不过,GPT-4Turbo的上下文长度也并非最长。一周前,百川智能发布的Baichuan2-192K,上下文窗口长度为192K,能够处理约35万个汉字。
开发助手
OpenAI此次更新中,着重面向开发者推出了AssistantAPI,使开发者能在应用中集成类似代理的AI体验。
这个API允许AI助手执行具体任务,调用模型和工具,并处理一些复杂的编程和数据处理工作。它支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。
助手API具有持久化线程功能,简化了状态管理,并允许调用开发者定义的函数。此外,它还提供了代码解释器和检索工具,可在外部数据上运行和检索信息。数据保护方面,开发者可自主管理其传递给API的数据。现在,开发者可以通过助手API游乐场,无需编码进行测试。
此外,OpenAI对函数调用进行了更新,现在模型可以在单个消息中调用多个函数,并更准确地返回正确的函数参数。GPT-4Turbo在遵循指令生成特定格式时表现更佳,并支持新的JSON模式以确保输出有效的JSON对象。新增的API参数response_format允许模型输出语法正确的JSON。此外,通过新的seed参数,模型可以产生可重现的输出,有助于调试和编写单元测试。OpenAI还计划推出返回输出令牌对数概率的功能,以便在构建“自动完成”等功能时使用。
知识更新
GPT-4的知识库更新到2023年4月。目前ChatGPT中使用的GPT-4模型,已经将知识库更新到了2023年4月,不过GPT-3.5的知识库仍然停留在2022年1月。
新的多模态模型
在多模态能力方面,GPT-4Turbo的API将集成DALL-E3,以及文生语音模型TTS(text-to-speech)。
开发者可以通过API直接调用GPT-4Turbowithvision中的DALL-E3模型,进行图片识别和图片生成。事实上,DALL·E3上线之后,ChatGPTPlus用户就已经可以在GPT-4模块下调用DALL·E3进行图片创作,以及多模态的图片识别了。不过,这次是以API的形式,将多模态的能力开放给开发者。
此外,OpenAI还上线了新的TTS文生语音功能。类似能力,在ChatGPT手机端也已经上线了一段时间(不过目前实测中文还是有一点英语口语),此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选,可以输出Opus、AAC和FLAC三种格式,尚不支持自建声音。
价格更低,输出更快
“在模型持续的迭代中,我们的价格也在不断下降。”SamAltman介绍说,相比于GPT-4,GPT-4Turbo的输入价格只有1/3,0.01美元每1000token;输出价格为0.03美元每1000token,只有原来的1/2。而内容生成的速度,提高了2倍。
又一个iPhone时刻:GPTStore
在ChatGPT插件上线的时候,就有很多人将其比喻为安卓市场或是iOS的AppStore。如今,OpenAI真的推出了AI版本的AppStore——GPTStore。
用户可以直接创建ChatGPT的自定义版本,在开发者大会现场,两位OpenAI工作人员现场演示了GPT的构建方法。
OpenAI工作人员Jessicashay现场演示了利用GPTBuilder构建一个能与行程表互动的GPTs。并以对话的形式命令GPT给SamAltman发信息,Altman也在现场接收到了这条信息。
另一个更加专业的演示则是OpenAI的工作人员现场演示AssistantsAPI的用法:它不仅能列出巴黎旅游建议,还能在地图上将计划中提到的地点按类别标记出来。
SamAltman表示OpenAI将会在本月底上线GPTStore,开发者可以通过GPTStore分享、发布自己的GPTs。此外,GPTStore产生的收入OpenAI也将按一定比例与开发者分成,不过具体的分配方案还尚未公开。
关于钱和微软
在现场的AssistantsAPI演示过程中,OpenAI工作人员开放了一个现场抽奖,第一波抽奖是随机选了5个到场工程师每人发了500美元的开发者额度。第二波则直接给到场的900多名软件开发人员及参会嘉宾每人发了500美元额度。
看似“撒币”的行为,其实对于OpenAI来说,也没有特别大方,因为API额度消耗的速度对于正常开发者来说,实在是太快了。多位开发者曾在OpenAI社区中表达了OpenAI发放的120美元的开发者试用优惠额度很快就会用光。
ChatGPT又变强了OpenAI会变成下一个苹果吗
过去半年中,OpenAI的估值水涨船高,总融资超过140亿美元,但OpenAI的资金消耗速度惊人。
一方面,OpenAI需要支付大量的算力和研发成本;另一方面,还要为未来不确定的法律问题做准备。
本次大会,OpenAI推出了copyrightshield功能,用于保护用户不受到版权问题困扰,不光从技术上规避版权风险,当用户遇到版权问题时OpenAI也会协助解决。
过去几个月中,OpenAI一直被美国的众多版权所有者联合维权,多家出版集团都在向OpenAI伸手要钱。在版权问题方面,未来的商业化推广道路需要有庞大的资金支持。在美国的法律环境下,要推出这样一项服务,OpenAI大概率也已经盘算好了败诉后的退路。
说到钱,就不得不提到OpenAI一直以来的大金主:微软。坊间一直流传着两家不合的传闻。SamAltman的演讲中,只邀请了微软CEOSatyaNadella一个嘉宾,似乎是在向外界证明OpenAI和微软的无间合作。
在演讲中,SamAltman直白地问SatyaNadella:微软和OpenAI的合作关系怎么样?
SatyaNadella幽默地回答说:“事实上,我记得你第一次向我伸出手时说,‘嘿,你有一些Azure积分吗’,比起那时,我们已经取得了很大的进步。”
微软始终是基础设施提供者,赚的是基础设施的钱。SatyaNadella反复强调:“我们的首要任务是构建最好的系统,以便你可以构建最好的模型,然后将其全部提供给开发人员。”
不过,SatyaNadella并没有否认微软开发团队在AI方面的研究工作,他表示:“我们自己也是开发者,我们也在构建产品。”