logo
繁体
繁体

商业深度:ChatGPT是这样创造了人工智能狂潮的,从一家非营利组织开始

《财富》杂志报道了OpenAI创始人萨姆·奥特曼如何利用了微软提供的数十亿美元打造出世界上最热门的技术,以至于科技巨头和全球各地的商业领袖都在为生成性人工智能失眠,甚至谷歌的创始人都回到了公司应对危机。

一代人的时间之内会有几次出现这样的产品:一项技术从工程部地下室的荧光阴暗处、书呆子的腥臭卧室、业余爱好者的孤独洞穴中,直接变成你的七大姑八大姨(great-aunt Edna)都知道怎么用的玩意儿。

早在1990年就出现了网络浏览器,但直到1994年网景浏览器(Netscape)的出现,大多数人才真正发现了互联网;在2001年 iPod 首次亮相之前就有了 MP3 播放器,但这些前辈们并没有引发数字音乐革命;而在苹果于2007年推出iPhone之前也有智能手机,但在iPhone之前,并没有如今这样丰富的应用程序生态。

2022年11月30日,人工智能迎来了或许是属于自己的“网景浏览器”时刻。

迎来这一时刻的是 OpenAI 的首席执行官山姆·奥特曼(Sam Altman)。OpenAI 是一家位于旧金山的人工智能公司,成立于2015年,得到了一批硅谷重量级人物的资金支持,包括伊隆·马斯克、彼得·蒂尔和贝宝帮,以及领英(LinkedIn)联合创始人里德·霍夫曼(Reid Hoffman)。 

山姆·H·奥特曼(1985年4月22日-)是一名美国企业家、投资者、程序员和博主。他亦是OpenAI的首席执行官,以及Y Combinator的前总裁。altman, CC BY-SA 4.0 via Wikimedia

 

去年11月30日,在公司成立约7年后,奥特曼在推特上说:“今天我们推出了ChatGPT,可以在这里试着与它交谈。”

随后的链接可以让任何人注册一个账户,开始免费与 OpenAI 的新颖聊天机器人对话。任何一个人都会这样做,而且不仅仅是为了聊天气。

一家软件公司的首席执行官兼工程师阿姆贾德·马萨德要求 ChatGPT 对自己的代码进行调试,这个 AI 做到了;

吉娜·霍莫卡是一位美食博主和影响者,让 ChatGPT 写一份健康巧克力饼干的食谱;

Scale AI (译注由麻省理工辍学的华裔天才少年创办的提升数据标注效率的公司)的工程师莱利·古德赛德让 ChatGPT 为《宋飞传》(Seinfeld,译注:知名美剧)写一集剧本;

盖伊·帕森斯则是一名营销人员,他还经营着一个专门介绍人工智能艺术的在线画廊,他让人工智能为自己写提示,以输入另一个人工智能系统 Midjourney,后者根据文本描述创建图像;

斯坦福大学医学院的皮肤科医生罗克萨纳·达内什尤(也在研究人工智能在医学中的应用,她向人工智能提出了医学问题;

而很多学生用ChatGPT来做家庭作业······

上述这些应用场景,仅仅是在聊天机器人发布后的头24小时之内出现的。以前也有过聊天机器人,但不是这个样子的。ChatGPT 可以进行长篇的、流畅对话,回答问题,并编写任何一个人所要求的几乎任何类型的书面材料,包括:商业计划书、广告活动、诗歌、笑话、计算机代码和电影剧本。

ChatGPT 远非完美,其结果并不总是准确的。不能引用其信息来源;几乎不知道2021年以后发生的任何事情;而且它所提供的东西,虽然通常足够顺利地通过高中课程甚至是大学课程,却很少像人类专家所能提供的那样精炼。

而另一方面,ChatGPT 在大约一秒钟内就能完成这些内容。通常情况下,用户侧几乎不需要提供任何具体的知识,而且它吐出的很多内容质量也不差。在发布后的5天内,有超过100万人就使用过了 ChatGPT,这是 Facebook 最初花了10个月才达到的里程碑。

在过去十年中,人工智能技术已经稳步进入了商业领域,并悄悄地改进了我们每天使用的许多软件,但却没有引起非技术专家人群的兴奋,而 ChatGPT 改变了这一点。

突然间,每个人都在谈论人工智能如何颠覆他们的工作、公司、学校和生活。

ChatGPT 是人工智能技术浪潮的一部分,这些技术被统称为“生成性人工智能”(generative AI),其中还包括像 Midjourney 和 Lensa 这样热闹的艺术生成器;而 OpenAI 处于科技行业下一个大事件的前沿,具有创业史诗的特征,包括全明星阵容和投资者的狂热,据说它的估值已达到290亿美元。

即使最近的耀眼崛起激起了人们的羡慕、好奇和恐惧,比如谷歌,其利润丰厚的搜索帝国可能会受到影响,据说在公司内部宣布了“红色警报”状态,以应对 ChatGPT,但 OpenAI 也不太可能进入科技超级巨头俱乐部。

直到几年前,OpenAI 还根本不是一个公司,而是一个致力于学术研究的小型非营利性实验室。有着崇高的创始原则,比如:保护人类免受无限制的人工智能的危险,仍然存在于其使命和愿景中。之后,OpenAI 经历了一次内部转型,使其原来的员工发生了分裂,并使其更加关注商业项目而不是纯科学。

一些批评者认为,将 ChatGPT 释放到“野外”本身就很危险,这也是 OpenAI 的原则发生深刻转变的一个标志。

在本周对外宣布的与微软扩大合作关系,其中就包括高达 100 亿美元的新资本,可能会导致这家软件巨头在未来几年内获得 OpenAI 的大部分利润。这笔交易可能会加深人们的看法,即曾经的理想主义努力现在主要关注的是赚钱。

尽管如此,《财富》杂志看到的文件显示,OpenAI 的业务目前是多么的无利可图。

37岁的联合创始人兼首席执行官奥特曼,就体现了 OpenAI 令人困惑的性质。奥特曼是一位连续创业的科技企业家,更多的是以商业智慧而非工程成就而闻名,他既是 OpenAI 估值飙升的设计师,也是其首席执行官,他公开表示 ChatGPT 离真正的可靠性还有很远。

同时,他认为这项技术是他更全面的、充满幻想的公司使命中的一步,即开发一种被称为人工通用智能(Artificial General Intelligence,缩写为AGI,或称为强人工智能)的计算机超级智能。奥特曼在去年7月发推文说:“AGI 可能是人类生存的必要品。我们面临的问题似乎太大,没有更好的工具我们无法解决。”

对于一个目的是要赚钱的企业来说,这是一个不寻常的指导思想,特别是考虑到一些计算机科学家将奥特曼的痴迷视为幻想。加州大学伯克利分校的计算机科学家本·雷希特说:“AGI实在是太傻了。我的意思是,它不是一个(完整的)东西。”

然而,通过ChatGPT,奥特曼已经将 OpenAI 和更深入的人工智能任务变成了吸引科技界的东西。问题是他与微软建立的合作关系能否弥补 ChatGPT 的缺陷,并利用其早期的领先优势来改变科技行业。

谷歌和其他巨头正在努力开发属于他们自己的人工智能平台;而未来更完善的软件可能会让ChatGPT 看起来像小孩子的游戏。OpenAI 可能有一天会发现:就像网景公司短暂的浏览器行业统治地位一样,它的突破为自身并不在其中的未来打开了一扇门。

吞噬几乎所有数据的巨兽

今年 1月中旬的一个星期四晚上,在旧金山,奥特曼罕见地公开露面。这位首席执行官身穿灰色毛衣、蓝色牛仔裤和一双色彩鲜艳的、鞋带经过特别染色的运动鞋,走进一个由投资者、技术人员和记者组成的房间,他们都聚集在一起,正在收集关于 ChatGPT 或即将到来的一轮融资的任何信息。

当他的采访者,专注于风险投资的媒体公司 StrictlyVC 的创始人康妮洛·伊索斯问他关于媒体的强烈反响时,奥特曼回答说:“我不看新闻,我也不怎么做诸如此类的事情。”

在 Salesforce 大厦46层的活动现场站满了人。在采访前举行的金融技术小组会议上,一位发言人甚至告诉大家,她知道他们“都在等待山姆·奥特曼。”

但是,尽管如此嘈杂,还有广为流传的关于微软注资的传言,奥特曼似乎不遗余力地抑制着人群的兴奋。他告诉大家:“这些技术的一个奇怪之处在于,它们令人印象深刻,但并不稳定。所以在首次演示中使用这些技术;你就会有这种非常令人印象深刻的感觉,‘哇,这太不可思议了,可以投入使用了(类似这样的反应)’。但是你体验它一百次,你就会看到它的弱点。”

这种谨慎似乎是 OpenAI 的官方模式,OpenAI 的总部位于旧金山教会区(译注:Mission District,又称拉丁区,是旧金山城内最古老的区域)的一个原行李箱工厂。事实上,如果ChatGPT 是人工智能的网景浏览器时刻,那么它是一个几乎未能发生的时刻,因为OpenAI 在几个月前差一点就关闭了这个项目。

最初,OpenAI 设想了一个允许用户以简单直白的英语(或许多其他语言)与人工智能交谈的聊天界面,这是改进其“大型语言模型”(Large Language Models,缩写为LLM)的一种方式。大多数生成式人工智能系统的核心都是 LLM。

这种模型是采用规模非常大的神经网络,并将其应用于大量人类创造的文本,简而言之,这是一种相当松散的、基于人脑连接的人工智能。

从人类创造的文本库中,这种语言模型学习到了一张复杂的、基于统计可能性的“图”。所谓统计可能性,是指任何一组词在任何给定的上下文语境中出现在一起的可能性。这使得大型语言模型能够执行大量的自然语言处理任务,比如:从翻译、总结或写作。

OpenAI 已经创造了世界上最强大的大型语言模型之一。它被称为 GPT-3,已经吸收了超过1750亿个连接,并在大约三分之二的互联网内容、所有的维基百科和两个大型书籍数据集上进行了训练。

但 OpenAI 发现,要让 GPT-3 准确地产生用户想要的东西,可能很困难。一个团队想到了使用强化学习来完善模型。强化学习是指人工智能系统以追求奖励最大化为目标,从试验和错误中学习。

这一团队认为:聊天机器人可能是这种方法的最佳候选者,因为以人类的对话形式提供了持续反馈,将使人工智能软件很容易知道它哪里做得很好,又在哪里需要改进。

因此,在2022年初,团队开始构建后来的 ChatGPT。

当一切就绪时,OpenAI 让测试者玩 ChatGPT。但根据 OpenAI 联合创始人、现任总裁格雷格·布洛克曼(Greg Brockman)说:测试者们并没有像 OpenAI 所希望的那样接受 Chat GPT;人们并不清楚自己应该和聊天机器人谈些什么。

有一段时间,OpenAI 换了个方向,试图建立可以帮助特定领域专业人士的专家级聊天机器人。但这一尝试也遇到了问题,部分原因是 OpenAI 缺乏正确的数据来源来训练专家级机器人。布罗克曼说,几乎是在不幸中的万幸情况下,OpenAI 决定将 ChatGPT 放到外部世界,直接供公众使用。

布罗克曼说:“我承认,我当时基本上不知道这样做是否会成功。”

公司高管们坚持认为,聊天机器人瞬间进入病毒传播让 OpenAI 措手不。OpenAI的首席技术官米拉·穆拉提(Mira Murati)说:“这绝对令人惊讶。”

奥特曼说,在旧金山的风险投资活动中,他“本来以为一切东西都会少一个数量级,比如少一个数量级的媒体炒作。” 

米拉·穆拉提(Mira Murati)毕业于达特茅斯学院,她曾在特斯拉担任 Model X 的产品经理,亦在厉动(Leap Motion)担任过产品与工程的副总裁。图源:领英账号

 

ChatGPT 并不是 OpenAI 唯一的被炒作产品和话题,OpenAI 相对较少的300名员工在创造而非简单分析数据方面,推动了人工智能所能做到的新极限。DALL-E 2 是 OpenAI 的另一项创造,它允许用户仅仅通过输入几个字,就创造出用户想象得到的任何东西的逼真图像。

这一人工智能系统现在已经被其他公司所效仿,包括 Midjourney 和一个名为 Stability AI 的开源竞争者。当然所有这些图像生成器都有缺点,最明显的是它们倾向于放大它们所训练的数据中的偏见,产生的图像可能具有种族主义和性别歧视的味道,当然这并不是主观恶意导致的。

通过对 GPT LLM 的代码进行微调,OpenAI 还创建了 Codex,这是一个可以为程序员编写代码的系统,程序员只需用普通的自然语言指定自己希望用代码做什么。而更多的创新即将到来。OpenAI 有一个更强大的大型语言模型(LLM)正在进行测试,名为 GPT-4,预计将在今年发布,甚至可能马上发布。

奥特曼还表示,OpenAI 正在开发一个可以从文本描述中自动生成视频的系统。同时,在今年1月中旬,OpenAI 表明自己打算发布 ChatGPT 的商业版本,宣布了一个等候列表,让潜在客户通过一个界面注册付费使用这款机器人,这将使客户更容易将聊天机器人整合到自己的网络产品和服务中。

微软捡了个便宜

持怀疑论的人可能会认为,OpenAI正在进行一轮大规模的融资,这个背景可能与ChatGPT的发布时间有关系,而 OpenAI 官方说时间是巧合的。

可以肯定的是,ChatGPT搅动了充满鲨鱼的水域。ChatGPT 在希望抢购 OpenAI 股份的风险投资公司中掀起了一股投喂狂潮,他们的目标就是 OpenAI 高管、员工和创始人目前持有的股权。

风投机构慷慨的报价,与刚刚宣布的微软新投资同步进行,微软将向该公司注入高达 100 亿美元的新资本。微软在 2016 年开始与 OpenAI 合作,与这家初创公司建立了战略伙伴关系,并在三年前宣布向这家公司投资 10 亿美元。

据熟悉新投标报价的消息人士称,这种不寻常的结构给了微软很大的财务优势。根据《财富》杂志看到的文件,在完成新的投资后,在 OpenAI 的第一批投资者赚回他们的初始资本后,微软将有权获得 OpenAI 75%的利润,直到它赚回自己所投资的130亿美元,这个数字包括早先对 OpenAI 的20亿美元投资,在《财富》杂志于1月份报道之前,这个数字还没有对外披露过。

此后,微软的份额将降至49%,直到这家软件巨头赚取 920 亿美元的利润。同时,其他风险投资者和 OpenAI 员工也将有权获得 OpenAI 49% 的利润,直到他们赚到大约1500亿美元。如果这些上限被触及,微软和投资者的股份将归还给 OpenAI 的非营利基金会。实质上,OpenAI 是在把自己借给微软,至于借多久,取决于 OpenAI 能以多快的速度赚到钱。

但赚回其投资,更不用说达到这些上限,可能需要相当长的时间。《财富》杂志看到的文件显示:到目前为止,OpenAI 的收入相对较少,而且严重亏损。文件显示,去年该公司预计将获得不到 3000 万美元的收入。但在计算和数据方面的支出大约为 4.1645 亿美元,在员工方面的支出为 8931 万美元,还有 3875 万美元的未指明用途的其他运营费用。

总的来说,OpenAI 在 2022 年的净亏损不包括员工股票期权,预计为 5.445 亿美元。而有了 ChatGPT 之后,亏损可能还会飙升。奥特曼在 Twitter 上回答伊隆·马斯克的问题时说,用户与 ChatGPT 的每一次互动都会给 OpenAI 带来 “几美分”(个位数)的运算成本,而随着聊天机器人的普及,总计价格每月可能会达到数百万美元。

OpenAI 预计,随着 ChatGPT 成为能够吸引客户的“汽笛”,其收入将迅速攀升。根据这些文件,2023 年的预期收入为 2 亿美元,2024 年则将超过 10 亿美元。但这些文件没有预测 OpenAI 的支出可能如何增长,以及何时能实现盈利。OpenAI 和微软拒绝对这些数字发表评论,但两家公司指向了一个明显的现实:OpenAI 和微软都认为,这个前非营利性实验室现在有了可以出售的东西。

微软已经从伙伴关系中获得了回报。微软已经在自己的 Azure 云中推出了一套基于 OpenAI 的工具和服务,这将使 Azure 客户能够使用 OpenAI 的技术,包括 ChantGPT 和 DALL-E。

例如,汽车市场 CarMax 已经推出了在这些 Azure 工具上运行的新服务。 

Microsoft Azure是微软的公用云端服务(Public Cloud Service) 平台。Microsoft Corporation, CC BY-SA 4.0 via Wikimedia

 

微软人工智能平台公司副总裁埃里克·博伊德(Eric Boyd)说,满足训练以及运行 OpenAI 的大型语言模型的需求,推动了微软云服务的创新,从而使所有 Azure 客户受益。

例如,微软已经为人工智能建立了自认为是世界上最强大的超级计算机集群,并创造了一些软件创新,使其更容易在这些机器上训练和运行大型人工智能模型。

微软正在逐步将 OpenAI 的技术注入自身旗下的大部分软件中,微软已经在搜索引擎 Bing 中发布了一个图像创建器,以及新款 Designer 平面设计工具,这两者都由 DALL-E 驱动;而在 Power Apps 软件中发布了一个支持GPT-3的工具,以及一个基于 OpenAI 的 Codex 模型的代码建议工具 GitHub Copilot。

晨星公司(Morningstar)负责科技股研究的高级股票研究分析师丹·罗曼诺夫(Dan Romanoff)说,即使 OpenAI 不能立即推动 Azure 的收入,与 OpenAI 的关系也是良好的品牌定位和营销。

他说:“这是很引人注目的。将 OpenAI 开发的人工智能解决方案放在Azure上,称之为 Azure 人工智能的能力,这让他们保持了竞争力。”

微软在云计算方面对手,比如:谷歌、AWS、IBM、甲骨文、Salesforce和其他公司,都有自己的“认知”服务,但是,与 ChatGPT 的创始人们有联系也无妨。

对微软来说,更大的收获可能是在搜索方面。关注科技行业的新媒体《The Information》最近报道说:微软计划将 ChatGPT 整合到 Bing 中,可能是会允许 ChatGPT 对查询返回简单、简洁的答案,让人们通过与聊天机器人对话进一步获取信息,而不是得到传统的链接列表。

谷歌目前在搜索市场上占主导地位,在全球拥有超过 90% 的市场份额。Bing 排在第二位,但完全不是一个量级,大约只有 3% 的份额。在2022年的前九个月,搜索为谷歌带来了1200 亿美元的收入;总体而言,搜索业务占到了谷歌收入的 60% 左右。

ChatGPT 可能为微软提供了唯一真正的机会,使其有可能将谷歌从这个宝座上打下来。微软拒绝对《The Information》的报道发表评论。

按照微软的标准,这些好处是很便宜的。其 130 亿美元的总投资是一笔巨款,但只占其在过去12个月中所获得的 850 亿美元税前利润的 15%,而对于一个能改变模式的技术,拥有其近期控制权来说,这是一个相对便宜的交易。

但就另一方而言,OpenAI 和奥特曼有可能付出不同的代价:微软的优先事项可能会排挤掉他们自己的优先事项,使他们更全面的使命面临风险,并疏远那些推动其获得当前成功的科学家

OpenAI的名人效应

2015年7月的一个晚上,时任著名创业公司孵化器 Y Combinator 负责人的奥特曼在门洛帕克瑰丽酒店(Rosewood Sand Hill)举办了一场私人晚宴,这家豪华的牧场式酒店位于门洛帕克谷的风险投资行业中心,伊隆·马斯克也在那里。

布罗克曼也在现场,他当时是麻省理工学院的一名辍学生,26岁,曾在支付处理方面的初创公司 Stripe 担任首席技术官。一些与会者是经验丰富的人工智能研究人员,有些人几乎没有任何机器学习的相关背景。

但他们所有人都相信AGI(Artificial General Intelligence,通用人工智能或强人工智能)是可能的。他们也对此很忧虑。

谷歌刚刚收购了总部位于伦敦的神经网络创业公司 DeepMind,这是在奥特曼、马斯克和其他科技业内人士看来能率先开发出 AGI 的最大热门。如果 DeepMind 获得成功,谷歌可能会垄断这项无所不能的技术。瑰丽酒店晚宴的目的是讨论组建与之匹敌的实验室,以确保这种情况不会发生。

这个新的实验室旨在成为 DeepMind 和谷歌所不具备的一切,将以非营利组织的形式运作,明确致力于将先进人工智能带来的利益民主化。它承诺将公布其研究,并开放其所有的技术的源代码,而且名字里就包含了对透明度的承诺:OpenAI。

这个实验室获得了令人印象深刻的捐赠者名单:不仅是马斯克,还有他在 PayPal 的同事蒂尔和霍夫曼;奥特曼和布罗克曼;Y Combinator 联合创始人杰西卡·利文斯顿;奥特曼建立的基金会 YC Research;印度IT外包公司印孚瑟斯(译注:Infosys,其创始人是现任英国首相苏纳克的岳父);以及亚马逊网络服务(AWS)。

这些创始捐赠者共同承诺向这家理想主义的新企业捐赠10亿美元。尽管根据税务记录,非营利组织只收到了引人注目的承诺数额中的一小部分。

但训练巨大的神经网络很快就被证明是昂贵的,计算成本达到数千万美元,而且人工智能研究人员的薪资也不便宜。伊尔亚‧苏茨克维(Ilya Sutskever)是一位出生在俄罗斯的科学家,他在谷歌工作后来到 OpenAI 担任首席科学家,根据税务记录,他在实验室的头几年年薪为190万美元。

几年后,奥特曼和 OpenAI 的其他人得出结论,为了与谷歌、Meta 和其他科技巨头竞争,这家实验室无法继续作为一个非营利组织运作。奥特曼在2019年告诉《连线》杂志:“我们要成功完成任务所需的资金量,比我原先想象的要巨大得多。”

设立一个营利性部门可以使 OpenAI 筹集风险资本。但 OpenAI 创建了一个不寻常的结构,将投资者的回报限制在其初始投资的数倍而已。而且,OpenAI 的非营利性董事会由硅谷知名人士组成,将保留对 OpenAI 知识产权的控制权(见下列组图)。马斯克是一个没有留下来的名人:2018年,他离开了董事会,理由是需要经营 SpaceX 和更重要的特斯拉。

OpenAI 的早期投资者和非营利性基金会的董事会中,有很多科技明星。OpenAI 的章程赋予了董事会对其知识产权的最终控制权,其中一些关键人物是:

伊隆·马斯克。他是 SpaceX 和特斯拉的首席执行官,也是 OpenAI 最重要的早期捐助者之一。不过,他于 2018 年离开了 OpenAI 董事会,他表示面临着利益冲突,因为特斯拉开始开发属于自己的先进人工智能。

里德·霍夫曼是 PayPal 和 LinkedIn 的联合创始人是风险投资公司 Greylock Partners 的合伙人。他是 OpenAI 的创始人之一。startupofyou, CC BY-SA 4.0 via Wikimedia

塔莎·麦考利是一位虚拟现实行业的企业家,她是有效利他主义的支持者,这一哲学运动将超级智能人工智能的危险作为其关注的重点之一。此外,她的老公是好莱坞著名影星约瑟夫·戈登·莱维特(Joseph Gordon-Levitt)。startupofyou, CC BY-SA 4.0 via Wikimedia

 

亚当·丹吉洛(Adam D’Angelo)是Facebook的早期高管,在2000年代末 Facebook 的繁荣时期担任首席技术官,后来共同创立了在线问题回答服务 Quora。Philip Neustrom, CC BY-SA 4.0 via Wikimedia

 

希文·齐利斯(Shivon Zilis)。齐利斯是伊隆·马斯克的脑机接口公司 Neuralink 的项目主管,这家公司曾一度与 OpenAI 共用一栋大楼。据报道,马斯克是齐利斯双胞胎婴儿的父亲。图源:个人网站

 

维诺德·科斯拉(Vinod Khosla) 这位太阳微系统公司(Java技术的开发者,2009年被甲骨文收购)的联合创始人是 OpenAI 营利性部门的另一位早期投资者。他认为人工智能将从根本上改变人类专业知识在许多行业的价值,包括医学。James Duncan Davidson, CC BY-SA 4.0 via Wikimedia

大约就在这个时候,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)急于证明:他的公司虽然被外界认为在人工智能领域落后于竞争对手,但可以在技术前沿发挥作用。微软公司曾试图聘请一位大名鼎鼎的人工智能科学家,但没有成功。微软还在建立一个巨大的、昂贵的专用芯片集群,以推进自己在语言模型方面的努力,这正是 OpenAI 所需要的超级计算能力,而当时微软正花费巨资购买。

OpenAI 擅长于完成纳德拉所希望的那种华丽的人工智能,以展示微软的人工智能智慧。奥特曼与纳德拉进行了接触,多次飞往西雅图,向他展示 OpenAI 的人工智能模型。纳德拉最终签署了一项协议,并在2019年7月宣布,使微软成为 OpenAI 技术商业化的“首选合作伙伴”,同时向这家人工智能初创公司提供 10 亿美元的初始投资。

虽然奥特曼从一开始就参与了 OpenAI,但他直到 2019年5月才成为首席执行官,也就是在OpenAI 转换为营利性企业之后不久。不过,从研究实验室到数十亿美元的轨迹,反映了奥特曼独特的筹款能力和以产品为导向的关注力,以及这些商业本能和他对更大的、科学驱动的创意的承诺之间的密切关系。

这位 OpenAI 的领导者在某种程度上就是硅谷人漫画形象:年轻、男性、脸色苍白;眼睛从来不眨,使用流利的极客语言,痴迷于最大化的效率和生产力;是一个致力于“改变世界”的工作狂人。

在2016年《纽约客》的一篇简介文章中,他说自己并没有阿斯伯格综合症,但他可以理解为什么外界会认为他有。

奥特曼从斯坦福大学的计算机科学学位课程中辍学,共同创办了 Loopt,这是一家社交媒体公司,同名应用程序会告诉你朋友在哪里。这家公司在 2005 年进入了 Y Combinator的第一批创业公司;Loopt未能起飞,但奥特曼在出售时赚到的钱,帮助他进入了风险投资领域。

他成立了自己的小型风险投资公司,名为Hydrazine Capital,筹集了约2100万美元,包括来自彼得·蒂尔的资金。然后,保罗·格雷厄姆和利文斯顿,也就是 Y Combinator 的联合创始人,把他请来作为格雷厄姆的继任者来管理YC。

奥特曼是一位企业家,而不是科学家或人工智能研究人员,他以特被擅长筹集风险投资资金而闻名。他相信伟大的事情来自于巨大的野心和坚定的自信心,他说他渴望通过所谓的深层技术游戏,创造数万亿美元的经济价值,尤其是在核聚变和量子计算等领域,这些领域的成功几率不是很高,但回报率可能很大。

曾在 Loopt 与奥特曼共事的资深科技投资者和创业公司顾问马克·雅各布斯坦(Mark Jacobstein)说:“山姆·奥特曼相信他在他所做的每一件事上都是最好的。我很确定他相信自己才是整个办公室里最好的乒乓球运动员,直到他的信念被证明是错误的。”

据几位现任和前任 OpenAI 内部人士称,随着奥特曼的掌权,这家初创公司的优先事项开始变化。曾经全面的研究议程缩小了,主要集中在自然语言处理上。公司的首席科学家苏茨克维和奥特曼为这一转变辩护说:他们在目前看来最有希望实现 AGI 的研究领域,做出了最大努力。但一些前雇员说,在微软最初的投资之后,专注于 LLM 的内部压力大大增加,部分原因是此类模型有直接的商业应用。

一些人抱怨说,OpenAI 的成立是为了不受企业的影响,但它很快就变成了一个巨大的技术公司的工具。一位前雇员说:“我们的重点是如何创造产品,而不是试图回答最有趣的问题。”和许多接受采访的人一样,这位员工要求匿名,因为有保密协议,也是为了避免疏远与 OpenAI 有关的强大人物。

OpenAI 也变得不那么开放了。OpenAI 已经开始从公布所有研究和开源代码的承诺中抽身,理由是担心自己的技术可能被滥用。但据前雇员说,商业逻辑在其中也起了作用。通过且仅仅通过 API 提供其 LLM 服务,OpenAI 保护了自己的知识产权和收入来源。

另一位OpenAI前雇员说:“(奥特曼)和(布罗克曼)对‘人工智能安全’有很多口头承诺,但这似乎只是商业考虑的假象,而实际的、合法性的人工智能安全问题被忽略了。”

作为例子,这位前雇员举出了 OpenAI 在 Midjourney 和 Stability AI 首次推出竞争性产品时,迅速推翻了此前由于担心被滥用而限制访问 DALL-E 2 的决定。此前 OpenAI 曾表示,只有在仔细的测试使其对 DALL-E 2 的安全系统更有信心后,才允许更广泛地使用这一服务。

根据一些前雇员的说法,这些战略和文化转变在十几名 OpenAI 研究人员和其他工作人员,其中许多人从事人工智能安全工作,决定在 2021 年与公司分道扬镳并成立自己的研究实验室,名为 Anthropic。

OpenAI 表示,它将继续公布远多于其他人工智能实验室的研究成果。它还为产品重点的转变做出辩护。首席技术官穆拉提说:“你不能只呆在实验室里建立 AGI。”她说:推出产品是发现人们想要如何使用和滥用技术的唯一途径。OpenAI 根本不知道 GPT-3 最受欢迎的应用之一竟然会是编写软件代码,直到他们看到人们确实喜欢用 OpenAI 来编码。

同样地,OpenAI 最担心的是人们会使用 GPT-3 来制造政治上的误导性消息,但事实证明这种担心是没有根据的;相反,她穆拉提表示:最普遍的恶意使用是人们在制造用于广告的垃圾邮件。

最后,穆拉提说:OpenAI 希望把技术向世界公开使用,“把真正强大的技术对社会的冲击降到最低。”她认为,如果不给人们一个未来可能出现的情况的预告,先进的人工智能对社会的破坏将更加严重。

苏茨克维承认 OpenAI 与微软的关系创造了一个新的“期望,即:我们确实需要从我们的技术中做出某种有用的产品”,但他坚持认为 OpenAI 的文化核心没有改变。他说:能够获准进入微软的数据中心,对 OpenAI 的进步至关重要。

布罗克曼还认为,这种合作关系使 OpenAI 能够创造收入,且同时保持不那么商业化的关注力,不然的话 OpenAI 将不得不真正变味。他说:“雇用数千名销售人员才是可能真正改变这家公司的变化,有一个已经做到这一点的合作伙伴(微软),实际上是很了不起的。”

苏茨克维断然否认了 OpenAI 已经不再强调安全的含义,“我想说的是事实恰恰相反。在 ‘Anthropic’分裂出去之前,人工智能的安全是一个专职化的团队,但现在人工智能安全是每个团队都有的责任。安全的标准不断提高,我们正在做的安全工作的数量不断增加。”

然而批评者说,OpenAI 以产品为导向的高级人工智能打法是不负责任的,相当于给了人们一把上了膛的枪,理由是这是确定他们是不是真的会互相开枪的最好方法。

纽约大学认知科学荣誉教授、对以深度学习为中心的人工智能打法持怀疑态度的加里·马库斯(Gary Marcus)认为,生成性人工智能构成了“对社会结构的真正且迫切的威胁”。他说,通过将制造虚假信息的成本降低到几乎为零,像 GPT-3 和 ChatGPT 这样的系统可能会释放出错误信息的浪潮。

马库斯说,我们甚至已经看到了第一批受害者。Stack Overflow 是一个让程序员提出和回答编程问题的网站,它已经不得不禁止用户提交由 ChatGPT 回答的答案,因为这个网站被那些看似合理但实质上却是错误的答案淹没了。同时,科技新闻网站 CNET 开始使用 ChatGPT 生成新闻文章,但后来发现许多文章由于事实不准确而不得不被纠正。

而对其他人来说,ChatGPT 编写出准确的代码才是真正的风险。网络安全公司Check Point的研究副总裁玛雅·霍洛维茨(Maya Horowitz)说,她的团队能够让 ChatGPT 编写网络攻击的每个阶段,从制作令人信服的钓鱼邮件到编写恶意代码,再到逃避常见的网络安全检查。她警告说:ChatGPT 基本上可以使零编码技能的人成为网络犯罪分子。

OpenAI 的首席技术官穆拉提说:“我担心的是,会有越来越多的攻击。”

她说,该公司也有这种担忧,并正在研究如何”调整“其人工智能模型,以便它们不会编写恶意软件,但这并没有简单的解决办法。

无数的批评家和教育工作者都谴责学生可以轻易地使用 ChatGPT 作弊。纽约市、巴尔的摩和洛杉矶的学区,都阻止了由学校管理的网络访问这款新推出的聊天机器人,澳大利亚的一些大学表示:他们将恢复只部署监考老师的纸质考试来评估学生。现在,OpenAI 正在研究使人工智能生成的文本更容易被发现的方法,包括可能在 ChatGPT 的输出中添加数字“水印”。

对于 ChatGPT 最初在2022年的数据训练和打标签方式,也存在道德方面的担忧。作为整个过程的一部分,OpenAI 雇用了一家数据标签公司,这家公司使用肯尼亚的低工资工人来识别涉及有毒语言和生动的性爱和暴力内容的段落。《时代》杂志的一项调查发现:其中一些工人报告说因此出现了心理健康问题。OpenAI 在一份声明中告诉时代周报记者,这种数据标签的目的是“最大限度地减少培训数据中的暴力和性爱内容,也是创建出可以检出有害内容的工具的必要准备步骤。”

OpenAI 的潜在危机

免费提供 ChatGPT 使 OpenAI 能够收集到大量的反馈意见,以帮助改进到未来的版本上。但还远不能确定 OpenAI 将保持其在语言人工智能领域的主导地位。总部设在伦敦的人工智能公司 Faculty 的创始人兼首席执行官马克·华纳(Marc Warner)说:“历史上看,我们倾向于看到这些非常通用的算法,但它们没有足够的护城河,无法让特定一家公司获得所有的一般回报。例如,人脸和图像识别技术最初是由谷歌和英伟达等科技巨头开发的,但现在已经无处不在。”

法院和监管机构也可能向生成性人工智能所依赖的数据飞轮里插入一根大棒。在加州联邦法院提起的 90 亿美元的集体诉讼,可能会对这个领域产生深远影响。案件原告指控微软和 OpenAI 没有为使用原告的代码注明来源或者提供财务补偿。微软和 OpenAI 用这些代码来训练 GitHub 的编码助手 Copilot,这违反了开放许可条款。被告的这两家公司拒绝对诉讼发表评论。

人工智能专家说:如果法院支持原告,有可能会破坏生成性人工智能的繁荣。大多数生成性的人工智能模型都是在未经许可或补偿的情况下从互联网上搜刮材料训练出来的。代表这些原告的同一家律师事务所最近对 Midjourney 和 Stability AI 提起了类似的诉讼,因为他们在训练数据中未经许可使用了有版权的艺术作品。

著名的图片社 Getty Images 也对 Stability AI 提起了版权侵权诉讼。如果立法者通过规则,赋予创作者选择不在人工智能训练中使用其内容的权利,那么另一个人工智能行业可能会面临的问题就要出现,而一些欧盟立法者正在考虑这样做。

同时,OpenAI 的竞争对手也没有停滞不前。据《纽约时报》报道,失去在搜索领域主导地位的前景,已经促使谷歌高管们宣布了一个内部的“红色警报”。据报道,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)已经召开会议,重新定义公司的人工智能战略,并计划在年内发布 20 种新的人工智能产品,以及要展示出具有聊天界面的搜索功能。

谷歌有自己强大的聊天机器人,名为 LaMDA,但一直踟蹰不前,因为担心如果最终被误用,会造成声誉损失。《纽约时报》援引谷歌公司的一份内部报告和未透露姓名的内部人士的话说:现在,谷歌计划根据 ChatGPT “重新调整”自己的风险偏好。据时报报道,谷歌还在开发一个文本到图像的生成系统,以与 OpenAI 的 DALL-E 和其他公司的产品竞争。

人工智能还是人工智障?

当然,目前还不清楚聊天机器人是否会成为搜索的未来。ChatGPT 经常发明一些“信息”,这是人工智能研究人员称之为“幻觉”的现象。ChatGPT 不能可靠地引用其信息来源,也不容易给出链接。目前的版本还无法访问实时互联网,因此不能提供最新的信息。

一些人,比如马库斯教授认为幻觉和偏见是所有大型语言模型的根本问题,需要对其设计进行彻底的反思。他说:“这些系统预测句子中的单词序列,就像类固醇的自动完成机制,但它们实际上没有机制来跟踪自身所说的真相,甚至没有机制来验证它们所说的是否与自己的训练数据相一致。”

其他人,包括 OpenAI 的投资者霍夫曼和维诺德·科斯拉,预测这些问题将在一年内得到解决。穆拉提的态度更为谨慎。她说:“到目前为止,我们一直在遵循一些研究方向,以解决事实的准确性和解决模型的可靠性等问题。我们还在这些方向上努力。”

事实上,OpenAI 已经发表了关于不同版本的 GPT 的研究,被称为 WebGPT,它有能力通过查询搜索引擎来回答问题,然后总结自己发现的信息,包括相关来源的脚注。

然而,WebGPT 并不完美:它倾向于接受用户问题时附带的前提,并寻找将之确认的信息,即使用户给出的前提是错误的它仍会如此。例如,当被问及愿望是否能使事情发生时,WebGPT 回答说:“你可以通过思想的力量使愿望成真,这是真的。”

在奥特曼罕见地在公开场合对人工智能进行狂想时,他听起来也像个一厢情愿的人。在旧金山的风险投资活动中,当被问及人工智能的最佳案例时,他滔滔不绝地说:“我认为最佳案例是如此之好,以至于难以想象……案例是如此令人难以置信的好,以至于你听起来像一个疯子在谈论它。”然后,他突然回到了建立 OpenAI 的根基上的乌托邦主题:“我认为最坏的情况是:我们所有人都被关进监狱。”