亚马逊CEO发布致股东信:仍然致力于削减成本和专注人工智能

时间: 2024-04-12 14:31:43

  鞭牛士报道,4月11日消息,据外电报道,亚马逊首席执行官安迪·贾西(Andy Jassy)周四发表了他的年度股东信,他在信中承诺,即使公司加倍投资人工智能等新增长领域,也会寻找控制成本的方法。

  「我认为亚马逊的每个人都相信,在我们竭尽全力如何让客户的生活变得更好、更轻松之前,我们的每一项业务还有非常长的路要走,而且每项业务都有相当大的上升空间。」贾西在前任首席执行官杰夫·贝佐斯(Jeff Bezos)于2021 年中期辞职后接掌亚马逊以来的第三封股东信中写道。

  在贾西的领导下,亚马逊已经变得更精简,销售放缓和充满挑战的经济迫使该公司放弃了贝佐斯时代的无情增长。从2022年底开始一直持续到2023年,亚马逊启动了其历史上最大规模的裁员计划,裁员超过27,000人。

  今年,这些裁员仍在继续,亚马逊宣布裁员云计算、Prime Video 和 Twitch 直播部门等。

  贾西表示,即使在某些领域处于紧缩时期,他仍专注于在企业内部寻找新的增长领域,以便亚马逊保持长期的弹性。他强调了建立“原始服务”的重要性,他将其描述为能刺激新项目和业务的离散的基础构建块。

  Jassy 以其云计算部门 Amazon Web Services 为例。在成为亚马逊首席执行官之前,贾西负责创建了 AWS,该服务从一个为其零售业务提供支持的内部工具发展成为占主导地位的云服务和亚马逊最赚钱的业务之一。

  他说,他相信生成人工智能正在成为亚马逊的下一个大型原始服务,或支柱,这是该公司经常用来描述其最成功业务的内部短语。

  「虽然我们自己构建了大量 GenAI 应用程序,但绝大多数最终将由其他公司构建。」Jassy 说。 「然而,我们在 AWS 中构建的不单单是一个引人注目的应用程序或基础模型。」

  他指出,亚马逊的云计算服务将成为AI热潮中的重要参与者,并表示:我们乐观地认为,这种改变世界的人工智能大部分将建立在 AWS 之上。

  亚马逊周四将著名人工智能先驱吴恩达 (Andrew Ng) 纳入其董事会,吴恩达曾领导谷歌大脑,曾任百度科学家。

  去年,随着AI领域的爆炸式增长,亚马逊发布了一系列公告,导致科技公司向该领域投入巨资。上个月,亚马逊增持了 27.5 亿美元人工智能初创公司 Anthropic 的股份,这是其迄今为止最大的风险投资。贾西还承诺将AI注入亚马逊的每一项业务。

  该公司于二月份推出了一款名为 Rufus 的工具,利用人工智能帮助用户搜索和购买产品。在另外的地方,它还推出了 Q, 一种为公司协助完成日常任务的人工智能聊天机器人,以及 为亚马逊网络服务客户提供的生成式人工智能服务Bedrock 。

  去年的这样一个时间段,我分享了我对亚马逊未来的热情和乐观。今天,我还有更多。原因有很多,但首先是我们在财务业绩和客户体验方面取得的进步,然后延伸到我们的持续创新和我们面前的非凡机遇。

  此外,亚马逊的营业收入和自由现金流(“FCF”)也大幅改善。 2023 年营业收入同比增长 201%,从 $12.2B(营业利润率为 2.4%)增至 $36.9B(营业利润率为 6.4%)。设备融资租赁调整后的十二个月自由现金流从 2022 年的 -$12.8B 提高到 $35.5B(上涨 $48.3B)。

  虽然我们在财务指标上取得了有意义的进展,但最令我们高兴的是我们各业务部门的客户体验持续改善。

  在我们的商店业务中,客户对我们对选择、价格和便利性的不懈关注做出了热情的回应。我们继续拥有最广泛的零售选择,有数亿种产品可供选择,仅去年一年就增加了数千万种产品,并且一些优质品牌开始在亚马逊上上市(例如 Coach、Victorias Secret、Pit Viper、Martha Stewart、Clinique、Lancôme和城市衰败)。

  对价格保持敏锐始终很重要,尤其是在经济不确定的情况下,客户对自己的支出非常谨慎。因此,我们在 2023 年第四季度以 Prime Big Deal Days 拉开了节日季的序幕,这是一项专为 Prime 会员提供的独家活动,旨在让您尽早开始假日购物。随后,我们延长了黑色星期五和网络星期一假日购物活动,向全部客户开放,这是我们有史以来最大的收入活动。 2023 年全年,客户在数百万笔交易和优惠券中节省了近 24B 美元,比上一年增加了近 70%。

  我们还逐步的提升交货速度,打破了多项公司记录。 2023 年,亚马逊以有史以来最快的速度向 Prime 会员配送,超过 70 亿件商品当天或次日送达,其中美国超过 40 亿件,欧洲超过 20 亿件。在美国,这个结果是两件事的结合。一是区域化的好处,我们重新构建了网络,以便将商品存储在离客户更近的地方。另一个是当日送达设施的扩张,到2023年,我们将当日送达或隔夜送达的物品数量同比增加了近70%。由于我们如此快速地向客户提供商品,客户更频繁地选择亚马逊来满足他们的购物需求,我们大家可以看到各个领域的成果,包括我们的日常必需品业务的上涨的速度(2023 年第四季度同比增长超过 20%)。

  我们的区域化努力还缩短了运输距离,有助于降低我们的服务成本。 2023 年,我们自 2018 年以来首次降低了全球单位服务成本。仅在美国,每单位服务成本就同比下降了 0.45 美元以上。服务成本的降低使我们既可以投资于速度的提高,又可以以较低的平均售价(“ASP”)增加更多的选择。更多的选择和更低的价格让我们考虑更多的购买。

  展望 2024 年(及以后),我们还没有完成降低服务成本的工作。我们挑战了我们履行网络中的每一个坚定信念,并重新评估了它的每个部分,并发现了我们始终相信能更加进一步降低成本的几个领域,同时也可以更快地为客户提供服务。我们的入库履行架构和由此产生的库存布局是 2024 年的重点领域,我们乐观地认为我们还有更多的上升空间。

  在国际上,我们喜欢我们成熟国家的发展轨迹,并看见我们的新兴地区(例如印度、巴西、澳大利亚、墨西哥、中东、非洲等)取得了有意义的进展,因为它们逐步扩大选择和功能,并走向盈利。 (2023 年第四季度,墨西哥是我们最新实现盈利的国际商店所在地)。我们坚信,从长远来看,这些新地区将继续增长并盈利。

  除了我们的品牌旗舰店业务外,亚马逊的广告业务增长依然强劲,同比增长 24%,从 2022 年的 38B 美元增长到 2023 年的 47B 美元,这主要是由我们的搜索广告推动的。我们在此产品中添加了赞助电视,这是一种自助解决方案,可供品牌创建可在多达 30 多个流媒体电视服务(包括 Amazon Freevee 和 Twitch)上展示的广告活动,并且没有最低支出。最近,我们通过在 Prime Video 节目和电影中引入广告来扩展我们的流媒体电视广告,品牌能够最终靠我们最受欢迎的娱乐产品(包括热门电影和节目、屡获殊荣的 Amazon MGM Originals 和现场直播体育赛事,如周四橄榄球之夜。流媒体电视广告增长迅速,并且开局良好。

  转向 AWS,我们从 2023 年开始看到成本大幅优化,大多数公司都试图在不确定的经济中省钱。这种优化很大程度上是由 AWS 推动的,帮助客户更有效地使用云并利用更强大、性价比更高的 AWS 功能,例如 Graviton 芯片(我们的通用 CPU 芯片,比其他领先的 x86 处理器提供约 40% 的性价比)、S3智能分层(一种存储类,用AI来检测访问频率较低的对象并将其存储在较便宜的存储层中)和储蓄计划(为客户提供更低的价格以换取更长的承诺)。这项工作减少了短期收入,但对客户来说是最好的,备受赞赏,并且对客户和 AWS 的长期发展来说应该是个好兆头。到 2023 年底,我们正真看到成本优化减弱、新交易加速、客户在更长时间内以更大的承诺续约,以及迁移再次增长。

  过去的一年对于AWS来说也是重要的交付年。我们推出了下一代通用 CPU 芯片 (Graviton4),与已经领先的前代产品 (Graviton3) 相比,它的计算性能提高了 30%,内存带宽提高了 75%。我们还发布了 AWS Trainium2 芯片,该芯片将为生成式 AI 应用程序提供速度高达四倍的机器学习训练速度,并且内存容量比 Trainium1 高出三倍。我们继续扩大 AWS 基础设施覆盖范围,目前在全球 33 个地理区域内提供 105 个可用区,并且还将新增 6 个区域(马来西亚、墨西哥、新西兰、沙特阿拉伯王国、泰国和位于柏林的第二个德国区域)。在生成式 AI(“GenAI”)中,我们向 Amazon SageMaker 添加了数十种功能,以便开发人员更轻松地构建新的基础模型(“FM”)。我们发明并提供了一项新服务 (Amazon Bedrock),让企业能利用现有的 FM 来构建 GenAI 应用程序。而且,我们在 Amazon Q 中推出了功能最强大的编码助手。客户对这些功能感到兴奋,并且我们正真看到我们的 GenAI 产品具有巨大的吸引力。 (更多关于我们如何接近 GenAI 以及为什么我们始终相信我们会在信中取得成功。)

  我们在许多新的业务投资方面也取得了进展,这些投资有可能对客户和亚马逊的长期发展产生重要影响。触及其中两个:

  我们越来越相信Prime Video本身就能成为一项庞大且盈利的业务。这种信心受到以下因素的支撑:引人入胜的独家内容(例如《星期四橄榄球之夜》、《指环王》、《热探者》、《男孩们》、《城堡》、《Road House》等)的持续开发、Prime Video 客户对此内容的参与度、我们的增长市场计划(通过我们的第三方渠道计划,以及客户租用或购买的各种节目和电影),以及在 Prime Video 中添加广告。

  十月,我们在柯伊伯项目商业化之旅中实现了一个重要里程碑,当时我们向太空发射了两颗端到端原型卫星,并成功验证了所有关键系统和子系统——这在首次发射中是罕见的。 Kuiper 是我们的低地球轨道卫星计划,旨在为目前没有宽带连接的 400-5 亿家庭(以及在更偏远地区寻求更好的连接和性能的政府和企业)提供宽带连接,并且是一个非常亚马逊的巨大收入机会。我们有望在 2024 年发射第一颗生产卫星。我们还有非常长的路要走,但我们的进展令人鼓舞。

  总体而言,2023 年是强劲的一年,我感谢代表客户交付成果的集体团队。这些结果代表了亚马逊的大量发明、协作、纪律、执行和重新想象。然而,我认为亚马逊的每个人都相信,在我们竭尽全力如何让客户的生活变得更好、更轻松之前,我们的每一项业务还有非常长的路要走,而且每项业务都有相当大的优势。我们正在投资的企业。

  在过去三年的年度信中,我试图让股东更深入地了解我们怎么样看待公司、我们正在追求的业务、我们未来的机会以及我们的动力。我们在多个细分市场开展业务,但将亚马逊联系在一起的是我们的共同使命,即让客户每天的生活变得更美好、更轻松。我们服务的每个客户群(消费者、卖家、品牌、开发商、企业和创作者)都是如此。在我们最好的情况下,我们不仅以客户为中心,而且富有创造力,多年思考,疯狂学习,斗志旺盛,快速交付,并像世界上最大的初创企业一样运营。

  我们花费大量精力思考怎么样为企业内部和外部的建设者提供支持。我们将建设者描述为喜欢发明的人。他们喜欢剖析客户体验,评估其中的问题,然后重新设计。在客户体验完美之前,建筑商往往不会满意。这并不妨碍他们一路上进行改进,但会驱使他们不断修补和迭代。虽然他们不惧怕从头开始发明,但他们会毫不犹豫地使用其他公司的高质量、可扩展、经济高效的组件。对于构建者来说,重要的是拥有合适的工具来不断快速改善客户体验。

  我们知道怎么做到这一点的最好方法是构建原始服务。将它们视为离散的基础构建块,构建者可根据他们想要的任何组合将它们编织在一起。以下是我们在 2003 年 AWS Vision 文档中描述原语的方式:

  “原语是软件研发人员的原始部分或最基本的构建块。它们是不可分割的(如果它们在功能上可以分成两部分,那么它们就必须如此)并且它们在一件事上做得很好。它们应该一起使用,而不是单独作为解决方案。而且,我们将构建它们以实现最大的研发人员灵活性。我们不会对原语施加大量限制,以防止研发人员伤害自己。相反,我们将针对研发人员的自由和创新来优化。”

  当然,这种原语概念不但可以应用于软件开发,而且与技术尤其相关。而且,在过去 20 年里,原语一直是我们快速创新的核心。

  以原语思维的众多优势之一是速度。让我举两个反例来说明这一点。首先,我们早年在亚马逊建立了成功的自有库存零售业务,我们从出版商、制造商和分销商那里购买全部的产品,将它们存储在我们的仓库中,然后自己发货。跟着时间的推移,我们意识到,通过允许第三方卖家在我们高流量的搜索和产品详情信息页面上将他们的产品列在我们自己的产品旁边,我们大家可以增加更广泛的选择和更低的价格。我们构建了几个核心零售服务(例如支付、搜索、订购、浏览、商品管理),这使得尝试不同的市场概念比我们没这些组件更简单。一组好的原语?并不真地。

  事实证明,这些核心组件过于混乱,而且没有正确划分。 2000 年代初,当我们在业务中与 Target 等公司合作时,我们经历了惨痛的教训。这个概念是, 将使用亚马逊的电子商务组件作为其网站的支柱,然后根据他们的意愿进行定制。为实现这种安排,我们一定要通过应用程序编程接口(“API”)将这些组件作为可分离的功能提供。这种解耦比预期要困难得多,因为随着亚马逊在最初几年的加快速度进行发展,我们在这些服务之间建立了如此多的依赖关系。

  我们用来操作的一个重量级机制(称为“NPI”)进一步强调了这种耦合。任何的需要多个内部团队开展工作的新举措都必须由 NPI 小组进行审核检查,每个团队将传达他们的工作要多少人周的时间。这个瓶颈限制了我们所取得的成就,让我们感到沮丧,并激励我们通过将这些电子商务组件重构为真正的原始服务来根除它,这些服务具有记录齐全、稳定的 API,使我们的构建者能够在没有一点协调税的情况下使用彼此的服务。

  在 Target 和 NPI 挑战期间,我们正在考虑构建一套新的基础设施技术服务,这将使亚马逊能够更快地行动,并使外部研发人员可构建他们想象的任何东西。这套服务后来被称为 AWS,上述经验使我们始终相信,我们该构建一套原始服务,可根据任何人认为合适的方式组合在一起。当时,大多数技术产品的功能都很丰富,并试图同时解决多项工作。结果,他们往往没有哪一项工作做得那么好。

  我们的 AWS 原始服务从一开始就设计得与众不同。它们提供了重要的、高度灵活但集中的功能。例如,我们的第一个主要原语是 2006 年 3 月推出的 Amazon Simple Storage Service(“S3”),旨在提供高度安全的对象存储、非常高的耐用性和可用性、互联网规模和非常低的成本。换句话说,在对象存储方面表现出色。当我们推出 S3 时,研发人员很兴奋,但也有些困惑。这是一个很有用的原始服务,但他们想知道,为什么只是对象存储?当我们于 2006 年 8 月推出 Amazon Elastic Compute Cloud (“EC2”) 和 2007 年推出 Amazon SimpleDB 时,大家意识到我们正在构建一套原始基础设施服务,使他们可以更快、更经济高效地构建他们能够想象的任何东西。 ,并且无需为数据中心或硬件预先管理或布局资本。随着 AWS 跟着时间的推移推出这些构建模块(我们现在有超过 240 个构建模块可供构建者使用,这比任何其他提供商都多),整个公司在 AWS 上迅速崛起(例如 Airbnb、Dropbox、Instagram、Pinterest、Stripe 等)。 ),各行业在 AWS 上进行了自我改造(例如,通过 Netflix、Disney+、Hulu、Max、Fox、Paramount 进行流媒体播放),甚至重要的政府机构也转向了 AWS(例如 CIA 以及其他几个美国情报机构)。但是,鲜为人知的受益者之一是亚马逊自己的消费者业务,该业务通过利用AWS 让他们构建的速度。基元如果做得好,可以迅速提高构建者的创新能力。

  追求原语并不能够确保成功。您可以构建很多东西,更不可思议的是更多的方式来组合它们。但是,一个好的指南针是选择您想要解决的真正的客户问题。

  我们的物流原语是一个有启发性的例子。在亚马逊成立之初,我们围绕仓储商品建立了核心能力,然后快速可靠地挑选、包装并将其运送给客户。当我们将第三方卖家添加到我们的市场时,他们经常要求可使用这些相同的物流能力。因我们已经构建了这套初始物流原语,所以我们能够在 2006 年引入亚马逊配送 (“FBA”),允许卖家使用亚马逊的配送网络来存储商品,然后让我们挑选、包装和运输它们向客户提供这些产品的好处是可以快速、优质地交付。这项服务为卖家节省了大量时间和金钱(通常比自己做便宜 70% 左右),并且仍然是我们最受欢迎的服务之一。随着越来越多的商家开始运营自己的直接面向消费者(“DTC”)网站,许多商家渴望继续使用我们的履行能力,同时访问我们的支付和身份原语,以推动他们自己网站上更高的订单转化(作为 Prime 会员)已与亚马逊共享此付款和身份信息)。几年前,我们推出了 Buy with Prime 来满足这一客户需求。 Prime 会员可以像在亚马逊上一样在 DTC 网站上快速结帐,并在使用 Prime 商品购买时获得快速的 Prime 送货速度,与默认体验相比,商家的订单转化率提高了约 25%。

  随着我们的商店业务大幅增长,我们的供应链变得更加复杂,我们必须开发大量功能,以便以低廉的价格和非常快的交货时间为客户提供无与伦比的选择。我们已擅长将产品从其他国家运往美国、清关,然后运送到存储设施。由于我们的运输履行中心没有足够的空间来存储维持我们所需的库存水平所需的所有库存,因此我们建立了一组成本较低的上游仓库,专门针对存储进行了优化(没有复杂的终端-用户、提货、包装和运输功能)。拥有这两个库存池促使我们构建算法来预测我们的运输履行中心的库存何时用完,并从这些上游仓库自动补充。而且,在过去几年中,我们的规模和可用的替代方案迫使我们建立自己的最后一英里交付能力(大致相当于 UPS 的规模),以经济实惠的方式为想要使用亚马逊的消费者和卖家提供服务。

  我们通过构建额外的履行原语来解决这些客户需求,这些原语既可以更好地为亚马逊消费者服务,又可以解决外部卖家日益复杂的电子商务活动。例如,对于需要进口产品帮助的卖家,我们提供“全球里程”服务,充分利用我们的专业知识。为了将库存从边境(或国内任何地方)运送到我们的存储设施,我们允许卖家使用我们的第一方亚马逊货运服务或通过我们的合作承运人计划使用第三方货运合作伙伴。为了以更低的成本存储更多库存,以确保更高的库存率和更短的交货时间,我们向卖家开放了上游亚马逊仓储和配送设施(以及在需要时向我们的运输履行中心自动补货)。对于那些想要管理自己的运输的人,我们已经开始允许客户使用我们的最后一英里交付网络,通过称为亚马逊运输的服务将包裹交付给最终客户。而且,对于希望使用我们的配送网络作为存储库存并将商品运送给客户(无论他们在哪里订购)的中心位置的卖家,我们提供多渠道配送服务。这些都是我们向卖家提供的原始信息。

  构建基元有意义地扩展了您的自由度。您可以保留您的原语,并在其基础上构建引人注目的特性和功能,让您的客户和企业从快速创新中获益。您可以向外部客户提供原语作为付费服务(就像我们对 AWS 和最新的物流产品所做的那样)。或者,您可以将这些原语组合成外部付费应用程序,就像我们使用 FBA、Buy with Prime 或 Amazon Supply Chain(最近发布的物流服务,集成了我们的多个物流原语)一样。但是,你还有选择。您仅受您构建的基元和想象力的限制。

  以我们门店业务中新的当日配送设施为例。它们位于美国最大的都市区(我们目前有 58 个),容纳了我们销量最高的 100,000 个 SKU(但也涵盖了数百万个其他 SKU,这些 SKU 可以从附近的履行中心注入到这些当日达设施中),并将从挑选客户订单到准备发货所需的时间缩短至 11 分钟。这些设施也构成了我们在网络中提供服务的最低成本。这种体验对客户来说非常积极,因此我们计划将这些设施的数量增加一倍。

  但是,如果我们将这种功能视为核心构建块,我们还能如何使用它呢?我们在有机杂货(与全食超市)和不易腐烂的商品(例如消费品、罐头食品、健康和美容产品等)方面拥有非常庞大且不断增长的杂货业务。我们一直在努力打造大规模实体店产品(亚马逊生鲜),以提供出色的易腐烂体验;但是,如果我们使用当日送达设施,使客户能够轻松地将牛奶、鸡蛋或其他易腐烂的物品添加到任何亚马逊订单中并获得当日送达,结果又会怎样呢?它可能会改变人们对每周一次的杂货购物的看法,并使易腐烂的购物变得像不易腐烂的购物一样方便。

  或者,以一项有人质疑的服务为例,但它正在取得实质性进展,我们认为这是一项非常有价值的未来原始能力——我们的送货无人机(称为 Prime Air)。无人机最终将使我们也可以在一小时内将包裹交付给客户。它不会一开始就适用于所有尺寸的包裹和所有地点,但我们相信随着时间的推移它会变得普遍。想一想一小时内送达会如何改变订购易腐烂物品的体验?

  亚马逊药房也是如此。需要润喉糖、Advil、抗生素或其他药物吗?当日设施已经在数小时内送达许多此类物品,而且随着我们更广泛地推出 Prime Air,这一时间只会变得更短。高度灵活的构建块可以跨企业和以新的组合方式组成,从而改变客户的可能性。

  有意识地构建基元需要耐心。在我们揭示这些构建块如何组合在一起之前,发布前几个原始服务有时会让客户(或广大公众)感到随意。我以 AWS 和 S3 为例,但我们的健康产品是另一个例子。在过去的 10 年里,我们在不同的团队中尝试了多项健康实验,但它们并不是由我们的原始方法驱动的。 2022 年,当我们将原始思维应用于巨大的全球医疗保健问题和机遇时,这种情况发生了变化。我们现在创建了几个重要的构建模块来帮助转变客户的健康体验:急性护理(通过 Amazon Clinic)、初级护理(通过 One Medical)以及用于购买患者可能需要的任何药物的药房服务。由于我们不断取得成功,亚马逊客户现在要求我们帮助他们获得各种健康和营养机会,这些机会可以通过我们现有的一些杂货构建模块(包括 Whole Foods Market 或 Amazon Fresh)来部分解锁。

  作为一名构建者,很难等待这些构建块被构建出来,而不是仅仅将一堆组件组合在一起来解决特定问题。后者可能会更快,但几乎总是会在未来减慢你的速度。我们在履行网络的机器人技术工作中看到了这种诱惑。我们寻求实现数十个流程的自动化,以提高安全性、生产率和成本。一些最大的机会需要在存储自动化、操纵、分类、大型笼子的长距离移动性以及物品的自动识别等领域进行发明。许多团队会直接跳到复杂的解决方案,将这些规则“恰到好处”地融入其中,以使协调一致的解决方案发挥作用,但这并不能解决更多问题,也不能随着新需求的出现而轻易地发展,而这可以不能重复用于需要许多相同组件的其他计划。然而,当您像我们的机器人团队那样思考原语时,您会优先考虑构建块,选择可以从每个原语中受益的重要举措,但构建工具箱以更自由(快速)地为未来和复杂的情况进行组合需要。我们的机器人团队在上述每个领域都构建了原语,这些原语将成为我们下一组自动化的关键,其中包括多层存储、拖车装卸、大型托盘移动性以及跨出库流程的更灵活的分拣(包括在汽车)。该团队还在构建一套基础人工智能模型,以更好地识别复杂环境中的产品,优化我们不断增长的机器人车队的运动,并更好地管理我们设施中的瓶颈。

  有时,人们问我们“你的下一个支柱是什么?您拥有 Marketplace、Prime 和 AWS,下一步是什么?”这当然是一个发人深省的问题。然而,人们从来没有问过,而且可能更有趣的一个问题是,您正在构建的下一组能够实现突破性客户体验的原语是什么?如果你今天问我,我会以生成式人工智能(“GenAI”)为主导。

  早期公众的大部分注意力都集中在 GenAI应用程序上,尤其是 2022 年 ChatGPT 的推出。但是,按照我们的“原始”思维方式,GenAI 堆栈中有三个不同的层,每个层都很庞大,而且我们都在深入投资。

  底层适用于想要构建基础模型(“FM”)的开发人员和公司。主要原语是训练模型和生成推理(或预测)所需的计算,以及使构建这些模型变得更容易的软件。从计算开始,关键是里面的芯片。迄今为止,几乎所有领先的 FM 都接受了 Nvidia 芯片的培训,并且我们将继续提供所有提供商中最广泛的 Nvidia 实例集合。也就是说,随着客户扩展其模型和应用程序,供应一直稀缺,成本仍然是一个问题。客户要求我们突破 AI 芯片性价比的极限,就像我们对通用 CPU 芯片的 Graviton 所做的那样。因此,我们构建了定制的人工智能训练芯片(名为 Trainium)和推理芯片(名为 Inferentia)。 2023 年,我们发布了 Trainium 和 Inferentia 芯片的第二版,它们都比第一版和其他替代品更具性价比。去年秋天,领先的 FM 制造商 Anthropic 宣布将使用 Trainium 和 Inferentia 来构建、训练和部署其未来的 FM。我们已经有多家客户在使用我们的人工智能芯片,包括 Anthropic、Airbnb、Hugging Face、Qualtrics、Ricoh 和 Snap。

  构建自己的 FM 的客户必须解决将模型投入生产的几个挑战。组织和微调数据、构建可扩展且高效的培训基础设施,然后以低延迟、经济高效的方式大规模部署模型是很困难的。这就是为什么我们构建了 Amazon SageMaker,这是一项托管的端到端服务,它改变了开发人员为 AI 准备数据、管理实验、更快地训练模型的游戏规则(例如,Perplexity AI 在 SageMaker 中训练模型的速度提高了 40%) 、降低推理延迟(例如 Workday 使用 SageMaker 将推理延迟减少了 80%),以及提高开发人员生产力(例如 NatWest 使用 SageMaker 将 AI 的价值实现时间从 12-18 个月缩短到不到 7 个月)。

  中间层适用于寻求利用现有 FM、使用自己的数据对其进行自定义以及利用领先云提供商的安全性和功能来构建 GenAI 应用程序的客户 - 全部作为托管服务。 Amazon Bedrock 发明了这一层,并为客户提供了构建和扩展 GenAI 应用程序的最简单方法,提供最广泛的第一方和第三方 FM 选择,以及领先的易用性功能,使 GenAI 构建者能够获得更高质量的模型输出更快。仅仅几个月后,Bedrock 就取得了良好的开端,拥有数万名活跃客户。该团队继续在 Bedrock 上快速迭代,最近提供了Guardrails(以保护应用程序将回答哪些问题)、知识库(通过检索增强生成(或 RAG)和实时查询来扩展模型的知识库)、代理(以完成多步骤任务)和微调(保持教学和细化模型),所有这些都提高了客户的应用程序质量。我们还刚刚添加了来自 Anthropic(他们新发布的 Claude 3 是世界上性能最好的大型语言模型)、Meta(与 Llama 2)、Mistral、Stability AI、Cohere 和我们自己的 Amazon Titan FM 系列的新模型。客户在 GenAI 的早期阶段了解到,要以所需的成本和延迟构建具有必要企业质量的生产 GenAI 应用程序,需要进行有意义的迭代。客户不只想要一种型号。他们希望获得适用于不同类型应用的各种模型和模型尺寸。客户想要一种使实验和迭代变得简单的服务,而这正是 Bedrock 所做的,这也是客户对此如此兴奋的原因。使用 Bedrock 的客户包括 ADP、Amdocs、Bridgewater Associates、Broadridge、科莱恩、Dana-Farber 癌症研究所、达美航空、Druva、Genesys、Genomics England、GoDaddy、Intuit、KT、Lonely Planet、LexisNexis、Netsmart、Perplexity AI、辉瑞、美巡赛、理光、火箭公司和西门子。

  该堆栈的顶层是应用程序层。我们正在为亚马逊的每个消费者业务构建大量 GenAI 应用程序。这些范围从 Rufus(我们新的人工智能购物助手)到更智能、更强大的 Alexa,再到广告功能(通过自然语言提示轻松生成、定制和编辑高质量图像、广告文案、和视频)、客户和卖家服务生产力应用程序以及其他数十个应用程序。我们还在 AWS 中构建了多个应用程序,其中包括可以说是最引人注目的早期 GenAI 用例 - 编码伴侣。我们最近推出了 Amazon Q,它是 AWS 上的专家,可以编写、调试、测试和实施代码,同时还可以进行转换(例如从旧版本的 Java 迁移到新版本)以及查询客户的各种数据存储库(例如内联网) 、wiki、Salesforce、Amazon S3、ServiceNow、Slack、Atlassian 等)来回答问题、总结数据、进行连贯的对话并采取行动。 Q 是当今最有能力的工作助手,并且发展迅速。

  虽然我们自己构建了大量 GenAI 应用程序,但绝大多数最终将由其他公司构建。然而,我们在 AWS 中构建的不仅仅是一个引人注目的应用程序或基础模型。这些 AWS 服务位于堆栈的所有三层,由一组原语组成,这些原语使人工智能的下一个开创性阶段民主化,并将使内部和外部构建者能够改变我们所知道的几乎所有客户体验(并发明全新的体验) )。我们乐观地认为,这种改变世界的人工智能大部分将构建在 AWS 之上。

  (顺便说一句,不要低估 GenAI 中安全性的重要性。客户的 AI 模型包含一些他们最敏感的数据。AWS 及其合作伙伴提供世界上最强大的安全功能和跟踪记录;因此,更多并且慢慢的变多的客户希望在 AWS 上运行他们的 GenAI。)

  最近,有人问我一个颇具挑战性的问题——亚马逊如何保持弹性?虽然措辞简单,但意义深远,因为它涉及我们迄今为止以及未来成功的核心。答案在于我们围绕根深蒂固原则的纪律: 1/ 雇用有动力不断改进和扩展可能性的构建者; 2/解决真正的客户挑战,而不是我们认为可能有趣的技术; 3/构建基元,以便我们能够以最高的速度进行创新和实验; 4/不要浪费时间尝试对抗重力(剧透警告:你总是会输)——当我们发现能够带来更好客户体验的技术时,我们会拥抱它; 5/接受失败的实验并从中学习——实际上变得更有动力再次尝试,并运用新知识。

  今天,我们继续在前所未有的变革时代开展业务,我们所从事的业务领域也面临着非同寻常的增长机遇。例如,虽然我们拥有近 500B 美元的消费者业务,但全球零售市场的约 80% 仍然位于实体店。同样,云计算业务的收入运行率接近 100B 美元,全球超过 85% 的 IT 支出仍然在本地。这些业务将不断转向线上和云端。在媒体和广告领域,内容将继续从线性格式迁移到流媒体格式。在全球范围内,数亿只有少数宽带接入的人将在未来几年内获得这种连接。最后但并非最不重要的一点是,生成式人工智能可能是自云(云本身仍处于早期阶段)以来,甚至自互联网以来最大的技术变革。与本地基础设施向云的大规模现代化(需要迁移工作)不同,这场 GenAI 革命将从一开始就建立在云之上。可能的解决方案所带来的社会和商业利益将令我们所有人感到震惊。

  在亚马逊的历史上,我们从未感到有如此多的机会让客户的生活变得更好、更轻松。我们对一切可能性感到无比兴奋,专注于创造未来,并期待共同努力实现这一目标。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  拜登承诺将用核武器保护日本!专家:美国的战略带有危险性!日本民众:这是走向战争不归路......

  种菜、养鸡鸭鹅、废品回收站……杭州一“高档小区”居民吐槽“实在太差了”,怎么回事?

  最强女海王!河南已婚女子同时交13名男友,颜值照曝光,网友:确实长得美……

  索尼推出 ULT Power 1/7/10 三款蓝牙音箱,130 美元起

  消息称 HMD Global 月内发布自有品牌机型,未来“将推旗舰手机”

  荣耀畅玩 50 手机开启预售:天玑 6100+ 处理器,1199 元起