2023年,來自千行百業的企業關注生成式AI、尋找應用場景;2024年,他們中的領先者實踐生成式AI、進行場景實驗;2025年,那些繼續保持領先的企業,將轉向生產階段,走向生成式AI應用的“深水區”,尋求商業價值回報。誰來為這些企業護航,又怎么護航?
能力越大,責任越大,為全球百萬客戶提供安全可靠云服務、連續13年被Gartner評為“全球云計算領導者”的亞馬遜云科技,先承擔了這份“護航”的重任。在2024 re:Invent全球大會上,亞馬遜云科技推出一系列技術發布,以覆蓋基礎設施、模型和應用的全棧聯動創新助力企業應用生成式AI,全面重塑客戶云上創新體驗。
在亞馬遜云科技2024 re:Invent中國行北京站,亞馬遜云科技大中華區產品部總經理陳曉建表示:“今年re:Invent全球大會的一系列重磅發布,我們不僅在云的核心服務層面持續創新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創新相互賦能、協同進化。只有這樣全棧聯動的大規模創新才能真正滿足當今客戶的發展需求,加速前沿技術的價值釋放,助力各行各業重塑未來?!?/p>
(亞馬遜云科技大中華區產品部總經理陳曉建,圖源:亞馬遜云科技)
三大領域技術矩陣,直面未來復雜需求
“2024年我們看到許多客戶從思考階段進入實踐階段,進行了大量場景試驗。但是我覺得2025年肯定會發生一個變化,很多客戶將從原型驗證階段轉化為生產階段,這是必經之路。屆時客戶需求將更加復雜,不僅是選擇模型,還需要各種技術支持?!标悤越ū硎?。
實踐層面,亞馬遜云科技在2024 re:Invent全球大會上的一系列技術發布,聚集生成式AI、數據戰略和云服務三大領域。
整體來看,這些新發布更加側重于產品的實際應用和工具優化,這是對全球用戶積極使用亞馬遜云科技進行生成式AI應用探索和創新的全新反饋。
沙利文大中華區總監李慶表示:“本次更新有兩個方面讓我印象深刻:一是隨著全球企業對生成式AI的深入應用,數據不僅實現跨區域的傳輸與協同,更實現跨地域、跨區域的深度連接;二是亞馬遜云科技進一步優化生成式AI的應用,從數據存儲、治理到管理的全流程提升,旨在簡化AI對數據的使用,同時強化模型功能、增加AI agent管理和應對模型幻覺的功能?!?/p>
技術“高能”的同時,在當天的溝通環節,陳曉建和亞馬遜云科技大中華區數據分析與生成式AI的產品總監崔瑋,還多次提到了獲得的“成本”與使用的“便捷”,這些在具體的創新中都有體現。
生成式AI:基礎設施、模型、應用的全進化
具體而言,在生成式AI領域,亞馬遜云科技全面強化基礎設施、模型和應用三層技術棧能力,幫助企業更輕松、更經濟地將生成式AI應用于實際業務場景。
基礎設施方面,突出能力。推出Amazon SageMaker AI的四項創新,包括新訓練配方、靈活訓練計劃和任務治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應用。幫助客戶更快構建、訓練、部署流行模型,節省數周時間并將成本降低最高40%。
模型方面,豐富選擇。一方面推出Amazon Nova基礎模型矩陣,突出的是對基礎模型成本的大幅降低。包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎模型,以及用于生成高質量圖像的Nova Canvas和生成高質量視頻的Nova Reel。在各自智能類別中,Amazon Nova Micro、Lite和Pro應用成本比Amazon Bedrock中表現最佳的模型至少降低75%,同時也是其中對應類別速度最快的模型。
另一方面,Amazon Bedrock平臺能力全面升級。新接入100多款熱門、新興及專業模型,并推出AI防護、多智能體協作和模型蒸餾等重磅更新,全面優化推理場景的準確性、成本和響應速度。
應用方面,延伸場景。Amazon Q更加深入軟件開發和商業應用場景,Amazon Q Developer增加三款新的智能體,能自動執行單元測試、文檔編制和代碼審查流程,并通過與GitLab深度集成,擴展應用場景;推出轉型功能以加速Windows.NET、VMware和大型機工作負載的遷移和現代化,縮短轉型時間并降低成本。強化了Amazon Q Business和Amazon Q in QuickSight洞察能力,并簡化了復雜工作流程的自動化實現方式。
數據戰略:體驗升級,統一平臺釋放數據價值
數據戰略領域,亞馬遜云科技推出新一代Amazon SageMaker,能夠為客戶提供單一的數據和AI開發環境,用戶可以在其中查找和訪問其組織中的所有數據,為各種常見的數據用例選擇最佳工具,并將數據和AI項目擴展至團隊內不同分工角色以實現協作。
Amazon SageMaker Lakehouse,能夠實現數據湖、數據倉庫、運營數據庫和企業應用程序中數據的統一管理,支持客戶使用熟悉的AI和機器學習工具或Apache Iceberg兼容的查詢引擎進行訪問和處理。
云服務:全棧聯動創新,提供更強大底層支持
云服務領域,亞馬遜云科技在計算、網絡、存儲和數據庫等核心領域持續創新,為各類工作負載提供更強大的底層支持。
計算部分,繼續憑借自研芯片引領算力創新?;贏mazon Trainium2的EC2 Trn2實例正式可用,較當前GPU實例性價比提升30-40%;推出配備64個Trainium2芯片的EC2 Trn2 UltraServers服務器,提供高達83.2 Petaflops浮點算力,計算能力是單一實例的四倍。在大規模訓練方面,Project Rainier集群搭載數十萬個Trainium2芯片,算力超越以往集群5倍以上。采用3納米工藝的下一代Trainium3芯片預計將在2025年末上線,預計將使集群性能提升4倍,并在性能、能效和密度上樹立新標桿。
網絡部分,升級基礎設施。推出第二代UltraCluster網絡架構,支持超過20000個GPU協同工作,帶寬達10Pb/s,延遲低于10ms,將模型訓練時間縮短至少15%。
存儲部分,增強數據處理能力。Amazon S3新增Metadata元數據功能實現自動獲取和實時更新;推出專為Iceberg表優化的S3 Tables存儲類型,將查詢性能提升3倍,事務處理能力提升10倍。
數據庫部分,全新的無服務器分布式SQL數據庫Amazon Aurora DSQL,采用active-active架構并具備自動故障恢復功能,支持應用程序在任意端點進行讀寫。它不僅提供99.999%的多區域可用性,還能實現近乎無限的可擴展性,且無需進行數據庫分片或實例升級。Amazon DynamoDB global tables增加了多區域強一致性支持,進一步增強了其分布式數據庫服務能力。
解決“幻覺”,讓企業無憂推進生成式AI生產應用
除了以上內容,更好地應對模型“幻覺”,更多企業才能沒有顧慮地推進生成式AI的生產應用,因為在眾多的真實場景中,容不得紕漏,生成的內容一旦與現實世界事實或用戶輸入不一致,可能造成難以挽回的損失,像是金融、醫療、法律領域尤其如此。
解決“幻覺”,才能讓企業有信心將生成式AI從原型驗證推向生產應用,也是充分釋放性能的前提。亞馬遜云科技探索了多種不同的技術方案發現自動推理技術(Automatic Reasoning)能夠很有效的解決“幻覺”問題,提升內容生成的安全性與準確定。
例如,可以通過自動推理來證明說在整個Amazon IAM之中設計的權限和策略是不是按照所預想的方式進行的,從而獲得可證明的安全性;推出的Amazon Bedrock 自動化推理檢查的功能,則能夠有效的去預防由于模型幻覺帶來的事實性錯誤。
整體來看,亞馬遜云科技將持續助力各行各業加速創新,突破既有范式,重塑未來。(丁科技網原創,轉載務必注明“來源:丁科技網”)
- QQ:61149512