智谱發佈GLM-5.1高速版API，輸出速度達400 tokens/s

2026/05/22 11:19

投訴舉報

Svmuu訊智譜面向部分企業客戶推出 GLM-5.1 高速版 API，其模型輸出速度達到 400 tokens/s，刷新全球大模型官方介面端到端速度紀錄。
據了解，該高速版在保留原有旗艦模型能力基礎上，由智譜與 TileRT 團隊聯合研發的高性能推理引擎驅動。該引擎透過重構 GPU 運行排程機制，將模型靜態編排為常駐 GPU 的 persistent Engine Kernel，以降低傳統推理中的核心啟動與顯存讀寫延遲。
在多卡場景下，TileRT 進一步將 8 卡 NVL 拓撲中的 GPU 節點特化為不同功能 Worker，以提升注意力層計算與跨卡通訊效率。
目前，該高速版服務已向智譜 MaaS 平台部分企業客戶開放。未來將繼續優化 FP8 推理及超長上下文能力，面向 AI 程式設計、即時互動與即時語音等低延遲場景提供支援。

免責聲明：本內容僅代表作者個人觀點，不構成任何投資理財建議。如有發現違規內容點擊舉報

上一篇：Robinhood上線AERO、QNT及ZRO | Here is the translated content in Traditional Chinese (zh-tw), adhering to the strict rules provided: 本周礦業數據要聞精選：川普家族比特幣礦企 American Bitcoin 持倉突破 7500 枚 BTC：下一篇

24小時熱榜

熱門話題

#SCRT #比特現金 #艾達幣 #狗狗幣 #波場 #USD Coin #幣安幣 #泰達幣 #RON #SNT #ELF #ICX #MASK #PEOPLE #USDP(PAX) #Wrapped Bitcoin

svmuu(水木財經)專注於區塊鏈產業動態、加密貨幣前沿資訊，同時涵蓋港股、美股及外匯市場的即時行情與深度分析。在這裡，您不僅能取得專業的7×24小時新聞速遞、精準的行情數據，還能體驗實用的投資工具，幫助您掌握數位資產與傳統金融市場的雙重機會。無論您是區塊鏈愛好者，還是港股、美股及外匯投資者，都將為您提供高效、快速的資訊服務，賦能您的投資決策。

更快的區塊鏈好幫手！

智谱發佈GLM-5.1高速版API，輸出速度達400 tokens/s

24小時熱榜

伊朗外交部：伊美達成協議文件

幣安將上線LRCX、KLAC等7個U本位永續合約

Gate合約股票專區上線ADSK（歐特克）、BKNG（繽客控股）等8個永續合約交易

深入瞭解ALTHEA代幣（ALTH）及其去中心化網絡

Morgan Stanley更新以太坊和Solana ETF文件，擬收取0.14%費用

10倍做多原油後浮虧133萬美元，某地址持有價值3777萬美元CL多單

OKX DEX xStocks交易賽進行中，總獎池300,000 USDC

亞洲槓桿AI押注創紀錄：韓國SK海力士2倍做多ETF資產管理規模達130億美元

某聰明錢購入32萬美元世界盃小組賽阿根廷戰勝奧地利

中國大陸狗狗幣交易平台現狀：監管政策與全球主流選擇

推薦閱讀

熱門話題