Svmuuによる報道 智譜(Zhipu AI)は一部の企業顧客向けに、GLM-5.1 高速版 API をリリースしました。このモデルの出力速度は 400 tokens/s に達し、グローバルの大規模言語モデルにおける公式インターフェースのエンドツーエンド速度記録を更新しました。
関係者によると、この高速版は従来のフラッグシップモデルの性能を維持した上で、智譜とTileRTチームが共同開発した高性能推論エンジンによって駆動されています。このエンジンはGPUの実行スケジューリングメカニズムを再構築し、モデルを静的にGPUに常駐するpersistent Engine Kernelとして配置することで、従来の推論におけるカーネル起動やメモリ読み書きのレイテンシを低減します。
マルチGPU環境では、TileRTは8カードNVLトポロジ内の各GPUノードを異なる機能を持つワーカーとして特化させ、アテンション層の計算とカード間通信の効率を向上させます。
現在、この高速版サービスは智譜MaaSプラットフォームの一部の企業顧客に開放されています。今後はFP8推論や超長文脈対応能力の最適化をさらに進め、AIプログラミング、リアルタイムインタラクション、リアルタイム音声などの低レイテンシシナリオ向けにサポートを提供する予定です。
智譜がGLM-5.1高速版APIを発表、出力速度は400 tokens/sに到達
免責事項:本内容は著者個人の見解であり、投資助言ではありません。違反内容を発見した場合クリックして通報
24H人気ランキング
-
バイナンス LRCX、KLACなど7つのU建て永久先物が上場予定
-
Gateの株式専用エリアにて、ADSK(オートデスク)、BKNG(ブッキング・ドット・コム)など8銘柄の永久先物取引が開始されました
-
ALTHEAトークン(ALTH)とその分散型ネットワークについて詳しく知る
-
OKX DEX xStocks トレードコンテスト開催中、賞金総額は300,000 USDC
-
モルガン・スタンレーは、イーサリアムおよびSolanaのETF申請書類を更新し、0.14%の手数料を徴収する方針を示した
-
アジアのレバレッジ型AI投資が過去最高を記録:韓国のSKハイニックスが2倍のロングETFを運用、運用資産総額は130億ドルに達した
-
ある「スマートマネー」が32万ドルを購入 ワールドカップのグループリーグでアルゼンチンがオーストリアに勝利
-
市場ニュース:米国のヴァンス副大統領は、イランとの初の会談を終えた後、まもなくスイスで演説を行う予定だ
-
中国本土のドージコイン取引プラットフォームの現状:規制政策と世界の主流の選択肢
-
イランメディアによると、イランと米国の交渉で5つの重要事項が合意されたという
おすすめ記事





