算力競賽新拐點

近兩天國際 AI 圈的焦點不只在模型更強,而是誰能更快、更穩、更省地把算力變成生產力。從用量上限調整、資料中心合作,到自動化演算法優化,企業部署策略正在改寫。

Claude 用量放寬與新算力合作

有供應商宣布把部分方案的程式助理用量上限拉高,並取消尖峰時段的額度折減,讓團隊在趕專案時更少被「限流」打斷。對香港中小企而言,這類改動直接影響工時與交付節奏。

同時,該公司也宣布與大型資料中心合作,短期內引入大量新 GPU 容量,目標是改善訂閱用戶的可用性與回應速度。這反映生成式 AI 的瓶頸已從功能,轉向供電、散熱與供應鏈。

AlphaEvolve 把「找更好演算法」自動化

另一邊,有研究團隊展示以模型驅動的程式代理,透過迭代搜尋與評估,替不同領域找出更優的演算法與系統設定。它不只做出漂亮的 demo,而是把優化成果帶到基因分析、電網與雲端基礎設施等場景。

對商業端更有感的是,這類工具可在既有模型不變的情況下提升訓練或推理效率,甚至改善路由、供應鏈與廣告模型準確度。企業可把它視為「AI 做 AI 工程」的一步,把成本壓力轉成競爭優勢。

算力成本成為企業採用的共同底層

還有大型模型公司高層公開談到,今年在運算上的支出可能達到數百億美元等級。當龍頭都要用巨額預算換速度與規模,中小企業更需要用好配額、挑對模型與架構,避免把 AI 變成不可控的雲端帳單。

接下來一季,值得關注的是:供應商是否持續提高用量與穩定性、是否推出更精細的企業治理與成本監控工具,以及能否把演算法優化能力下放到一般開發團隊。

總結而言,AI 的下一段競賽不只看誰的模型指標更高,而是誰能把算力與效率做成可預測的營運能力。學會用工具管理配額、監控成本、並把優化流程制度化,會是 2026 年最實際的 AI 內功。