開源長上下文新動向

這兩天的 AI 產業焦點,一邊是更長上下文、更便宜的模型選項,另一邊則是合規時間表仍在變動。對香港團隊而言,模型選型與治理要同步推進。

長上下文開源模型再加速

有廠商把新一代模型以更寬鬆授權釋出,並主打 1M token 長上下文,指向長流程代理工作,例如自動寫碼、測試與文件整理。這類工作常把 token 用量推到新高度,令成本可預測性成為決策關鍵。

同時,新模型用混合專家架構去壓低推理成本,強調在較少 token 的情況下完成同樣任務。對企業來說,這意味可把重複、長時間的流程放在自家環境跑,既保留資料控制,也減少被 API 計價牽著走。

EU AI Act 合規期限仍有變數

歐盟 AI 法案對高風險系統的要求,原本指向 2026 年 8 月的關鍵時間點,但亦出現延後聲音,最終仍取決於政治與程序能否落地。對有歐盟客戶或服務覆蓋歐盟用戶的 SaaS、金融與人力資源產品,不能只等結果才開始準備。

務實做法是先盤點哪些用例可能落入高風險範圍,例如生物辨識、僱用決策、信貸或保險評分等,並預先建立文件、日志保留與人為覆核機制。就算日後期限延後,這些基建也能降低審計成本。

美國政策框架釋放的訊號

美國亦提出國家級政策框架,方向偏向鼓勵採用與沙盒試點,同時談到如何處理聯邦與州層面的規範邊界。對跨境業務而言,重點不在單一法規,而是要把風險管理流程做成可移植,才能應對不同司法區的變化。

建議企業把「模型供應鏈」納入治理:包括訓練資料來源、授權條款、部署位置、輸出監測與人機協作流程,並用指標量度每個流程的 token 成本與成功率。當你把效益與風險都量化,選用開源或商用模型就不再只靠感覺。

總結而言,長上下文與代理工作正在把模型成本結構改寫,而合規與政策又要求企業建立更可追溯的流程。先把治理底座打好,再挑最適合的模型,會比追逐單一新功能更實際。