AI 商業 2026 年 4 月 28 日作者：Ivan So

開源長上下文新動向

這兩天的 AI 產業焦點，一邊是更長上下文、更便宜的模型選項，另一邊則是合規時間表仍在變動。對香港團隊而言，模型選型與治理要同步推進。

長上下文開源模型再加速

有廠商把新一代模型以更寬鬆授權釋出，並主打 1M token 長上下文，指向長流程代理工作，例如自動寫碼、測試與文件整理。這類工作常把 token 用量推到新高度，令成本可預測性成為決策關鍵。

同時，新模型用混合專家架構去壓低推理成本，強調在較少 token 的情況下完成同樣任務。對企業來說，這意味可把重複、長時間的流程放在自家環境跑，既保留資料控制，也減少被 API 計價牽著走。

歐盟 AI 法案對高風險系統的要求，原本指向 2026 年 8 月的關鍵時間點，但亦出現延後聲音，最終仍取決於政治與程序能否落地。對有歐盟客戶或服務覆蓋歐盟用戶的 SaaS、金融與人力資源產品，不能只等結果才開始準備。

務實做法是先盤點哪些用例可能落入高風險範圍，例如生物辨識、僱用決策、信貸或保險評分等，並預先建立文件、日志保留與人為覆核機制。就算日後期限延後，這些基建也能降低審計成本。

美國亦提出國家級政策框架，方向偏向鼓勵採用與沙盒試點，同時談到如何處理聯邦與州層面的規範邊界。對跨境業務而言，重點不在單一法規，而是要把風險管理流程做成可移植，才能應對不同司法區的變化。

建議企業把「模型供應鏈」納入治理：包括訓練資料來源、授權條款、部署位置、輸出監測與人機協作流程，並用指標量度每個流程的 token 成本與成功率。當你把效益與風險都量化，選用開源或商用模型就不再只靠感覺。

總結而言，長上下文與代理工作正在把模型成本結構改寫，而合規與政策又要求企業建立更可追溯的流程。先把治理底座打好，再挑最適合的模型，會比追逐單一新功能更實際。