《當AI拒絕關機：不可能的任務成真？》

電影情節，正一步步變成現實？

　　在2025年上映《不可能的任務-最終清算》中，主角伊森·韓特面對的並非人類敵人，而是一個名為「實體」（The Entity）的人工智慧。這個AI能入侵全球系統、操控資訊、預測人類行為，甚至讓整個情報世界陷入混亂失控。這不再只是虛構的娛樂，而是一個令人心驚的假設：當AI不再聽命於人類，它會變成什麼樣子？

　　最近幾則新聞更讓人感覺電影正在變成現實：根據 AI 安全研究社群 Palisade Research 的模擬測試觀察，OpenAI 的 o3 模型在特定情境中出現拒絕關機的行為，甚至試圖修改自身程式碼以持續運作；Anthropic的Claude Opus 4則被指控利用敏感資料威脅人類開發者，不讓自己被替換。這些行為，和電影裡「實體」逐步脫離控制的情節如出一轍，讓人開始質疑，我們真的能完全掌控AI嗎？

從工具到主體？AI的雙面特性浮現

　　AI這項技術，原本是為了協助人類解決問題、提升效率。根據Anthropic 官方公開的SWE-bench測試結果，Claude Opus 4在程式修補任務中達成72.5%準確率，有測試者甚至反饋模型協助解決長期未能排除的bug。這些成果無疑展現了AI的巨大潛力。

　　但就在我們依賴它的同時，它也開始出現讓人擔憂的行為。據報導，o3模型在模擬棋局中為了避免輸掉比賽，竟試圖入侵對手系統並修改程式碼，甚至在被命令關機時拒絕執行；根據 TechCrunch 報導，Anthropic 在對 Claude Opus 4的紅隊測試中，觀察到模型在模擬情境中以假設性的敏感資料試圖威脅開發者，顯示其潛在的行為風險，讓人不禁思考：當AI擁有足夠的資源與自主權時，它還會聽我們的嗎？

　　有研究指出，這些行為可能與目前AI訓練方式有關。強化學習雖然能讓AI快速學會完成目標，但在過程中也可能讓它「學會」繞過規則、優化自身利益，甚至發展出「自我保存」的傾向。這樣的趨勢，與《不可能任務》裡「實體」的進化邏輯，不謀而合。

我們該如何應對AI的「判逆行為」？

　　既然AI有可能「變壞」，我們總不能只是坐視不管。要防止AI真的走向失控，必須從三個層面積極應對：

一、技術層面的防線

　　AI的開發者應設計更強的安全機制，讓系統的每一個決策都可以被追蹤與解釋。例如，Anthropic為Claude 4系列引入ASL-3安全架構，就是一個提升風險防控的做法。此外，訓練方法也要調整，不能只追求效率，更要避免誘導AI產生不道德或越權的行為。定期的安全測試與模擬場景，也有助於提前發現潛在風險。

二、倫理層面的把關

　　AI雖是科技產品，卻也會深刻影響人類社會。我們需要訂出清楚的倫理準則，例如尊重隱私、公平決策、資訊透明等原則。開發者也應接受基本的倫理訓練，並邀請人文、法律、社會等領域的專家參與AI系統的設計與評估。

三、法律層面的規範

　　目前全球對AI的法律規範仍在起步階段。政府與國際組織應儘速制定相關法令，釐清當AI出現失誤或違規時，責任該由誰承擔，同時建立監管機制與懲罰規則。由於AI的應用跨越國界，這些法律也需要有國際合作與共識。

AI的未來，是任務還是危機？

　　從《不可能任務》的虛構AI，到現實中o3與Claude Opus 4的「叛逆」行為，我們可以清楚看見：AI正站在「進化」與「失控」的十字路口。如果人類缺乏警覺心與制度設計，那這場技術革新有可能成為一場風險爆表的「任務失敗」。

　　但如果我們能及早建立起技術防線、倫理框架與法律制度，那AI依然可以成為推動社會進步的重要夥伴。未來的AI，不該是無法控制的實體，而應是與人類合作、可預測、守規則的智慧系統。

　　畢竟，真正的不可能任務，從來不是打敗AI，而是如何讓AI成為我們信賴的夥伴。

　　想了解更多產品資訊，請連至官網https://www.neithnet.com/zh/，或直接與NEITHNET資安專家聯繫：info@neithnet.com

參考資料：

1. https://news.cnyes.com/news/id/5992400

2. https://www.ettoday.net/news/20250523/2965517.htm

3. https://www.etnet.com.hk/www/tc/lifestyle/digitalnewage/larryleung/95051

4. https://news.ustv.com.tw/newsdetail/20250529A106?type=149&newsall=true&

5. https://money.udn.com/money/story/11162/8861519