AWS 軟體開發用 AI 智能代理邁向更高複雜度任務

AWS

Amazon Web Services（AWS）釋出了其 Amazon Q Developer 軟體開發代理的更新版本，根據測試基準顯示，其解決任務的能力提升了 51%。

使用 OpenAI 所建立的 SWE-bench 測試基準來評估人工智慧（AI）平台解決 Python 開發者常見問題的能力後發現，Amazon Q Developer 代理在驗證資料集上的任務解決率從最初的 25.6% 提升至 38.8%，在完整 SWE-bench 資料集上的表現則從 13.82% 提升至 19.75%。

Amazon Q Developer 工程總監 Neha Goswami 表示，這些結果顯示，像 Amazon Q Developer 這類的 AI 代理會隨著時間演進，並透過大型語言模型（LLM）推理能力的進步，逐步能處理更多複雜任務。

Goswami 指出，目前已有許多開發者透過 Amazon Q Developer 提供的自然語言介面分析現有程式碼庫，並在數分鐘內執行程式碼變更。

此能力也進一步讓組織更容易追上程式語言最新版本的腳步，例如可大幅減少升級至最新版 Java 所需的繁瑣作業。

從長遠來看，像 Amazon Q Developer 這樣的生成式 AI 工具，也將使跨語言轉換程式碼變得更為簡單。

整體而言，AI 代理已被訓練來執行更廣泛的複雜任務。Amazon Q Developer 代理可以開啟、建立與關閉檔案，選取與取消選取程式碼區塊，尋找與替換程式碼，甚至在需要時還原變更。

工具所執行的操作結果會回饋至更新後的提示詞中，並再次傳遞給 LLM，以決定下一步動作。代理會自主決定何時已完成符合請求的變更，並將結果提供給開發人員審查。Q Developer 代理也內建邏輯，以避免陷入無效或死胡同的流程。

AWS 也為 Q Developer 代理開發了一套 textcode 框架，透過使用代碼標記（tokens）來建立程式碼、檔案與工作區的表徵，進而協助 LLM 更容易理解整個軟體開發環境中的元素。

目前尚不清楚有多少開發者已全面採用生成式 AI 來撰寫程式碼或管理任務，但隨著 LLM 持續演進，應用程式的建置與部署速度可望大幅加快。現階段，生成式 AI 所帶來的最大效益多集中於加速撰寫程式碼，但隨著推理能力提升，DevOps 流程的自動化程度也會隨之提高。未來幾年內所部署的軟體量，可能會遠遠超越過去十年的總和。

當前的挑戰是清楚了解現今的生成式 AI 代理已能勝任哪些任務，並為下一波更強大的代理所引領的新一代 DevOps 時代做好準備。

Telegram : @Alan5808

Line : @286fhkvy

Youtube : @kingcloud85

FB : https://www.facebook.com/kingcloud.tech/