AWS 軟體開發用 AI 智能代理邁向更高複雜度任務

AWS 軟體開發用 AI 智能代理邁向更高複雜度任務

Amazon Web Services(AWS)釋出了其 Amazon Q Developer 軟體開發代理的更新版本,根據測試基準顯示,其解決任務的能力提升了 51%。

使用 OpenAI 所建立的 SWE-bench 測試基準來評估人工智慧(AI)平台解決 Python 開發者常見問題的能力後發現,Amazon Q Developer 代理在驗證資料集上的任務解決率從最初的 25.6% 提升至 38.8%,在完整 SWE-bench 資料集上的表現則從 13.82% 提升至 19.75%。

Amazon Q Developer 工程總監 Neha Goswami 表示,這些結果顯示,像 Amazon Q Developer 這類的 AI 代理會隨著時間演進,並透過大型語言模型(LLM)推理能力的進步,逐步能處理更多複雜任務。

Goswami 指出,目前已有許多開發者透過 Amazon Q Developer 提供的自然語言介面分析現有程式碼庫,並在數分鐘內執行程式碼變更。

此能力也進一步讓組織更容易追上程式語言最新版本的腳步,例如可大幅減少升級至最新版 Java 所需的繁瑣作業。

從長遠來看,像 Amazon Q Developer 這樣的生成式 AI 工具,也將使跨語言轉換程式碼變得更為簡單。

整體而言,AI 代理已被訓練來執行更廣泛的複雜任務。Amazon Q Developer 代理可以開啟、建立與關閉檔案,選取與取消選取程式碼區塊,尋找與替換程式碼,甚至在需要時還原變更。

工具所執行的操作結果會回饋至更新後的提示詞中,並再次傳遞給 LLM,以決定下一步動作。代理會自主決定何時已完成符合請求的變更,並將結果提供給開發人員審查。Q Developer 代理也內建邏輯,以避免陷入無效或死胡同的流程。

AWS 也為 Q Developer 代理開發了一套 textcode 框架,透過使用代碼標記(tokens)來建立程式碼、檔案與工作區的表徵,進而協助 LLM 更容易理解整個軟體開發環境中的元素。

目前尚不清楚有多少開發者已全面採用生成式 AI 來撰寫程式碼或管理任務,但隨著 LLM 持續演進,應用程式的建置與部署速度可望大幅加快。現階段,生成式 AI 所帶來的最大效益多集中於加速撰寫程式碼,但隨著推理能力提升,DevOps 流程的自動化程度也會隨之提高。未來幾年內所部署的軟體量,可能會遠遠超越過去十年的總和。

當前的挑戰是清楚了解現今的生成式 AI 代理已能勝任哪些任務,並為下一波更強大的代理所引領的新一代 DevOps 時代做好準備。

Telegram : @Alan5808

Line : @286fhkvy

Youtube : @kingcloud85

FB : https://www.facebook.com/kingcloud.tech/