
「全球第一款完全自主的AI軟體工程師」- Devin, 由美國初創企業Cognition推出,根據該公司的部落格上表示,Devin能夠運用自己的shell、程式碼編輯器和獨立的網頁瀏覽器解決工程任務。
簡介
1、Devin,全球第一款AI軟體工程師,僅需一個提示就能編寫程式碼、建立網站和軟體。
2、這款人工智慧工具的目的不是取代人類工程師,而是協助他們,使他們的工作更加輕鬆。
3、Devin已成功通過來自領先人工智慧公司的工程面試。
以下是Devin的詳細資訊。
Cognition表示,他們已為這款AI驅動的Devin配置了shell、程式碼編輯器和獨立的網頁瀏覽器。在演示中,Devin使用瀏覽器打開API文件,以了解如何插入每個API。當AI代理遇到錯誤時,它會自動在程式碼編輯器中的主程式碼中添加調試列印語句,然後重新執行程式碼。
Devin:功能特色?
在該公司的YouTube頻道上,展示了AI代理的各種用例,包括構建和部署應用程式、尋找並修復程式碼庫中的錯誤,以及微調AI模型。
之前的程式設計AI,例如:ChatGPT, Copilot,都是必須在人輔助的情況下,不斷的調整、修改,才可以成功,因此過去的AI是無法在沒有人類干預或協助的情況下自主完成程式碼,然而Devin卻能夠獨自作業,修改錯誤,持續更正,來自動完成程式的開發。
根據官網指出,它能夠做出成千上萬個決策,從錯誤中學習,並隨著時間的推移變得更加優秀。此外,它擁有所有人類工程師所需的工具,如程式碼編輯器和瀏覽器。基本上,與其他解決方案相比,它在標準軟體工程問題集的測試中表現出色。這個人工智慧工具在由頂級人工智慧公司進行的實際工程面試中表現良好。這些面試可能涉及與人工智慧和軟體工程領域相關的任務和挑戰,而這個人工智慧助手成功地滿足了期望。
Devin:準確度如何?
Cognition表示,他們已在SWE-bench上對Devin進行了測試,這是一個基於GitHub上開源項目的真實世界問題的基準平台。根據該公司的說法,Devin成功解決了13.86%的問題,而GPT4 AI模型僅能解決1.74%的問題。之前的最佳成績由Anthropic的Claude 2 AI模型獲得,解決了4.80%的問題。

Devin:如何登入使用?
Devin目前提供給希望使用這款AI代理進行工程工作的個人早期訪問。客戶可以通過在公司網站上提交請求來獲得此AI動力編碼代理的早期訪問權。
如果您也要加入等候名單,請到他們的官方部落格:部落格
界面



好