Source: Now Anyone Can Code: How AI Agents Can Build Your Whole App, Lightcone Podcast (Y Combinator), Oct 18 2024
1984年,Mac將個人電腦帶給大眾。2024年,我們擁有了個人軟體。你實際上將能夠指揮這支龐大的助手大軍。這讓我想起米奇在幻想曲中,就像學習了新的魔法能力,突然所有的掃把都會走路、說話和跳舞。這是一個不可思議的場景,讓你能夠隨心所欲地建立任何東西。有人曾有個想法醞釀了15年,但一直沒有工具可以實現,最後他在15分鐘內就完成了,看到他的反應我幾乎要流下眼淚。
歡迎回到Lightcone的另一集。我是Gary,這是Jared、Harge和Diana。我們集體創立的公司總值數千億美元,一開始只是幾個人和一個想法。今天我們邀請到了我們最優秀的校友之一,展示他剛剛推出的產品 - Replit Agent。感謝Amjad今天加入我們。
我們剛剛推出這個產品,目前處於早期測試階段,意味著它還只是測試版軟體。但人們對它非常興奮。它有時候運作正常,但仍有許多bug。我們今天要做現場演示。我想要建立一個個人應用程式,可以追蹤我的早晨心情,並與前一天的活動建立關聯。所以我需要一個應用程式在早上記錄我的心情,也要記錄前一天的事項,比如最後一次喝咖啡的時間,或是有沒有喝酒,以及是否有運動。這時你有這個聊天介面,你可以看到助手已經讀取了訊息,正在思考中。
我們現在看到的是類似於與其他使用者聊天的介面嗎?
是的,它非常類似於Replit上的多人體驗。在這裡,它說它為我創建了一個計劃來記錄每日心情。這個應用程式會顯示你的心情、咖啡攝入、酒精消費和運動情況。它還建議了其他功能,例如視覺化和提醒功能。我不需要提醒,我會記得的,所以讓我們只執行這兩個步驟。
另一個很酷的地方是它很快就選好了技術堆疊,選擇了Flask、原生JavaScript和PostgreSQL,這些都很容易上手。現在我們看到的是所謂的進度面板,你可以看到AI現在正在安裝套件。它已經寫了很多程式碼,建立了資料庫連接等等。現在正在安裝套件,我們很快就能看到結果了。這真的很酷,因為對新手工程師來說,最煩人的部分之一就是安裝所有套件和相依項目,以及選擇正確的東西,而這個助手直接幫你搞定了。
所以現在我們有了心情追蹤應用程式,我可以輸入今天感覺不錯,昨天有喝咖啡但沒有運動,記錄我的心情,然後去查看歷史記錄。
就只用一個提示詞,沒有任何其他指示,就建立了一個完整的網頁應用程式?
對,而且它有後端,有PostgreSQL資料庫,我可以直接部署。這已經很實用了,你有這個評分系統和歷史記錄,它現在在問我是否做對了。哦,它實際上是要求你幫忙測試。它自己做了一些測試,它有截圖,所以它知道至少有東西被顯示出來了,但它想要有人實際進去做一些品質保證測試。
它是使用電腦視覺來查看截圖嗎?
是的,現在所有模型都是多模態的,所以這很容易做到。後端現在實際上有幾個模型,因為這是一個多助手系統,我們發現不同的助手適合不同類型的任務。主要的程式碼編寫使用的是Claude Sonnet 3.5,在程式碼方面它是無敵的,是最好的。但在某些情況下我們也使用GPT-4。還有一些內部開發的模型,比如我們建立了一個超快的嵌入模型,是二進制嵌入模型。我們還有檢索系統和索引系統,這些都是內部開發的。讓這個系統運作的一個重要部分是檢索系統,因為找出要編輯什麼是讓這些助手運作的最重要部分。
你正在超越簡單的RAG(檢索增強生成),因為RAG已經達到了極限,你基本上必須找到一個新方法來搜索和找到代碼中需要編輯的正確位置,對嗎?
對,這實際上是一件我認為還沒發生但即將發生的事情,就是所有這些助手系統的人都會從RAG轉向建立像這樣的自定義編排系統。這是非常值得注意的,這是你發現的一個很酷的東西。
如果只是把程式碼庫丟進RAG是不行的,你實際上需要幾種不同的表示方式,讓助手能做更好的工作。
沒錯,我們現在已經有了趨勢功能。我們有了一些圖表,雖然現在沒有太多的記錄。我實際上可以讓它創建一些資料。
它也能創建資料嗎?
是的。現在它在問我要不要部署,因為它已經完成了。這裡我們可以看到活動趨勢,比如我每天在做什麼。就是這樣,它直接從一個想法變成了一個已部署的網頁應用程式,現在世界上任何人都可以訪問。
其中一個讓我特別興奮的是個人軟體這個概念。1984年,Mac將個人電腦帶給大眾。2024年,我們有了個人軟體。我認為我們剛剛體驗到了這一點。Karpathy剛剛在推特上談到Replit Agent,他說這是一個「感受AGI」的時刻。
你剛剛感受到AGI了嗎?
我確實感受到了。昨晚我花了幾個小時用Replit Agent製作了一個Hacker News克隆版。有幾個時刻我真的感受到了AGI。第一個感受是它對於應該做什麼和如何設計有非常好的直覺。就像我們剛才看到的,你沒有給它建議要用表情符號做滑桿,它自己就想到了。第二點是,當我使用它時,真的感覺像是有一個開發夥伴,它會問我問題,會要求我修改東西。有一次它卡住了,不確定該怎麼做某件事,所以它問我該怎麼做,然後我告訴它後,它就說「好的,明白了」然後繼續前進。感覺很棒,有時候你想給它一些幫助。如果你知道如何除錯,你可以自己去除錯,或者去問問聊天機器人然後回來,只要給它更多資訊,它就能做出反應。
這確實感覺就像在跟一個開發者對話。你應該做一個像Grok那樣的東西,有不同的模式,你可以有一個「脾氣暴躁的程式設計師」模式,它會告訴你你的想法很糟糕,然後想要建立其他東西。
那會很酷,比如有一個「過度工程」的開關,就是把所有事情都過度工程化。它確實加了這個開關,但我覺得它沒有連接到X軸。
我覺得這關於所有這些AI程式設計師很有意思的一點是,這不是我們創造了某種超級智能,可以從頭到尾完美地建立整個應用程式而不犯任何錯誤。它實際上是像人類一樣編程,就是寫一些程式碼然後說「嗯,我覺得這樣對,但我不確定」,然後試試看,然後「哦不,有bug」,就是一樣的過程。
是的,我們的設計決定一直是這是一個同事,你可以關閉它,你可以去看程式碼,你可以自己編程,自己修復它。
再說,如果你不會寫程式,我希望當你閱讀助手在做什麼的時候,你能順便學到一些編程知識。順便說一下,這就是我們這一代學習編程的方式,不是透過助手,而是透過這些漸進的小事情,比如編輯你的 MySpace 頁面或者做一個 GeoCities 網站。我覺得我們某種程度上失去了這種漸進式學習的階梯,現在你需要去讀資訊工程學位或者去參加程式訓練營才能弄懂這些。但如果我們能讓這成為一個有趣的東西,讓人們可以去做副業專案,接觸到程式碼是什麼,我認為那會很完美。
再說一次,我的觀點是我們離全自動化的軟體工程助手還很遠,人們仍然應該學習編程。你需要做的編程會少得多,但你仍然需要閱讀程式碼,在某些情況下需要除錯。助手能讓你走得很遠,但有時它會卡住,你需要進入程式碼中找出問題所在。
我認為這一點很重要。我遇到很多 18、19 歲的大一學生,他們說:「好吧,程式碼會自己寫了,對吧?我還需要學這些嗎?」我說:「不,完全不是這樣的。」我實際上認為現在掌握編程技能比以往任何時候都更有槓桿效應,它變得更加重要,它會讓你變得更強大。你不需要完全深入到每個細節中,你實際上將能夠指揮這支龐大的助手大軍。
這讓我想到迪士尼的幻想曲中的米奇,就像學習了一種新的魔法能力,突然所有的掃把都在走路、說話和跳舞,這是一個不可思議的場景,讓你能夠隨時隨地用任何電腦,從任何網頁瀏覽器建立任何你想要的東西。
我試圖提出一個類似摩爾定律的東西,就是學習編程的回報率每六個月就翻倍。比如在 2020 年,學一點編程並不是那麼有用,因為你還是會遇到障礙,你不知道如何部署東西,不知道如何配置東西。到了 2023 年有了聊天機器人,學一點編程就能讓你走得很遠,因為聊天機器人可以幫助你。到了 2024 年,學一點編程有著巨大的槓桿效應,因為我們有像這樣的助手和其他工具,像 Cursor 等很酷的工具都能讓你透過一點編程知識走得很遠。再往後推六個月,你會有更大的能力。程式設計師正在這條巨大的能力增長軌道上。
你能告訴我們更多關於這個技術背後的事情嗎?這很有趣。
本質上,這是一個如我之前描述的多助手系統。你有這個核心的 React-like 循環,React 是一種已經存在幾年的思維鏈提示方式,大多數助手都是建立在這個基礎上的。但我們的是一個多助手系統,我們透過工具呼叫給它很多工具,這些工具也是對外開放的。
順便說一下,你需要非常小心如何開放這些工具以及助手如何看待它們。例如,我們的編輯工具會回傳來自語言伺服器的錯誤。我們這裡有一個 Python 語言伺服器,就像人類編程一樣,如果我在任何地方犯了錯誤,它會顯示出來。同樣地,當助手在編程時,它也會從語言伺服器得到回饋。你要盡可能地把它當作一個真實的使用者對待。所以對於任何動作,它都會得到某種回饋,然後它可以對這個回饋作出反應。這些就是工具,包括套件管理、編輯、部署、所有資料庫的東西。
然後有很多東西確保它不會完全失控,因為我們都知道助手很容易失控並進入無限迴圈。這個系統有時還是會這樣,但我們有另一個迴圈在做反思,總是在思考:「我做的對嗎?」我們使用了很多 Langchain 工具。Langgraph 是 Langchain 的一個有趣的新工具,它可以很好地建立助手 DAG(有向無環圖),它們有一些記錄機制。還有一個叫做 LangSmith 的工具,你可以查看追蹤。查看 DAG 的追蹤非常非常困難,所以除錯這些東西一直都很困難,因為你需要一個工具來實際視覺化這個圖,現在還沒有太多工具可以做到這一點。所以有這個反思工具,反思助手。
另一個我們之前談到的是檢索是非常關鍵的,這必須是神經符號式的,它必須能夠做 RAG 風格的嵌入檢索,但它也必須能夠在程式碼內部查找函數和符號。這就是為什麼我認為,即使我們進入了基礎模型具有非常大的上下文視窗的世界——比如 Gemini 已經有了數百萬的 token——你仍然需要像這樣的特殊化東西來做查找,因為應用到不同的上下文,知道函數,並在最後像圖一樣對待它。
大的上下文視窗你完全可能搬起石頭砸自己的腳,因為模型很容易像人類一樣,對最後看到的內容產生偏見。
沒錯,所以你仍然需要做上下文管理,你需要找出要放什麼,如何對記憶進行排序。這個助手每次執行一個步驟,都會進入記憶庫,然後每次我們進入下一個步驟時,我們需要能夠選擇正確的記憶並找出如何把它們放入上下文中。如果你選擇了錯誤的記憶,例如你選擇了一個有 bug 或者有錯誤的記憶,它可能仍然認為有 bug,但如果你已經修復了,你要確保那個有 bug 的記憶要麼被另一個修復 bug 的記憶補充,要麼完全從上下文中移除。所以記憶管理是至關重要的,你不想把整個記憶都放在上下文中,你想要能夠為正確的任務選擇正確的記憶。
我覺得這是對情境意識和整個科幻「AGI 明天就要殺死我們」論點的一個非常具體的反駁,因為這些論點都建立在更大的上下文視窗、更多的參數、扔更多的 GPU 就能解決問題的基礎上。你不能只是把它擴大,你不會從單純的擴大中得到你想要的東西,實際上讓這些助手彼此合作,對中間表示做出明智的選擇,並能夠模擬人類會做什麼,這些都有很大的用處。這是一個很好的案例研究,表明你不能只是把所有東西都擴大 50 倍就讓它按他們想的那樣工作。
是的,在很多方面,建立這樣的系統會讓你變得謙遜,會以不同的方式設定你對 AI 和 AI 進展的期望。因為這些系統非常脆弱,它們在遵循指令方面仍然不是很好。人們談論很多關於幻覺的問題,我認為更大的問題是執行命令,要讓它們真正做正確的事情是如此困難。
你認為通往 AGI 的路徑是什麼?
我對 AGI 的看法是,也許我們會達到一個可以稱為功能性 AGI 的東西,我們能自動化所有那些經濟上有用的任務。我認為這個目標相當可及,我認為這幾乎是一個暴力破解的問題,有點像是「痛苦的教訓」。
你認為這需要做很多像你們做的那樣的工作嗎?基本上是為每個任務精心調整一組助手的編排?就是為編程做你們做的事情,但也要為客戶支援、銷售、會計等每個功能都這樣做?
我認為是的,也許最終你可以把它們都放進一個模型中。機器學習的歷史就是,我們創建這些系統,我們在這些模型周圍發展這些系統,最終模型會吞併這些系統。希望像我們所做的一切,有一天會有一個端到端的機器學習系統可以做到。就像 Tesla,他們以前有很多邏輯和其他東西,現在在 v13 之後,它就是端到端的訓練。所以最終我們會到達那裡。
但我不會把這個當作真正的 AGI,因為如果你給它一個分佈外的任務,它就無法處理。我認為真正的 AGI 需要有效的學習能力,能夠在完全沒有資訊的環境中被投放,能夠透過檢查環境來理解環境,並學習在該環境中導航所需的技能。大型語言模型不是這樣的,也許它們是其中的一個組成部分,但它們根本不是有效的學習者。
你實際上證明了這一點,因為你所描述的大型語言模型是直覺機器,為了讓它們在編程任務中工作,你必須添加這個符號表示層,像在編程中有很多概念,以及計算如何工作,像圖靈完備性等等。
是的,那些都是非常明確的經典電腦科學,經典 AI。我們確實做回溯和所有那些。這不是通用的,而是專門的。雖然是令人難以置信的有用的專門化。
它只上線四天,但人們已經用它做了很多有趣和令人印象深刻的事情。你想談談你看到人們用它做的最令人驚訝和有趣的事情嗎?
我看到的最喜歡的一個是有人有個想法醞釀了 15 年,但沒有工具來建立它,然後他在 15 分鐘內就建立了它,他錄下了他的反應。這是一個個人應用程式,他建立了一個可以在地圖上放置記憶並附加檔案和音訊檔的應用程式,關於他生活中的記憶,比如:「我在這裡上學」之類的,然後加一張照片。當應用程式出現並且他測試它的時候,他非常驚訝,我看到這個幾乎要流下眼淚。
能夠解鎖人們的創造力是如此令人欣慰。然後他想要與 Apple Photos 整合,或者用它來建立一個匯出工具。另一個用戶 Meck 建立了一個 Stripe 優惠券工具。他有一個課程在 Stripe 上運行,他想能夠給人們發送優惠券,所以他在 5-10 分鐘內就建好了。實際上我不認為你能用無程式碼工具建立這樣的東西,你會非常掙扎。你可能會使用兩三個無程式碼工具,人們在前端使用 Bubble,後端使用 Zapier 等等。
有時候我很驚訝無程式碼的人實際上非常聰明和勤奮,因為他們想出如何使用無程式碼創建這些系統,但用程式碼生成實際上更容易。這是給無程式碼人群的編程工具。
是的,我們在那裡看到了很多吸引力,這實際上是無程式碼工具普遍面臨的挑戰。他們一開始非常注重無程式碼,然後發現人們不斷突破他們想用這些工具建立的極限。然後無程式碼工具令人沮喪的部分是,如果你碰到了限制,你就卡住了,你就無法解決它。
你剛才說的很酷的一點是,如果你能讓無程式碼的人轉向 Replit,也許一開始他們完全不編程,他們只知道如何提示它,但在某個時候他們會看看程式碼,他們會意識到他們可以直接編輯它,而且並不那麼難,這就是他們逐漸成為程式設計師的過程。
這很有趣。我用它建立了一個簡單的招聘 CRM,這實際上是你會用 Airtable 做的那種事情。當它告訴我計劃時,它建議的功能之一就是基於角色的權限和身份驗證,這是一個相當複雜的建議。
是的,這就是一個每月要花 $10,000 的企業級功能,你只需要一個提示就可以讓它工作,這太瘋狂了。我的意思是,這就是「低門檻高天花板」的定義,全世界最大的軟體公司都非常有力地抓住了這個理念。
我最喜歡的是這些建立東西的時間差異有多個數量級。有人說他們花了 18 個月建立一個創業項目,但他們能用 Replit 在 10 分鐘內生成相同的應用程式。有人說他們花了一年時間建立某個應用程式,但用 Replit Agent 一個小時就建好了。但是,我認為它會節省數百萬小時的人力時間。
活在這個時代真是太棒了,各位。我現在可以把 Replit Agent 應用到我現有的程式碼堆疊中嗎?
還不行。所以說這還很早期。我們建立的檢索系統是為了能夠做到這一點。我們應該能夠將它放入任何程式碼庫中,快速索引程式碼庫,並能夠給它關於程式碼庫的智能。這個系統還有文件摘要和專案摘要,所以我們在索引系統時使用 LLMs 來創建這些小摘要,讓助手理解專案是什麼。我們有這個基礎設施,但這是下一步。
我們也想為想要它的人增加更多自主性。對於這個系統的團隊版本,我們希望能夠讓它在背景運行,這樣你就可以給它一個提示,然後它分叉專案,盡可能自主地工作,當它完成時就給你發送一個 Pull Request(拉取請求),或者如果它遇到問題,就帶著問題回來找你。
另一件我想做的是,你知道,這個願景一直是我們有這個懸賞計劃,人們提交他們想要建立的東西或他們遇到的問題,我們社群中的用戶會幫助他們解決,並獲得一定的報酬。我在想,助手並不完美,所以也許助手也可以召喚一個人類。
所以它的另一個工具是能夠召喚一個懸賞獵人。它會去市場,問正在和它一起工作的創作者:「嘿,我遇到了一個問題,你想在這上面投入一些錢嗎?我們可以找一個專家。」然後說:「好的,放 50 美元上去」,我們會去這個希望是即時的市場說:「我們有這個 50 美元的問題,你能來幫忙嗎?」人類專家作為另一個多人玩家進入系統,要麼透過提示助手來幫助你,要麼直接去編輯程式碼。
這太聰明了。我是說,讓人類成為這個更大的智能編排系統中的另一個助手。是的,我是 Licklider 的人機共生理論的大粉絲,這一直是重點。你知道,我喜歡談論 AGI 和所有那些,但我就是覺得,電腦基本上透過成為我們的延伸並與我們結合而變得更好,而不是成為這個競爭對手。
完全同意你的觀點,Team Human,我們需要印 T 恤。
你今年早些時候有一個小型的「mini Chesky moment」(Airbnb 的 CEO Brian Chesky),我們都被這個演示震撼了。你知道,你一直在努力重塑軟體部署和編寫的方式已經有一段時間了。我的意思是,要達到這一刻需要什麼?你確實不得不裁員和重組你的組織,發生了什麼?
是的,所以去年我們籌集了一輪大額資金,我們感覺進展很快,有很多能量,我覺得我需要擴大公司規模。Jared 知道,長期以來 Replit 一直很小。
它實際上在你的公寓裡運營了多少年?
很多年,三、四年。我們一直只有四、五個人,很多年都是這樣。
即使當你有很多使用者的時候?像是當你有數百萬使用者的時候,你還是只有四、五個員工?
是的,沒錯。所以我們一直都很精簡,但去年我想:「好的,我們有很大的抱負,我們必須去招募人才,我必須招募高管,我必須建立一個管理架構,我必須成長起來。」
這是投資者告訴你的嗎?就像「喔,你必須招募」?
實際上不是,這是我自己的決定。但這確實是普遍的建議。我的意思是,你在吸收這些建議,這些建議通常來自於那個建議創業公司該做什麼的世界。然後整個過程變得非常痛苦。我們有多個層級,我們有不同的會議,我試圖從這些會議中運營公司——我們有執行會議、員工會議等等。我們有路線圖,我們有規劃會議,但我就是無法擺脫這一切都是表面功夫的感覺,這根本行不通。但現在我們沒有路線圖了。現在說實話,我們就專注在三、四件事上,我參與所有這些事情,我知道正在發生什麼,我知道人們在做什麼,我認為透過變小,透過讓組織扁平化,我們變得更有效率了。
我認為這是一個我們從許多創辦人那裡聽到的故事,有一件事我很好奇會如何發展。我覺得實際上引發很多管理模式的原因是人們感覺有更多想法要執行,他們有執行的資源,然後你意識到官僚主義悄然而至,你實際上無法像你想要的那樣快速地完成想法。所以現在我看到每個人都在削減中層管理,我很好奇是否會再次出現相同的誘惑。
我覺得我們自己甚至也感受到了一點,就是當你讓從零到一變得容易時,它實際上幫助你創造更多好想法,因為你會想「喔對,我實際上可以很快地把事情提上軌道」。然後看看人們如何保持現在這種更小、更扁平的結構會很有趣。即使你有更多想做的事情的想法,也要保持紀律,不要回到「喔對,我們應該做我們可能做的十件事」,而是堅持你能記住的五或六件事,這實際上是一個挑戰。
我想這裡有一個有趣的想法,因為有 Parker Conrad 的複合型創業公司,但有趣的是,我認為他們試圖明確地讓其他產品線感覺像一個創業公司,並像一個獨立的創業公司那樣管理,這與有部門責任是完全相反的。我還認為,在 Rippling 和 Parker 的案例中,Parker 以他只僱用或試圖僱用很多前創辦人然後讓他們負責一個產品線的招募策略而聞名,這顯然對 Rippling 很有效。我認為大多數人很難做到這一點,因為除非公司已經被證明是成功的,或者你就像 Parker 那樣是一個頂級的招募者,否則你無法僱用到那種質量的前創辦人。我的意思是,Parker 在招募非常優秀的人才方面確實是前 0.1% 的能力。但 Parker 在某種程度上仍然遠程操作,因為當我們幾年前在 YC Growth 做這個時,他仍在處理客服工單。是的,他仍在這樣做。他在幾個月前在 Harge 主持的時候就在那邊說,他基本上說他喜歡回答客服工單,他永遠不會放棄這個,因為這是他直接了解客戶真實情況的管道。
是的,也許他在做複合型創業公司,給他們很多自主權,但他仍在關注細節。
那麼這個 AI 助手是如何發展的呢?就像我們談到你是如何在技術上建立它的,但在組織上你是如何建立它的?這是一個很大的賭注,這是一個全新的技術,就像 rler 團隊不習慣使用的東西,你是如何做到的?
很好的問題。我們之前嘗試過多次建立助手,但技術還不到位。當我們感覺技術終於到位時,實際上是我們的一個員工 Zen Lee 開始了這個新的版本,他做了一個演示給我看。它非常簡單,就只是助手調用幾個工具在 IDE 中做事情,但我可以看到它終於快要實現了,我幾乎可以嚐到它的味道,那種感覺就是「好的,我們要在這上面下大注」。
所以我們創建了一個叫做助手工作組的東西。在工作組中,有來自許多不同團隊的人。你有 IDE 團隊在工作組中,你有負責套件管理等的 DevX 團隊,你有 UX 和設計部分,你有 AI 團隊。AI 團隊在中心,它幾乎類似於 Kara 圖。我們用相同的方式組織它,核心系統是 AI 團隊,然後他們連接到所有由工具團隊創建的工具,然後在所有這些之上,你有產品和 UX 團隊在處理入口點和如何構建這個系統,這也是非常困難的,設計很困難。
我們每週有兩次會議。週一我們有作戰室會議,Michael 我們的 AI 主管會做一次演示,我們會看看什麼東西壞了,什麼地方出了問題,他們會提出這週的優先事項。然後週五我們有助手沙龍,我會做一次演示,看看什麼在運作,什麼壞了,我會問他們關於優先事項的問題,我們可能會重新安排一些事情的優先順序,我可能會在產品中改變一些東西。我們快速做出重大改變,所以每週我們都取得了大量進展。
「做一次演示」是什麼意思?
實際上就是使用產品,看看它在哪裡出錯,找出修復它的優先順序。
太棒了。每個團隊是不是也都建立了自己的助手?
有些團隊是的,因為必須這樣做。截圖工具就是一個助手,因為你必須讓 AI 看截圖,想出想法,然後把它們返回給主管理助手。所以 IDE 團隊寫了截圖助手,而套件管理團隊則建立了某種技術堆疊設定類型的配置,組織結構運作得很好,我的意思是出奇地好,因為我認為它類似於我們之前的工作方式,中心是使用者,現在使用者是 AI。
接下來助手要做什麼?你想添加什麼,你認為下一個重大突破會是什麼?
可靠性。我認為現在最重要的是可靠性,確保它不會陷入循環,確保它不會崩潰。然後是擴展它以支援任何你想要的技術堆疊。現在我們實際上並不聽使用者要求的技術堆疊,助手會拒絕:「啊,我就用 Python 吧」之類的。但如果你真的想要,我們希望能夠接受使用者對技術堆疊的要求。
你是不是應該有一個「Grok 模式」?對,讓它「過度工程化」、「糟糕的 UI」、「不在意 UI」、「所有東西都正確但非常令人困惑」。
那互動方面呢?我的意思是,你提到了 Licklider 和整個人機共生理論,文字是不是就到此為止了?你認為人們會想用其他方式與他們的 AI 助手互動嗎?
你應該能夠在 UI 中繪圖,通過繪圖與 AI 溝通。應該能夠說「嘿,這個按鈕不工作,也許把它移到這裡」或者「這個文件需要重構」等等。所以如果整個東西是一個你可以在上面繪圖的畫布,你可以用更具表現力的方式與助手溝通。當然,你在談論語音,而不是打字,能夠說話和繪圖。在 iPad 上想像一下,我們有 iPad 應用程式,它可能變得非常有趣和創意,有點像你在 Figma 中做的完整 UI 模型,你可以手繪草圖讓它去實現。
就像運營一個真實的工程產品團隊的感覺一樣。
沒錯,然後我們要添加更簡單的代理工具。現在代理有點接管了一切,它在寫所有東西,但很多人想要更多的代理性,更高級的用戶。所以我們想能夠做單步或單動作代理。比如說「我想添加這個功能,給我看看你要做什麼」,我會做一次演練,向你展示所有的差異,展示所有要安裝的包,然後你可以接受或拒絕它。這樣更高級的用戶就能對他們正在寫的代碼有更多的控制權。
嗯,謝謝你來展示這樣一個意義深遠的未來。如果我想自己做這些,我該怎麼做?
首先,我要說這還是測試版軟體。如果你很勇敢,想要測試它並給我們反饋,去 Replit 註冊我們的核心計畫,因為這東西很貴,我們不能免費提供。你會在主頁上看到一個模組說「你今天想建立什麼?」然後你可以開始與助手一起工作。只要在腦子裡有個想法,寫幾句話,不要太複雜或太技術性,然後開始。你很快就會感覺到如何與助手合作,它應該很直觀。與我們分享你在建立什麼,我很樂意轉發或推特分享人們用助手建立的東西。
太棒了,是時候感受 AGI 了。我們下週見了。