影片筆記:🚀AI通过录屏学习复杂操作?Codex新增录制回放神器:Record & Replay插件实测!录一遍操作流程就能自动生成可复用skill,三大实战案例彻底颠覆你的自动化工作流认知!复杂工作流一键复现
一句話總結
OpenAI Codex 新增「Record and Replay」插件,允許用戶錄製瀏覽器操作步驟並自動轉化為可復用的 Skill(技能),通過三個由淺入深的案例(PPT 製作、視頻生成發布、深度研究)驗證了其處理複雜工作流的能力,為不擅長編寫提示詞的用戶提供了高效自動化解決方案。
核心重點
功能核心價值:
- 無需手動編寫複雜提示詞。
- 將重複性操作轉化為可復用的 Skill。
- 快速、精準地創建 Skill。
安裝與使用流程:
- 確保 Codex 更新到最新版。
- 通過側邊欄插件圖標搜索並安裝「Record」。
- 在聊天中使用「Try in Chat」功能。
三大實戰案例驗證:
- 基礎案例:Cloud Design 創建 PPT 並下載,驗證了 Skill 生成的準確性與路徑正確性。
- 進階案例:Jamina 視頻生成、下載並發布,展示了處理多步驟、跨平台任務的能力。
- 高階案例:Cloud Code Deep Research 深度研究,通過修改 Skill 解決授權問題,實現自動化深度研究。
適用對象與優勢:
- 特別適合不擅長寫提示詞或需要創建複雜 Skill 的用戶。
- 大幅提升工作效率,實現「錄一遍操作流程就能自动生成可复用skill」。
詳細大綱
一、功能介紹與安裝步驟
- 功能名稱:Record and Replay(錄製與回放)。
- 安裝指引:
確認 Codex 已更新至最新版本。
點擊 Codex 左側側邊欄的插件圖標。
搜索「Record」並進入插件頁面。
點擊右上角進行安裝。
安裝完成後,點擊「Try in Chat」即可在聊天視窗中使用。
二、案例演示一:Cloud Design 創建 PPT
- 任務目標:使用 Cloud Design 根據指定主題創建 PPT 並下載至本地。
- 錄製過程:
在 Codex 輸入提示詞:記錄工作流並轉化為可復用技能。
描述任務內容。
點擊底部「錄製」按鈕開始錄製。
實際操作路徑:打開 Cloud Design -> 點擊 Slides -> 輸入提示詞(如:創建講解 Harnessed 的 PPT)-> 發送 -> 確認主題 -> 選擇中文 -> 生成 PPT -> 點擊 Share -> 點擊導出 -> 點擊下載。
停止錄製。
- 結果分析:
- Codex 分析錄製內容(耗時約 7 分 25 秒)。
- 調用 Skill Creator 創建 Skill。
- 生成的 Skill 工作流包含:打開鏈接、確認登錄、進入創建 PPT、描述內容。
- Skill 命名為「Cloud DesignPPT」。
- 測試驗證:
- 調用 Skill,輸入主題:「創建 5year AI Agent 2026 年發展趨勢報告的 PPT」。
- Codex 自動打開瀏覽器,模擬鼠標操作,輸入提示詞(比用戶輸入更完整精準),生成 PPT 並下載。
- 驗證結果:效果良好,路徑正確,結構驗證通過。
三、案例演示二:Jamina 視頻生成與發布
- 任務目標:使用 Jamina 生成視頻,下載並發布到指定平台。
- 錄製過程:
在 Codex 描述任務:使用 Jamina 視頻生成功能,根據話題生成視頻,下載並上傳發布。
實際操作路徑:打開 Jamina -> 點擊加號創建視頻 -> 輸入提示詞 -> 等待生成 -> 下載視頻 -> 回到平台 -> 點擊發布 -> 上傳視頻 -> 點擊發布。
停止錄製(耗時約 3 分 20 秒)。
- 結果分析:
- Codex 僅用 2 分 46 秒創建 Skill。
- Skill 工作流包含:打開網址、創建視頻、輸入提示詞、等待生成、下載、打開平台、發布、上傳。
- 測試驗證:
- 調用 Skill,輸入提示詞:「生成火星探測器在火星探索的視頻,然後發布」。
- Codex 自動執行全流程:打開 Jamina、輸入提示詞、生成視頻、下載、打開平台、搜索視頻、上傳、發布。
- 驗證結果:流程完整,複雜任務處理能力強。
四、案例演示三:Cloud Code Deep Research 深度研究
- 任務目標:在交互模式下調用 Cloud Code 的 Deep Research 功能進行深度研究。
- 背景說明:Cloud-P 命令無法直接調用 Deep Research,需通過錄製回放在交互模式下實現。
- 錄製過程:
在 Codex 描述任務:調用 Cloud Code 深度研究功能,對指定話題進行研究。
實際操作路徑:打開終端 -> 輸入 Cloud Code 啟動命令 -> 調用 Deep Research -> 輸入話題(如:AI Agent 在 2020 年的發展趨勢)-> 發送。
Cloud Code 啟動 7 個 Agent 進行研究。
停止錄製。
- 結果分析:
- Skill 工作流包含:判斷 Cloud Code 可用性、打開 Cloud Code、找到 Deep Research 命令、跟隨話題、監控進度。
- 用戶提問:如果 Cloud Code 未打開,是否應先打開終端?Codex 確認技能已明確協入。
- 優化與測試:
- 用戶要求修改 Skill:明確使用特定命令啟動 Cloud Code,以省去每次授權步驟。
- Codex 重新修改 Skill,提示修改完成。
- 再次測試:Codex 按照要求的命令啟動 Cloud Code,成功調用 Deep Research,完善提示詞(限制最多 5 個 Sub Agents),並獲得授權,自動完成研究。
五、總結與建議
- 標準工作流程:調用插件 -> 簡單描述任務 -> 錄製工作流 -> 調用創建的 Skill 測試 -> 如有偏差讓 Codex 修改 Skill -> 達到近乎完美。
- 適用對象:不擅長寫提示詞、不會創建複雜 Skill 的用戶。
- 最終價值:大幅提升效率,讓用戶通過錄製生成自己的 Skill。
工具 / 模型 / 名詞整理
- OpenAI Codex:影片主要介紹的 AI 工具。
- Record and Replay:Codex 新增的插件名稱(錄製與回放)。
- Scale / Skill:影片中提到通過錄製生成的可復用技能(註:逐字稿中混用 Scale 與 Skill,此處保留原樣)。
- Cloud Design:用於創建 PPT 的工具/平台。
- Slides:Cloud Design 中的功能按鈕(創建 PPT)。
- Jamina:用於生成視頻的工具/平台。
- Cloud Code:用於深度研究的工具。
- Deep Research:Cloud Code 中的功能(深度研究)。
- Cloud-P:Cloud Code 中的一條命令。
- Sub Agents:Deep Research 中啟動的子代理。
操作流程整理
通用安裝與使用流程
更新與安裝:確保 Codex 為最新版,進入側邊欄插件圖標,搜索「Record」並安裝。
啟動錄製:在聊天視窗點擊「Try in Chat」,輸入提示詞描述任務,點擊「錄製」按鈕。
執行操作:在瀏覽器中實際執行所需的操作步驟(如打開網站、點擊按鈕、輸入內容等)。
停止與生成:停止錄製,Codex 分析錄製內容並自動生成 Skill。
測試與優化:調用生成的 Skill 進行測試,若結果有偏差,可要求 Codex 修改 Skill 直至滿意。
案例一:Cloud Design PPT 製作流程
描述任務:使用 Cloud Design 創建 PPT 並下載。
錄製操作:打開 Cloud Design -> Slides -> 輸入主題 -> 生成 -> 導出 -> 下載。
生成 Skill:命名為「Cloud DesignPPT」。
測試:輸入新主題,驗證自動生成與下載功能。
案例二:Jamina 視頻生成與發布流程
描述任務:使用 Jamina 生成視頻並發布。
錄製操作:打開 Jamina -> 創建視頻 -> 輸入提示詞 -> 等待生成 -> 下載 -> 打開平台 -> 發布 -> 上傳 -> 發布。
生成 Skill:包含打開網址、創建、生成、下載、發布等步驟。
測試:輸入新話題,驗證全流程自動化。
案例三:Cloud Code 深度研究流程
描述任務:調用 Cloud Code Deep Research 進行研究。
錄製操作:打開終端 -> 啟動 Cloud Code -> 調用 Deep Research -> 輸入話題。
優化 Skill:明確啟動命令以省去授權步驟。
測試:驗證自動啟動、授權、研究完成及結果獲取。
值得注意的限制或風險
提示詞依賴性:雖然免寫複雜提示詞,但初始任務描述仍需準確,且生成的 Skill 中 Codex 可能會自動補充或優化提示詞(如案例一中 Codex 輸入的提示詞比用戶更完整精準)。
授權與權限問題:案例三中提到需要解決授權問題,若 Skill 未明確包含啟動命令或授權步驟,可能會中斷流程。
流程偏差風險:若實際操作與錄製時的環境或步驟有微小差異,Skill 可能會執行失敗,需要用戶進行二次修改(「如有偏差讓 Codex 修改 Skill」)。
時間成本:生成 Skill 需要一定的分析時間(案例一耗時約 7 分 25 秒,案例二耗時 2 分 46 秒),對於極簡單的操作可能不如手動快捷。
逐字稿辨識疑點
- Scale vs Skill:逐字稿中多次出現「做成 Scale」,隨後又說「創建 Skill」。疑點:此處「Scale」是否為「Skill」的聽寫錯誤或口誤?
- Harnessed:在案例一中,用戶輸入提示詞為「創建一份講解 Harnessed 的 PPT」。疑點:「Harnessed」是否為特定專有名詞、產品名或口誤?
- 5year AI Agent:在案例一測試中,主題為「創建 5year AI Agent 2026 年發展趨勢報告的 PPT」。疑點:「5year」是否為「5-year」或特定術語的聽寫錯誤?
- AIAgent 在 2020 年:在案例三中,輸入話題為「AI Agent 在 2020 年的發展趨勢」。疑點:考慮到影片背景可能較新,「2020 年」是否為口誤(如應為 2024 或 2025)?需查證。
- 協入:在案例三中,Codex 回復「這個技能已經明確協入」。疑點:「協入」是否為「寫入」或「嵌入」的聽寫錯誤?
- 跑片:在總結部分提到「如果有跑片的地方」。疑點:「跑片」是否為「跑偏」的聽寫錯誤?
可延伸追問
Record and Replay 插件生成的 Skill 是否支持跨瀏覽器或跨設備使用?
對於需要登錄驗證的網站,Skill 如何處理 Cookie 或登錄狀態的保持?
如果錄製過程中出現彈窗或意外錯誤,Skill 是否具備錯誤處理機制?
生成的 Skill 是否可以導出為代碼格式供開發者進一步修改?
Codex 在分析錄製內容時,對於非標準網頁元素(如動態加載內容)的識別準確度如何?
逐字稿時間軸
右側可一路往下捲;左側影片框會固定。點擊時間戳會讓左側影片跳到對應秒數。