最近聽到一名詞 agentic AI (代理式 AI),之前我也有耳聞這名詞,但當時 AI 知識還太菜,搞不懂一堆 AI 名詞。直到最近愈了解 AI 技術,才懂這名詞的亮點。
這時就要介紹另一較舊的技術 generative AI (生成式 AI),它主要目的是作內容生成,包括知名的 ChatGPT (文字)、Nano Banana (圖片)、Veo (影片)…
而 agentic AI 能做的不只是內容生成,它還具有工具調用 (tool calling)、工作流執行 (workflow)。例如 n8n 就是一款爆紅的方塊圖 AI 工作流開發工具,能製作 agentic AI 的應用,比如寫一支 AI 代理人,每天定時幫你上網抓新聞、做總結,再寄到你的 Telegram.
而 LangChain 則是一款 Python agentic AI 軟體框架,無須架設 n8n 就能串聯 LLM,做 agentic AI. 無論是 n8n, LangChain 都使你能打造自己的 AI 代理人。
在這 AI 時代,我也想跟上時代,就試著開發一個 AI agent 吧!😆我想到我有一件無趣,又得常常去執行的事,就交給 AI agent:我有時會在我的 YouTube 頻道上傳 8K 360 全景影片。但 YouTube 不會通知我的影片上傳後,是否處理完 8K 畫質,導致我要三不五時開網頁去檢查我的影片是否出現 8K 的選項。所以我就把這個問題作為開發 agentic AI 的練習題吧。
趁著最近 OpenAI Codex app 有 2 個月限免,我就用它來幫我寫 code,我沒做什麼軟體工程的規劃,使用 vibe coding 的方式下題示詞作開發。我用這個題示詞作為開發的起頭:
write an ai agent in langchain. the agent uses llm from local ollama. the agent runs a task at 6:30 am everyday or triggered manually by restful api. the task is:
1. open url https://studio.youtube.com/channel/XXXXXXX
2. find the first private video
3. open the video on youtube
4. click the setting button
5. click the quality item
6. check if there is 8k resolution, or not.
7. send the video name, url, and 8k resolution status info to telegram
後續又再下了幾個提示詞,大約只花了幾個小時,最終改出符合我要求的 AI agent😆成功解鎖用 vibe coding 的方式開發 agentic AI!
原始碼:
https://github.com/MrMYHuang/youtube-check-8k-agent
更新:後來想想我這個自動化工作並不需要 AI 參與到工作流中,因為我只要用現有的非 AI 工具(瀏覽器操作、程式呼叫 Telegram APIs)就能達成😅 加入 LLM AI 到工作流,頂多只利用 LLM 作訊息生成,而我的訊息也沒太多內容需要 LLM 處理。雖 AI 在我的程式中實用性不足,但這次的開發是一個很好的 vibe coding, agentic AI, local AI 的經驗。