「AI 技術學習心得 – Agent Skills」


最近開始上班後,還真的比較沒以前有「腦力」學習 AI 的新技術。即便下班後有時間,想學習 AI 新知,也很容易就用腦過度、頭昏,學不下去😅 但我那怕被 AI 技術淘汰的心,讓我有機會就去多學一點 AI 新知。

今天又學懂一項近期熱門的 AI 新技術 – Agent Skills🙂 它是 Anthropic 公司在 2 個月前提出的技術,最近 OpenAI 也支援了,看來是一項重要技術,才會被廣泛支援。

有在學習 AI 新技術的人,可能會遇到被一堆很相似但不同的名詞弄得一團亂,如 tool calling, MCP, multi AI agents, … 現在又多了一個 agent skills😅

Agent skills 是什麼?我想到一個好懂的類比:過去我們在用「程式語言」寫程式時,會將重複的程式碼片段做成一可重複呼叫的「函式 (function)」,這寫過程式的人應該都知道吧😆 然而在大語言模型 (LLM) 的抽象層級,「程式」是用「自然語言」而不是較低層的「程式語言」寫出來的!Agent skills 的一重要精神就是它是自然語言層級的可重複呼叫的「函式」,正式名稱是 “skill.”

Skill 就是用自然語言寫出的一段可重複使用的工作任務/函式。比如你可以寫一個 ppt skill,內容是用 Markdown 純文字格式寫一段給 LLM 看的提示詞,比如指導 LLM agent 要如何產生 PPT 簡報、字型、顏色、…。當你呼叫 ppt skill 並加上額外的提示詞輸入,比如要生成一分「水循環的簡報」,LLM agent 就會基於 ppt skill 的提示詞的簡報要求,生成「水循環的簡報」。

Agent skills 其實還有一個 context window 佔用的優化,這也能用「自然語言的函式」作解釋:函式具有「資訊打包、隱藏」的特性,所以 agent 可以先不載入完整 skill 提示詞,判斷此次任務需要用哪些 skills,再完整載入需要用的 skills 提示詞,以避免不必要的佔用 context window。


Leave a Reply