Meng-Yuan Huang's Blog

Category: Uncategorized

「練功文 – 開發 AI Agent」

有人說 2026 年是 AI agent 年，各行各業都在導入 AI agents. 趁著這趨勢，我也想跟上時代，做幾個 AI agents 讓自己履歷更漂亮。這時代要「高效使用 AI」，我總結一個重要心法：「困難的事，都先交給 AI.」因為 AI 可能會有很好的答案。但如果 AI 沒有好答案，花下去的時間、金錢成本也不太高。我這次開發了一支 AI agent – sv-repair-agent，就是靠 AI 給我建議，加上一些我的想法、生成提示詞、再生成程式碼。從點子發想到實現成品，所花的時間不超過 24 小時。這個作品在做一款 CLI AI agent，可讀入語法有錯的 SystemVerilog 檔，再用 SystemVerilog linter – verilator 作語法檢查，若有錯誤則將訊息交給 Pi coding agent 作語法修復，此檢查/修復 loop 可迭代多次。Pi coding agent 可連本地端 LLM provider。其實原本 AI 給了許多點子，我挑了一個簡單的來做。不過能在履歷添上一筆，CP 值還滿高的😆…

May 17, 2026
「練功文 – 再嘗試用 AI 開火箭寫程式」

我上次分享了一招這個時代如何用 AI 輔助快速寫出升維打擊的程式，也就是利用 AI 快速提升自己能力的維度，做出高品質的程式。這招的心法（看到賺到👍）：先把需求用 AI 生成高品質的 AI coding agent 提示詞、作 review，再把提示詞丟給 AI coding agent 執行。簡單的說，連寫提示詞的工作都被 AI 取代😆 這招心法與我之前看某 YouTuber 教的，如何在這時代做個 AI 導演的心法如出一轍，只不過一個是生成程式、一個是生成影片。昨天我又想到一個之前做過的 AI app 題目 – retrival augmented generation (RAG). 雖然是有一點舊的題目，但我仍覺得它很值得鑽研的應用。因為現今的 LLM AI 模型愈來愈強，能做愈來愈多事，那人的工作價值就相對被壓縮，簡單的說：AI 取代人類🥲😅 那人類（正確來說是前沿 LLM AI 公司以外的人）還有什麼可以玩呢？LLM AI 強在它學過的東西做得比人又快又好。反過來說它沒學過的東西，就是人類還可以玩的，所以封閉的資料（如一家公司的內部資料），就很適合拿來開發 AI 應用。但要自己訓練 LLM AI 模型沒幾個人玩得起，因此 RAG 就是一個好用、不必訓練模型的技術，用來生成封閉領域的資料。我之前做的 RAG app 有些簡陋，用的是靜態…

May 9, 2026
「用 AI 降維打擊生成有質感前端設計」

平時在網路上看了不少高手能用 AI 快速生成精美的前端網頁設計，我愈看愈心癢 – 別人寫程式都在開火箭，我怎能停留在石器時代😅 但想進步，需要門路。好在我看多了文章，有些人會稍微透露一點技巧，再加上自身累積的經驗，能猜出個大概。我最近領悟一個用 AI 降維打擊的技巧，能讓自己使用 AI 的產出得到巨大提升：你覺得對自己很難、做不到的事，直接問 AI 怎麼做！(我想這大概是因為這些 AI 模型的訓練資料大部分用的是較為通用、精美的資料，所以當你向 AI 詢求建議，它往往會給出較常用、精美的資料。) 比如我雖然會寫程式，但前端 UI 美術設計沒有天份，常常只做得出能用的介面，但也常被人覺得醜。甚至到了 AI 時代，我寫出的 UI 還是醜，所以 UI 設計對我來說還真難😅 我不懂怎麼下提示詞能做出精美的 UI。這個難題就很適合用 AI 幫我提升能力的維度。我昨天就決定要驗證以上方法，用 AI 做一款精美的前端網頁 app。我想了一個題目：可愛貼紙線上商店 app但我不知道要怎麼下提示詞生成精美 UI 的 app，所以我就請 ChatGPT 幫我生成給 AI coding agent 使用的提示詞，如下：“I want to design an online cute sticker shopping frontend only website.…

May 5, 2026
「AI 養蝦文 – 現今地端龍蝦的定位」

最近又在研究在本地端使用開源模型 (Qwen3.5 35B A3B) 測試龍蝦（OpenClaw）的能力。首先我們知道龍蝦的能力主要決定於它的蝦腦 – LLM，若不了解 LLM 本身的特性而想做出超出它的能力，就會事與願違。LLM 其中一重要特性就是「參數量」，它一部分可類比「訓練所學習的知識量」（最近的研究還顯示可類比人類「情緒」）。我發現地端 35B 的知識量有些不符我原先的期待，比如我問龍蝦「某飯店附近有什麼好玩的？」，它卻回我另一縣市的某地有什麼東西，幻覺嚴重😅 後來我叫龍蝦上網搜尋，得到的資訊就正確許多。這些實驗才讓我想起：不要寄望僅 35B 的模型就能包含了世界的大部分資訊！以現今的 AI 技術來講，LLM 的強項在於：它對學習過的知識處理的比人又快又好。但這也是它的弱項：它對未學習過的知識，特別是未來的新知，容易出現幻覺。我認為除非 AI 技術突破，能用公式化的推理、預測未來的新知，就可能將未來的海量知識壓縮成只剩少量參數的「公式」。或許到那時僅 35B 的參數就能解答世界絕大多數的知識也不一定！？（做個白日夢）😅 回到現在，以我的經驗，35B 的知識量，不足以處理一般人日常生活的問題。但可透過 RAG 的技術，例如搜尋網路知識，補足知識不足的問題。所以最近許多人開始認識到，在地端要跑一個「知識」量足夠、大參數量 LLM 是困難的（受限硬體效能）。退而求其次的作法是跑一個少參數，但能做對事、「方法」正確的 LLM。總結來說，現今雲端能跑大參數 LLM 是「知識與方法」皆強大。而地端適合跑小參數 LLM，「方法」的強大會比「知識」重要，也因此它的用法會更重於「用方法取得額外新知」或「用方法正確處理任務（如工作流）」，有別於使用大參數 LLM 那種較無腦的用法。 (若未來硬體科技突破，地端也適合跑大參數 LLM，那以上問題就不存在😆)

April 4, 2026
「養蝦文 – 升速的 AI 蝦腦」

昨天在逛 X.com 滑到一篇在講 oMLX 的地端 LLM 推論工具，說它速度比 LM Stuido 快。我好奇就來試了一下，嚇一跳。原本用 Qwen3.5 35B A3B 8 bits + LM Studio 寫一支貪食蛇約 25 分鐘，改用 oMLX 只要 7 分鐘，快了 3 倍多！而且我還查到 oMLX 支援批次推論，有些情況下能提升 4 倍 token 速度。這讓我想嘗試一邊用 Roo Code 寫 code，一邊叫龍蝦幫我做事，實測真的可行。 oMLX 帶來的龍蝦速度提升非常有感。以前丟一句話給龍蝦，就要等 1-2 分鐘才有結果。現在丟一句話，快的話大概不到 10 秒就收到龍蝦回應。這種倍速的提升，也打破我之前因為地端龍蝦跑太慢，而㧪殺了許多的嘗試，正所謂貧窮限制了想像。像我這 1、2 天就做了許多嘗試：抓新聞、問時事、找活動資訊、啟用第 2 支龍蝦，作 multi agents，一隻在寫 code 時，另一隻在抓新聞。我還幫龍蝦申請了專用 Google…

March 29, 2026
「AI 將軟體工程成為”心想事成”的時代！？」

我從去年 10 月全力投入 AI 領域的研究，至今約半年。會有這種動力持續研究、進步，除了是自己的興趣與工作，另一方面也很大的成份是「危機感」😅 不努力不行啊！別人都在開火箭，我豈能用腳踏車追？所以有時間我就想辦法突破自己能力的極限，找題目給自己做。最近看到別人的一些作品，有了一些靈感。我想把之前做的 speak-to-llm app 再做更大的工程：加入可觀測性 (observability)。會想做這個題目是因為實務上 LLM apps 會依 token 使用量計價，所以它是一個很有意義的度量 (metrics)，所以我想為我的 app 加上一個儀表板 (dashboard) 能即時看到 tokens 的使用量。不過我不想重刻一個儀表板，而是用我之前學過的知名儀表板工具 – Grafana，再搭配 metrics 收集工具 Prometheus. 我寫了 300 多個字元的提示詞，用 GPT-5.4 修改，就改出來了！細節我有些忘了。故事還沒結束，我今天又在練功，再加碼：加入事件串流服務 – Kafka. 就是將後端程式的 token 事件訊息作 2 種應用：1. 原本的即時儀表板顯示。2. 事件訊息記錄 (logging) 至 PostgreSQL DB.Kafka 很適合處理這種不同速率資料流。我也是用 GPT-5.4 作修改，寫了 340 多個字元提示詞，只跟 AI…

March 21, 2026
「練功文 – 地端語音輸入 Chat GPT」

近期看到網路上 AI coding 高手能在短短幾天就做出一套大系統😲，我身為這一行的一份子，不求贏過別人，但也別輸得太多啊😅 要跟得上時代。所以我也想了一個類似的較小題目，挑戰突破自我。我的題目就是在本地端用開源的 speech to text, LLM 模型及免費的 LLM server (LM Studio) 寫一支全端 app – 語音輸入 Chat GPT. 我利用過去所研發出來的多 AI 專家代理人團隊開發我的 app，用了大約 3 個晚上，做出一個功能正常的版本，如圖。成功往 AI coding 領域跨了一步😄 原始碼：https://github.com/MrMYHuang/speak-to-llm

March 13, 2026
「AI 養蝦經驗談 – 龍蝦換地端腦成功！」

之前發現 AI 蝦 (OpenClaw) 在網路上處處碰壁，許多網站都會擋 AI 機器人。想給蝦安裝技能 (Skills)，又擔心不安全。感覺什麼都不能做，所以我一度棄養😅 但最近看到 FB 上有一些人的養蝦經驗分享，讓我又開始覺得有趣。其中一項應用就是近期流行、Anthropic, OpenAI 都在做的 – AI 操縱本機電腦。其實這本來就是 OpenClaw 的一大賣點，只是我居然忘了😅 AI 操縱電腦可做的事就不只是”操縱瀏覽器”而已，而是理論上任何軟體它都能操縱！比如它可以幫你寫 code，安裝 web server，部署你的網頁小遊戲，這比裝一些來路不明的 Skills 安全多了、也比在網路上處處受阻更有可用性。可以把它看作一個「許願池」，想要什麼它盡量幫你辦到，這讓我想重新養蝦。另外，養蝦腦 (LLM) 的飼料費 (tokens) 也不便宜，我之前大約來回對話幾小時，就花掉台幣 180 元 (MiniMax M2.5)。幸運的是最近推出的千問 Qwen3.5 開源模型夠強，可比 Sonnet 4.5，我下載了 Qwen3.5 35B A3B Q8 用 LM Stuido 在地端取代雲端的蝦腦，目前使用體驗還不錯😄 如圖，我實驗性的叫龍蝦幫我成生 PDF，它成功了。我有去查蝦的 chat log，它是自己安裝 Python 套件幫我完成工作👍 看來我可以 24 hours…

March 8, 2026
「練功文 – 偷師 AI 高手技術」

我之前寫過一篇文章分享我對現今 AI 進步的體悟與學習之道 – 「低成本的 AI 技能轉移」。今天我又想增進自己的 AI 技術，但卡關了，不知道我還能作什麼進步，就想到上網跟高手學習。我相信在這 AI 超強的時代，能輕易的複製別人的 AI 技術，只要肯學。我看了一部 AI demo 影片：https://youtu.be/6LCf5tMO3-c?si=LFG5T-dPkWxQyK0b 當中有一個 demo 讓我腦洞大開，就是講者用一張金門大橋的圖片丟給 AI 讓它生成 3D 網頁程式。這件事在之前是我想像不到的，原來還可以這樣做！我之前無法想像一些技術，是腦洞受限於我原有的知識量，當腦洞大開後，就大致知道我要如何引導 AI 做出，而且真的很簡單。我就依樣畫葫蘆，將一張金門大橋的圖丟給我本機地端架的 Qwen3.5 35B A3B 8-bit，下提示詞：use three.js to model objects in this image 不到 5 分鐘就做出一陽春版的 3D 金門大橋😆 如圖。雖然與原圖仍有不小差距，但這是用本機小模型跑的，也不能要求太多，主要是驗證我的技能複製概念可行👍 原始碼：https://github.com/MrMYHuang/3d-bridge-by-ai

March 7, 2026
「第一次當導演 – Seedance 2.0 AI 生成短片」

之前好奇現在 AI 影片生成做到多強，就看了一部在講 Seedance 2.0 的影片。那影片還教你怎麼有方法的生成影片，我也莫名其妙就學跟著學會怎麼做了😆，這真是現在 AI 太強，許多專業被降維打擊🥲 昨天想幫朋友試一下 Seedance 2.0，一時也不知下什麼提示詞，就想到那教學的幾招：先寫一段想拍影片的描述、找一張圖（可以上網找免費的），再叫 ChatGPT 幫你寫分鏡。如下連結所示：https://chatgpt.com/share/699ed013-2274-800f-a55e-cbb2f5a3b3ab 然後再到即夢 AI 用 Seedance 2.0 輸入分鏡詞與圖片，然後送出，生成！一次最多 15 秒。（但我是用限時免費的 1 次生成機會，沒付費訂閱🙂）以下是我的作品😆 果然不是專業的，還有地方要改善。

February 25, 2026