Meng-Yuan Huang's Blog

「練功文 – 地端語音輸入 Chat GPT」

近期看到網路上 AI coding 高手能在短短幾天就做出一套大系統😲，我身為這一行的一份子，不求贏過別人，但也別輸得太多啊😅 要跟得上時代。所以我也想了一個類似的較小題目，挑戰突破自我。我的題目就是在本地端用開源的 speech to text, LLM 模型及免費的 LLM server (LM Studio) 寫一支全端 app – 語音輸入 Chat GPT. 我利用過去所研發出來的多 AI 專家代理人團隊開發我的 app，用了大約 3 個晚上，做出一個功能正常的版本，如圖。成功往 AI coding 領域跨了一步😄 原始碼：https://github.com/MrMYHuang/speak-to-llm

March 13, 2026
「AI 養蝦經驗談 – 龍蝦換地端腦成功！」

之前發現 AI 蝦 (OpenClaw) 在網路上處處碰壁，許多網站都會擋 AI 機器人。想給蝦安裝技能 (Skills)，又擔心不安全。感覺什麼都不能做，所以我一度棄養😅 但最近看到 FB 上有一些人的養蝦經驗分享，讓我又開始覺得有趣。其中一項應用就是近期流行、Anthropic, OpenAI 都在做的 – AI 操縱本機電腦。其實這本來就是 OpenClaw 的一大賣點，只是我居然忘了😅 AI 操縱電腦可做的事就不只是”操縱瀏覽器”而已，而是理論上任何軟體它都能操縱！比如它可以幫你寫 code，安裝 web server，部署你的網頁小遊戲，這比裝一些來路不明的 Skills 安全多了、也比在網路上處處受阻更有可用性。可以把它看作一個「許願池」，想要什麼它盡量幫你辦到，這讓我想重新養蝦。另外，養蝦腦 (LLM) 的飼料費 (tokens) 也不便宜，我之前大約來回對話幾小時，就花掉台幣 180 元 (MiniMax M2.5)。幸運的是最近推出的千問 Qwen3.5 開源模型夠強，可比 Sonnet 4.5，我下載了 Qwen3.5 35B A3B Q8 用 LM Stuido 在地端取代雲端的蝦腦，目前使用體驗還不錯😄 如圖，我實驗性的叫龍蝦幫我成生 PDF，它成功了。我有去查蝦的 chat log，它是自己安裝 Python 套件幫我完成工作👍 看來我可以 24 hours…

March 8, 2026
「練功文 – 偷師 AI 高手技術」

我之前寫過一篇文章分享我對現今 AI 進步的體悟與學習之道 – 「低成本的 AI 技能轉移」。今天我又想增進自己的 AI 技術，但卡關了，不知道我還能作什麼進步，就想到上網跟高手學習。我相信在這 AI 超強的時代，能輕易的複製別人的 AI 技術，只要肯學。我看了一部 AI demo 影片：https://youtu.be/6LCf5tMO3-c?si=LFG5T-dPkWxQyK0b 當中有一個 demo 讓我腦洞大開，就是講者用一張金門大橋的圖片丟給 AI 讓它生成 3D 網頁程式。這件事在之前是我想像不到的，原來還可以這樣做！我之前無法想像一些技術，是腦洞受限於我原有的知識量，當腦洞大開後，就大致知道我要如何引導 AI 做出，而且真的很簡單。我就依樣畫葫蘆，將一張金門大橋的圖丟給我本機地端架的 Qwen3.5 35B A3B 8-bit，下提示詞：use three.js to model objects in this image 不到 5 分鐘就做出一陽春版的 3D 金門大橋😆 如圖。雖然與原圖仍有不小差距，但這是用本機小模型跑的，也不能要求太多，主要是驗證我的技能複製概念可行👍 原始碼：https://github.com/MrMYHuang/3d-bridge-by-ai

March 7, 2026
「第一次當導演 – Seedance 2.0 AI 生成短片」

之前好奇現在 AI 影片生成做到多強，就看了一部在講 Seedance 2.0 的影片。那影片還教你怎麼有方法的生成影片，我也莫名其妙就學跟著學會怎麼做了😆，這真是現在 AI 太強，許多專業被降維打擊🥲 昨天想幫朋友試一下 Seedance 2.0，一時也不知下什麼提示詞，就想到那教學的幾招：先寫一段想拍影片的描述、找一張圖（可以上網找免費的），再叫 ChatGPT 幫你寫分鏡。如下連結所示：https://chatgpt.com/share/699ed013-2274-800f-a55e-cbb2f5a3b3ab 然後再到即夢 AI 用 Seedance 2.0 輸入分鏡詞與圖片，然後送出，生成！一次最多 15 秒。（但我是用限時免費的 1 次生成機會，沒付費訂閱🙂）以下是我的作品😆 果然不是專業的，還有地方要改善。

February 25, 2026
「我也開缸養龍蝦了，AI 助理 – OpenClaw」

近期爆紅一陣子的個人 AI 助理軟體 – OpenClaw （中文圈稱之”龍蝦”），在朋友的慫恿下，我也開缸養了一隻😆 如圖所示。本來怕有安全疑慮，一直不敢嘗試。但看到 YouTube 上的分享，有人養得出神入化，相當於僱用了一個每天 24 小時幫他在工作的員工 (只不過不是人，是 AI)，我也想試試看能不能一樣厲害。在安全性的部分，我想到可以開一個虛擬機器 (VM)，讓龍蝦在其中跑。另一方面也是實驗性質，等我確認 OpenClaw 真的對我實用，再考慮入手雲端主機或樹莓派開發板來養龍蝦。模型我用的是朋友推薦的 MiniMax M2.5 （雲端付費），目前只儲值最小金額 – 美金 25 元。玩了半天下來，我發現其實龍蝦的知識坑、技術坑或限制也不少，目前安裝還是需要一點軟體設定技術。限制的部分則遇到許多網站為了避免被 AI 機器人抓資料，導致沒有廣告效益，會用許多技術擋 AI 機器人，甚至可能會 ban 使用者的帳號，所以用龍蝦操控瀏覽器的體驗不是很順暢。安全問題的坑，則要避免自己的龍蝦外出時被綁架😅 ，像近期有一些人給他的龍蝦開 Threads 帳號發文，但被人用回文內含”提示詞”的方式綁架。所以我也不敢亂開 APIs 或帳號權限給我的龍蝦使用。導致它目前很多事都不能做😅 使用龍蝦有一重要功能 – 為龍蝦安裝新技能 (agent skills)，讓牠能做更多種事。OpenClaw 官網的 skills 是開放大家上傳分享技能，但是否安全就不一定了，連龍蝦之父自己的 skills 都有被標示”可疑”😅 這也是一個安全問題的坑。我目前的作法是：保守一點，先別輕舉妄動、開太多權限給龍蝦。等研究更多人的龍蝦用法，並確認安全、好用，再開權限試試看。

February 21, 2026
「AI 時代，未來人類的新工作方式！？」

軟體 AI 時代已來臨，也許會如一些人預言再 1、2 年，軟體工作會被 AI 全面取代。但硬體的工作可能也不太樂觀，現在機器人、機器狗、無人機、無人車都做到這麼厲害，有些人也預言硬體的工作會晚幾年被硬體 AI 取代😅滿多人對未來持悲觀態度，覺得人類要失業了、沒法賺錢。雖然有些人對 AI 進步持樂觀態度，認為人類以後不需要工作了，可以享樂了。但悲觀的人還是認為”沒錢”怎麼享樂！？我之前也是屬於悲觀派，想不出”無法賺錢”的解套方法。但我今天在 YouTube 看到一部講 AI 機器人的喜劇小品，演員開頭的幾句台詞讓我很有啟發：https://youtu.be/3JLk0CFi6Xk?si=l8oPFAVJwZwDO8hG這小品有一句講到「它們（AI 機器人）負責掙錢養家」點醒我，的確 AI 時代很多事情都被巔覆了：看網頁的、寫文章的、寫 code 的、寫新聞的、電話客服的、訂餐廳的、…都快要不是人類了、是 AI。那麼為何「工作賺錢」這件事不能是 AI 來做呢？比如說機器人每天早上出門上班，下班回家充電。人類在家享樂！？😆另外，其實現在就有軟體 AI 在幫人類賺錢了，就是軟體的 agentic AI，將 AI 導入軟體的工作流中，所以說「用 AI 來賺錢」這件事可說是進行式。也就是，很可能未來人類各家各戶要工作賺錢，就是去買一台機器人，讓它去工作。所以理想來看，即便所有人類工作都被 AI 取代，人類還是有辦法賺錢的😅 不過還是要看資本家能不能將財富回饋社會，不然資本家要跟一般人拼機器人數量，那還是輾壓式勝利、社會貧富不均！

February 20, 2026
「練功文 – AI 時代典範轉移 (Paradigm Shift) 案例」

我有業餘經營 YouTube 頻道，之前教過寫程式、串珠，近期轉型 Vlog 拍攝騎車的 360 度全景影片。（內容跨度好像頗大的😅）https://www.youtube.com/@mrmyh 今天我的頻道有一位觀眾給我的騎車影片好評，並在我影片描述提到”甚至 VR 眼鏡”效果會更好一事，表示他因此想買 VR 眼鏡。但我忽然想起，之前就有人回饋我說用 VR 眼鏡看騎車影片會頭暈，我查了一下似乎是有科學依據！我自己沒試過，卻叫人試試看，甚至可能要花不少錢買一台 VR 眼鏡後來發現不好用！？😱 所以我趕緊回覆觀眾要三思。事情到此還沒結束。這段文字 “甚至 VR 眼鏡” 我一直以來都是複製、貼上到我每個新發的影片，在不同影音平台共有 42 支。這有些誤導人的訊息若不刪除，會繼續造成影響。但要處理 42 支影片，我就必需反覆點開每支影片、修改描述、存檔，用想的就很累，有些人遇到這情形可能就放棄了！但我想起現在是 AI 時代，有 AI 能幫我們做事，應該不難。我就用 Codex + GPT-5.3-Codex + Playwright MCP 組合，讓 AI 操縱瀏覽器去改這 42 支影片。提示詞如下：1. Open this url: https://xxx.example.com2. for each item of video list, do:2.1 click…

February 20, 2026
「練功文 – 使用多 AI Agents 打造一人軟體公司」

我上一篇文提到，我在試近期新出的 AI 科技 – multi AI agents，就是能一次叫出多個 AI agents 組一個專業軟體科技團隊，幫我寫 app:https://www.facebook.com/share/p/1GTNHtN1YA/ 我試著寫出一支 app，當時我以為的身分是 team leader，負責指揮各軟體專家做事。不過事後，我發現我在做的事只是把 app 需求 (requirements)、部分技術規格 (specifications) 丟給 AI，讓它們自行發揮😅 所以我的身分比較像”客戶、業務及一小部分技術 leader”，如果再加上”出錢使用 AI”（雖然目前還在用免費試用😅），也就是”老闆”的身份，那我差不多是在開一家公司😆，可能改天有能力再把 product manager 也加進來吧。我復盤了上一篇的使用 AI 軟體團隊練功文，發現有一些改善的地方。原先我以為要呼叫 agent 當中的指揮者 – gem-orchestrator 幫我指揮它的 AI 團隊、並列給它可用的成員。後來 debug 發現，根本沒呼叫到它，而是 AI 模型自己做指揮者，指揮多 AI subagents。雖然有生出可用的東西，但提示詞並不是最精簡的。後來我再研究正確的啟動 orchestrator agent 及團隊 subagents 的做法，題示詞精簡了許多。我又重新跑了一次，同時也額外加入更多要求 end-to-end tests, docker compose validation. 我重跑這次改用…

February 19, 2026
「練功文 – AI 時代當一回無腦指揮家 (Orchestrator)」

今日我又嘗試突破自己在 AI 時代的技能 – AI 代理人指揮家 (orchestrator). 這項技能大約在 3 個月前還是一項獨家研發、付費傳授，如今 AI 進步後，連我這沒上過課的都能上網查查提示詞，無腦啟動！那「AI 代理人指揮家」技能到底在做什麼？以軟體工程來說，傳統上一個團隊會有一個領導者/指揮家 (leader / orchestrator)，團隊中會有多個受指揮的專業成員分別負責不同專業任務，如研究者、計劃者、實作者、測試者、審查者、維運者，甚至可以讓他們同時進行工作，加快開發流程。至於更多的細節我就不多著墨，畢竟自己過去專業並非指揮家，多講多錯😆 然而近期的 AI coding agent 工具已開發、實作出以上這種團隊概念，只要付一些訂閱費，人人都能成為團隊指揮家，一次指揮多個人（我用了 8 個）同時做事！這項指揮的技術有幾個不同名詞: Subagents (GitHub Copilot), Agent Teams (Claude). 我用的是 GitHub Copilot + GPT-5.3-Codex. 我的作法超簡單、無腦。首先我大略研究了一下文章 – subagents 要如何呼叫、如何並行執行：https://code.visualstudio.com/docs/copilot/agents/subagents#_orchestration-patterns將關鍵提示詞 “subagent, parallel” 抄下來。第二步，將別人寫好的專家 agents 整組拿來用，如 gem 系列的 agents:https://github.com/github/awesome-copilot/tree/main/agents 第三步，寫提示詞。我想做一支筆記程式，我把想要的功能、UI, 軟體工程技術全列上去。再把所有 gem 系列的 subagents 也全列上去，指示要並行執行…

February 18, 2026
「當今超強的資訊變形金剛 – Transformer AI」

現今大語言模型能做的轉換 (transform) 真是一再突破我的腦容量，很多以前我覺得辦不到的事，現在都辦得到了。Transformer 這個詞取得真洽當。我以前很難想像一個純文字的程式碼，能轉出流程圖、架構圖、投影片…等，現在透過 AI 都能辦到了。而且這轉換還不限單向，反過來做也可以。我發明一個名詞，稱這種轉換為「異質轉換」，就是用異質的功能使用相同的(全部或部分)資訊。把握這個「異質轉換」的精髓，並了解現今 AI 能把這項任務做得很好，你就能開發出驚人轉換「魔術」。像我最近做過 2 件有意思的事：1. 我以前在 AWS 雲端有手工架了一個服務 – lambda function，我要上傳我的程式碼給它。但每次要更新程式碼，我就要從網頁登入、輸入帳密、… 做很多步驟，很繁瑣也易錯。因此我直接將該 lambda function 的網址丟給 AI (GPT-5.3-Codex)，要它幫我生成一鍵部署的指令檔，就順利完成了！我知道它辦得到這件事，因為網址中有足夠的資訊讓它萃取，寫出正確開箱即用的程式碼。就是這麼簡單。這是我以前不能想像的，一串網址與幾個題示詞能轉出一支開箱即用的指令程式。 2. 我的 app 原本架設在 AWS 雲端的東京區，但我的 app 使用者大多台灣人。為了使雲端連線速度更快，我最近想遷移我的雲端服務到台灣。但很麻煩，因為當初在東京的雲端服務，是我花時間、手工一步步打造的且 AWS 也沒提供無痛轉移工具，我難道要在台灣的雲端再來一遍手工打造嗎？而且手工打造容易疏漏，少設定某些東西。這時我又想到 AI，我叫 AI (GPT-5.3-Codex) 把我第 1 點所生成的指令檔轉成 Terraform (一種雲端基礎建設部署的程式碼)，才 2 分鐘就生成出來，我只要改幾個設定，用 terraform 部署，可能不到幾小時就成功了！奇怪？我第 1 點生成的指令檔明明是給部署 app 用的，不是部署雲端基礎建設 (infrastructure) 用的，怎麼也能轉😱😆 現在 AI 真的超強👍…

February 16, 2026