-
「練功文 – 再嘗試用 AI 開火箭寫程式」
我上次分享了一招這個時代如何用 AI 輔助快速寫出升維打擊的程式,也就是利用 AI 快速提升自己能力的維度,做出高品質的程式。 這招的心法(看到賺到👍):先把需求用 AI 生成高品質的 AI coding agent 提示詞、作 review,再把提示詞丟給 AI coding agent 執行。簡單的說,連寫提示詞的工作都被 AI 取代😆 這招心法與我之前看某 YouTuber 教的,如何在這時代做個 AI 導演的心法如出一轍,只不過一個是生成程式、一個是生成影片。 昨天我又想到一個之前做過的 AI app 題目 – retrival augmented generation (RAG). 雖然是有一點舊的題目,但我仍覺得它很值得鑽研的應用。因為現今的 LLM AI 模型愈來愈強,能做愈來愈多事,那人的工作價值就相對被壓縮,簡單的說:AI 取代人類🥲😅 那人類(正確來說是前沿 LLM AI 公司以外的人)還有什麼可以玩呢?LLM AI 強在它學過的東西做得比人又快又好。反過來說它沒學過的東西,就是人類還可以玩的,所以封閉的資料(如一家公司的內部資料),就很適合拿來開發 AI 應用。但要自己訓練 LLM AI 模型沒幾個人玩得起,因此 RAG 就是一個好用、不必訓練模型的技術,用來生成封閉領域的資料。 我之前做的 RAG app 有些簡陋,用的是靜態…
-
「用 AI 降維打擊生成有質感前端設計」
平時在網路上看了不少高手能用 AI 快速生成精美的前端網頁設計,我愈看愈心癢 – 別人寫程式都在開火箭,我怎能停留在石器時代😅 但想進步,需要門路。好在我看多了文章,有些人會稍微透露一點技巧,再加上自身累積的經驗,能猜出個大概。 我最近領悟一個用 AI 降維打擊的技巧,能讓自己使用 AI 的產出得到巨大提升:你覺得對自己很難、做不到的事,直接問 AI 怎麼做!(我想這大概是因為這些 AI 模型的訓練資料大部分用的是較為通用、精美的資料,所以當你向 AI 詢求建議,它往往會給出較常用、精美的資料。) 比如我雖然會寫程式,但前端 UI 美術設計沒有天份,常常只做得出能用的介面,但也常被人覺得醜。甚至到了 AI 時代,我寫出的 UI 還是醜,所以 UI 設計對我來說還真難😅 我不懂怎麼下提示詞能做出精美的 UI。這個難題就很適合用 AI 幫我提升能力的維度。 我昨天就決定要驗證以上方法,用 AI 做一款精美的前端網頁 app。我想了一個題目:可愛貼紙線上商店 app但我不知道要怎麼下提示詞生成精美 UI 的 app,所以我就請 ChatGPT 幫我生成給 AI coding agent 使用的提示詞,如下:“I want to design an online cute sticker shopping frontend only website.…
-
「AI 養蝦文 – 現今地端龍蝦的定位」
最近又在研究在本地端使用開源模型 (Qwen3.5 35B A3B) 測試龍蝦 (OpenClaw) 的能力。 首先我們知道龍蝦的能力主要決定於它的蝦腦 – LLM,若不了解 LLM 本身的特性而想做出超出它的能力,就會事與願違。LLM 其中一重要特性就是「參數量」,它一部分可類比「訓練所學習的知識量」(最近的研究還顯示可類比人類「情緒」)。 我發現地端 35B 的知識量有些不符我原先的期待,比如我問龍蝦「某飯店附近有什麼好玩的?」,它卻回我另一縣市的某地有什麼東西,幻覺嚴重😅 後來我叫龍蝦上網搜尋,得到的資訊就正確許多。這些實驗才讓我想起:不要寄望僅 35B 的模型就能包含了世界的大部分資訊! 以現今的 AI 技術來講,LLM 的強項在於:它對學習過的知識處理的比人又快又好。但這也是它的弱項:它對未學習過的知識,特別是未來的新知,容易出現幻覺。我認為除非 AI 技術突破,能用公式化的推理、預測未來的新知,就可能將未來的海量知識壓縮成只剩少量參數的「公式」。或許到那時僅 35B 的參數就能解答世界絕大多數的知識也不一定!?(做個白日夢)😅 回到現在,以我的經驗,35B 的知識量,不足以處理一般人日常生活的問題。但可透過 RAG 的技術,例如搜尋網路知識,補足知識不足的問題。所以最近許多人開始認識到,在地端要跑一個「知識」量足夠、大參數量 LLM 是困難的(受限硬體效能)。退而求其次的作法是跑一個少參數,但能做對事、「方法」正確的 LLM。 總結來說,現今雲端能跑大參數 LLM 是「知識與方法」皆強大。而地端適合跑小參數 LLM,「方法」的強大會比「知識」重要,也因此它的用法會更重於「用方法取得額外新知」或「用方法正確處理任務(如工作流)」,有別於使用大參數 LLM 那種較無腦的用法。 (若未來硬體科技突破,地端也適合跑大參數 LLM,那以上問題就不存在😆)
-
「養蝦文 – 升速的 AI 蝦腦」
昨天在逛 X.com 滑到一篇在講 oMLX 的地端 LLM 推論工具,說它速度比 LM Stuido 快。 我好奇就來試了一下,嚇一跳。原本用 Qwen3.5 35B A3B 8 bits + LM Studio 寫一支貪食蛇約 25 分鐘,改用 oMLX 只要 7 分鐘,快了 3 倍多!而且我還查到 oMLX 支援批次推論,有些情況下能提升 4 倍 token 速度。這讓我想嘗試一邊用 Roo Code 寫 code,一邊叫龍蝦幫我做事,實測真的可行。 oMLX 帶來的龍蝦速度提升非常有感。以前丟一句話給龍蝦,就要等 1-2 分鐘才有結果。現在丟一句話,快的話大概不到 10 秒就收到龍蝦回應。 這種倍速的提升,也打破我之前因為地端龍蝦跑太慢,而㧪殺了許多的嘗試,正所謂貧窮限制了想像。像我這 1、2 天就做了許多嘗試:抓新聞、問時事、找活動資訊、啟用第 2 支龍蝦,作 multi agents,一隻在寫 code 時,另一隻在抓新聞。 我還幫龍蝦申請了專用 Google…
-
「AI 將軟體工程成為”心想事成”的時代!?」
我從去年 10 月全力投入 AI 領域的研究,至今約半年。會有這種動力持續研究、進步,除了是自己的興趣與工作,另一方面也很大的成份是「危機感」😅 不努力不行啊!別人都在開火箭,我豈能用腳踏車追?所以有時間我就想辦法突破自己能力的極限,找題目給自己做。 最近看到別人的一些作品,有了一些靈感。我想把之前做的 speak-to-llm app 再做更大的工程:加入可觀測性 (observability)。 會想做這個題目是因為實務上 LLM apps 會依 token 使用量計價,所以它是一個很有意義的度量 (metrics),所以我想為我的 app 加上一個儀表板 (dashboard) 能即時看到 tokens 的使用量。不過我不想重刻一個儀表板,而是用我之前學過的知名儀表板工具 – Grafana,再搭配 metrics 收集工具 Prometheus. 我寫了 300 多個字元的提示詞,用 GPT-5.4 修改,就改出來了!細節我有些忘了。 故事還沒結束,我今天又在練功,再加碼:加入事件串流服務 – Kafka. 就是將後端程式的 token 事件訊息作 2 種應用:1. 原本的即時儀表板顯示。2. 事件訊息記錄 (logging) 至 PostgreSQL DB.Kafka 很適合處理這種不同速率資料流。 我也是用 GPT-5.4 作修改,寫了 340 多個字元提示詞,只跟 AI…
-
「練功文 – 地端語音輸入 Chat GPT」
近期看到網路上 AI coding 高手能在短短幾天就做出一套大系統😲,我身為這一行的一份子,不求贏過別人,但也別輸得太多啊😅 要跟得上時代。 所以我也想了一個類似的較小題目,挑戰突破自我。我的題目就是在本地端用開源的 speech to text, LLM 模型及免費的 LLM server (LM Studio) 寫一支全端 app – 語音輸入 Chat GPT. 我利用過去所研發出來的多 AI 專家代理人團隊開發我的 app,用了大約 3 個晚上,做出一個功能正常的版本,如圖。 成功往 AI coding 領域跨了一步😄 原始碼:https://github.com/MrMYHuang/speak-to-llm
-
「AI 養蝦經驗談 – 龍蝦換地端腦成功!」
之前發現 AI 蝦 (OpenClaw) 在網路上處處碰壁,許多網站都會擋 AI 機器人。想給蝦安裝技能 (Skills),又擔心不安全。感覺什麼都不能做,所以我一度棄養😅 但最近看到 FB 上有一些人的養蝦經驗分享,讓我又開始覺得有趣。其中一項應用就是近期流行、Anthropic, OpenAI 都在做的 – AI 操縱本機電腦。其實這本來就是 OpenClaw 的一大賣點,只是我居然忘了😅 AI 操縱電腦可做的事就不只是”操縱瀏覽器”而已,而是理論上任何軟體它都能操縱!比如它可以幫你寫 code,安裝 web server,部署你的網頁小遊戲,這比裝一些來路不明的 Skills 安全多了、也比在網路上處處受阻更有可用性。可以把它看作一個「許願池」,想要什麼它盡量幫你辦到,這讓我想重新養蝦。 另外,養蝦腦 (LLM) 的飼料費 (tokens) 也不便宜,我之前大約來回對話幾小時,就花掉台幣 180 元 (MiniMax M2.5)。幸運的是最近推出的千問 Qwen3.5 開源模型夠強,可比 Sonnet 4.5,我下載了 Qwen3.5 35B A3B Q8 用 LM Stuido 在地端取代雲端的蝦腦,目前使用體驗還不錯😄 如圖,我實驗性的叫龍蝦幫我成生 PDF,它成功了。我有去查蝦的 chat log,它是自己安裝 Python 套件幫我完成工作👍 看來我可以 24 hours…
-
「練功文 – 偷師 AI 高手技術 」
我之前寫過一篇文章分享我對現今 AI 進步的體悟與學習之道 – 「低成本的 AI 技能轉移」。 今天我又想增進自己的 AI 技術,但卡關了,不知道我還能作什麼進步,就想到上網跟高手學習。我相信在這 AI 超強的時代,能輕易的複製別人的 AI 技術,只要肯學。 我看了一部 AI demo 影片:https://youtu.be/6LCf5tMO3-c?si=LFG5T-dPkWxQyK0b 當中有一個 demo 讓我腦洞大開,就是講者用一張金門大橋的圖片丟給 AI 讓它生成 3D 網頁程式。這件事在之前是我想像不到的,原來還可以這樣做! 我之前無法想像一些技術,是腦洞受限於我原有的知識量,當腦洞大開後,就大致知道我要如何引導 AI 做出,而且真的很簡單。我就依樣畫葫蘆,將一張金門大橋的圖丟給我本機地端架的 Qwen3.5 35B A3B 8-bit,下提示詞:use three.js to model objects in this image 不到 5 分鐘就做出一陽春版的 3D 金門大橋😆 如圖。 雖然與原圖仍有不小差距,但這是用本機小模型跑的,也不能要求太多,主要是驗證我的技能複製概念可行👍 原始碼:https://github.com/MrMYHuang/3d-bridge-by-ai
-
「第一次當導演 – Seedance 2.0 AI 生成短片」
之前好奇現在 AI 影片生成做到多強,就看了一部在講 Seedance 2.0 的影片。那影片還教你怎麼有方法的生成影片,我也莫名其妙就學跟著學會怎麼做了😆,這真是現在 AI 太強,許多專業被降維打擊🥲 昨天想幫朋友試一下 Seedance 2.0,一時也不知下什麼提示詞,就想到那教學的幾招:先寫一段想拍影片的描述、找一張圖(可以上網找免費的),再叫 ChatGPT 幫你寫分鏡。如下連結所示:https://chatgpt.com/share/699ed013-2274-800f-a55e-cbb2f5a3b3ab 然後再到即夢 AI 用 Seedance 2.0 輸入分鏡詞與圖片,然後送出,生成!一次最多 15 秒。(但我是用限時免費的 1 次生成機會,沒付費訂閱🙂) 以下是我的作品😆 果然不是專業的,還有地方要改善。
-
「我也開缸養龍蝦了,AI 助理 – OpenClaw」
近期爆紅一陣子的個人 AI 助理軟體 – OpenClaw (中文圈稱之”龍蝦”),在朋友的慫恿下,我也開缸養了一隻😆 如圖所示。 本來怕有安全疑慮,一直不敢嘗試。但看到 YouTube 上的分享,有人養得出神入化,相當於僱用了一個每天 24 小時幫他在工作的員工 (只不過不是人,是 AI),我也想試試看能不能一樣厲害。 在安全性的部分,我想到可以開一個虛擬機器 (VM),讓龍蝦在其中跑。另一方面也是實驗性質,等我確認 OpenClaw 真的對我實用,再考慮入手雲端主機或樹莓派開發板來養龍蝦。 模型我用的是朋友推薦的 MiniMax M2.5 (雲端付費),目前只儲值最小金額 – 美金 25 元。 玩了半天下來,我發現其實龍蝦的知識坑、技術坑或限制也不少,目前安裝還是需要一點軟體設定技術。限制的部分則遇到許多網站為了避免被 AI 機器人抓資料,導致沒有廣告效益,會用許多技術擋 AI 機器人,甚至可能會 ban 使用者的帳號,所以用龍蝦操控瀏覽器的體驗不是很順暢。 安全問題的坑,則要避免自己的龍蝦外出時被綁架😅 ,像近期有一些人給他的龍蝦開 Threads 帳號發文,但被人用回文內含”提示詞”的方式綁架。所以我也不敢亂開 APIs 或帳號權限給我的龍蝦使用。導致它目前很多事都不能做😅 使用龍蝦有一重要功能 – 為龍蝦安裝新技能 (agent skills),讓牠能做更多種事。OpenClaw 官網的 skills 是開放大家上傳分享技能,但是否安全就不一定了,連龍蝦之父自己的 skills 都有被標示”可疑”😅 這也是一個安全問題的坑。 我目前的作法是:保守一點,先別輕舉妄動、開太多權限給龍蝦。等研究更多人的龍蝦用法,並確認安全、好用,再開權限試試看。