訂戶限定 17:強大的 Gemma 3、上班前夕的花蓮之旅、Vibe Coding
AI 模型與花蓮二日遊
朋友們好,又一段時間不見了!
偷偷告訴你,從上一期到今天,我依舊沒有使用 Threads 或推特——我欣慰☺️
希望可以一直延續下去,不過我其實有設一個 deadline,時間到可能還是會上去看一下
但是,不要輕易受到這些平台的吸引,依舊是一個長期目標
讓我們進入第一個主題:
你曾經在你的電腦上,跑過本地的大語言模型(LLM)嗎?
不可否認,這事雖然不難,YouTube 也有一堆影片教學,但仍存在一些技術門檻
如果是 Windows 電腦,就需要獨立的顯卡,Mac 則相對簡單許多——在 Mac 上,透過 Ollama 可以很方便可以下載、運行本地大模型
沒有嘗試過也沒有關係,我只是要表達我的一點點觀察與心得
其實我也很少做這件事,因為我還找不到應用的場景,但我相信它有,所以開始嘗試
早期試過 Meta 推出的 Llama 3.2 7B,說真的,效果差強人意,你絕對不會想用
回答常常中文夾雜英文,或其它國家的語言,顯得語無論次
前陣子火紅的 DeepSeek 也有開源的輕量化版本,我下載了 14B,他的中文能力比很多「美國來的模型」強許多
而標題的 Gemma 3,則是第一次讓我感受到開源模型的強大!
我下載了 Gemma 3 12B,讓我非常訝異的是,他對於繁體中文的回答能力、流暢度、文辭的優美程度,絕對超過我對於一個 12B 小模型的期待
Google 推出的模型,繁體中文的能力特別強,這並不讓我意外,因為他們本來就有 Google 翻譯這樣的服務,對於繁中的資料量肯定比其他公司來得多
但整體而言,它還是太讓我驚艷了!
你可以看看下面他的回答,特別留意他的用詞(我有給它人設,所以他並不是原始個性)
BTW,最後一段的英文是梗,不是無故的中英夾雜XD
簡單來說,我覺得它的用詞非常流暢且自然,幾乎可以說是之前 GPT 3.5 的水準,但別忘了,GPT 3.5 的參數量可是高達 175B
總之,我很期待開源模型接下來的發展,遠不只有 DeepSeek 而已
上上禮拜,是我上班前的最後一個星期——沒錯, 我現在已經在工作了XD,結束了超過半年的待業🐥
除了上一期提到的去東北角之外,星期四、五,還跟女朋友一起去了花蓮二日遊
簡述一下這兩日的行程供參考
星期四:
台北車站 → 花蓮車站 → check in 民宿 → 景美車站(一個很小的站)→ 走路 2 小時 → 七星潭 → 原野牧場 → 計程車 → 東大門夜市 → 民宿
星期五:
民宿 → 計程車 → 池南國家森林遊樂區 → 莫內花園咖啡農莊(cafe) → 鯉魚潭環潭之旅 → 計程車 → 吉安慶修院 → 山海正甜 吉製冰所 → 輪胎麵店 → 計程車 → 花蓮車站 → 台北車站
圖:原野牧場的窗外視野
現在的花蓮,玩起來真的非常舒適,因為遊客並不多
晚上的東大門夜市也是……有點冷清吧(可能一方面是我去的時候是星期四),但很適合我這種不愛人擠人的觀光客
第一天的旅程中,為了滿足「走路」的心願,我們特地坐火車到景美車站,再往南走回到七星潭
但是,我強烈建議你不要這麼做XD
除了距離有點長之外,這中間的路程基本上都是公路(193 縣道),車也不算少,我覺得走起來不太舒服
第二天的景點,則適合步行許多,湖光山色,美不勝收,強力推薦!(但需要交通工具)
有沒有心動了呢?🥰
你聽過 Vibe Coding 嗎?這篇介紹寫得不錯
老實說,作為一個軟體工程師,我第一次聽到這個詞彙的時候,是相當不以為然的👿
但隨著 Will 保哥也在他的臉書上面發表了更多關於 Vibe coding 的貼文
我的想法開始有了轉變,畢竟保哥是我非常佩服且尊敬的軟體開發者
之後我會寫一篇文章,表達我自己對於這個議題的看法,而且又要結合《葬送的芙莉蓮》XD
現在我隱隱覺得,Vibe coding 的能力,在不久的將來,或許也是軟體工程師必備的能力之一
AI 確實不斷地在重新形塑著我們的技能(與價值觀)
很多我們曾經珍視的能力,在現在看來似乎已經不那麼重要
希望我跟得上這股潮流,哈哈哈!
下次見