BI決定AI是「硬用」還是「應用」

                June 28, 2023

            BI決定AI是「硬用」還是「應用」

            AI是沒有「品質」可言的
Github及Copilot是軟體人員在社團例會中最關心的題目，而非軟體人員則是一直在追問，何時會有M365可以使用？呵呵，這應該是很有得等了，明年看有沒有機會吧。
近期AI應用社團在大家的協助下，還是盡最大的努力，在還沒有殺手級應用的情況下，不斷地介紹一些第三方開發的工具。儘管我們對這些工具都不是很瞭解，或是這些工具真的都還不夠成熟到可以大規模的優化我們的工作流，但在這個過程中，我們都慢慢理解，上次我在早會中分享Bill Gates說的那句話：我們真的太高估AI「現在」能給我們的效益及影響。
論文中提到的一些新技術，拜現在開發技術進步，有些論文都會直接附上Demo程式可以「試玩」一下，範例的展示都非常完美，可若我真的用實際上的資料或用例去測試時，就會發現這些技術真的要落地，穩定度都遠遠低於預期。自己玩玩當然是沒問題，可這實在是沒辦法推給別人用。
不說第三方開發的那些新工具，就連ChatGPT前陣子也被網友發現「變笨了」，而我自己是發現本來蠻愛用的BingChat，這陣子何止是變笨了，簡直連基本溝通能力都有點問題了。同樣的提詞，不管我怎麼調整優化，以前很ok的，現在竟然完全是無法work的了，不是品質不行，是根本連低標都不到。
有人說，AI能提升「個人」的生產力沒有問題，但是它沒有辦法大規模的提升企業的生產力。本來我有點看不懂，個人都可以了，不就等於企業的生產力也提升了嗎？技術上是這麼說沒錯，但重點不是有沒有提升，而是無法「大規模」。這有點像半導體晶片產業，美國他們很擅長設計，但他們在大規模的生產上就無法比得過台積電。「護國神山」一定累積了許多技術和經驗，才讓他們能在大規模的生產下，穩定度更好，品質更好。
其實，所謂的品質，很多時候就是指這種穩定性。
AI不一定解得了BI的問題
之前有一個服務叫TextQL，它除了可以讓我們直接說出想要的試算報表，更可以讓我們直接丟進一個Excel檔後，用自然語言說出要分析的目標為何。一開始我很開心地介紹給同事試用，這幾乎是我之前定義社團的長期目標之一，也就是「分析小助手」的實作了，我想這真的是絕佳的落地工具了吧，多少人都還是需要對Excel中的內容作分析，如果有了這個，一定可以為大家省下許多時間的。
它有一個設計很特別，就是它並不是直接解決問題，而是嘗試產出Python Code來解決問題。一開始我不太懂為什麼是這樣解決問題的？許多工具都是讓用戶直接說，然後AI把答案丟出來給用戶不是嗎？甚至我覺得這可能只是一種實作的手段而已，沒花太多時間去想。
後來，建豪在使用的過程中，發現它並沒有辦法很正確的分析他的報表（當然也就沒辦法得到他想要的答案了）。我本來以為，是不是他描述的不夠清楚？還是表格真的「長得」很奇怪？結果真的一看，覺得也還好啊，這明明應該是人類可以輕鬆理解的格式啊。結果我自己試，試了各式各樣的提詞，甚至是改造了表格自身的表現格式，來找出問題究竟在哪裡。結果是，簡單的例子和中規中矩，長得像資料庫的報表是還算穩定，只要表格中有一些「特別」的設計，它不只是有可能會辨識不出哪個是欄位，哪邊是資料。有時明明提詞是同一個，它吐出來的源碼還會有其他奇怪的結果。整個試下來，我幾乎癱坐在椅子上得到一個很無力的答案：它完全應付不了實務問題。
這個問題在「debug」的過程中，我想起另一件事，也是把一些長相為A的資料轉成長相為B的資料。結果也是很類似這樣的狀況，大部分的狀況都還可以，有時候就是有些小bug，出來的內容不是格式不對，就是內容有些跑掉。一開始想沒關係，反正是我自己用，看到結果有錯的話，自己快速修一修就好了。後來實在是受不了，明明提詞是同一個，model是同一個，不管是ChatGPT還是BingChat，都無法穩定的給我正確答案，而且我也不曉得問題出在哪裡，只能「多試個幾次」嘗試拿到正確的答案（這前提還是在我知道什麼是「正確的答案」的前提下）。我那時的想法就覺得真是夠了，這樣根本沒有省到我的心力及時間，最後索性直接叫ChatGPT產Javascriot前端程式給我，反正轉換邏輯是一樣的，我只是需要有人可以來寫這份程式。花了點時間和ChatGPT一起Cowork之後，最終這份工具到現在，都還是很穩定的解決資料的轉換需求。
我還是用BI的方式來解決AI解決不了的問題。
我總算搞懂TextQL的思路了。大語言模型的數學是國文老師教的，數字的問題最好還是讓程式語言來算。而且，整個分析的過程，除了可讓用戶知道這最後的答案是怎麼來的，若這其實會是一個常態性的報表需求，對用戶而言，一份穩定的Python源碼，才是能真正能穩定的解決問題的方法，1+1一定就是要等於2，數字可不是可以讓AI可以發揮「創意」的地方。
Plugin才是用戶看得到的，其他的都叫API
5月24日Microsoft照例舉辦了Build大會。當然，最重要的還是關於AI的相關動向。
不出意料的，Microsoft為自家所有的產品都計畫了Copilot進去。M365是之前就宣告過的，這次是除了把Azure裡的服務和Skype也都加入了Copilot，連Windows都要加入Copilot了。外行的看熱鬧，內行的就知道這真的是近乎是「射月」等級的目標。
另外一個重磅消息則是，ChatGPT的插件介面，將和上述的Copilot使用一樣的介面。意思是說，如果開發者在ChatGPT開發了一個套件，這個套件將可以同步適用在剛剛說的M365上的Copilot，也可以用在Azure上有的Copilot，甚至可以用在Windows的Copilot上！
當Copilot這個概念出現在M365上時，大部分的用戶膝反射式的念頭應該是「好棒哦，以後可以更快地完成工作了耶！」。嘖嘖募資平台策略長Manny就點出了一個重要的趨勢：接下來所有App的UI/UX的重要性將開始是一個問號。當用戶直接把需求講出來，App就可以直接完成的時候，選單在哪裡，按鍵怎麼排，一個頁面要放多少控制項，流程應該怎麼設計才會順…這些問題突然都不是問題了。或是說，這些問題都變成是軟體開發商的問題了。
當Copilot這個概念出現在Windows上時，大部分的用戶膝反射式的念頭應該不會差太多，可接下來的趨勢就更重要了：如果用戶跟作業系統的互動方式，也變成自然語言了，剛剛的M365，未來的Windows，又何嘗不是一個“更大”的ChatGPT？那Windows中內建的，或是安裝第3方的App又是什麼？
其實不都是一種插件嗎？
以前，我們要在系統中裝7-Zip來解壓縮，裝ACDSee/XnView來看圖，裝WinAmp來聽音樂，裝KMPlayer來看影片(你看看你看看…為什麼你可以喊得出那麼多骨董啊…)，這些工具用途不同，用法不同，每個工具都有所謂的「上手門檻」。可當這些工具的功能，都可以由作業系統透過自然語言直接驅動的時候，每個App幾乎就只有被調用的時候，才能出來露個臉，它們不過就是Copilot的插件而已。其他的時候用戶都不需要知道，這些App“還”能做什麼。就算這些App是純文字介面也無所謂，只要他們會知道哪個App能使命必達，能多才多藝，用戶就會喜歡一直使用它。
App的”插件化“這件事，背後有著我們不能再視而不見的問題。
除了Microsoft的Build大會外，其實OpenAI這個月也有重要更新。大多數的用戶在意的是GPT-3.5的Token數放大到16K，這很棒。對開發者而言有一個很重要的功能是「Function Calling」。簡單來說，就是OpenAI把ChatGPT「怎麼叫插件做事」這件事給正規化了，而這件事也沒那麼深奧，就是插件要在註解中明確的註明，自己能做什麼事，而這件事要呼叫哪支API來做。
當我們在做「業務小助手」的技術驗證時，發現其實最頭痛的不是AI的部分，而是知識資料的長相會千奇百怪。有的是PDF，有的是Word，有的是Excel，文件自身及內容的介面，都是我們難以預期的，如果我們沒辦法有效正規化資料的處理方式，AI再厲害也難為無米之炊；當我們在做「分析小助手」的技術驗證時，發現其實最頭痛的結果也不是AI的部分，而是我們要怎麼讓Model來“控制”競品分析系統？它根本沒有設計API要“被控制”啊！
Bezos當時在要求Amazon裡所有的資訊的流通，一律只能用API進行時，該說是他“深謀遠慮”嗎？他一定不是未卜先知，他只是在解決軟體工程的問題。但可想而知，將來Amazon一定會有許多服務，可以馬上跟Copilot串接上去被用戶使用。軟體服務怎麼被串接使用，這根本是BI的問題，而不是AI。
結合可控的BI才真的能「應用」

            🐹倉鼠週報20：當AI成為人類情感的寄託 - by 李元魁 - 🐹 知識倉鼠
            你有想過與 AI 機器人成為朋友嗎？也許現在我們都很排斥將情感寄託於機器人，但眾多的數據都表明，也許未來 AI 將成為我們關係網中的一員，成為我們都朋友、家人，甚至寵物。

不管是從應用領域的一些典型案例，還是多模態的應用能力演進，都可以看到同一個事實：目前真的還是在「初步思維鍊可控」。也就是說，我們若只想找看看有沒有哪個第3方應用寫得很完美及穩定，直接導入就可以大規模的優化我們的製程效率，這個想法現在可能是過早了。就像一開始我自己的經驗那樣，AI可拿來發想產生創意，也有推論能力解決問題，但只能是在「個人」的層級上。真的要落地到大規模，多模態及高複雜度的實務需求時，還是只有用我們的BI寫出來的工具，才是真的靠譜。當然，這個領域的變化一直都很快，現在我們會需要有足夠的基礎知識及實務經驗，來判斷什麼問題該用model解，什麼問題該用code解，也許過不了多久，什麼問題都有model可以解了，或是都有model可以產出程式來解。
應用社團除了會繼續關注AI技術的發展趨勢，分享成熟的小工具，增加個人層級的生產力以外，最重要的是我們還會繼續投入「Copilot」及「Plugin」的研發能力。「Copilot」是讓現有的工具更容易被使用，更多人願意用，更有生產力；而「Plugin」的開發則是為將來的「Copilot生態系」做好準備，現在已有超過400個以上的插件在ChatGPT Plus上給付費用戶使用，再過一陣子免費的用戶就會開始意識到，ChatGPT上能做的事越來越多，幾乎都不用去官網走網頁流程處理了。等到M365正式推出，Windows11的Copilot也上線了，大家看到的介面都是插件了，App的功能和官網的API都是插件的內容而已，再也不一定是用戶接觸的第一個介面了。
我們在「業務小幫手」和「ChatIGS」的投入已經幫我們取得了一些概念驗證（POC）成果。我們已有Copilot及Plugin的基礎開發能力，但還需要在「分析小助手」這個案例中做一個更大規模，更正式的開發經驗，才能確保我們有足夠的know-how，來根據產品單位需求自行開發，或是評估合適的外包或產學。
第三方開發的東西如果沒有足夠的成熟度及穩定度，那就真的是個人用用就好，別「硬用」。接下來的Roadmap是Copilot及Plugin了，它們才真的是要大規模的「應用」了，現在我們一定要趕快掌握相關的研發技術，能把我們自己的BI結合到產品的Copilot或是ChatGPT類的Plugin上，穩定工作，Get things done，那才叫「應用」。

Don't miss what's next. Subscribe to 技管思維: