台灣的LLM的願景

台灣的LLM的願景

有一種聲音認為「台灣要有台灣的大型語言模型(LLM)」。如果真的存在那樣的state-of-the-art LLM,會是什麼樣子呢?

會是說話充滿台灣風格的模型嗎?這種程度現在的SOTA LLM就能夠滿足了。另一種可能性是「只能」以台灣風格說話的模型。沒有其他風格,也就沒有被其他風格污染的問題了。這樣的LLM能最大程度保存現在的台灣文化。

但這又衍生一個問題:這個LLM註定沒有用。例如問LLM有關「台灣文章為什麼總是充滿華麗辭藻卻缺乏事實」的時候,我很難想像一個台灣風格的LLM能夠達到令我滿意的答案。只要是台灣社會中缺乏廣泛討論的事情或問題,都可能得不到答案。我個人滿喜歡現在這種用「中文講出西方邏輯」的LLM。如果未來真的有台灣LLM,我大概也不會用。文化保存與解決問題在目標性上存在部分矛盾,註定台灣LLM難以最佳化解決問題的能力。

小結

因此,我並不看好「做台灣的LLM」的想法,或至少不應該期待大眾會廣泛使用台灣的LLM。可能可以有學術性質的LLM,但答題能力永遠達不到SOTA,在繁中語境下也達不到SOTA。在商業性不足的情況下,台灣的LLM在技術上可能也沒有足夠的資源做到SOTA。這又衍生出最後一個問題,總有一天主流LLM會聰明到能夠完美復現台灣風格的說話方式,到時候台灣的LLM又該為什麽原因存在呢?

本來想以「傳統可能是用文化偽裝成的一種野蠻」做結的,因為我真的很討厭台灣那忽略事實的寫作傳統。但是一旦開始寫字,字就像是有了自己的生命一樣,變成另一種樣子了。


Yi-Lung Chiu