Career Advice 名家分享

AI仍未夠聰明?

上文提及「大型語言模型」(LLM, Large Language Model)的新進化LLMgt,能夠透過結合空間數據及IoT,處理3D環境及在3D空間內發出指令以進行操作。然而要管理這種AI模型,仍需要專業科研人員發出像魔法咒語般的提示詞或程式碼,才能發動其能力。當一般用戶在企業組織將之實際應用時,未必可以用得稱心如意。

 

筆者早前探訪一位企業客戶,他是應用AI 語言模型的「常客」,已廣泛利用LLM協助企業工作,初用時覺得非常便捷,但日子久了卻發現AI所提交的答案未如理想,並非他確切所要的回覆。的確,現時市面上的商用AI軟件,未必完全能適切該機構的用途,而且AI的回應亦難以控制,回覆跟用戶所期望的答案多有落差。這亦讓我反思,如何讓企業使用者更好地管理、控制及運用LLM?雖然LLM已經很聰明,但要它確切理解用戶的需要再作出回應,當中似乎仍有一缺口。

 

早前業內人士發布了新一代基座大模型GLM-4,它能夠自主地根據使用者意圖,自動理解及規劃複雜指令。這正是我思考的方向,也是我們團隊正開發的All in One人工智能平台——AI LIFE。它可結合LLM,實時融匯IoT、PNT及大數據,駁通不同的API,進行快速分析,向有關使用單位提供即時的對應方案。

 

用戶可根據自己所想,有效地驅動它理解並執行複雜的指令。舉例問它:「睇下公司數據庫,A產品仲剩幾多貨?」回答這個問題的難度在於,模型要理解廣東話「睇下」、「仲剩幾多」的意思,同時問題中也沒有告之是哪個數據庫、要在哪兒搜尋。模型會懂得自動接駁公司數據系統進行搜索,根據該指令自行規劃檢索任務、自行選擇資訊來源、自行與資訊來源互動,再提交回應給你。

 

坦白說,現時的LLM模型的確很聰明,然而其聰明只在於模仿能力極高,它卻會出現「幻覺」、錯誤推理、整合出偏離的答案。我們團隊努力建構的All in One人工智能平台AI LIFE,是管理LLM模型的平台,旨在填補落差,先理解用戶的發問(Reasoning),繼而作出相應回覆(React)。看似簡單,但過程卻殊不簡單,特別是我們用的廣東話,字詞多義又多變化,上述例子中「睇下」已含觀看、檢視、查閱等意思,日常我們又會講成「睇睇」、「Check下」、「數下」等不同說法,要讓模型準確理解用戶的意思並非易事,故在開發時難度很高,我們正不斷努力!