Background image

2025 AI趨勢深度研究: AGI、LLM與AI Agent

2025 AI趨勢深度研究: AGI、LLM與AI Agent

一次搞懂AI完整版圖以及為什麼你不該用DeepSeek

隨著人工智慧技術不斷進步,2025年的AI趨勢正朝向更高層次的智能自主與應用落地發展。從Generative AI到AGI,再到具備自主決策能力的AI Agent,這一波技術革新正在重塑我們的工作與生活方式。本文將從關鍵技術、最新應用案例、DeepSeek分析以及未來挑戰四個層面,帶您全面了解未來AI的發展脈絡。

本篇內容架構(歡迎挑選有興趣的主題閱讀):

  1. AGI的新時代:從Generative AI到通用人工智能
  2. LLM技術的快速演進與關鍵技術
  3. AI Agent:智能代理與自主決策新時代
  4. DeepSeek分析與比較
  5. LLM與AGI的最新進展與趨勢
  6. 2025 AI 趨勢展望與未來挑戰
2025年, AI 正在加速改變我們生活2025年, AI 正在加速改變我們生活

一、AGI的新時代:從Generative AI到通用人工智能

什麼是生成式AI (Generative AI)

生成式AI(Generative AI)是一種基於深度學習的模型,能夠根據輸入資料(如文字、圖像、聲音等),產生具有創造性的新內容。例如,常見的文字生成模型(如ChatGPT)、圖像生成模型(如DALL·E)都是生成式AI的典型代表。

  • 特徵: 能夠學習龐大資料中的特徵,並根據輸入指令自動生成近似或全新的內容。
  • 應用範圍: 從文案撰寫、語言翻譯到插畫設計、音樂創作、程式碼生成等。
  • 限制: 在面臨需要跨領域知識或複雜推理的任務時,傳統生成式AI仍較難自動完成全流程作業。

什麼是通用人工智能 AGI

傳統的生成式AI主要聚焦於內容生成與單一任務應用,但隨著技術突破,業界的焦點已經轉向AGI——通用人工智能AGI (Artificial General Intelligence)。AGI具備跨領域學習、決策與問題解決的能力,能夠根據自然語言指令,完成從網頁操作到自動下單等複雜任務,也被視為AI Agent的前身。

實際案例: 在LnData 數據科學家的測試中,使用者僅需以自然語言下達「請幫我購買」的指令,AI便能自主開啟瀏覽器、搜尋商品價格、點擊按鈕並進行資料填寫。從單一指令到全流程自動化的應用,正是AGI技術邁向實用化的重要里程碑;目前 LnData已率先投入打造數據分析的AGI模型。

AGI 與 Generative AI 比較AGI 與 Generative AI 比較

AGI的應變能力 Improvise Ability

AGI不僅能執行單一步驟的操作,更能夠在動態情境中「即興應變(Improvise)」:

  1. 理解診斷問題:根據不同的環境或上下文,動態辨識關鍵資訊。
  2. 生成解決方案:根據既有知識與推理能力,提出多種可行方案。
  3. 執行與自我修正:在執行過程中持續監控結果,並對錯誤或異常狀況進行修正。
LnData 如何以 AI 自主分析並優化廣告投放策略LnData 如何以 AI 自主分析並優化廣告投放策略

這就是為何AGI在面對複雜且多變的商業或日常場景時,能更貼近人類的思考與決策模式。以協助廣告投放業務為例:

AI系統可整合消費者行為數據、競爭對手情報與即時新聞等多重資訊,並根據不同廣告平台的特性,自動調整投放策略。當廣告成效不如預期時,AGI能即時分析問題根源,調整受眾設定、廣告內容或投放預算,最大化廣告投資回報率。

二、LLM技術的快速演進與關鍵技術

大型語言模型(LLM)憑藉其強大的語言理解與生成能力,已成為驅動現代AI應用的基石。根據LnData的數據科學團隊研究,目前LLM在自然語言處理、鏈式思考(Chain-of-Thought)以及自我監督學習等方面都有驚人的進展,而這些歸功於以下重要技術的發展:

提示詞工程 (Prompt Engineering)

提示詞工程是指在與LLM互動時,透過設計良好的提示詞(Prompt),來引導模型生成更準確或更符合需求的內容。

常見的提示詞要點如下

  • 明確問題範圍,避免模糊或過度籠統。
  • 提供必要的上下文與示例。
  • 透過反覆實驗與調整,尋找最佳提示詞結構。

檢索增強生成 (RAG)

檢索增強生成(Retrieval-Augmented Generation,RAG)技術旨在讓LLM能夠存取外部知識庫,並在生成答案時引用這些相關資料。相較於原生模型僅依賴訓練資料,RAG能夠產生更準確、即時且具有明確引用來源的答案。這也讓LLM能將企業的資料庫檔案文件作為資料擴充。

RAG 流程架構示意RAG 流程架構示意

ReAct 技術框架

ReAct (Reasoning + Acting) 讓AI可以實現CoT(Chain of Thoughts)逐步思考、查詢外部資源並進行外部工具運算,最終產生更完整且符合現實需求的答案。ReAct技術的重要性在於它讓LLM能更有效地與外部世界互動,突破單純文字生成的侷限,應用場景大幅擴張。

ReAct 框架核心組成

  1. Observation (觀察):接收環境資訊或使用者輸入
  2. Reasoning (推理):基於觀察進行邏輯推理,決定下一步行動
  3. Action (行動):執行特定操作(如呼叫API、查詢資料庫、進行計算)
  4. Repeat (重複循環):根據新的觀察結果,不斷推理並調整行動

強化學習與回饋機制

透過強化學習(Reinforcement Learning, RL),AI能根據環境反饋調整策略,最大化累積獎勵。這種方法特別適用於需要持續決策和優化行動的場景,例如遊戲AI或機器人控制。其中人類回饋(RLHF)則進一步提升了AI生成內容的品質,例如ChatGPT透過人類標註,學習生成更符合人類偏好的回應。四種主要的回饋機制包含:

  1. 環境回饋 (Environment Feedback):AI 執行行動後,環境直接給予回饋。例如:遊戲AI贏了得到加分,輸了扣分。
  2. 自我回饋 (Self-Reflection Feedback):AI 透過內部的評估機制,反思自身的行動。例如:AI代理回顧自己的推理過程,找出可優化之處。
  3. 人類回饋 (Human Feedback, RLHF):人類提供標註數據,指導AI學習。例如:ChatGPT透過人類標註,學習生成更符合人類偏好的回應。
  4. 內部回饋機制 (Intrinsic Reward):AI 因探索新事物或發現新策略而獲得內部的獎勵。例如:機器人發現新的解決問題方法,給予自己額外獎勵。

三、AI Agent:智能代理與自主決策新時代

AI代理:2025年最受矚目的AI趨勢

近年來,隨著大型語言模型(LLM)和強化學習技術的快速發展,AI代理(AI Agent)正逐漸成為AI領域的新焦點。除了經濟學人預測AI Agent將讓我們可以「從對話走向執行」,Google CEO甚至高調宣稱,我們已經進入了「代理時代」(Agentic Era)。那麼,AI代理究竟是什麼?它又將如何改變我們的生活?

AI代理的定義與特性

簡單來說,AI代理是一種可以自主執行任務的AI系統,並且以大型語言模型為基礎,具有感應、規劃、決策執行與反思等能力。

AI代理的工作流程通常包含四個步驟:

  1. 感知與分析(Perception):收集並分析環境資訊。
  2. 決策與計劃(Planning):基於所收集的資訊,制定計劃或做出決策。
  3. 執行(Action):按照計劃執行相應的動作。
  4. 學習與適應(Feedback):根據執行結果和環境反饋,進行學習和行為調整。

這種循環交互的工作方式,使AI代理能超越傳統的AI模型,在複雜多變的環境中不斷優化自身的行為策略。

AI模型與 AI 代理的比較AI模型與 AI 代理的比較

AI代理的關鍵技術:ReAct 與 PPO

AI Agent 可以透過整合多種工具與技術,提供自動化工作流程,有效處理各領域的複雜任務。包含以知識圖譜、RAG、API查詢等工具,提升AI Agent獲取和處理資訊的能力;或是藉由意圖分類、語氣轉換等技術,使AI Agent能更人性化地與使用者互動。而為了讓 AI Agent變得更聰明,目前最流行的兩大關鍵技術為 ReActPPO

  • ReAct (Reasoning + Acting)
    如前所述,ReAct 框架是透過循環交互的方式完成任務,每一步都包含觀察、推理與行動,能與環境或工具進行深度互動。
  • PPO (Proximal Policy Optimization)
    一種強化學習演算法,旨在改善策略梯度方法的穩定性與效率。PPO能協助AI代理在反覆試驗中持續優化行動策略,使其更快速、更穩定地學習到最佳決策路徑。

AI代理的應用案例

客服領域:

  • 解決使用者複雜問題:利用FAQ資料庫、RAG提供精準答案。
  • 意圖分類:根據問題類型,採用不同回應策略(技術問題、退款、抱怨等)。
  • 語氣風格轉換:調整AI回應風格,符合不同客戶需求。

旅遊規劃:

  • 行程規劃:結合知識圖譜和RAG,提供行程、交通、住宿建議。
  • 即時資訊:透過API查詢,獲取交通、天氣等動態資訊。
  • 路徑優化:自動計算最佳移動路線,提升行程效率。

工程開發:

  • 工程數據解析:使用Text-to-SQL查詢工程資料庫,解答進度問題。
  • 文件分析:利用RAG和PDF分析,處理工程合約、SOP等文件。
  • 專業知識理解:結合知識圖譜和專業詞彙訓練,提升LLM對工程術語的理解。

LnData客戶案例:

  • 煉油廠擴建專案查詢:在煉油廠擴建專案中,透過Neo4j知識圖譜用於查詢設備與施工步驟的關聯,以便確定正確的安裝順序。
  • 報價合約表解析:從PDF文件中自動解析表格數據,結合OCR、Transformer模型、Prompt Engineering和LLM評估。

AI代理的挑戰與未來展望

AI代理技術的快速發展,為許多產業帶來了巨大的變革機會,然而,大規模落地、技術難題、倫理問題是該技術必須面對,並且解決的三大挑戰:

  • 大規模落地: AI產品尚未大規模普及,商業模式仍在探索。
  • 技術難題: AI代理的自主學習和決策能力仍有待提高。
  • 倫理問題: AI代理的自主性與潛在風險引發倫理擔憂。

在AI代理技術發展的初期,除了需要克服技術上的挑戰,要如何商業化AI agent,成為能讓一般消費者廣為接受的產品,依舊是一大挑戰。除了技術與商業化問題,由於AI agent相較於一般的AI程式,有更高程度的自主性,因此在倫理上,也增加了人類必須與AI agent互動的新倫理議題,例如如何應對AI代理的潛在風險,避免其產生歧視、偏見或錯誤行為。

四、DeepSeek分析與比較

為什麼你不該用 DeepSeek

在眾多AI應用中,DeepSeek在今年初橫空出世,其宣稱的低成本、高效能使其一推出就獲得廣大關注,其離線版甚至被上百萬用戶下載。然而,許多實際使用者與專家皆提出警告:DeepSeek是一個「毒葡萄」,強調「盡量不要接觸也不要用」,這是因為DeepSeek在技術穩定性與安全性方面存在一些隱憂。

什麼是DeepSeek?

DeepSeek 是一個由中國公司 DeepSeek 所開發的大型語言模型,並擅長於程式碼和數學領域。其模型之所以被拿來與OpenAI的先進模型進行比較,主要原因在於它在性能、成本與開源性方面展現了初步優勢:

  • 成本效益:宣稱其成本僅...(加入數據),能以較低成本達到OpenAI同等級效能。
  • 開源性:採取開源策略,允許開發者自由使用、修改和改進其模型。
  • 性能表現:在部分基準測試中,DeepSeek的模型在數學、程式設計和自然語言推理等任務上表現出色。
DeepSeek R1 與 OpenAI o3 先進模型優劣勢比較DeepSeek R1 與 OpenAI o3 先進模型優劣勢比較

DeepSeek-R1 的成本真的只要 600 萬美元複刻嗎?

根據DeepSeek官方數據,其V3模型共耗費約 278.8 萬小時的 H800 GPU 時間,假設每小時成本為 2 美元,總計約 557.6 萬美元。

然而,這可能忽略了隱藏成本。包含前期研究(V1、V2等前代版本)、架構設計及演算法試驗等都需額外投入,因此實際成本勢必更高。因此我們推估 DeepSeek 的完整訓練過程中,總成本至少超過1000萬美元。實際上,早有市場消息指出,DeepSeek母公司曾以10億人民幣買輝達A100。

DeepSeek-R1 API成本分析

DeepSeek API 在價格上,平均比 GPT-4 還要便宜 2~3 倍,但是必須透過「百萬 Token」作為單位的方案購買。這對於不需如此大量使用的用戶而言,成本可能會高出許多。此外,若 DeepSeek 的硬體成本比 OpenAI 還要高,那麼要如何提供如此低價的API存取服務,依舊是一項挑戰。

DeepSeek的資安與技術風險

  • 資安疑慮1:DeepSeek雖然開源,但不代表可控制其輸出。因此在處理敏感資料時,若缺乏完善的安全機制,可能導致用戶資料外洩。
  • 資安疑慮2:根據 LnData研究結果,發現DeepSeek疑似透過第三方追蹤,將API金鑰、對話紀錄等敏感資訊送往百度。且包含加拿大、南韓等都有同樣的情形被揭露。
  • 資安疑慮3: 根據DeepSeek的隱私政策明確指出,用戶資料儲存於中國境內並受中國法律管轄,然後相關聲明並未符合歐盟GDPR。這意味著在使用 DeepSeek 時,用戶資料可能會面臨中國政府審查的風險。
  • 資安疑慮4: DeepSeek R1模型因為開源被封裝成惡意軟體,並且在社群平台上被廣為傳播。這造成了使用者在下載使用 Deepseek 模型的時候,產生極大的資安風險。
  • 蒸餾技術局限: DeepSeek使用「distill(蒸餾)」方式微調其他模型,但最終知識量可能仍侷限於小語言模型範圍。

我們的建議: DeepSeek免費不代表真實成本低,若企業盲目採用,可能因安全性與穩定性問題付出更高代價。

延伸閱讀:資料科學家告訴你為什麼不該用 DeepSeek

DeepSeek會衝擊NVIDIA晶片市場嗎?

DeepSeek的低成本策略,以及其能夠在相對較少的硬體資源下,達到不錯的效能,有可能對NVIDIA在高階GPU市場的壟斷地位產生衝擊。如果DeepSeek的技術能夠持續發展,並且被廣泛應用,那麼將有機會改變當前的AI硬體市場格局,讓NVIDIA必須要面對來自其他競爭者的挑戰。

DeepSeek模型架構框架是否原創?

DeepSeek的模型架構框架,在很大程度上是基於現有的開源模型進行修改和優化。它採用了類似 Transformer 的架構,並在訓練過程中使用了大量的資料集。儘管 DeepSeek 在一些基準測試中表現出色,但其模型架構框架的原創性仍然存在爭議。

小結:台灣企業不該依賴 DeepSeek,那我們需要什麼?

雖然台灣具有全球最強大的半導體產業與許多技術人才,甚至稱為「 AI島」,但事實上,台灣不只尚未真正擁有可媲美國際的自產大型AI模型;同時相對的,企業更迫切需要SLM(小語言模型)專家與本土化AI技術。因此從長遠來看,台灣若要發展自有AI技術,勢必需要更穩定且安全的模型基礎,而非只依賴DeepSeek等大模型或其蒸餾模型。

五、LLM與AGI的最新進展與趨勢

鴻海開源模型 FoxBrain

鴻海開源模型 FoxBrain 是一個開放給開發者進行研究和商業使用的多語言大型語言模型。透過鴻海在製造領域當中累積多年的經驗,FoxBrain 將會提供製造業者所需要的生成式 AI 解決方案。該模型可根據不同的任務需求,進行微調(fine-tune),進而應用在多種領域,例如智慧製造、智慧服務和智慧城市等等。

OpenAI 推出 Responses API與平台工具

Responses API:OpenAI推出的整合式API,可簡化開發者整合AI功能至應用程式的過程,內建工具調用與檔案搜尋功能,並支援網頁搜尋。該API 的出現,將讓AI Agent的開發更加的輕鬆方便,讓各行各業都有機會推出自有的AI Agent。

OpenAI Operator 與 Claude Computer Use

OpenAI 的 Operator 和 Anthropic 的 Claude 的「電腦使用(Computer Use)」功能,在概念上具有相似之處,兩者皆為旨在模擬人類操作電腦的 AI 代理,能夠執行如瀏覽網頁、填寫表單、訂購商品等任務。然而,它們在具體的實現方式上有所不同。

  • OpenAI 的 Operator: 是一個網頁應用程式,它利用名為「Computer-Using Agent (CUA)」的模型,結合 GPT-4o 的視覺能力與強化學習,使得 AI 能夠在瀏覽器中執行簡單的線上任務,例如預訂音樂會門票或填寫線上購物訂單。
  • Anthropic 的 Claude 的「電腦使用」功能:允許 Claude 模型控制電腦,模擬人類的操作 (RPA),例如移動游標、點擊按鈕和輸入文字。這使得 Claude 能夠自主執行複雜的多步驟任務,例如填寫表單或訂購食物。
  • 主要差異:兩者差異主要在運行環境上——Operator 在雲端的虛擬機上運行,而「電腦使用」功能則可以本地電腦上運行,取決於設定方式。

Gemini 與OpenAI 的 Deep Research

  • Google Gemini Deep Research:能自動搜尋、分析並整合網路資訊,生成詳細報告,甚至整合arxiv論文進行高深研究。Google Gemeni擁有強大的檢索工具,以及對資料的處理能力,因此在Deep research 上具有相當大的優勢。
  • OpenAI o3 模型 Deep Research:OpenAI 也致力於提升其模型在 Deep Research 方面的能力。他們正在開發新的工具和技術,以幫助模型更好地理解和處理複雜的資訊。

AGILE框架與OpenAGI平台等延伸模式

什麼是AGILE框架:

  • AGILE(LLM Agents that Interact and Learn from Environments)是一種創新的LLM框架,結合了大型語言模型(LLM)、記憶、工具以及專家互動,旨在讓 AI agent 從環境中學習,執行複雜的對話任務。
  • 此框架將LLM作為策略模型,並透過強化學習進行微調,並在產品問答和醫療問答等領域展現出卓越的性能。

什麼是OpenAGI平台:

  • OpenAGI是一個開源的AGI研究平台,它整合了LLM和領域專家模型,用於解決多步驟的真實世界任務。
  • 該平台採用強化學習機制,透過任務反饋來提升LLM的問題解決能力,為通用人工智慧(AGI)的發展提供了新的途徑。

此外,還有更多直覺且no-code的Web UI新服務誕生:

  • Dify:是一個開源的 LLM 開發平台,提供視覺化的拖拉式界面,用於建構 RAG pipeline、AI Agent 以及自訂工作流程,使得開發人員能夠更快速,以及便利的開發出各種LLM的應用。可支援多種開源與商業 LLM,例如 GPT-4 和 Claude。
  • FastGPT:FastGPT 專注於 RAG 知識庫問答與 LLM應用開發,提供工作流編排(Flow Module)。適合企業內部文件管理、智能問答系統。
Dify 是一個開源的 LLM 開發平台,提供視覺化的拖拉式界面Dify 是一個開源的 LLM 開發平台,提供視覺化的拖拉式界面

六、2025 AI 趨勢展望與未來挑戰

總結來說,2025年的AI生態系將呈現以下幾大趨勢:

  1. AGI普及化: 未來的AI不再僅限於單一任務,而能跨領域自主學習與決策,甚至在部分情境中具備取代人工的能力。
  2. LLM技術持續突破:隨著模型規模與訓練數據的不斷增長,LLM在自然語言理解、生成及推理方面將飛快進化,推動更多產業的數位轉型。
  3. AI Agent智能代理:自動化工具將從輔助轉變為自主代理,協助使用者完成從網路操作到商務決策的各類任務,大幅提升生產力與決策效率。
  4. 產品選擇與安全挑戰:在眾多產品中,如何在技術創新與安全監控之間取得平衡成為關鍵。DeepSeek的案例提醒我們,有些技術雖然吸引眼球,但成熟度與安全性才是決定長期應用成敗的重要因素。

面對這些趨勢與挑戰,企業與個人用戶在技術與解方選擇時需更謹慎,不僅要關注前沿創新,更需確保系統具備完善的安全保障與風險管控機制。

結語

從AGI的概念落地到LLM技術的突破,再到 AI Agent在實際應用中的智能代理,2025年的AI發展已展現出顛覆傳統操作模式的巨大潛力。儘管 DeepSeek 等早期產品曾在市場上引起轟動,但其在安全性與技術成熟度上的不足,也提醒我們:只有不斷創新與完善,才能在智能化浪潮中立於不敗之地。

LnData 致力於追蹤這些前沿技術,並通過數據中台架構與數據賦能解方、數據顧問諮詢,幫助業界掌握最新AI技術動態!

立即開始:聯繫我們,展開組織數據驅動之旅

延伸閱讀:2025 AI Agent 商用爆發元年,發展前必看指南