2025 AI趨勢深度研究: AGI、LLM與AI Agent

一次搞懂AI完整版圖以及為什麼你不該用DeepSeek

隨著人工智慧技術不斷進步，2025年的AI趨勢正朝向更高層次的智能自主與應用落地發展。從Generative AI到AGI，再到具備自主決策能力的AI Agent，這一波技術革新正在重塑我們的工作與生活方式。本文將從關鍵技術、最新應用案例、DeepSeek分析以及未來挑戰四個層面，帶您全面了解未來AI的發展脈絡。

本篇內容架構(歡迎挑選有興趣的主題閱讀)：

AGI的新時代：從Generative AI到通用人工智能
LLM技術的快速演進與關鍵技術
AI Agent：智能代理與自主決策新時代
DeepSeek分析與比較
LLM與AGI的最新進展與趨勢
2025 AI 趨勢展望與未來挑戰

一、AGI的新時代：從Generative AI到通用人工智能

什麼是生成式AI (Generative AI)

生成式AI（Generative AI）是一種基於深度學習的模型，能夠根據輸入資料（如文字、圖像、聲音等），產生具有創造性的新內容。例如，常見的文字生成模型（如ChatGPT）、圖像生成模型（如DALL·E）都是生成式AI的典型代表。

特徵： 能夠學習龐大資料中的特徵，並根據輸入指令自動生成近似或全新的內容。
應用範圍： 從文案撰寫、語言翻譯到插畫設計、音樂創作、程式碼生成等。
限制： 在面臨需要跨領域知識或複雜推理的任務時，傳統生成式AI仍較難自動完成全流程作業。

什麼是通用人工智能 AGI

傳統的生成式AI主要聚焦於內容生成與單一任務應用，但隨著技術突破，業界的焦點已經轉向AGI——通用人工智能AGI (Artificial General Intelligence)。AGI具備跨領域學習、決策與問題解決的能力，能夠根據自然語言指令，完成從網頁操作到自動下單等複雜任務，也被視為AI Agent的前身。

實際案例： 在LnData 數據科學家的測試中，使用者僅需以自然語言下達「請幫我購買」的指令，AI便能自主開啟瀏覽器、搜尋商品價格、點擊按鈕並進行資料填寫。從單一指令到全流程自動化的應用，正是AGI技術邁向實用化的重要里程碑；目前 LnData已率先投入打造數據分析的AGI模型。

AGI的應變能力 Improvise Ability

AGI不僅能執行單一步驟的操作，更能夠在動態情境中「即興應變（Improvise）」：

理解診斷問題：根據不同的環境或上下文，動態辨識關鍵資訊。
生成解決方案：根據既有知識與推理能力，提出多種可行方案。
執行與自我修正：在執行過程中持續監控結果，並對錯誤或異常狀況進行修正。

這就是為何AGI在面對複雜且多變的商業或日常場景時，能更貼近人類的思考與決策模式。以協助廣告投放業務為例：

AI系統可整合消費者行為數據、競爭對手情報與即時新聞等多重資訊，並根據不同廣告平台的特性，自動調整投放策略。當廣告成效不如預期時，AGI能即時分析問題根源，調整受眾設定、廣告內容或投放預算，最大化廣告投資回報率。

二、LLM技術的快速演進與關鍵技術

大型語言模型（LLM）憑藉其強大的語言理解與生成能力，已成為驅動現代AI應用的基石。根據LnData的數據科學團隊研究，目前LLM在自然語言處理、鏈式思考（Chain-of-Thought）以及自我監督學習等方面都有驚人的進展，而這些歸功於以下重要技術的發展：

提示詞工程 (Prompt Engineering)

提示詞工程是指在與LLM互動時，透過設計良好的提示詞（Prompt），來引導模型生成更準確或更符合需求的內容。

常見的提示詞要點如下：

明確問題範圍，避免模糊或過度籠統。
提供必要的上下文與示例。
透過反覆實驗與調整，尋找最佳提示詞結構。

檢索增強生成 (RAG)

檢索增強生成（Retrieval-Augmented Generation，RAG）技術旨在讓LLM能夠存取外部知識庫，並在生成答案時引用這些相關資料。相較於原生模型僅依賴訓練資料，RAG能夠產生更準確、即時且具有明確引用來源的答案。這也讓LLM能將企業的資料庫檔案文件作為資料擴充。

ReAct 技術框架

ReAct (Reasoning + Acting) 讓AI可以實現CoT（Chain of Thoughts）逐步思考、查詢外部資源並進行外部工具運算，最終產生更完整且符合現實需求的答案。ReAct技術的重要性在於它讓LLM能更有效地與外部世界互動，突破單純文字生成的侷限，應用場景大幅擴張。

ReAct 框架核心組成：

Observation (觀察)：接收環境資訊或使用者輸入
Reasoning (推理)：基於觀察進行邏輯推理，決定下一步行動
Action (行動)：執行特定操作（如呼叫API、查詢資料庫、進行計算）
Repeat (重複循環)：根據新的觀察結果，不斷推理並調整行動

強化學習與回饋機制

透過強化學習（Reinforcement Learning, RL），AI能根據環境反饋調整策略，最大化累積獎勵。這種方法特別適用於需要持續決策和優化行動的場景，例如遊戲AI或機器人控制。其中人類回饋（RLHF）則進一步提升了AI生成內容的品質，例如ChatGPT透過人類標註，學習生成更符合人類偏好的回應。四種主要的回饋機制包含：

環境回饋 (Environment Feedback)：AI 執行行動後，環境直接給予回饋。例如：遊戲AI贏了得到加分，輸了扣分。
自我回饋 (Self-Reflection Feedback)：AI 透過內部的評估機制，反思自身的行動。例如：AI代理回顧自己的推理過程，找出可優化之處。
人類回饋 (Human Feedback, RLHF)：人類提供標註數據，指導AI學習。例如：ChatGPT透過人類標註，學習生成更符合人類偏好的回應。
內部回饋機制 (Intrinsic Reward)：AI 因探索新事物或發現新策略而獲得內部的獎勵。例如：機器人發現新的解決問題方法，給予自己額外獎勵。

三、AI Agent：智能代理與自主決策新時代

AI代理：2025年最受矚目的AI趨勢

近年來，隨著大型語言模型（LLM）和強化學習技術的快速發展，AI代理（AI Agent）正逐漸成為AI領域的新焦點。除了經濟學人預測AI Agent將讓我們可以「從對話走向執行」，Google CEO甚至高調宣稱，我們已經進入了「代理時代」（Agentic Era）。那麼，AI代理究竟是什麼？它又將如何改變我們的生活？

AI代理的定義與特性

簡單來說，AI代理是一種可以自主執行任務的AI系統，並且以大型語言模型為基礎，具有感應、規劃、決策執行與反思等能力。

AI代理的工作流程通常包含四個步驟：

感知與分析（Perception）：收集並分析環境資訊。
決策與計劃（Planning）：基於所收集的資訊，制定計劃或做出決策。
執行（Action）：按照計劃執行相應的動作。
學習與適應（Feedback）：根據執行結果和環境反饋，進行學習和行為調整。

這種循環交互的工作方式，使AI代理能超越傳統的AI模型，在複雜多變的環境中不斷優化自身的行為策略。

AI代理的關鍵技術：ReAct 與 PPO

AI Agent 可以透過整合多種工具與技術，提供自動化工作流程，有效處理各領域的複雜任務。包含以知識圖譜、RAG、API查詢等工具，提升AI Agent獲取和處理資訊的能力；或是藉由意圖分類、語氣轉換等技術，使AI Agent能更人性化地與使用者互動。而為了讓 AI Agent變得更聰明，目前最流行的兩大關鍵技術為 ReAct 與 PPO：

ReAct (Reasoning + Acting)
如前所述，ReAct 框架是透過循環交互的方式完成任務，每一步都包含觀察、推理與行動，能與環境或工具進行深度互動。
PPO (Proximal Policy Optimization)
一種強化學習演算法，旨在改善策略梯度方法的穩定性與效率。PPO能協助AI代理在反覆試驗中持續優化行動策略，使其更快速、更穩定地學習到最佳決策路徑。

AI代理的應用案例

客服領域：

解決使用者複雜問題：利用FAQ資料庫、RAG提供精準答案。
意圖分類：根據問題類型，採用不同回應策略（技術問題、退款、抱怨等）。
語氣風格轉換：調整AI回應風格，符合不同客戶需求。

旅遊規劃：

行程規劃：結合知識圖譜和RAG，提供行程、交通、住宿建議。
即時資訊：透過API查詢，獲取交通、天氣等動態資訊。
路徑優化：自動計算最佳移動路線，提升行程效率。

工程開發：

工程數據解析：使用Text-to-SQL查詢工程資料庫，解答進度問題。
文件分析：利用RAG和PDF分析，處理工程合約、SOP等文件。
專業知識理解：結合知識圖譜和專業詞彙訓練，提升LLM對工程術語的理解。

LnData客戶案例：

煉油廠擴建專案查詢：在煉油廠擴建專案中，透過Neo4j知識圖譜用於查詢設備與施工步驟的關聯，以便確定正確的安裝順序。
報價合約表解析：從PDF文件中自動解析表格數據，結合OCR、Transformer模型、Prompt Engineering和LLM評估。

AI代理的挑戰與未來展望

AI代理技術的快速發展，為許多產業帶來了巨大的變革機會，然而，大規模落地、技術難題、倫理問題是該技術必須面對，並且解決的三大挑戰：

大規模落地： AI產品尚未大規模普及，商業模式仍在探索。
技術難題： AI代理的自主學習和決策能力仍有待提高。
倫理問題： AI代理的自主性與潛在風險引發倫理擔憂。

在AI代理技術發展的初期，除了需要克服技術上的挑戰，要如何商業化AI agent，成為能讓一般消費者廣為接受的產品，依舊是一大挑戰。除了技術與商業化問題，由於AI agent相較於一般的AI程式，有更高程度的自主性，因此在倫理上，也增加了人類必須與AI agent互動的新倫理議題，例如如何應對AI代理的潛在風險，避免其產生歧視、偏見或錯誤行為。

四、DeepSeek分析與比較

為什麼你不該用 DeepSeek

在眾多AI應用中，DeepSeek在今年初橫空出世，其宣稱的低成本、高效能使其一推出就獲得廣大關注，其離線版甚至被上百萬用戶下載。然而，許多實際使用者與專家皆提出警告：DeepSeek是一個「毒葡萄」，強調「盡量不要接觸也不要用」，這是因為DeepSeek在技術穩定性與安全性方面存在一些隱憂。

什麼是DeepSeek？

DeepSeek 是一個由中國公司 DeepSeek 所開發的大型語言模型，並擅長於程式碼和數學領域。其模型之所以被拿來與OpenAI的先進模型進行比較，主要原因在於它在性能、成本與開源性方面展現了初步優勢：

成本效益：宣稱其成本僅...(加入數據)，能以較低成本達到OpenAI同等級效能。
開源性：採取開源策略，允許開發者自由使用、修改和改進其模型。
性能表現：在部分基準測試中，DeepSeek的模型在數學、程式設計和自然語言推理等任務上表現出色。

DeepSeek-R1 的成本真的只要 600 萬美元複刻嗎？

根據DeepSeek官方數據，其V3模型共耗費約 278.8 萬小時的 H800 GPU 時間，假設每小時成本為 2 美元，總計約 557.6 萬美元。

然而，這可能忽略了隱藏成本。包含前期研究(V1、V2等前代版本)、架構設計及演算法試驗等都需額外投入，因此實際成本勢必更高。因此我們推估 DeepSeek 的完整訓練過程中，總成本至少超過1000萬美元。實際上，早有市場消息指出，DeepSeek母公司曾以10億人民幣買輝達A100。

DeepSeek-R1 API成本分析

DeepSeek API 在價格上，平均比 GPT-4 還要便宜 2~3 倍，但是必須透過「百萬 Token」作為單位的方案購買。這對於不需如此大量使用的用戶而言，成本可能會高出許多。此外，若 DeepSeek 的硬體成本比 OpenAI 還要高，那麼要如何提供如此低價的API存取服務，依舊是一項挑戰。

DeepSeek的資安與技術風險

資安疑慮1：DeepSeek雖然開源，但不代表可控制其輸出。因此在處理敏感資料時，若缺乏完善的安全機制，可能導致用戶資料外洩。
資安疑慮2：根據 LnData研究結果，發現DeepSeek疑似透過第三方追蹤，將API金鑰、對話紀錄等敏感資訊送往百度。且包含加拿大、南韓等都有同樣的情形被揭露。
資安疑慮3： 根據DeepSeek的隱私政策明確指出，用戶資料儲存於中國境內並受中國法律管轄，然後相關聲明並未符合歐盟GDPR。這意味著在使用 DeepSeek 時，用戶資料可能會面臨中國政府審查的風險。
資安疑慮4： DeepSeek R1模型因為開源被封裝成惡意軟體，並且在社群平台上被廣為傳播。這造成了使用者在下載使用 Deepseek 模型的時候，產生極大的資安風險。
蒸餾技術局限： DeepSeek使用「distill(蒸餾)」方式微調其他模型，但最終知識量可能仍侷限於小語言模型範圍。

我們的建議： DeepSeek免費不代表真實成本低，若企業盲目採用，可能因安全性與穩定性問題付出更高代價。

延伸閱讀：資料科學家告訴你為什麼不該用 DeepSeek

DeepSeek會衝擊NVIDIA晶片市場嗎？

DeepSeek的低成本策略，以及其能夠在相對較少的硬體資源下，達到不錯的效能，有可能對NVIDIA在高階GPU市場的壟斷地位產生衝擊。如果DeepSeek的技術能夠持續發展，並且被廣泛應用，那麼將有機會改變當前的AI硬體市場格局，讓NVIDIA必須要面對來自其他競爭者的挑戰。

DeepSeek模型架構框架是否原創？

DeepSeek的模型架構框架，在很大程度上是基於現有的開源模型進行修改和優化。它採用了類似 Transformer 的架構，並在訓練過程中使用了大量的資料集。儘管 DeepSeek 在一些基準測試中表現出色，但其模型架構框架的原創性仍然存在爭議。

小結：台灣企業不該依賴 DeepSeek，那我們需要什麼？

雖然台灣具有全球最強大的半導體產業與許多技術人才，甚至稱為「 AI島」，但事實上，台灣不只尚未真正擁有可媲美國際的自產大型AI模型；同時相對的，企業更迫切需要SLM（小語言模型）專家與本土化AI技術。因此從長遠來看，台灣若要發展自有AI技術，勢必需要更穩定且安全的模型基礎，而非只依賴DeepSeek等大模型或其蒸餾模型。

五、LLM與AGI的最新進展與趨勢

鴻海開源模型 FoxBrain

鴻海開源模型 FoxBrain 是一個開放給開發者進行研究和商業使用的多語言大型語言模型。透過鴻海在製造領域當中累積多年的經驗，FoxBrain 將會提供製造業者所需要的生成式 AI 解決方案。該模型可根據不同的任務需求，進行微調（fine-tune），進而應用在多種領域，例如智慧製造、智慧服務和智慧城市等等。

OpenAI 推出 Responses API與平台工具

Responses API：OpenAI推出的整合式API，可簡化開發者整合AI功能至應用程式的過程，內建工具調用與檔案搜尋功能，並支援網頁搜尋。該API 的出現，將讓AI Agent的開發更加的輕鬆方便，讓各行各業都有機會推出自有的AI Agent。

OpenAI Operator 與 Claude Computer Use

OpenAI 的 Operator 和 Anthropic 的 Claude 的「電腦使用(Computer Use)」功能，在概念上具有相似之處，兩者皆為旨在模擬人類操作電腦的 AI 代理，能夠執行如瀏覽網頁、填寫表單、訂購商品等任務。然而，它們在具體的實現方式上有所不同。

OpenAI 的 Operator： 是一個網頁應用程式，它利用名為「Computer-Using Agent (CUA)」的模型，結合 GPT-4o 的視覺能力與強化學習，使得 AI 能夠在瀏覽器中執行簡單的線上任務，例如預訂音樂會門票或填寫線上購物訂單。
Anthropic 的 Claude 的「電腦使用」功能：允許 Claude 模型控制電腦，模擬人類的操作 (RPA)，例如移動游標、點擊按鈕和輸入文字。這使得 Claude 能夠自主執行複雜的多步驟任務，例如填寫表單或訂購食物。
主要差異：兩者差異主要在運行環境上——Operator 在雲端的虛擬機上運行，而「電腦使用」功能則可以本地電腦上運行，取決於設定方式。

Gemini 與OpenAI 的 Deep Research

Google Gemini Deep Research：能自動搜尋、分析並整合網路資訊，生成詳細報告，甚至整合arxiv論文進行高深研究。Google Gemeni擁有強大的檢索工具，以及對資料的處理能力，因此在Deep research 上具有相當大的優勢。
OpenAI o3 模型 Deep Research：OpenAI 也致力於提升其模型在 Deep Research 方面的能力。他們正在開發新的工具和技術，以幫助模型更好地理解和處理複雜的資訊。

AGILE框架與OpenAGI平台等延伸模式

什麼是AGILE框架：

AGILE（LLM Agents that Interact and Learn from Environments）是一種創新的LLM框架，結合了大型語言模型（LLM）、記憶、工具以及專家互動，旨在讓 AI agent 從環境中學習，執行複雜的對話任務。
此框架將LLM作為策略模型，並透過強化學習進行微調，並在產品問答和醫療問答等領域展現出卓越的性能。

什麼是OpenAGI平台：

OpenAGI是一個開源的AGI研究平台，它整合了LLM和領域專家模型，用於解決多步驟的真實世界任務。
該平台採用強化學習機制，透過任務反饋來提升LLM的問題解決能力，為通用人工智慧（AGI）的發展提供了新的途徑。

此外，還有更多直覺且no-code的Web UI新服務誕生：

Dify：是一個開源的 LLM 開發平台，提供視覺化的拖拉式界面，用於建構 RAG pipeline、AI Agent 以及自訂工作流程，使得開發人員能夠更快速，以及便利的開發出各種LLM的應用。可支援多種開源與商業 LLM，例如 GPT-4 和 Claude。
FastGPT：FastGPT 專注於 RAG 知識庫問答與 LLM應用開發，提供工作流編排（Flow Module）。適合企業內部文件管理、智能問答系統。

六、2025 AI 趨勢展望與未來挑戰

總結來說，2025年的AI生態系將呈現以下幾大趨勢：

AGI普及化： 未來的AI不再僅限於單一任務，而能跨領域自主學習與決策，甚至在部分情境中具備取代人工的能力。
LLM技術持續突破：隨著模型規模與訓練數據的不斷增長，LLM在自然語言理解、生成及推理方面將飛快進化，推動更多產業的數位轉型。
AI Agent智能代理：自動化工具將從輔助轉變為自主代理，協助使用者完成從網路操作到商務決策的各類任務，大幅提升生產力與決策效率。
產品選擇與安全挑戰：在眾多產品中，如何在技術創新與安全監控之間取得平衡成為關鍵。DeepSeek的案例提醒我們，有些技術雖然吸引眼球，但成熟度與安全性才是決定長期應用成敗的重要因素。

面對這些趨勢與挑戰，企業與個人用戶在技術與解方選擇時需更謹慎，不僅要關注前沿創新，更需確保系統具備完善的安全保障與風險管控機制。

結語

從AGI的概念落地到LLM技術的突破，再到 AI Agent在實際應用中的智能代理，2025年的AI發展已展現出顛覆傳統操作模式的巨大潛力。儘管 DeepSeek 等早期產品曾在市場上引起轟動，但其在安全性與技術成熟度上的不足，也提醒我們：只有不斷創新與完善，才能在智能化浪潮中立於不敗之地。

LnData 致力於追蹤這些前沿技術，並通過數據中台架構與數據賦能解方、數據顧問諮詢，幫助業界掌握最新AI技術動態！

立即開始：聯繫我們，展開組織數據驅動之旅

延伸閱讀：2025 AI Agent 商用爆發元年，發展前必看指南