2025 AI趨勢深度研究: AGI、LLM與AI Agent 一次搞懂AI完整版圖以及為什麼你不該用DeepSeek 隨著人工智慧技術不斷進步,2025年的AI趨勢正朝向更高層次的智能自主與應用落地發展。從Generative AI到AGI,再到具備自主決策能力的AI Agent,這一波技術革新正在重塑我們的工作與生活方式。本文將從關鍵技術、最新應用案例、DeepSeek分析以及未來挑戰四個層面,帶您全面了解未來AI的發展脈絡。
本篇內容架構(歡迎挑選有興趣的主題閱讀):
AGI的新時代:從Generative AI到通用人工智能 LLM技術的快速演進與關鍵技術 AI Agent:智能代理與自主決策新時代 DeepSeek分析與比較 LLM與AGI的最新進展與趨勢 2025 AI 趨勢展望與未來挑戰 2025年, AI 正在加速改變我們生活
一、AGI的新時代:從Generative AI到通用人工智能 什麼是生成式AI (Generative AI) 生成式AI(Generative AI)是一種基於深度學習的模型,能夠根據輸入資料(如文字、圖像、聲音等),產生具有創造性的新內容。例如,常見的文字生成模型(如ChatGPT)、圖像生成模型(如DALL·E)都是生成式AI的典型代表。
特徵: 能夠學習龐大資料中的特徵,並根據輸入指令自動生成近似或全新的內容。應用範圍: 從文案撰寫、語言翻譯到插畫設計、音樂創作、程式碼生成等。限制: 在面臨需要跨領域知識或複雜推理的任務時,傳統生成式AI仍較難自動完成全流程作業。
什麼是通用人工智能 AGI 傳統的生成式AI主要聚焦於內容生成與單一任務應用,但隨著技術突破,業界的焦點已經轉向AGI——通用人工智能AGI (Artificial General Intelligence)。AGI具備跨領域學習、決策與問題解決的能力,能夠根據自然語言指令,完成從網頁操作到自動下單等複雜任務,也被視為AI Agent的前身。
實際案例: 在LnData 數據科學家的測試中,使用者僅需以自然語言下達「請幫我購買」的指令,AI便能自主開啟瀏覽器、搜尋商品價格、點擊按鈕並進行資料填寫。從單一指令到全流程自動化的應用,正是AGI技術邁向實用化的重要里程碑;目前 LnData已率先投入打造數據分析的AGI模型。
AGI 與 Generative AI 比較
AGI的應變能力 Improvise Ability AGI不僅能執行單一步驟的操作,更能夠在動態情境中「即興應變(Improvise)」:
理解診斷問題 :根據不同的環境或上下文,動態辨識關鍵資訊。生成解決方案 :根據既有知識與推理能力,提出多種可行方案。執行與自我修正 :在執行過程中持續監控結果,並對錯誤或異常狀況進行修正。LnData 如何以 AI 自主分析並優化廣告投放策略
這就是為何AGI在面對複雜且多變的商業或日常場景時,能更貼近人類的思考與決策模式。以協助廣告投放業務為例:
AI系統可整合消費者行為數據、競爭對手情報與即時新聞等多重資訊,並根據不同廣告平台的特性,自動調整投放策略。當廣告成效不如預期時,AGI能即時分析問題根源,調整受眾設定、廣告內容或投放預算,最大化廣告投資回報率。
二、LLM技術的快速演進與關鍵技術 大型語言模型(LLM)憑藉其強大的語言理解與生成能力,已成為驅動現代AI應用的基石。根據LnData的數據科學團隊研究,目前LLM在自然語言處理、鏈式思考(Chain-of-Thought)以及自我監督學習等方面都有驚人的進展,而這些歸功於以下重要技術的發展:
提示詞工程 (Prompt Engineering) 提示詞工程 是指在與LLM互動時,透過設計良好的提示詞(Prompt),來引導模型生成更準確或更符合需求的內容。
常見的提示詞要點如下 :
明確問題範圍,避免模糊或過度籠統。 提供必要的上下文與示例。 透過反覆實驗與調整,尋找最佳提示詞結構。
檢索增強生成 (RAG) 檢索增強生成(Retrieval-Augmented Generation,RAG)技術旨在讓LLM能夠存取外部知識庫,並在生成答案時引用這些相關資料。相較於原生模型僅依賴訓練資料,RAG能夠產生更準確、即時且具有明確引用來源的答案。這也讓LLM能將企業的資料庫檔案文件作為資料擴充。
RAG 流程架構示意
ReAct 技術框架 ReAct (Reasoning + Acting) 讓AI可以實現CoT(Chain of Thoughts)逐步思考、查詢外部資源並進行外部工具運算,最終產生更完整且符合現實需求的答案。ReAct技術的重要性在於它讓LLM能更有效地與外部世界互動,突破單純文字生成的侷限,應用場景大幅擴張。
ReAct 框架核心組成 :
Observation (觀察) :接收環境資訊或使用者輸入Reasoning (推理) :基於觀察進行邏輯推理,決定下一步行動Action (行動) :執行特定操作(如呼叫API、查詢資料庫、進行計算)Repeat (重複循環) :根據新的觀察結果,不斷推理並調整行動
強化學習與回饋機制 透過強化學習(Reinforcement Learning, RL),AI能根據環境反饋調整策略,最大化累積獎勵。這種方法特別適用於需要持續決策和優化行動的場景,例如遊戲AI或機器人控制。其中人類回饋(RLHF)則進一步提升了AI生成內容的品質,例如ChatGPT透過人類標註,學習生成更符合人類偏好的回應。四種主要的回饋機制包含:
環境回饋 (Environment Feedback): AI 執行行動後,環境直接給予回饋。例如:遊戲AI贏了得到加分,輸了扣分。自我回饋 (Self-Reflection Feedback): AI 透過內部的評估機制,反思自身的行動。例如:AI代理回顧自己的推理過程,找出可優化之處。人類回饋 (Human Feedback, RLHF): 人類提供標註數據,指導AI學習。例如:ChatGPT透過人類標註,學習生成更符合人類偏好的回應。內部回饋機制 (Intrinsic Reward): AI 因探索新事物或發現新策略而獲得內部的獎勵。例如:機器人發現新的解決問題方法,給予自己額外獎勵。
三、AI Agent:智能代理與自主決策新時代 AI代理:2025年最受矚目的AI趨勢 近年來,隨著大型語言模型(LLM)和強化學習技術的快速發展,AI代理(AI Agent)正逐漸成為AI領域的新焦點。除了經濟學人預測AI Agent將讓我們可以「從對話走向執行」,Google CEO甚至高調宣稱,我們已經進入了「代理時代」(Agentic Era)。那麼,AI代理究竟是什麼?它又將如何改變我們的生活?
AI代理的定義與特性 簡單來說,AI代理是一種可以自主執行任務的AI系統 ,並且以大型語言模型為基礎,具有感應、規劃、決策執行與反思等能力。
AI代理的工作流程通常包含四個步驟:
感知與分析(Perception) :收集並分析環境資訊。決策與計劃(Planning) :基於所收集的資訊,制定計劃或做出決策。執行(Action) :按照計劃執行相應的動作。學習與適應(Feedback) :根據執行結果和環境反饋,進行學習和行為調整。
這種循環交互的工作方式,使AI代理能超越傳統的AI模型,在複雜多變的環境中不斷優化自身的行為策略。
AI模型與 AI 代理的比較
AI代理的關鍵技術:ReAct 與 PPO AI Agent 可以透過整合多種工具與技術,提供自動化工作流程,有效處理各領域的複雜任務。包含以知識圖譜、RAG、API查詢等工具,提升AI Agent獲取和處理資訊的能力;或是藉由意圖分類、語氣轉換等技術,使AI Agent能更人性化地與使用者互動。而為了讓 AI Agent變得更聰明,目前最流行的兩大關鍵技術為 ReAct 與 PPO :
ReAct (Reasoning + Acting) 如前所述,ReAct 框架是透過循環交互的方式完成任務,每一步都包含觀察、推理與行動,能與環境或工具進行深度互動。PPO (Proximal Policy Optimization) 一種強化學習演算法,旨在改善策略梯度方法的穩定性與效率。PPO能協助AI代理在反覆試驗中持續優化行動策略,使其更快速、更穩定地學習到最佳決策路徑。
AI代理的應用案例 客服領域:
解決使用者複雜問題:利用FAQ資料庫、RAG提供精準答案。 意圖分類:根據問題類型,採用不同回應策略(技術問題、退款、抱怨等)。 語氣風格轉換:調整AI回應風格,符合不同客戶需求。 旅遊規劃:
行程規劃:結合知識圖譜和RAG,提供行程、交通、住宿建議。 即時資訊:透過API查詢,獲取交通、天氣等動態資訊。 路徑優化:自動計算最佳移動路線,提升行程效率。 工程開發:
工程數據解析:使用Text-to-SQL查詢工程資料庫,解答進度問題。 文件分析:利用RAG和PDF分析,處理工程合約、SOP等文件。 專業知識理解:結合知識圖譜和專業詞彙訓練,提升LLM對工程術語的理解。 LnData客戶案例:
煉油廠擴建專案查詢: 在煉油廠擴建專案中,透過Neo4j知識圖譜 用於查詢設備與施工步驟的關聯,以便確定正確的安裝順序。報價合約表解析: 從PDF文件中自動解析表格數據,結合OCR、Transformer模型、Prompt Engineering和LLM評估。
AI代理的挑戰與未來展望 AI代理技術的快速發展,為許多產業帶來了巨大的變革機會,然而,大規模落地、技術難題、倫理問題是該技術必須面對,並且解決的三大挑戰:
大規模落地: AI產品尚未大規模普及,商業模式仍在探索。技術難題: AI代理的自主學習和決策能力仍有待提高。倫理問題: AI代理的自主性與潛在風險引發倫理擔憂。
在AI代理技術發展的初期,除了需要克服技術上的挑戰,要如何商業化AI agent,成為能讓一般消費者廣為接受的產品,依舊是一大挑戰。除了技術與商業化問題,由於AI agent相較於一般的AI程式,有更高程度的自主性,因此在倫理上,也增加了人類必須與AI agent互動的新倫理議題,例如如何應對AI代理的潛在風險,避免其產生歧視、偏見或錯誤行為。
四、DeepSeek分析與比較 為什麼你不該用 DeepSeek 在眾多AI應用中,DeepSeek在今年初橫空出世,其宣稱的低成本、高效能使其一推出就獲得廣大關注,其離線版甚至被上百萬用戶下載。然而,許多實際使用者與專家皆提出警告:DeepSeek是一個「毒葡萄」,強調「盡量不要接觸也不要用」,這是因為DeepSeek在技術穩定性與安全性方面存在一些隱憂。
什麼是DeepSeek? DeepSeek 是一個由中國公司 DeepSeek 所開發的大型語言模型,並擅長於程式碼和數學領域。其模型之所以被拿來與OpenAI的先進模型進行比較,主要原因在於它在性能、成本與開源性方面展現了初步優勢:
成本效益 :宣稱其成本僅...(加入數據),能以較低成本達到OpenAI同等級效能。開源性 :採取開源策略,允許開發者自由使用、修改和改進其模型。性能表現 :在部分基準測試中,DeepSeek的模型在數學、程式設計和自然語言推理等任務上表現出色。DeepSeek R1 與 OpenAI o3 先進模型優劣勢比較
DeepSeek-R1 的成本真的只要 600 萬美元複刻嗎? 根據DeepSeek官方數據,其V3模型共耗費約 278.8 萬小時的 H800 GPU 時間,假設每小時成本為 2 美元,總計約 557.6 萬美元。
然而,這可能忽略了隱藏成本。包含前期研究(V1、V2等前代版本)、架構設計及演算法試驗等都需額外投入,因此實際成本勢必更高。因此我們推估 DeepSeek 的完整訓練過程中,總成本至少超過1000萬美元。實際上,早有市場消息指出,DeepSeek母公司曾以10億人民幣 買輝達A100。
DeepSeek-R1 API成本分析 DeepSeek API 在價格上,平均比 GPT-4 還要便宜 2~3 倍,但是必須透過「百萬 Token」作為單位的方案購買。這對於不需如此大量使用的用戶而言,成本可能會高出許多。此外,若 DeepSeek 的硬體成本比 OpenAI 還要高,那麼要如何提供如此低價的API存取服務,依舊是一項挑戰。
DeepSeek的資安與技術風險 資安疑慮1 :DeepSeek雖然開源,但不代表可控制其輸出。因此在處理敏感資料時,若缺乏完善的安全機制,可能導致用戶資料外洩。資安疑慮2:根據 LnData研究結果,發現DeepSeek疑似透過第三方追蹤,將API金鑰、對話紀錄等敏感資訊送往百度。且包含加拿大、南韓等都有同樣的情形 被揭露。 資安疑慮3: 根據DeepSeek的隱私政策明確指出,用戶資料儲存於中國境內並受中國法律管轄,然後相關聲明並未符合歐盟GDPR。這意味著在使用 DeepSeek 時,用戶資料可能會面臨中國政府審查的風險。資安疑慮4: DeepSeek R1模型因為開源被封裝成惡意軟體,並且在社群平台上被廣為傳播。這造成了使用者在下載使用 Deepseek 模型的時候,產生極大的資安風險。蒸餾技術局限: DeepSeek使用「distill(蒸餾)」方式微調其他模型,但最終知識量可能仍侷限於小語言模型範圍。
我們的建議: DeepSeek免費不代表真實成本低,若企業盲目採用,可能因安全性與穩定性問題付出更高代價。
延伸閱讀:資料科學家告訴你為什麼不該用 DeepSeek
VIDEO
DeepSeek會衝擊NVIDIA晶片市場嗎? DeepSeek的低成本策略,以及其能夠在相對較少的硬體資源下,達到不錯的效能,有可能對NVIDIA在高階GPU市場的壟斷地位產生衝擊。如果DeepSeek的技術能夠持續發展,並且被廣泛應用,那麼將有機會改變當前的AI硬體市場格局,讓NVIDIA必須要面對來自其他競爭者的挑戰。
DeepSeek模型架構框架是否原創? DeepSeek的模型架構框架,在很大程度上是基於現有的開源模型進行修改和優化。它採用了類似 Transformer 的架構,並在訓練過程中使用了大量的資料集。儘管 DeepSeek 在一些基準測試中表現出色,但其模型架構框架的原創性仍然存在爭議。
小結:台灣企業不該依賴 DeepSeek,那我們需要什麼? 雖然台灣具有全球最強大的半導體產業與許多技術人才,甚至稱為「 AI島」,但事實上,台灣不只尚未真正擁有可媲美國際的自產大型AI模型;同時相對的,企業更迫切需要SLM(小語言模型)專家與本土化AI技術。因此從長遠來看,台灣若要發展自有AI技術,勢必需要更穩定且安全的模型基礎,而非只依賴DeepSeek等大模型或其蒸餾模型。
五、LLM與AGI的最新進展與趨勢 鴻海開源模型 FoxBrain 鴻海開源模型 FoxBrain 是一個開放給開發者進行研究和商業使用的多語言大型語言模型。透過鴻海在製造領域當中累積多年的經驗,FoxBrain 將會提供製造業者所需要的生成式 AI 解決方案。該模型可根據不同的任務需求,進行微調(fine-tune),進而應用在多種領域,例如智慧製造、智慧服務和智慧城市等等。
OpenAI 推出 Responses API與平台工具 Responses API :OpenAI推出的整合式API,可簡化開發者整合AI功能至應用程式的過程,內建工具調用與檔案搜尋功能,並支援網頁搜尋。該API 的出現,將讓AI Agent的開發更加的輕鬆方便,讓各行各業都有機會推出自有的AI Agent。
OpenAI Operator 與 Claude Computer Use OpenAI 的 Operator 和 Anthropic 的 Claude 的「電腦使用(Computer Use) 」功能,在概念上具有相似之處,兩者皆為旨在模擬人類操作電腦的 AI 代理,能夠執行如瀏覽網頁、填寫表單、訂購商品等任務。然而,它們在具體的實現方式上有所不同。
OpenAI 的 Operator: 是一個網頁應用程式,它利用名為「Computer-Using Agent (CUA)」的模型,結合 GPT-4o 的視覺能力與強化學習,使得 AI 能夠在瀏覽器中執行簡單的線上任務,例如預訂音樂會門票或填寫線上購物訂單。Anthropic 的 Claude 的「電腦使用」功能: 允許 Claude 模型控制電腦,模擬人類的操作 (RPA),例如移動游標、點擊按鈕和輸入文字。這使得 Claude 能夠自主執行複雜的多步驟任務,例如填寫表單或訂購食物。主要差異: 兩者差異主要在運行環境 上——Operator 在雲端的虛擬機上運行,而「電腦使用」功能則可以本地電腦上運行,取決於設定方式。
Gemini 與OpenAI 的 Deep Research Google Gemini Deep Research :能自動搜尋、分析並整合網路資訊,生成詳細報告,甚至整合arxiv論文進行高深研究。Google Gemeni擁有強大的檢索工具,以及對資料的處理能力,因此在Deep research 上具有相當大的優勢。OpenAI o3 模型 Deep Research :OpenAI 也致力於提升其模型在 Deep Research 方面的能力。他們正在開發新的工具和技術,以幫助模型更好地理解和處理複雜的資訊。
AGILE框架與OpenAGI平台等延伸模式 什麼是AGILE框架:
AGILE(LLM Agents that Interact and Learn from Environments)是一種創新的LLM框架,結合了大型語言模型(LLM)、記憶、工具以及專家互動,旨在讓 AI agent 從環境中學習,執行複雜的對話任務。 此框架將LLM作為策略模型,並透過強化學習進行微調,並在產品問答和醫療問答等領域展現出卓越的性能。
什麼是OpenAGI平台:
OpenAGI 是一個開源的AGI研究平台,它整合了LLM和領域專家模型,用於解決多步驟的真實世界任務。該平台採用強化學習機制,透過任務反饋來提升LLM的問題解決能力,為通用人工智慧(AGI)的發展提供了新的途徑。
此外,還有更多直覺且no-code的Web UI新服務誕生:
Dify :是一個開源的 LLM 開發平台,提供視覺化的拖拉式界面,用於建構 RAG pipeline、AI Agent 以及自訂工作流程,使得開發人員能夠更快速,以及便利的開發出各種LLM的應用。可支援多種開源與商業 LLM,例如 GPT-4 和 Claude。FastGPT :FastGPT 專注於 RAG 知識庫問答與 LLM應用開發,提供工作流編排(Flow Module)。適合企業內部文件管理、智能問答系統。Dify 是一個開源的 LLM 開發平台,提供視覺化的拖拉式界面
六、2025 AI 趨勢展望與未來挑戰 總結來說,2025年的AI生態系將呈現以下幾大趨勢:
AGI普及化: 未來的AI不再僅限於單一任務,而能跨領域自主學習與決策,甚至在部分情境中具備取代人工的能力。LLM技術持續突破: 隨著模型規模與訓練數據的不斷增長,LLM在自然語言理解、生成及推理方面將飛快進化,推動更多產業的數位轉型。AI Agent智能代理: 自動化工具將從輔助轉變為自主代理,協助使用者完成從網路操作到商務決策的各類任務,大幅提升生產力與決策效率。產品選擇與安全挑戰: 在眾多產品中,如何在技術創新與安全監控之間取得平衡成為關鍵。DeepSeek的案例提醒我們,有些技術雖然吸引眼球,但成熟度與安全性才是決定長期應用成敗的重要因素。
面對這些趨勢與挑戰,企業與個人用戶在技術與解方選擇時需更謹慎,不僅要關注前沿創新,更需確保系統具備完善的安全保障與風險管控機制。
結語 從AGI的概念落地到LLM技術的突破,再到 AI Agent在實際應用中的智能代理,2025年的AI發展已展現出顛覆傳統操作模式的巨大潛力。儘管 DeepSeek 等早期產品曾在市場上引起轟動,但其在安全性與技術成熟度上的不足,也提醒我們:只有不斷創新與完善,才能在智能化浪潮中立於不敗之地。
LnData 致力於追蹤這些前沿技術,並通過數據中台 架構與數據賦能解方、數據顧問諮詢,幫助業界掌握最新AI技術動態!
立即開始:聯繫我們 ,展開組織數據驅動之旅
延伸閱讀:2025 AI Agent 商用爆發元年,發展前必看指南