中文字幕亚洲欧美,日韩中文在线观看,亚洲欧美中日韩中文字幕,欧美日韩高清不卡免费观看,亚洲欧美日韩中文综合v日本,日韩欧美亚洲综合,欧美亚洲欧美日韩中文二区

×

掃碼關注微信公眾號

>

挖貝網(wǎng)> 產(chǎn)業(yè)> 詳情

重大升級 | SecGPT V2.0：打造真正“懂安全”的大模型

2025/4/16 10:13:42

2025 年，AI不再只是內容生成工具，它正成為各行各業(yè)的“第二大腦”。

隨著GPT-4.5、DeepSeek等新一代大模型的崛起，我們正進入Agentic AI(智能體AI)的時代—— 它不僅能對話，還能思考、執(zhí)行和協(xié)作，正在重塑整個生產(chǎn)力范式：

AI Coding：開發(fā)者從寫代碼者，變?yōu)榧軜嫀熀椭笓]官

Deep Research：安全研究員配備“超級助手”，漏洞分析效率倍增

Security Copilot：SecGPT不再是提示詞工具，而是實戰(zhàn)中的“作戰(zhàn)參謀”

“模型即產(chǎn)品”正在成為現(xiàn)實，Agentic AI 正走入你我身邊。

—— 引用自海外獨角獸發(fā)布材料

而這一次，云起無垠沒有止步于“能用”，我們在追求“好用”的同時，更關注真正實戰(zhàn)可落地的AI安全能力。

從模型訓練、數(shù)據(jù)構建、能力評測，到安全Copilot應用，我們打造出更聰明、更安全、更懂安全的SecGPT 2.0。開源模型可以去github下載使用。

下一站，我們將共同邁入Agentic Security的未來。

歡迎加入這場由“安全智能體”引領的技術革新！

01什么是SecGPT?

在通用大模型席卷全球的今天，云起無垠選擇了一條不同的路：打造真正懂網(wǎng)絡安全的大模型。

這不是一次“技術熱潮”的追隨，而是一次面向實戰(zhàn)的系統(tǒng)性創(chuàng)新。

SecGPT，正是我們在2023年推出的開源成果——全球首個聚焦網(wǎng)絡安全的大模型。

|我們希望它不只是“會說安全”，而是真正能“做安全”的智能體。

自發(fā)布以來，SecGPT持續(xù)受到全球安全技術社區(qū)的高度關注：

GitHub收獲Star數(shù)突破2,300+

HuggingFace下載量超過10,000+

被數(shù)十家安全團隊用于安全問答、漏洞歸因、攻防演練等實戰(zhàn)任務

SecGPT 能做什么？

SecGPT融合了自然語言理解、代碼生成、安全知識推理等核心能力，已經(jīng)能夠勝任多種關鍵安全任務：

漏洞分析：識別漏洞成因、評估影響范圍、提出修復建議

日志/流量溯源：輔助分析攻擊鏈、復原攻擊路徑

異常檢測：解析網(wǎng)絡行為，判斷是否存在潛在威脅

攻防推理：支持紅隊演練/藍隊研判，完成多輪策略分析

命令解析：識別腳本意圖，揭示潛在風險操作

知識問答：成為團隊“即問即答”的安全知識庫

這些能力不再停留在“能回答”，而是可以被“調用”、“組合”、“協(xié)同”執(zhí)行，支撐起復雜的安全智能任務流。

SecGPT 的定位：安全智能體的核心引擎

在“云起AI安全大腦”體系中，SecGPT是整個系統(tǒng)的統(tǒng)一語言理解與推理核心。

理解自然語言：大幅降低使用門檻，助力非安全專家也能上手

融合安全知識：具備上下文關聯(lián)與多步推理能力

持續(xù)學習反饋：具備智能體持續(xù)優(yōu)化、自我增強的能力

無論是作為單點智能助手，還是嵌入式任務引擎，SecGPT都已具備強大的適配性、擴展性與安全可控性。

02為什么我們要持續(xù)更新SecGPT?

自2023年SecGPT開源以來，大語言模型技術持續(xù)突飛猛進。從語言理解到邏輯推理，再到工具調用與多任務協(xié)同，行業(yè)標準幾經(jīng)更替，邁入智能體（Agentic AI）時代。與此同時，云起無垠也在持續(xù)推進商業(yè)版安全大模型 SecGPT Pro 的多輪迭代，核心能力已實現(xiàn)代際躍升。

但開源版本仍停留在早期階段，在語言表達、安全理解與接口兼容性方面逐漸顯現(xiàn)出技術邊界，難以應對當前復雜多變的安全任務需求。因此，我們決定對SecGPT開源模型進行全面升級，持續(xù)回饋全球安全社區(qū)，并助推安全智能體在更多場景中的落地與演化。

1）模型基礎設施演進，舊模型能力邊界逐漸暴露

大語言模型領域的基礎設施已經(jīng)發(fā)生底層變動。相比早期模型，新一代模型具備更長上下文處理能力、更高效的注意力機制、結構更清晰的工具調用接口，以及支持Agent工作流的任務控制能力。例如，支持MCP協(xié)議、ReAct思維鏈、Routing插件架構、Function Calling、工具上下文記憶、部署端的量化控制與微調架構等，都已成為安全智能體設計中的“新基礎”。

一旦開源模型長期不更新，將面臨以下技術脫節(jié)問題：

無法適配新一代推理引擎（如 vLLM、TGI）

無法兼容結構化插件調用（Function/API 調度）

缺失任務鏈調度能力（Task-Aware Routing）

微調體系無法與最新安全數(shù)據(jù)對齊（SFT+RLHF+RAG混合）

隨著智能體形態(tài)的普及，能力缺口將迅速放大，直接影響用戶體驗和模型落地價值。

2）安全任務結構升級，對模型能力提出多維要求

早期模型使用者多集中于問答類任務，例如安全知識普及、命令解析、腳本理解等。這類任務主要依賴語言理解能力，結構相對簡單。然而，當安全模型真正進入研發(fā)、攻防、運營等實際場景后，任務呈現(xiàn)出明顯的結構化、多輪化、工具化趨勢：

漏洞鏈條重建→多日志輸入+多階段因果推理

多語言項目審計→代碼上下文建模+跨文件引用分析

安全知識圖譜構建→抽取實體/關系+圖結構生成

安全運營協(xié)同→工具調度+狀態(tài)反饋+報告輸出

這類任務要求模型不僅具備語義理解能力，還要具備：

推理路徑構建能力（Chain-of-Thought/Tree-of-Thought）

知識檢索與融合能力（用于語境增強與準確性提升）

任務規(guī)劃與階段控制能力（支持多輪次有狀態(tài)任務執(zhí)行）

多工具協(xié)同使用能力（如模糊測試 + 漏洞掃描 + 資產(chǎn)識別）

原有SecGPT模型架構難以完成上述能力組合，僅靠 Prompt 注入或零樣本提示遠遠不夠。

3）現(xiàn)實挑戰(zhàn)：通用模型無法替代專業(yè)安全模型

盡管DeepSeek、Qwen、LLaMA等開源大模型在通用語言理解、代碼生成等任務中取得顯著進展，但在安全場景下，它們面臨以下結構性瓶頸，尤其在企業(yè)級私有部署環(huán)境中更為突出：

（1）知識盲區(qū)廣泛，缺乏關鍵安全語料支撐

通用模型訓練語料以開放領域為主，嚴重缺乏如下高價值安全語料：滲透測試日志、攻擊鏈行為樣本、系統(tǒng)調用軌跡、漏洞利用（PoC/Exp）、紅隊審計報告等。這直接限制了其對實戰(zhàn)攻防細節(jié)的掌握能力。

（2）語義建模能力薄弱，缺乏安全背景意識

在漏洞成因理解、系統(tǒng)語境建模、協(xié)議行為解析等任務中，通用模型的理解能力多停留在淺層表述，無法進行因果鏈條建模與深層語義推理，缺乏“攻防語境”下的專業(yè)認知。

（3）工具接口調用不精準，缺失系統(tǒng)適配能力

通用模型未針對安全工具（如模糊測試框架、漏洞掃描器、靜態(tài)分析引擎等）進行微調和適配，導致在調用第三方接口時經(jīng)常出現(xiàn)參數(shù)配置錯誤、上下文不匹配、調用邏輯混亂等問題，嚴重影響任務可執(zhí)行性和穩(wěn)定性。

（4）任務鏈結構理解缺失，推理與執(zhí)行脫節(jié)

安全任務往往涉及多步推理（理解→分析→調用工具→收集反饋→修復建議），通用模型缺乏對這類“任務鏈”結構的建模能力，常常出現(xiàn)中途跳躍、邏輯斷裂、輸出不可收斂等現(xiàn)象，無法勝任復雜工作流調度任務。

當前通用大模型在安全場景中往往表現(xiàn)為“語言流暢但邏輯混亂，表達順暢但結果失真”。在真實系統(tǒng)環(huán)境下，其輸出容易出現(xiàn)答非所問、指令不收斂、工具調用失敗、上下文錯亂等問題，難以支撐企業(yè)對安全智能體高可信、高精度、高可控的實際需求。

03本次更新，SecGPT能力提升了哪些維度?

本輪升級，我們同步發(fā)布了1.5B / 7B / 14B三個模型規(guī)格，全面適配從低配CPU、本地4090 GPU到企業(yè)級多卡集群等多種運行環(huán)境，實現(xiàn)大模型能力的普適化落地。更大規(guī)模的32B、72B、671B旗艦版也將在后續(xù)分批開放，進一步支撐企業(yè)級復雜安全任務的多輪推理與智能決策。

本輪更新亮點

1. 更強的基座能力：通用+安全深度融合

我們基于Qwen2.5-Instruct系列與DeepSeek-R1系列基座模型，結合自建安全任務集與安全知識庫，在8臺A100 GPU集群上持續(xù)訓練一周以上，完成大規(guī)模預訓練 + 指令微調 + 強化學習，顯著提升模型在安全場景中的理解、推理與響應能力。

下圖展示了一次訓練過程中各關鍵指標的演化軌跡：

訓練與驗證損失（train/loss 與 eval/loss）：二者均呈現(xiàn)出平穩(wěn)下降趨勢，說明模型在訓練集與驗證集上均持續(xù)收斂，未出現(xiàn)過擬合跡象。

學習率曲線（train/learning_rate）：采用典型的 Warmup + 衰減策略，有效提升了早期訓練的穩(wěn)定性與收斂速度。

梯度范數(shù)（train/grad_norm）：整體波動平穩(wěn)，僅在少數(shù)步數(shù)存在輕微尖峰，未出現(xiàn)梯度爆炸或消失，表明訓練過程健康穩(wěn)定。

評估表現(xiàn)：eval/runtime與 eval/samples_per_second波動范圍小，說明在評估過程中系統(tǒng)資源使用高效，推理吞吐量穩(wěn)定。

其他指標：如訓練輪數(shù)（train/epoch）、輸入token 數(shù)量（train/num_input_tokens_seen）等也表明訓練過程如期進行，達成預期計劃。

模型訓練與評估過程示例圖

2. 更大的高質量安全語料庫：私有 + 公共數(shù)據(jù)雙輪驅動

我們已構建了一個超大規(guī)模、結構完備的網(wǎng)絡安全語料庫，總量超過5TB、共計106,721個原始文件，其中超過 40%內容為人工精選與結構化處理。私有數(shù)據(jù)部分系統(tǒng)整合了具備70+字段 / 14類結構標簽體系的安全數(shù)據(jù)資源，經(jīng)過統(tǒng)一清洗、語義標注與重構，構建出數(shù)百億 Tokens 級的高質量語料，為大模型深度推理能力提供堅實支撐。

下圖展示了該語料庫的構成維度，整體采集邏輯遵循“理論支撐 — 實戰(zhàn)對抗 — 應用落地”三層結構體系：

理論支撐：涵蓋法律法規(guī)、學術論文、行業(yè)報告等權威資料，為模型提供穩(wěn)固的知識基座；

實戰(zhàn)對抗：包括漏洞詳情、CTF題庫、日志流量、惡意樣本與逆向分析等數(shù)據(jù)，提升模型對真實攻擊行為的識別與追蹤能力；

應用落地：涵蓋安全社區(qū)博客、教育培訓資料、安全知識圖譜與自動化策略，增強模型在安全運營、輔助決策等場景中的適配能力。

技術亮點：

雙輪驅動機制（私有 + 公共數(shù)據(jù)）保障語料在廣度與深度上的協(xié)同提升；

多維標簽體系使語料具備更強的結構化能力與上下文理解能力；

三層語料構建邏輯覆蓋從知識構建、威脅應對到實戰(zhàn)部署的完整安全任務鏈路。

3. 能力躍升：SecGPT正在蛻變?yōu)椤鞍踩帧?/p>

通過多輪數(shù)據(jù)優(yōu)化與任務精調，SecGPT已實現(xiàn)多個能力維度的跨越式進展：

更懂攻擊鏈、攻防語言與行業(yè)術語

更擅長處理復雜日志與漏洞描述

更適配私有化部署、邊緣推理等現(xiàn)實場景

核心能力提升詳解

1. 模型能力評測：全面指標躍升，實戰(zhàn)智能初現(xiàn)

為全面評估 SecGPT 的安全實戰(zhàn)能力，我們構建了一套覆蓋安全證書問答、安全通識、編程能力、知識理解與推理能力的綜合評估體系，主要采用以下標準化數(shù)據(jù)集：CISSP、CS-EVAL、CEVAL、GSM8K、BBH。

在與原始模型 SecGPT-mini 的對比中，訓練后的模型在所有指標上均實現(xiàn)大幅躍升，具體如下：

1）模型橫向評測對比表

能力躍升解讀：

mini→1.5B：具備“能答對”的基礎問答能力，適配中低復雜度任務；

1.5B→7B：推理深度、泛化能力顯著增強，能理解任務意圖并構建較為完整的解決路徑；

7B→14B：能力躍遷至“類專家”級，能夠處理高復雜度推理、安全策略制定等高階任務。

模型橫向評測對比

相較于基礎模型 Qwen2.5-Instruct，SecGPT 在所有評測指標上均實現(xiàn)實質性超越，反映出我們在數(shù)據(jù)構建、微調范式、安全任務精調機制上的整體優(yōu)化成效：

洞察亮點：

在CISSP和CS-EVAL等安全類數(shù)據(jù)集上，SecGPT 在所有參數(shù)規(guī)模下均表現(xiàn)優(yōu)于Qwen2.5同規(guī)格版本；

表明我們構建的安全任務指令集與精調策略已顯著提升模型的實戰(zhàn)應用能力與專業(yè)問答深度。

2. 安全能力提升：更全、更準、更專業(yè)

本輪升級中，SecGPT在安全知識問答方面完成了從信息整合到邏輯輸出的能力躍遷，具體體現(xiàn)在：

知識覆蓋更全面：引入了涵蓋法律法規(guī)、攻擊戰(zhàn)術、逆向分析等14類安全知識領域的結構化語料；

答案生成更精準：通過多輪對話控制與語義優(yōu)化技術，提升了問答對齊率與上下文記憶穩(wěn)定性；

推理能力更突出：具備多段知識聯(lián)結與復合邏輯推演能力，能完成如攻擊鏈分析、威脅研判等復雜任務。

1）滲透測試場景能力

SecGPT 能夠模擬滲透攻擊流程，從信息收集、漏洞利用到提權橫向，具備關鍵工具命令分析、Payload 構造、利用鏈生成等能力。

2）日志分析和流量分析能力

在安全日志與網(wǎng)絡流量場景下，SecGPT 能自動識別異常事件、構建攻擊鏈圖譜、抽取關鍵 IOC（Indicator of Compromise），輔助完成事件溯源與告警分類。

3）逆向分析能力

基于對反匯編、API調用序列、加殼行為等低層數(shù)據(jù)的理解，SecGPT能輔助完成惡意樣本的靜態(tài)分析、特征提取與家族歸類，具備一定的逆向輔助解讀能力。

代碼

5）工具使用

04接下來，我們要做的還有很多……

1. 發(fā)布首份網(wǎng)絡安全大模型基準評測報告

我們即將發(fā)布首份網(wǎng)絡安全大模型能力評測與選型報告，圍繞威脅情報問答、代碼審計、日志分析等典型場景，構建一套系統(tǒng)化、透明且可復現(xiàn)的評測體系，全面對比當前主流模型的能力邊界。這份報告不僅為安全技術社區(qū)提供清晰的對比依據(jù)，也將成為合作伙伴制定Fine-tune策略和智能體架構選型的關鍵參考材料。

2. 全面復盤：如何訓練一個真正“懂安全”的大模型

盡管通用大模型在語言理解領域已取得顯著進展，但能夠真正理解攻擊鏈邏輯、漏洞細節(jié)、勝任安全推理與實戰(zhàn)輔助的大模型仍然稀缺。我們將以全棧視角，全面復盤“如何訓練一個好用的安全大模型”，包括高質量安全訓練數(shù)據(jù)構建、模型架構調優(yōu)、多任務對齊訓練、能力評測體系設計等關鍵環(huán)節(jié)，打通數(shù)據(jù)→算法→評測的閉環(huán)路徑，推動安全智能體的實用化落地。

3. 自動化 CTF 解題能力建設：邁向安全智能體的第一步

我們正在持續(xù)推進SecGPT在CTF解題任務中的自動化能力，目標是實現(xiàn)“理解題意 → 推理思路 → 構造Payload → 完成解題”的閉環(huán)流程。

目前模型已在大量真實題目中完成微調，具備初步能力：理解題意與還原考點，自動構造注入、命令執(zhí)行、ROP等攻擊鏈，解釋與變換攻擊命令含義，同類題型的遷移泛化表現(xiàn)良好。

下一步，我們將聚焦標準化數(shù)據(jù)構建、解題評分指標、自動解題Agent原型開發(fā)，以及聯(lián)合社區(qū)開展實戰(zhàn)挑戰(zhàn)驗證。CTF場景將成為安全大模型邁向Agent化的典型突破口。

4. 安全訓練數(shù)據(jù)集逐步開放，共建數(shù)據(jù)基座

我們正在建設并逐步開放一批具備混合結構、場景標簽的高質量安全數(shù)據(jù)集，覆蓋知識問答、代碼審計、漏洞挖掘、威脅情報解析、流量分析等關鍵任務場景。未來將支持多語言、多模態(tài)、多任務協(xié)同訓練，進一步增強安全大模型的泛化能力和實戰(zhàn)適應性。我們誠邀社區(qū)、企業(yè)、高校共同參與數(shù)據(jù)共建，共同筑牢安全模型的數(shù)據(jù)底座。

05最后，邀請你一起參與SecGPT的共建

SecGPT的成長離不開安全社區(qū)的反饋與參與。我們歡迎：

安全研究員提供數(shù)據(jù)、使用場景與測試建議

企業(yè)用戶參與內測，共同打造實用、可靠、安全的行業(yè)模型

歡迎關注我們，即將開放下一輪模型內測與插件測試通道！

你最希望SecGPT能替你解決哪些安全難題？歡迎留言討論????

SecGPT

相關閱讀

推薦閱讀

快訊更多

專題更多