关于AI挖掘SRC漏洞的一些经验和问题分享

关于AI挖掘SRC漏洞的一些经验和问题分享
关于AI挖掘SRC漏洞的一些经验和问题分享

本人之前从事二进制方向,PWN和逆向的研究,从一个月前开始SRC的研究。正好赶上了这波AI挖掘SRC的浪潮,各路培训机构层出不穷,本人也在可以算是第一家有成熟套路的机构报了名,上了几天课,但是一直有几个无法解决的问题,在此分享一些目前的一些收获和测试情况(后面我会附上我想到的问题,有些问题没有实践只是猜想)以及向各位佬友交流一下有没有更好的解决方案。

  • 各类堆skill大法

    在这个方法下又诞生了几种方法论:

    • 把SRC报告喂给ai,让ai总结成skill 问题:src报告通常都是复现过程,缺少了漏洞发现的过程,以及一些排查思路。

    • 让ai打靶场,总结成skill 问题:实测dp无法很好地写这个skill,打到有价值的地方也不进行总结,gpt5.5稍微好一点,但是效果也不尽人意

    • 蒸馏各类网安skill 问题:显而易见,听说这种skill很难出货,因为信息杂乱,通常是由ai总结,依然脱离实战
      另外,实测发现随着上下文变长,AI会慢慢不听skill的话

  • 记忆系统
    这种方法我觉得不仅适用于网安,也适用其他领域。
    就是将上下文、技巧、经验不仅存储在skill里,也存储在数据库中 问题:ai不知道什么时候把当前的重复错误行为和有价值的经验存入数据库,也不知道什么时候从数据库中提取什么经验。且选型我目前很纠结,这个东西类似本地知识库,但是用RAG又很臃肿,用jsonl又过于轻量且只能用关键词一比一搜索,不能模糊搜索,那还有什么意义呢,比如xss一搜,可能出来很多很多,即便解决了这个问题,也面临ai不会用的问题。

我想到的解决办法:

  1. 针对记忆系统,使用传统skill的方式去写,但是由人工审核干预,还是很累做不到自动化,比如看到AI重复犯错,就触发写记忆skill,写到对应领域的技巧的skill里

  2. 轻量skill,skill只做角色定位+写记忆skill+记忆

    实测还是有问题,不约束流程,ai会漏掉很多接口,功能点,还是不听skill的话,上下文问题还是无法解决。以下是测试情况,测试目标是我徒弟测试过的一个edu站点。

    • 第一版重流程skill(从国外大佬提取+打靶场强制他优化)无记忆系统:
      deepseek v4 pro可以挖到edu站点中手挖几小时出来的同样的身份证信息泄露,又多挖出来四个csrf
    • 第二版加记忆系统,轻skill:
      dp直接蒙圈,困在主站页面,浪费大量token后没有任何发现(开始不用mcp工具一直用curl)
      gpt5.5竟然更严重,从头到尾不调用mcp工具
    • 第三版最轻量skill:
      gpt5.5同样的问题,并且会胆子很小,各种功能点全部避开,甚至js都不看

    目前也是徘徊,我觉得记忆系统有必要,但是不知道怎样落地,ai挖洞的意义难道不是覆盖手工无法覆盖的地方,提高手工的效率吗,如果他学不会手工的技巧,漏掉功能点,哪还有什么意义呢,初入此站,望各位佬友能一起交流,寻找灵感。

5 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文