代码审计之SAST自动化

前言:

很久没写文章了,有点忙,落个笔,分享一些捣鼓或说适配好的一些好玩的东西。
脚本工具不开源,给一些思路,希望能给大家带来一些收获。
笔者能力有限,如有错误,欢迎斧正。

正文:

基于代码审计的原理去思考,正则匹配阶段,ast阶段,ir,cfg图阶段,ql查询语言阶段。
联动这四个方向相互的优势去结合做适配好自动化代码审计,去进行处理好soure,sink,调用栈关系。

source,sink分析:

这里的source和sink其实思路笔者采用的是利用第一阶段的正则匹配的思路去做,为什么不用其他阶段去做的原因,因为笔者追求的是非漏报,而后在联动调用栈分析达到完整的代码分析,而不是追求不误报。

基于这种状况去做的话,正则匹配应该是最优解。

2个方面:
1、代码开发简单。
2、不会出现ql,ir,cfg这种的依赖缺失构造不全的情况。如如果是闭源代码的情况下,后面的几种就会出现很多坑点。

调用python去进行正则匹配分析,自动化提取出相关的参数入口点,以及参数变量,危险函数,即可。

source:
如直接匹配常见的getParameter函数以及其他的参数函数即可匹配到常见是source函数
image.png
以及提取出里面的参数变量值
image.png

sink:
同理也调用匹配常见的危险函数即可。
image.png

调用栈分析:

原理思路1:

参考了很多项目以及原理。
目前大多数还是以asm,soot,bcel的思路去做的类,函数,一层调用关系提取分析。
然后结合指针分析,或者jvm栈帧去追踪污点流,最后利用结合一些算法去产生一个完整的调用栈。

像gadgetinspector:
就是利用分析了相关的类,函数,调用关系等,然后利用jvm栈帧确定污点流,最后结合算法产生完整调用栈,输出一个完整的结果。
image.png
image.png
但是经过笔者实测这种方式的污点流追踪对于没有返回值赋值的会导致追踪不到,导致漏报。

基于上面分析的思路我们去可以进行仿写一个类似的工具,结合每个语言的开源解析代码去提取分析出相关的函数,类,调用关系,而后进行数据处理,获取到完整的调用栈。

优势:可批量挖掘,且工具可以自己DIY,如优化算法,优化source,sink限定。
缺点:开发难度会更高,需要关注污点的问题。

如net:

net可以结合dnlib去解析dll代码提取出里面的方法,类,调用关系。而后转深度算法去进行遍历,最后获取到一个完整的调用栈。
image.png
image.png
image.png

java同理:

调用开源的java-callgraph获取到精准的类分析,方法分析,caller分析,而后在结合深度算法获取到一条完整的调用关系。
image.png
image.png

原理思路2:

这种是笔者查看了一个开发的开源项目后,产生的一种思考。
一种多语言通解思路,开发插件,调用引擎的调用关系分析+深度算法 实现获取大量的调用关系。
优势:
1、可适配多种语言,只要引擎可支持该语言的调用分析,即可直接获取。
2、插件开发简单,不用去关注污点等问题了,直接调用引擎的巨大优势实现。
3、由于引擎的强大能力,因此不用担心断的问题。
缺点:
插件不能实现批量自动化挖掘。

如idea的调用关系分析image.png
然后在去开发一个插件,而后转dot进行获取调用关系。
下面调用的方法
调用他的方法:
image.png
他调用的方法:image.png

结合:

然后结合sink,source的代码匹配出常见的危险函数后,在结合上面的调用栈,即可快速挖掘出一条有漏洞的调用链。
且还可以继续做限定,如匹配出哪些地方有source然后结合获取到的调用栈 拼接一个有漏洞的点就可实现自动化出来了。

后言:

有些老哥可能会说,可以直接利用已成熟的工具,如tabby,codeql,joern,soot,bytecodedl,doop这些思路去玩,但是经过笔者实测,这些相关工具对应非开源产品的处理不太友好。
当然也可能是笔者的问题,如果有老哥知道如何解决,望指教。

所以怎么说呢,结合起来用吧,如果是开源产品,挖掘链这种,利用这些工具也还行,但是对于闭源项目或是有缺的项目,或许基于自己的思路会更好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/585416.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

文件分块+断点续传 实现大文件上传全栈解决方案(前端+nodejs)

1. 文件分块 将大文件切分成较小的片段(通常称为分片或块),然后逐个上传这些分片。这种方法可以提高上传的稳定性,因为如果某个分片上传失败,只需要重新上传该分片而不需要重新上传整个文件。同时,分片上传…

linux 搭建知识库文档系统 mm-wiki

目录 一、前言 二、常用的知识库文档工具 2.1 PingCode 2.2 语雀 2.3 Tettra 2.4 Zoho Wiki 2.5 Helpjuice 2.6 SlimWiki 2.7 Document360 2.8 MM-Wiki 2.9 其他工具补充 三、MM-Wiki 介绍 3.1 什么是MM-Wiki 3.2 MM-Wiki 特点 四、搭建MM-Wiki前置准备 4.1 前置…

带环链表及例题

环形链表,链表中的尾节点指向链表中的某个节点导致形成循环的链表。 通过图可以这样表示。 我们一般采用快慢指针的方式解决带环链表的题目,下面直接上例题 环形链表 力扣链接: . - 力扣(LeetCode) 让我们判断一个…

渗透测试之sql注入绕过技巧

在sql注入中,通常会将某些关键的字符过滤掉,以此来达到预防sql注入的目的。这时我们就可以通过某些技巧来绕过。 绕过技巧1: 这个是在某个比赛中出现的,当时并没有多少人成功绕过。 如下: 如下图:在php中…

Django前后端项目部署

Django前后端分离项目部署 本文采用阿里云服务器,centos7.9操作系统 本文默认服务器已安装nginx,mysql并且可以正常运行Django vue uwsgi nginx注意:先部署后端,使用postman测试请求没有问题后在修改vue中的axios文件中baseURL&#xff0…

PLC通过Modbus转Profinet网关连接变频器与电机通讯

Modbus转Profinet网关(XD-MDPN100)是一种能够实现Modbus协议和Profinet协议之间转换的设备。Modbus转Profinet网关可提供单个或多个RS485接口,PLC作为控制中枢,变频器作为控制电机转速,通过Modbus转Profinet网关&#…

美国站群服务器的定义、功能以及在网站运营中的应用

美国站群服务器的定义、功能以及在网站运营中的应用 在当今互联网的蓬勃发展中,站群服务器已成为网站运营和SEO优化中不可或缺的重要工具之一。尤其是美国站群服务器,在全球范围内备受关注。本文将深入探讨美国站群服务器的定义、功能以及在网站运营中的…

【城市】应届生第一次打工需要知道的常识(薪资结构,社保,五险二金,个税,专项扣除)

【城市】应届生第一次打工需要知道的常识(薪资结构,社保,五险二金,个税,专项扣除) 文章目录 1、什么是应届生 & 如何界定应届生2、社保,五险一金,五险二金3、薪资结构&#xff0…

运存与内存?内存与存储? 傻傻分不清

主页: 元存储博客 图片来源: Blackblaze 文章目录 名词为何“内存”的含义混乱内存和存储含义内存和存储作用RAM 与 存储差异速度和性能容量和尺寸易失性和持久性常见问题:总结名词 内存: Memory,如内存条 存储器: Storage, 包括硬盘等 为何“内存”的含义混乱 <

class089 贪心经典题目专题1【左程云算法】

class089 贪心经典题目专题1【左程云算法】 前言版权推荐class089 贪心经典题目专题1code1 179. 最大数code2 1029. 两地调度code3 1553. 吃掉 N 个橘子的最少天数code4 253. 会议室IIcode5 630. 课程表 IIIcode6 1167. 连接棒材的最低费用(leetcode测试)code6 P1090 连接棒材的…

C进阶-数据的存储

文章目录 1. 数据类型介绍类型的基本归类 2. 整型在内存中的存储:原码,反码,补码2.1. 原码,反码,补码 2.2. 大小端介绍大端字节序存储小端字节序存储例:设计程序判断是大端还是小端? 2.3. 练习练习1练习2练习3练习4 3. 浮点型在内存中的存储 1. 数据类型介绍 数据类型数据类型…

YARN详解

YARN 简介 YARN 是Yet Another Resource Negotiator的缩写。 YARN是第二代MapReduce,即MRv2,是在第一代MapReduce基础上演变而来的,主要是为了解决原始Hadoop扩展性较差,不支持多计算框架而提出的;通俗讲就是资源管理器. YARN核心思想: 将 MR1 中资源管理和作业调度两个功能分…

node.js 解析post请求 方法二

前提&#xff1a;以前面发的node.js解析post请求方法一为模板&#xff0c;具体见 http://t.csdnimg.cn/ABaIn 此文我们运用第二种方法&#xff1a;使用第三方模块formidable对post请求进行解析。 1》代码难点 *** 在Node.js中使用formidable模块来解析POST请求主要涉及到处理…

读(用知云翻译)gaitedge论文

文章目录 前言摘要一、介绍二、相关工作2.1步态识别2.2端到端学习 三、跨域问题四、我们的框架4.1步法合成4.2步态对准模块 五、实验5.1设置5.2性能比较5.3消融实验5.4可视化 六、结论 前言 本篇博客仅为个人学习&#xff0c;全文均为知云翻译&#xff0c;如有翻译不当&#x…

Android中的屏幕刷新机制(动画视频形象说明机制)

一&#xff0c;刷新率和帧率&#xff0c;60hz和60fps的区别 在Android系统中&#xff0c;刷新率和帧率是两个不同的概念&#xff0c;它们各自在显示过程中扮演着不同的角色。以下是对它们的详细解释&#xff1a; 刷新率&#xff0c;单位是Hz&#xff0c;是指屏幕在一秒内刷新…

Python来计算 1,2,3,4 能组成多少个不相同且不重复的三位数?

我们今天的例子是 有 1&#xff0c;2&#xff0c;3&#xff0c;4 四个数字&#xff0c;它们能组成多省个互不相同且无重复的三位数&#xff1f;都分别是多少&#xff1f; 话不多说&#xff0c;我们先上代码 num 0 # 我们写了三个for循环&#xff0c;表示生成的三位数 for i…

ROS 2边学边练(41)-- 使用基于tf2_ros::MessageFilter带标记(位姿、时间...)的数据类型

前言 此篇将介绍如何利用tf2来使用传感器数据&#xff08;如单声道和立体声摄像机以及雷达&#xff09;。 假设我们创建了一只海龟叫turtle3&#xff0c;它的里程计不大好用&#xff0c;为了监视turtle3的活动轨迹&#xff0c;有台头顶摄像机被安装到该海龟的背上&#xff08;负…

arp欺骗详解

目录 arp攻击原理 arp协议简介 arp攻击原理 arp实验 实验环境 实验步骤 1、使用ipconfig命令查看靶机&#xff08;window10&#xff09;的IP地址为下一步攻击做好准备&#xff0c;这一步是模拟你获取对方IP的过程 2、使用ifconfig查询查看攻击者&#xff08;kali&#x…

【华为 ICT HCIA eNSP 习题汇总】——题目集19

1、&#xff08;多选&#xff09;以下选项中&#xff0c;FTP 常用文件传输类型有&#xff08;&#xff09;。 A、ASCII 码类型 B、二进制类型 C、EBCDIC 类型 D、本地类型 考点&#xff1a;应用层 解析&#xff1a;&#xff08;AB&#xff09; 文件传输协议&#xff08;FTP&…

Win10无法合并分区?尝试以下2种解决方法吧

若Win10无法合并分区&#xff0c;导致C盘无法扩容&#xff0c;该如何解决呢&#xff1f;本文将介绍如何利用磁盘管理工具和傲梅分区助手轻松解决这个问题&#xff01; 为什么要合并硬盘分区&#xff1f; 合并硬盘分区是指将同一硬盘上的两个分区合并成一个&#xff0c;或者将…