Intel Pin

Stella981
• 阅读 588

这篇文章主要介绍一下Intel Pin在JIT模式和Probe模式下对库换数的替换,以及实现中有哪写需要注意的地方。

JIT模式就是对插桩的代码进行即时编译,然后缓存起来使用

Probe模式就是在要插桩的函数入口前面插入一条跳转指令,跳转到新的替换函数处执行,不在原来执行代码上进行修改

具体的大家可以参考Pin官方手册

https://software.intel.com/sites/landingpage/pintool/docs/65163/Pin/html/index.html

下面进入正文

在编写程序过程中,我们有时候需要需要关注一下某些库函数的调用,方便我们我们监测。比如我们想关注应用程序中共享变量的情况,共享变量主要就是静态变量,全局变量,以及堆变量(new或是malloc或是realloc或是calloc),以堆变量为例,我们就必须要监测malloc等函数,GCC中提供了LD_PRELOAD预加载库技术,通过这种技术,我们可以对一些库函数进行重写,然后在链接的时候首先加载我们自己写的动态链接库,后面加载正常的库函数时候由于符号表中已经有了我们重写的函数,那么就不会重定位到真正的库函数的位置。这篇文章主要使用Intel的Pin 二进制动态插桩框架来达到同样的效果,如果对Pin不了解的同学建议去看一下上面给出的手册链接。

使用JIT进行的malloc函数替换,根据代码解释

#include "pin.H"
#include <string.h>
#include <iostream>
using namespace std;


void * MallocWrapper( CONTEXT * ctxt, AFUNPTR pf_malloc, size_t size)
{  // Simulate out-of-memory every so often
    void * res;
    cout<<"=====Enter the MallocWrapper=======\n";
    cout<<"Malloc Size:"<<size<<endl;
    PIN_CallApplicationFunction(ctxt, PIN_ThreadId(),
        CALLINGSTD_DEFAULT,  pf_malloc,
        PIN_PARG(void *),  &res, PIN_PARG(size_t), size, PIN_PARG_END());
    return res;  }
 
VOID ImageLoad(IMG img, VOID *v) { 
    // Pin callback. Registered by IMG_AddInstrumentFunction
    if (strstr(IMG_Name(img).c_str(), "libc.so") ||
         strstr(IMG_Name(img).c_str(), "MSVCR80") || 
         strstr(IMG_Name(img).c_str(), "MSVCR90")) {

        RTN mallocRtn = RTN_FindByName(img, "malloc");
        //build a function proto
        PROTO protoMalloc = PROTO_Allocate( PIN_PARG(void *), CALLINGSTD_DEFAULT,
        "malloc", PIN_PARG(size_t), PIN_PARG_END() );
        //replace the application function
        RTN_ReplaceSignature(mallocRtn, AFUNPTR(MallocWrapper),
        IARG_PROTOTYPE, protoMalloc,IARG_CONST_CONTEXT,
        IARG_ORIG_FUNCPTR,IARG_FUNCARG_ENTRYPOINT_VALUE, 0,
        IARG_END);
    } 
}

int main(int argc, CHAR *argv[]) 
{
    PIN_InitSymbols();
    PIN_Init(argc,argv);
    IMG_AddInstrumentFunction(ImageLoad, 0);
    PIN_StartProgram();                
}

对于ImageLoad函数

首先根据malloc函数名找到malloc函数所在的库以及对应的Routine,RTN_FindByName主要干的就是这个

其次,对插桩的函数重新生成原型,替换原有的malloc函数原型

PROTO_Allocate就是生成一个原始函数原型,PIN_PARG(void *)表示的是返回类型,malloc函数的返回类型为void *,CALLINGSTD_DEFAULT表示编译这个函数的调用标准(一般不用改变),PIN_PARG(size_t)表示就是malloc中的传递的参数,这里参数传递的是类型就是size_t,最后必须加上IARG_END表示截止,这样返回的就是一个指向函数原型的指针。

RTN_ReplaceSignature表示就是在JIT模式对函数进行替换,mallocRtn表示就是malloc函数的Routine,AFUNPTR(MallocWrapper)表示就是替换函数的指针,IARG_PROTOTYPE允许你定义原始函数原型,因此后面加上我们之前定义好的原始函数原型protoMalloc,IARG_CONST_CONTEXT就是我们包装函数需要传递的第一个参数,IARG_ORIG_FUNCPTR表示原始函数指针(可以通过这个调用原始函数),最后一个参数是我们传递给原始malloc函数的,因此使用IARG_FUNCARG_ENTRYPOINT_VALUE,0表示传递给原始malloc的第一个参数,IARG_END表示截止。

再来看一下我们的包装函数MallocWrapper

我们首先打印一些信息,然后通过PIN_CallApplicationFunction调用我们原始函数,参数中需要注意的就是pf_malloc就是我们要调用的原始函数指针, PIN_PARG(void *),  &res,表示原始函数返回类型和值,PIN_PARG(size_t), size表示原始函数的参数类型和值,这样的话我们就能够调用原始函数了。

大家编译成Pin Tool后,可以用小程序测试(也可从这里参考我的代码)

结果类似如下:

=====Enter the MallocWrapper=======
Malloc Size:5
=====Enter the MallocWrapper=======
Malloc Size:5
=====Enter the MallocWrapper=======
Malloc Size:120
=====Enter the MallocWrapper=======
Malloc Size:12
=====Enter the MallocWrapper=======
Malloc Size:784

使用Probe进行malloc函数替换,代码如下:

typedef VOID * ( *PF_MALLOC )( size_t );

void * MallocWrapper(PF_MALLOC pf_malloc,size_t size)
{  // Simulate out-of-memory every so often
    cout<<"=====Enter the MallocWrapper=======\n";
    cout<<"Malloc Size:"<<size<<endl;
    return pf_malloc(size);
}
 
// Pin calls this function every time a new img is loaded.
// It is best to do probe replacement when the image is loaded,
// because only one thread knows about the image at this time.
VOID ImageLoad( IMG img, VOID *v )
{
    // See if malloc() is present in the image.  If so, replace it.
    RTN rtn = RTN_FindByName( img, "malloc" );
    
    if (RTN_Valid(rtn))
    {
        // Define a function prototype of the orig func
        PROTO proto_malloc = PROTO_Allocate( PIN_PARG(void *), 
                           CALLINGSTD_DEFAULT, "malloc", 
                           PIN_PARG(int), PIN_PARG_END() );
        
        // Replace the application routine with the replacement function.
        RTN_ReplaceSignatureProbed(rtn, AFUNPTR(MallocWrapper),
                                   IARG_PROTOTYPE, proto_malloc,
                                   IARG_ORIG_FUNCPTR,
                                   IARG_FUNCARG_ENTRYPOINT_VALUE, 0,
                                   IARG_END);

        // Free the function prototype.
        PROTO_Free( proto_malloc );
    }
}
 
int main(int argc, CHAR *argv[]) {
    PIN_InitSymbols();     
    PIN_Init(argc,argv);
    IMG_AddInstrumentFunction(ImageLoad, 0);
    PIN_StartProgramProbed();                
}

和之前的JIT模式很类似,只是这里的话,我们可以直接通过原始函数指针来调用(因为在Probe模式中不支持CONTEXT),还有就是替换函数变成了RTN_ReplaceSignatureProbed,程序启动函数变成了PIN_StartProgramProbed。

同时还需要注意的是,如果以Probe方式启动的话,那么系统需要支持特定的库,具体参考这里

以Probe方式运行效率更高,但是有很多Pin的一些功能支持Probe,如果不是特别在意效率的话,建议大家就是用JIT模式,使用简单并且功能齐全。

本文同步分享在 博客“勿到”(CSDN)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Jacquelyn38 Jacquelyn38
2年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
2年前
GreenPlum tidb 性能比较
主要的需求  针对大体量表的OLAP统计查询,需要找到一个稳定,高性能的大数据数据库,具体使用  数据可以实时的写入和查询,并发的tps不是很高建立数据仓库,模式上主要采用星星模型、雪花模型,或者宽表前端展示分为3类 saiku、granafa、c代码开发数据体量:事实表在35亿、维度表大的在500
Stella981 Stella981
2年前
JS 苹果手机日期显示NaN问题
问题描述newDate("2019122910:30:00")在IOS下显示为NaN原因分析带的日期IOS下存在兼容问题解决方法字符串替换letdateStr"2019122910:30:00";datedateStr.repl
Stella981 Stella981
2年前
PostgreSQL Oracle 兼容性之
Oracle使用sys\_guid()用来产生UUID值。 在PostgreSQL中有类似的函数,需要安装uuidossp插件。 如果用户不想修改代码,还是需要使用sys\_guid()函数的话,可以自己写一个。 如下:1.postgres\createextension"uuidossp";2.CREATE
Stella981 Stella981
2年前
JOptionPane修改图标
1.在Linux平台下.JOptionPane会显示Java默认的图标,在window平台不显示图标,如何替换这个图标了?2JOptionPane.setIcon(Icon)修改的是内容区域的icon,而不是左上角的Icon.所以需要通过修改Jdialog/Frame的图标来达到修改默认图标的问题.3.代码:if(JOptio
Wesley13 Wesley13
2年前
00_设计模式之语言选择
设计模式之语言选择设计模式简介背景设计模式是一套被反复使用的、多数人知晓的、经过分类编目的、代码设计经验的总结。设计模式(Designpattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的
Wesley13 Wesley13
2年前
Java设计模式之命令模式
介绍命令模式是一种行为型设计模式。在命令模式中,所有的请求都会被包装成为一个对象。参考了一下其他关于命令模式的文章,其中有谈到说是可以用不同的请求对客户进行参数化。对这句话的理解是,因为将请求封装成为对象,所以客户的所有操作,其实就是多个命令类的对象而已,即参数化了。命令模式的最大的特点就是将请求的调用者与请求的最终执行者进行了解
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究