C程序编程四步走

Wesley13
• 阅读 364

任何一个 C 程序代码到生成一个可执行文件都需要四步,分别是预处理 Pre-processing ,编译 Compiling ,汇编 Assembling 和链接 Link ,这里借助 Gcc 工具来探究这四步分别做了什么事,起到什么样的作用。本文使用的测试代码是经典入门程序 "Hello World!"。

测试环境

为探究预处理,编译,汇编和链接的功能,我们在 Ubuntu 系统中使用 Gcc 编译器( version=4.8.4 ),用简单的也是最经典的入门程序 "Hello World!" 作为测试代码。源文件 hello.c 代码如下:

// filename: hello.c
# include <stdio.h>

int main(void){
  printf("Hello World!");
  return 0;
}

正常情况我们都会执行命令 gcc hello.c -o hello.out 来生成二进制可执行程序 hello.out。

预处理

C 预处理器是用在编译器处理程序之前,它预扫描源代码完成包含头文件宏扩展条件编译行控制等功能。对于测试代码中,预处理器只对头文件进行了处理。获取预处理器输出的结果使用该命令 gcc -E hello.c -o hello.i。 由于 hello.i 文件内容比较多,这里截取部分进行说明。

// filename: hello.i
# 1 "hello.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 1 "<command-line>" 2
# 1 "hello.c"

...
# 1 "/usr/lib/gcc/x86_64-linux-gnu/4.8/include/stddef.h" 1 3 4
# 212 "/usr/lib/gcc/x86_64-linux-gnu/4.8/include/stddef.h" 3 4
typedef long unsigned int size_t;

...
# 5 "hello.c" 2

int main(){
    printf("Hello World!");
    return 0;
}

Tips:
hello.i 中有很多这样的格式# line filename flags,它表示下面行是由文件 filename 的第 line 行生成的。其中 flags 有 1,2,3,4 四种取值

  • 1 代表新文件的开始
  • 2 代表返回一个文件
  • 3 代表下面的文本来自系统头文件,所以某些警告可以过滤掉
  • 4 代表下面的文本应该包含在extern C块中 按照提示 stddef.h 文件中第 212 行有 size_t 的宏定义。

编译

编译的过程是将某种编程语言写的源代码(这里特指 C 语言)转换成另一种编程语言(这里特指汇编语言)。前面我们将 hello.c 预处理成了 hello.i 文件,现在就要将 hello.i 文件编译成汇编文件 hello.s 。获取编译器输出的结果使用命令 gcc -S hello.i -o hello.s 。汇编结果见 hello.s

    .file    "hello.c"
    .section    .rodata
  .LC0:
    .string    "Hello World!"
    .text
    .globl    main
    .type    main, @function
  main:
  .LFB0:
    .cfi_startproc
    pushq    %rbp
    .cfi_def_cfa_offset 16
    .cfi_offset 6, -16
    movq    %rsp, %rbp
    .cfi_def_cfa_register 6
    movl    $.LC0, %edi
    movl    $0, %eax
    call    printf
    movl    $0, %eax
    popq    %rbp
    .cfi_def_cfa 7, 8
    ret
    .cfi_endproc
  .LFE0:
    .size    main, .-main
    .ident    "GCC: (Ubuntu 4.8.4-2ubuntu1~14.04.3) 4.8.4"
    .section    .note.GNU-stack,"",@progbits

汇编

汇编的过程是将汇编语言编写的源码转换成可执行的机器代码,通常目标文件中包含至少两个段:代码段和数据段。其中代码段包含程序的指令,一般可读和可执行,不可写;数据段用来存放程序中所用到的各种全局变量或静态数据,一般可读,可写,可执行。获取汇编器输出的结果使用该命令 gcc -o hello.o -c hello.c ,由于 hello.o 是二进制文件,是无法阅读的。这里我们通过命令 objdump 来对二进制文件进行反汇编,查看里面内容。

// objdump -d hello.o 查看hello.o中代码段信息
hello.o:     文件格式 elf64-x86-64

Disassembly of section .text:

0000000000000000 <main>:
   0:    55                   push   %rbp
   1:    48 89 e5             mov    %rsp,%rbp
   4:    bf 00 00 00 00       mov    $0x0,%edi
   9:    b8 00 00 00 00       mov    $0x0,%eax
   e:    e8 00 00 00 00       callq  13 <main+0x13>
  13:    b8 00 00 00 00       mov    $0x0,%eax
  18:    5d                   pop    %rbp
  19:    c3                   retq

hello.o中各段信息如下:

// objdump -h hello.o 显示hello.o中各个段的头部信息
hello.o:     文件格式 elf64-x86-64

节:
Idx Name          Size      VMA               LMA               File off  Algn
  0 .text         0000001a  0000000000000000  0000000000000000  00000040  2**0
                  CONTENTS, ALLOC, LOAD, RELOC, READONLY, CODE
  1 .data         00000000  0000000000000000  0000000000000000  0000005a  2**0
                  CONTENTS, ALLOC, LOAD, DATA
  2 .bss          00000000  0000000000000000  0000000000000000  0000005a  2**0
                  ALLOC
  3 .rodata       0000000d  0000000000000000  0000000000000000  0000005a  2**0
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  4 .comment      0000002c  0000000000000000  0000000000000000  00000067  2**0
                  CONTENTS, READONLY
  5 .note.GNU-stack 00000000  0000000000000000  0000000000000000  00000093  2**0
                  CONTENTS, READONLY
  6 .eh_frame     00000038  0000000000000000  0000000000000000  00000098  2**3
                  CONTENTS, ALLOC, LOAD, RELOC, READONLY, DATA

链接

链接的过程是将一个或多个由编译器或汇编器生成的目标文件链接库(静态库或动态库)形成可执行文件。其中静态库会和汇编生成的目标文件一起链接打包到可执行文件中【静态链接】,它对函数库的链接是放在编译时期完成的。而动态库在程序编译时不会被链接到可执行文件中,而是在程序运行时才会被载入【动态链接】。不同的应用程序如果调用相同的库,那么在内存中只需要一份该共享库实例。获取链接器链接后的可执行文件使用命令 gcc hello.o -o hello 。如果想看该可执行文件依赖的库,可以使用命令 ldd hello

  # ldd hello 显示hello依赖的库
  linux-vdso.so.1 =>  (0x00007ffc85980000)
  libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f06c7a53000)
  /lib64/ld-linux-x86-64.so.2 (0x000055ad7be9e000)

参考文献

  1. 预处理
  2. 预处理-行号标记
  3. 编译器
  4. 汇编
  5. 链接器

如果该文章对您产生了帮助,或者您对技术文章感兴趣,可以关注微信公众号: 技术茶话会, 能够第一时间收到相关的技术文章,谢谢!

C程序编程四步走

本篇文章由一文多发平台ArtiPub自动发布

点赞
收藏
评论区
推荐文章
blmius blmius
2年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Stella981 Stella981
2年前
Opencv中Mat矩阵相乘——点乘、dot、mul运算详解
Opencv中Mat矩阵相乘——点乘、dot、mul运算详解2016年09月02日00:00:36 \牧野(https://www.oschina.net/action/GoToLink?urlhttps%3A%2F%2Fme.csdn.net%2Fdcrmg) 阅读数:59593
Stella981 Stella981
2年前
C# Aspose.Cells导出xlsx格式Excel,打开文件报“Excel 已完成文件级验证和修复。此工作簿的某些部分可能已被修复或丢弃”
报错信息:最近打开下载的Excel,会报如下错误。(xls格式不受影响)!(https://oscimg.oschina.net/oscnet/2b6f0c8d7f97368d095d9f0c96bcb36d410.png)!(https://oscimg.oschina.net/oscnet/fe1a8000d00cec3c
Stella981 Stella981
2年前
Linux查看GPU信息和使用情况
1、Linux查看显卡信息:lspci|grepivga2、使用nvidiaGPU可以:lspci|grepinvidia!(https://oscimg.oschina.net/oscnet/36e7c7382fa9fe49068e7e5f8825bc67a17.png)前边的序号"00:0f.0"是显卡的代
Stella981 Stella981
2年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
2年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Stella981 Stella981
2年前
Github标星5300+,专门为程序员开发文档开源管理系统,我粉了
!(https://oscimg.oschina.net/oscnet/a11909a041dac65b1a36b2ae8b9bcc5c432.jpg)码农那点事儿关注我们,一起学习进步!(https://oscimg.oschina.net/oscnet/f4cce1b7389cb00baaab228e455da78d0
Stella981 Stella981
2年前
Nginx反向代理upstream模块介绍
!(https://oscimg.oschina.net/oscnet/1e67c46e359a4d6c8f36b590a372961f.gif)!(https://oscimg.oschina.net/oscnet/819eda5e7de54c23b54b04cfc00d3206.jpg)1.Nginx反
Python进阶者 Python进阶者
5个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这