编译链接实战(9)elf符号表

news2025/7/13 23:54:19

文章目录

    • 符号的概念
    • 符号表探索

前面介绍了elf文件的两种视图,以及两种视图的各自几个组成部分:

img

elf文件有两种视图,链接视图和执行视图。在链接视图里,elf文件被划分成了elf 头、节头表、若干的节(section);在执行视图里,elf文件被划分成了elf头、程序头表、段(segment)。

可以看到,段实际上包含了若干个节,执行视图是给程序启动用的,用于指示如何加载程序;而链接视图是连接时使用的,用于指示链接器如何链接文件。

节头表就是一个表,可以理解成一个结构体数组,每一项用于描述一个节。每个我们今天来看下其中的一个节【符号表】。

今天我们关注**.symtab.dynsym**这两个节。

动态符号表 (.dynsym) 用来保存与动态链接相关的导入导出符号,不包括模块内部的符号。

而 .symtab 则保存所有符号,包括 .dynsym 中的符号。

符号的概念

什么是符号?我们将函数和全局变量(static局部变量也算)统称为符号(Symbol),函数名和变量名就是符号名(Symbol Name),我们可以将符号看做是链接中的粘合剂,整个链接过程正是基于符号才能够正确完成。每个目标文件都会有一个符号表(Symbol Table),即上图的.symtab段,这个表里记录了目标文件所用到的所有符号。每个定义的符号有一个对应的值,叫做符号值(Symbol Value),对于变量和函数来说,符号值就是它们的地址。

在本目标文件中引用的全局符号,却没有定义在本目标文件中,一般叫做外部符号。

实际上段名(比如.text),汇编语言里的标签(比如_start、_edata、_end),源文件名也是符号。

备注:局部变量临时分配在栈中,不会在过程外被引用,所以不会产生符号。

弱符号

符号可以分为强符号和弱符号。

  • 强符号:函数名、初始化的全局变量名;
  • 弱符号:未初始化的全局变量名。

符号表探索

我们来写一个测试程序:
oop.c:

#include <stdio.h>
int g_a = 10;      
static int g_s_b;
static int g_s_c = 0;
int g_d;
__thread int g_tls_e;
static __thread int g_tls_s_f;
__thread int g_tls_g = 0;
extern int g_e_h;
extern void fun1();
void fun()
{
        int l_i;
        g_d = 10; 
        static int l_s_i;
        g_e_h= 10;//外部变量和函数如果不使用的话,编译器不会为其产生符号表,因为会优化 
        fun1();
        printf("hello\n");
        return;
}

//定义一个弱函数
__attribute__((weak)) void fun_weak() 
{
        return;
}

该程序定义了若干个变量用于覆盖所有情况。
前缀g表示全局,l表示局部,s表示静态,tls表示线程局部数据,e表示extern。

进行编译而不链接:

gcc oop.c -c 

得到oop.o可重定位对象文件,前面说过,也是elf格式文件。

查看其节头表:

$ readelf -S oop.o  --wide
There are 15 section headers, starting at offset 0x458:

Section Headers:
  [Nr] Name              Type            Address          Off    Size   ES Flg Lk Inf Al
  [ 0]                   NULL            0000000000000000 000000 000000 00      0   0  0
  [ 1] .text             PROGBITS        0000000000000000 000040 000043 00  AX  0   0  1
  [ 2] .rela.text        RELA            0000000000000000 000330 000078 18   I 12   1  8
  [ 3] .data             PROGBITS        0000000000000000 000084 000004 00  WA  0   0  4
  [ 4] .bss              NOBITS          0000000000000000 000088 000010 00  WA  0   0  4
  [ 5] .tbss             NOBITS          0000000000000000 000088 00000c 00 WAT  0   0  4
  [ 6] .rodata           PROGBITS        0000000000000000 000088 000006 00   A  0   0  1
  [ 7] .comment          PROGBITS        0000000000000000 00008e 00002c 01  MS  0   0  1
  [ 8] .note.GNU-stack   PROGBITS        0000000000000000 0000ba 000000 00      0   0  1
  [ 9] .note.gnu.property NOTE            0000000000000000 0000c0 000020 00   A  0   0  8
  [10] .eh_frame         PROGBITS        0000000000000000 0000e0 000058 00   A  0   0  8
  [11] .rela.eh_frame    RELA            0000000000000000 0003a8 000030 18   I 12  10  8
  [12] .symtab           SYMTAB          0000000000000000 000138 000198 18     13   8  8
  [13] .strtab           STRTAB          0000000000000000 0002d0 00005a 00      0   0  1
  [14] .shstrtab         STRTAB          0000000000000000 0003d8 00007a 00      0   0  1
Key to Flags:
  W (write), A (alloc), X (execute), M (merge), S (strings), I (info),
  L (link order), O (extra OS processing required), G (group), T (TLS),
  C (compressed), x (unknown), o (OS specific), E (exclude),
  D (mbind), l (large), p (processor specific)

通过readelf的-s选项可以查看符号表:

$ readelf -s oop.o        

Symbol table '.symtab' contains 17 entries:
   Num:    Value          Size Type    Bind   Vis      Ndx Name
     0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND 
     1: 0000000000000000     0 FILE    LOCAL  DEFAULT  ABS oop.c
     2: 0000000000000000     0 SECTION LOCAL  DEFAULT    1 .text
     3: 0000000000000004     4 OBJECT  LOCAL  DEFAULT    4 g_s_b
     4: 0000000000000008     4 OBJECT  LOCAL  DEFAULT    4 g_s_c
     5: 0000000000000004     4 TLS     LOCAL  DEFAULT    5 g_tls_s_f
     6: 0000000000000000     0 SECTION LOCAL  DEFAULT    6 .rodata
     7: 000000000000000c     4 OBJECT  LOCAL  DEFAULT    4 l_s_i.0
     8: 0000000000000000     4 OBJECT  GLOBAL DEFAULT    3 g_a
     9: 0000000000000000     4 OBJECT  GLOBAL DEFAULT    4 g_d
    10: 0000000000000000     4 TLS     GLOBAL DEFAULT    5 g_tls_e
    11: 0000000000000008     4 TLS     GLOBAL DEFAULT    5 g_tls_g
    12: 0000000000000000    56 FUNC    GLOBAL DEFAULT    1 fun
    13: 0000000000000000     0 NOTYPE  GLOBAL DEFAULT  UND g_e_h
    14: 0000000000000000     0 NOTYPE  GLOBAL DEFAULT  UND fun1
    15: 0000000000000000     0 NOTYPE  GLOBAL DEFAULT  UND puts
    16: 0000000000000038    11 FUNC    WEAK   DEFAULT    1 fun_weak

strip之后就查询不到静态符号表信息了,但是动态符号表信息还是可以查到的。

可以看到该符号表包含了17项(entry),每一项用Elf32_Sym结构体描述:

typedef struct
{
  Elf32_Word    st_name;                /* Symbol name (string tbl index) */
  Elf32_Addr    st_value;               /* Symbol value */
  Elf32_Word    st_size;                /* Symbol size */
  unsigned char st_info;                /* Symbol type and binding */
  unsigned char st_other;               /* Symbol visibility */
  Elf32_Section st_shndx;               /* Section index */
} Elf32_Sym;

每一列的值其实都和结构体的成员相对应。

  • Name 符号的名字

  • Ndx 表示其所在section的序号,初始化过的全局变量g_a肯定在数据段.data,函数在代码段.text,【未经初始化的全局变量】和static变量在.bss段(static不管是否初始化都在bss段)。由于.bss段在程序启动时会被清0,所以未初始化的全局变量和static变量的值是0。
    对于在本文件中引用到,但是在其他文件定义的符号,其Ndx为UND,例如本例的extern变量和函数。在链接阶段,找到该符号的定义之后,会对其Ndx进行修正。

  • Value 该符号的值(注意不是变量的值),符号的值就是指符号的地址,对于编译的中间文件.ol来说,value其实是该符号在其所在的section的偏移,是个相对值;对于链接后的可执行文件来说,该值是个绝对值,表示符号的绝对地址。

  • Type 表示符号的类型,常见的几种类型如下:

 484 #define STT_NOTYPE      0               /* Symbol type is unspecified */
 485 #define STT_OBJECT      1               /* Symbol is a data object */
 486 #define STT_FUNC        2               /* Symbol is a code object */
 487 #define STT_SECTION     3               /* Symbol associated with a section */
 488 #define STT_FILE        4               /* Symbol's name is file name */
 489 #define STT_COMMON      5               /* Symbol is a common data object */
 490 #define STT_TLS         6               /* Symbol is thread-local data object*/
  • OBJECT 表示全局变量和static变量
    FUNC 表示函数
    FILE 文件名
    COM 公用全局变量
    TLS 线程本地数据

  • Bind列有以下几个常见值:

 472 #define STB_LOCAL       0               /* Local symbol */
 473 #define STB_GLOBAL      1               /* Global symbol */
 474 #define STB_WEAK        2               /* Weak symbol */

分别表示局部、全局、弱符号。

  • Vis表示该符号的可见范围,visibility的缩写:
 /* Symbol visibility specification encoded in the st_other field.  */
 #define STV_DEFAULT     0               /* Default symbol visibility rules */
 #define STV_INTERNAL    1               /* Processor specific hidden class */
 #define STV_HIDDEN      2               /* Sym unavailable in other modules */
 #define STV_PROTECTED   3               /* Not preemptible, not exported */ 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/362569.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++项目——高并发内存池(2)——thread_cache的基础功能实现

1.并发内存池concurrent memory pool 组成部分 thread cache、central cache、page cache thread cache&#xff1a;线程缓存是每个线程独有的&#xff0c;用于小于64k的内存的分配&#xff0c;线程从这里申请内存不需要加锁&#xff0c;每个线程独享一个cache&#xff0c;这…

算法学习与填充计划---2023.2.21---夏目

&#x1f680;write in front&#x1f680; &#x1f4dd;个人主页&#xff1a;认真写博客的夏目浅石.CSDN &#x1f381;欢迎各位→点赞&#x1f44d; 收藏⭐️ 留言&#x1f4dd;​ &#x1f4e3;系列专栏&#xff1a;ACM周训练题目合集.CSDN &#x1f4ac;总结&#xff1a…

继 承

1.继承继承是面向对象三大特性之一有些类与类之间存在特殊的关系继承的好处: 减少重复代码语法: class 子类: 继承方式 父类子类也称为派生类 父类也称为基类class Python : public BasePage {public :void Content() {}};2.继承方式继承方式一共有三种:公共继承保护继承私有继…

Homekit智能家居一智能吸顶灯

买灯要看什么因素 好灯具的灯光可以说是家居的“魔术师”&#xff0c;除了实用的照明功能外&#xff0c;对细节的把控也非常到位。那么该如何选到一款各方面合适的灯呢&#xff1f; 照度 可以简单理解为清晰度&#xff0c;复杂点套公式来说照度光通量&#xff08;亮度&#x…

ChatGPT为什么不受开发者喜欢?

记得 ChatGPT 最开始上线不久的时候&#xff0c;看到的大部分尝鲜和测试结果都是开发者在做进行敲代码测试&#xff0c;可以说职业危机感非常强的一群人了。 再者&#xff0c;加上 ChatGPT 要使用起来其实是有一些技术门槛的&#xff0c;愿意折腾的人也多是程序员&#xff0c;…

操作系统和进程的资源消耗

free -h 获取操作系统当前内存Mem 行(第二行)是内存的使用情况。Swap 行(第三行)是交换空间的使用情况。total 列显示系统总的可用物理内存和交换空间大小。used 列显示已经被使用的物理内存和交换空间。free 列显示还有多少物理内存和交换空间可用使用。shared 列显示被共享使…

基于龙芯 2K1000 的嵌入式 Linux 系统移植和驱动程序设计(一)

2.1 需求分析 本课题以龙芯 2K1000 处理器为嵌入式系统的处理器&#xff0c;需要实现一个完成的嵌入式软件系统&#xff0c;系统能够正常启动并可以稳定运行嵌入式 Linux。设计网络设备驱 动&#xff0c;可以实现板卡与其他网络设备之间的网络连接和文件传输。设计 PCIE 设备驱…

自定义Ext JS组件类

在Ext JS 中如何自定义一个组件类呢? 实现方式是继承Ext.Component ,定义一个自己的组件类。 那么,这个组件类该怎样扩展自己的功能呢? 举例来说, 有这样一个需求: 扩展一个Grid的子类,通过pageType的属性值来显示不同的列。 如果是查看页面,则所有列都是不可编辑的如…

尚医通 (二十)预约挂号功能

目录一、预约挂号详情1、需求2、预约挂号详情接口3、预约挂号详情前端二、预约确认1、需求2、预约确认接口3、预约确认前端一、预约挂号详情 1、需求 接口分析 &#xff08;1&#xff09;根据预约周期&#xff0c;展示可预约日期数据&#xff0c;按分页展示 &#xff08;2&…

【微信小程序】使用云存储存入指定文件夹

前言在我们开发微信小程序的时候常会用到云开发的功能&#xff0c;它相比传统的SQL上手难度低&#xff0c;比较适合没有什么后端基础的开发者使用。在具体的项目需求中我们会让用户上传一些图片或者表格&#xff0c;随着用户量增大&#xff0c;文件类型增多&#xff0c;云存储分…

张驰咨询2023年企业如何活下去、甚至有效增长?

2023年企业活下去和有效增长的关键在于适应和应对不断变化的市场和环境。以下是几点建议&#xff1a; 数字化转型&#xff1a;随着数字化的普及&#xff0c;企业需要加快数字化转型&#xff0c;提高数字化技术的应用水平。这样可以提高企业的生产效率、管理效率和创新能力。 …

2023年谷歌seo排名优化指南

本文主要分享2023年关于谷歌排名机制变化以及如何提升谷歌排名的一些方法。 本文由光算创作&#xff0c;有可能会被剽窃和修改&#xff0c;我们佛系对待这种行为吧。 2023年&#xff0c;谷歌搜索引擎对于SEO的优化策略已经发生了一些变化&#xff0c;要想保持网站在谷歌搜索中…

Javaweb之mybits入门

2.1 Mybatis概述 2.1.1 Mybatis概念 MyBatis 是一款优秀的持久层框架&#xff0c;用于简化 JDBC 开发 MyBatis 本是 Apache 的一个开源项目iBatis, 2010年这个项目由apache software foundation 迁移到了google code&#xff0c;并且改名为MyBatis 。2013年11月迁移到Github …

挣值管理案例讲解

一、概念1.挣值管理是一种综合了范围、时间、成本绩效测量的方法。通过与计划完成的工作量、实际挣得的收益、实际的成本进行比较&#xff0c;可以确定成本、进度是否按计划进行。挣值管理可以在项目某一特定时间点上&#xff0c;从达到范围、时间、成本三项目标上评价项目所处…

1.2 学习环境准备

文章目录1.MariaDB简介2.MariaDB服务端和客户端安装1.MariaDB简介 因为MariaDB作为MySQL的延申&#xff0c;其包含MySQL所有的有点&#xff0c;并且其包含了更丰富的特性。比如微秒的支持、线程池、子查询优化、组提交、进度报告等&#xff1b; 所以我们接下来将已MariaDB作为…

TCP多线程并发IO阻塞服务模型

1. 多进程并发服务器 在 Linux 环境下多进程的应用很多,其中最主要的就是网络/客户服务器。多进程服务器是当客户有请求时,服务器用一个子进程来处理客户请求。父进程继续等待其它客户的请求。这种方法的优点是当客户有请求时,服务器能及时处理客户,特别是在客户服务器交互…

狂神说:流程控制——顺序选择循环结构

System.out.println(10) // 输出带回车 System.out.print(10) // 输出没有回车一、顺序机构挨个往下写&#xff0c;就是最基本的顺序结构二、选择结构 if、switchif单选择结构虽然简单&#xff0c;但也挺经常用的Scanner scanner new Scanner(System.in); // 和下面的…

毕业后想从事软件测试,现在需要学习哪些内容呢

在你选择学习之前&#xff0c;要先考虑一下这个是不是你喜欢的发展方向&#xff0c;而不是只听别人推荐就直接做了选择先了解下软件测试是做什么的以及未来发展前景&#xff0c;最后才是如何自学 软件测试就是在测试这个软件是不是能够完全按照需求运行。软件测试岗再简单点说…

基于JAVAWEB的出租车管理系统

摘要在Internet高速发展的今天&#xff0c;我们生活的各个领域都涉及到计算机的应用&#xff0c;其中包括出租车管理系统的网络应用&#xff0c;在国外出租车管理已经是很普遍的方式&#xff0c;不过国内的出租车管理可能还处于起步阶段。出租车管理系统具有出租、归还等功能。…

分布式之如何突破raft集群写数据性能瓶颈

写在前面 在分布式之Raft共识算法分析 一文中我们分析了当前比较常用的raft共识算法&#xff0c;通过raft算法我们可以很容易搭建集群并选举leader&#xff0c;然后由leader负责数据的写操作&#xff0c;这样也可以很容易的解决数据一致性的问题&#xff0c;但是只由leader来处…