Linux下,进程不能直接访问硬件设备。当进程需要访问硬件设备时(读取磁盘文件、接收网络数据等),则必须由用户态切换为内核态,然后通过系统调用来访问硬件设备。
strace是跟踪进程执行时的系统调用和所接收的信号(即它跟踪到一个进程产生的系统调用,包括参数、返回值、执行消耗的时间)。
strace最简单的用法是执行一个指定的命令(过程中,starce会记录和解析命令进程的所有系统调用及这个进程的所有的信号值),在指定命令结束后立即退出
[ljy@localhost t_7_17]$ strace cat /dev/execve("/bin/cat", ["cat", "/dev/"], [/* 44 vars */]) = 0brk(0) = 0x8bf3000mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7798000access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory)open("/etc/ld.so.cache", O_RDONLY) = 3fstat64(3, {st_mode=S_IFREG|0644, st_size=52530, ...}) = 0mmap2(NULL, 52530, PROT_READ, MAP_PRIVATE, 3, 0) = 0xb778b000close(3) = 0open("/lib/libc.so.6", O_RDONLY) = 3read(3, "\177ELF\1\1\1\3\0\0\0\0\0\0\0\0\3\0\3\0\1\0\0\0\200\356a\0004\0\0\0"..., 512) = 512fstat64(3, {st_mode=S_IFREG|0755, st_size=1910572, ...}) = 0mmap2(0x608000, 1665452, PROT_READ|PROT_EXEC, MAP_PRIVATE|MAP_DENYWRITE, 3, 0) = 0x608000mmap2(0x799000, 12288, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_DENYWRITE, 3, 0x191) = 0x799000mmap2(0x79c000, 10668, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_ANONYMOUS, -1, 0) = 0x79c000close(3) = 0mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb778a000set_thread_area({entry_number:-1 -> 6, base_addr:0xb778a6c0, limit:1048575, seg_32bit:1, contents:0, read_exec_only:0, limit_in_pages:1, seg_not_present:0, useable:1}) = 0mprotect(0x799000, 8192, PROT_READ) = 0mprotect(0x600000, 4096, PROT_READ) = 0munmap(0xb778b000, 52530) = 0brk(0) = 0x8bf3000brk(0x8c14000) = 0x8c14000open("/usr/lib/locale/locale-archive", O_RDONLY|O_LARGEFILE) = 3fstat64(3, {st_mode=S_IFREG|0644, st_size=99158544, ...}) = 0mmap2(NULL, 2097152, PROT_READ, MAP_PRIVATE, 3, 0) = 0xb758a000mmap2(NULL, 262144, PROT_READ, MAP_PRIVATE, 3, 0x2d7f) = 0xb754a000mmap2(NULL, 1392640, PROT_READ, MAP_PRIVATE, 3, 0x3270) = 0xb73f6000close(3) = 0fstat64(1, {st_mode=S_IFCHR|0620, st_rdev=makedev(136, 0), ...}) = 0open("/dev/", O_RDONLY|O_LARGEFILE) = 3fstat64(3, {st_mode=S_IFDIR|0755, st_size=3760, ...}) = 0read(3, 0x8bf4000, 32768) = -1 EISDIR (Is a directory)write(2, "cat: ", 5cat: ) = 5write(2, "/dev/", 5/dev/) = 5open("/usr/share/locale/locale.alias", O_RDONLY) = 4fstat64(4, {st_mode=S_IFREG|0644, st_size=2512, ...}) = 0mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb73f5000read(4, "# Locale name alias data base.\n#"..., 4096) = 2512read(4, "", 4096) = 0close(4) = 0munmap(0xb73f5000, 4096) = 0open("/usr/share/locale/zh_CN.UTF-8/LC_MESSAGES/libc.mo", O_RDONLY) = -1 ENOENT (No such file or directory)open("/usr/share/locale/zh_CN.utf8/LC_MESSAGES/libc.mo", O_RDONLY) = -1 ENOENT (No such file or directory)open("/usr/share/locale/zh_CN/LC_MESSAGES/libc.mo", O_RDONLY) = 4fstat64(4, {st_mode=S_IFREG|0644, st_size=81139, ...}) = 0mmap2(NULL, 81139, PROT_READ, MAP_PRIVATE, 4, 0) = 0xb73e2000close(4) = 0open("/usr/lib/gconv/gconv-modules.cache", O_RDONLY) = 4fstat64(4, {st_mode=S_IFREG|0644, st_size=26058, ...}) = 0mmap2(NULL, 26058, PROT_READ, MAP_SHARED, 4, 0) = 0xb73db000close(4) = 0write(2, ": \346\230\257\344\270\200\344\270\252\347\233\256\345\275\225", 17: 是一个目录) = 17write(2, "\n", 1) = 1close(3) = 0close(1) = 0close(2) = 0exit_group(1) = ?
每一行都是一条系统调用,等号左边是系统调用的函数名和参数,右边是该调用的返回值
strace显示这些调用的参数并返回符号形式的值。
strace从内核接收信息,而且不需要以任何特殊的方式来构建内核
参数:
-c 统计每一系统调用的所执行的时间,次数和出错的次数等.
-d 输出strace关于标准错误的调试信息.
-f 跟踪由fork调用所产生的子进程.
-ff 如果提供-o filename,则所有进程的跟踪结果输出到相应的filename.pid中,pid是各进程的进程号.
-F 尝试跟踪vfork调用.在-f时,vfork不被跟踪.
-h 输出简要的帮助信息.
-i 输出系统调用的入口指针.
-q 禁止输出关于脱离的消息.
-r 打印出相对时间关于,,每一个系统调用.
-t 在输出中的每一行前加上时间信息.
-tt 在输出中的每一行前加上时间信息,微秒级.
-ttt 微秒级输出.
-T 显示每一调用所耗的时间.
-v 输出所有的系统调用.一些调用关于环境变量,状态,输入输出等调用由于使用频繁,默认不输出.
-V 输出strace的版本信息.
-x 以十六进制形式输出非标准字符串
-xx 所有字符串以十六进制形式输出.
-a column 设置返回值的输出位置.默认 为40.
-e expr 指定一个表达式,用来控制如何跟踪.格式:[qualifier=][!]value1[,value2]...
qualifier只能是 trace,abbrev,verbose,raw,signal,read,write其中之一.value是用来限定的符号或数字.默认的 qualifier是 trace.感叹号是否定符号.例如:-eopen等价于 -e trace=open,表示只跟踪open调用.而-etrace!=open 表示跟踪除了open以外的其他调用.有两个特殊的符号 all 和 none. 注意有些shell使用!来执行历史记录里的命令,所以要使用\\.
-e trace=set 只跟踪指定的系统 调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用.默认的为set=all.
-e trace=file 只跟踪有关文件操作的系统调用.
-e trace=process 只跟踪有关进程控制的系统调用.
-e trace=network 跟踪与网络有关的所有系统调用.
-e strace=signal 跟踪所有与系统信号有关的系统调用.
-e trace=ipc 跟踪所有与进程通讯有关的系统调用.
-e abbrev=set 设定strace输出的系统调用的结果集.-v 等于abbrev=none.默认为abbrev=all.
-e raw=set 将指定的系统调用的参数以十六进制显示.
-e signal=set 指定跟踪的系统信号.默认为all.如 signal=!SIGIO(或者signal=!io),表示不跟踪SIGIO信号.
-e read=set 输出从指定文件中读出 的数据.例如: -e read=3,5 -e write=set 输出写入到指定文件中的数据.
-o filename 将strace的输出写入文件filename
-p pid 跟踪指定的进程pid.
-s strsize 指定输出的字符串的最大长度.默认为32.文件名一直全部输出.
-u username 以username的UID和GID执行被跟踪的命令
实例:
1.追踪系统调用
test.c
然后gcc test.c,生成可执行文件a.out
(1)直接执行a.out
(2)通过strace执行a.out
[ljy@localhost t_7_17]$ strace ./a.outexecve("./a.out", ["./a.out"], [/* 44 vars */]) = 0brk(0) = 0x8823000mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7783000access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory)open("/etc/ld.so.cache", O_RDONLY) = 3fstat64(3, {st_mode=S_IFREG|0644, st_size=52530, ...}) = 0mmap2(NULL, 52530, PROT_READ, MAP_PRIVATE, 3, 0) = 0xb7776000close(3) = 0open("/lib/libc.so.6", O_RDONLY) = 3read(3, "\177ELF\1\1\1\3\0\0\0\0\0\0\0\0\3\0\3\0\1\0\0\0\200\356a\0004\0\0\0"..., 512) = 512fstat64(3, {st_mode=S_IFREG|0755, st_size=1910572, ...}) = 0mmap2(0x608000, 1665452, PROT_READ|PROT_EXEC, MAP_PRIVATE|MAP_DENYWRITE, 3, 0) = 0x608000mmap2(0x799000, 12288, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_DENYWRITE, 3, 0x191) = 0x799000mmap2(0x79c000, 10668, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_ANONYMOUS, -1, 0) = 0x79c000close(3) = 0mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7775000set_thread_area({entry_number:-1 -> 6, base_addr:0xb77756c0, limit:1048575, seg_32bit:1, contents:0, read_exec_only:0, limit_in_pages:1, seg_not_present:0, useable:1}) = 0mprotect(0x799000, 8192, PROT_READ) = 0mprotect(0x600000, 4096, PROT_READ) = 0munmap(0xb7776000, 52530) = 0fstat64(1, {st_mode=S_IFCHR|0620, st_rdev=makedev(136, 0), ...}) = 0mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7782000fstat64(0, {st_mode=S_IFCHR|0620, st_rdev=makedev(136, 0), ...}) = 0mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7781000write(1, "\350\257\267\350\276\223\345\205\245\344\270\200\344\270\252\346\225\260\357\274\232", 21请输入一个数:) = 21read(0, 0xb7781000, 1024) = ? ERESTARTSYS (To be restarted)--- SIGWINCH (Window changed) @ 0 (0) ---read(0, 0xb7781000, 1024) = ? ERESTARTSYS (To be restarted)--- SIGWINCH (Window changed) @ 0 (0) ---read(0, 0xb7781000, 1024) = ? ERESTARTSYS (To be restarted)--- SIGWINCH (Window changed) @ 0 (0) ---read(0, 0xb7781000, 1024) = ? ERESTARTSYS (To be restarted)--- SIGWINCH (Window changed) @ 0 (0) ---read(0,
系统首先调用execve开始一个新的进程,接着进行环境的初始化操作,最后停顿在下图中的read(0,""),这相当于我们的scanf()函数,等待输入,
输入78后,调用write()函数将格式化的数值000000078输出到屏幕上,最后调用exit_group()函数退出进程,完成整个程序的运行。
2.跟踪信号传递
首先,strace ./a.out,等到等待输入的那一步时,不输入任何东西,然后打开另外一个窗口,输入命令:killall a.out
我们观察第一次打开的strace窗口中,此时,我们看见程序退出了,结果如下
3.系统调用统计
使用-c参数,它会将进程的所有系统调用做一个统计分析展示出来
这里清楚的告诉我们,在这一过程中调用了哪些系统函数,调用了多少次,消耗了多少时间等信息,这对我们分析一个程序是很有帮助的
其他常用参数的使用:
(1)重定向输出
-o 将strace 的结果输出到文件中
若不指定 -o 参数的话,默认的输出设备是STDERR,也就是说,使用 -o filename 和 2>filename 的结果是一样的。
-o filename
2>filename
(2)对系统调用进行计时
-T 将每个系统调用所花费的时间打印出来
每个调用的花销体现在调用行最右边的尖括号里边(下面只是调用的一部分)
(3)系统调用的时间
-t/-tt/-ttt
-t 精确到秒
-tt 精确到微秒
-ttt 精确到微秒,而且时间表示为unix时间戳
(4)截断输出
-s 指定trace结果的每一行输出的字符串长度
现指定-s 5,而在read时,我们输入一个超过5个字符的字符串
(5)追踪现有的进程
-p pid