Skip to main content
 首页 » 操作系统

Linux read()/fread()/mmap()执行效率对比

2022年07月19日30shanyou

一、 read()/fread()/mmap()执行效率对比

系统调用read.c: 
 
#include <sys/types.h> 
#include <sys/stat.h> 
#include <fcntl.h> 
#include <unistd.h> 
#include <stdio.h> 
 
int main() 
{ 
    int fd = open("linux_logo.pnm", O_RDONLY); 
    int num = 0; 
    char buff[1]; 
     
    do{ 
        num = read(fd, buff, 1); 
    }while(num != 0); 
     
    close(fd); 
     
    return 0; 
}
库函数fread.c: 
#include <stdio.h> 
#include <stdlib.h> 
 
int main() 
{ 
    FILE *fp = fopen("linux_logo.pnm", "r"); 
    int num = 0; 
    char buff[1]; 
     
    do{ 
        num = fread(buff, 1, 1, fp); 
    }while(num != 0); 
     
    close(fp); 
     
    return 0; 
}
使用mmap进行文件映射: 
#include <fcntl.h>      //open 
#include <sys/mman.h>   //mmap 
#include <sys/types.h>  //fstat 
#include <sys/stat.h> 
#include <unistd.h> 
 
int main() 
{ 
    int i; 
    char buff[1]; 
    struct stat statue; 
     
    int fd = open("linux_logo.pnm", O_RDONLY); 
     
    fstat(fd, &statue); 
 
    char *pm = mmap(NULL, statue.st_size, PROT_READ, MAP_SHARED, fd, 0) ; 
 
    for(i=0; i<statue.st_size; i++) 
    { 
        buff[0] = pm[i]; 
    } 
 
    munmap(pm, statue.st_size); 
 
    close(fd); 
     
    return 0; 
}
编译后三者执行时间: 
time ./read 
real    0m2.830s 
user    0m0.287s 
sys    0m2.178s 
 
time ./fread 
real    0m0.088s 
user    0m0.082s 
sys    0m0.008s 
 
time ./mmap 
real    0m0.026s 
user    0m0.008s 
sys    0m0.005s 
 
ll linux_logo.pnm  
-rw-r--r--. 1 root root 1152015 Aug 27 15:10 linux_logo.pnm

1. ./read的sys(内核态时间)是./fread的2.178/0.008=272倍,而1152015/4096(细页大小为4kB)=281,非常接近,由知识背景推测出可能./read进行的系统调用次数为./fread的4096倍(因为fread()是带缓冲的,每次可能读取1页数据缓存起来,而read()不带缓冲,每次都从硬盘重新读取)

证明:

strace ./read 打印信息如下:

read(3, "\375", 1) = 1
read(3, "\375", 1) = 1
read(3, "\375", 1) = 1
read(3, "\375", 1) = 1
read(3, ^C <unfinished ...>

strace ./fread 打印信息如下:

read(3, "=\211+=\210+=\206+<\201+8\200/8m%)Y\31\31b)\"tB7{QAs"..., 4096) = 4096
read(3, "\223\234\211\223\234\211\223\234\211\224\235\212\225\236\213\230\241\214\227\240\213\225\236\211\224\235\"..., 4096) = 4096
read(3, "YHzYHxWFuTCvRBvRBuP>rM;uR?uR?sP="..., 4096) = 4096
read(3, "Z\231|\\\227zZ\226y[\231|^\232\177a\232\177a\232\201c\237\206h\245\214n\250\217q\247"..., 4096) = 1039
read(3, "", 4096) = 0
exit_group(0) = ?
[root@sfl sys_call]# ^C

可以看出./read每次执行read系统调用都只读取1字节,而./fread中的fread()的read系统调用每次读取4096字节,证明了自己的猜测。

2.在频繁读取问价的情况下,mmap()进行文件映射时执行效率最高的,因为它不需要频繁进行系统调用,可以像操作内存一样操作文件。

3.系统调用是相当耗费时间的,注意适当使用系统调用。

二、相关命令学习

1.time(测量)命令

time命令常用于测量一个命令的运行时间,注意不是用来显示和修改系统时间的(这是date命令干的事情)

real    0m5.064s      <== 实际使用时间(real time,算上了等待、休眠等的时间)
user    0m0.020s     <== 用户态使用时间(the process spent in user mode)
sys     0m0.040s      <== 内核态使用时间(the process spent in kernel mode)

man time后根据说明带参数操作是不成功的,原因是:这个time使用的是shell脚本里面的,是不带命令行参数的,而可执行程序是带命令行参数的

type -a time                    /*列出time命令的类型,发现有两种*/

time is a shell keyword   /*shell脚本中也提供了这个命令,而且默认是使用shell脚本中的*/

time is /usr/bin/time       /*命令行程序*/

  使用可执行程序的time即可带命令行参数,标识将./read的执行写入到test.txt中而不是command窗口,-v友好的显示;注意这里的time是测量的意思,还会列出很多其他的信息。

/usr/bin/time -o test.txt -v ./read

  无法将time的输出信息重定向到文件里面,为什么?因为time是shell的关键字,shell做了特殊处理,它会把time命令后面的命令行作为一个整体来进行处理,在重定向时,实际上是针对后面的命令来的,time命令本身的输出并不会被重定向的,两种解决方法:

{ time command-line; } 2>file  注意分隔符的使用。

(time command-line) 2>file 这里time紧贴着小括号(也可以的,命令行结束也不必带分号。

2.strace命令

作用:在最简单的情况下,strace运行指定的命令,直到它退出。它拦截并记录由进程调用的系统调用和进程接收到的信号。 每个系统调用的名称,其参数及其返回值都以标准错误或-o选项指定的文件打印。

文件hello.c 
 
#include <stdio.h> 
 
void main() 
{ 
    printf("hello world!\n"); 
} 
 
gcc hello.c -o hello

执行命令:strace ./hello 打印如下信息:

execve("./pp", ["./pp"], [/* 57 vars */]) = 0 
brk(0)                                  = 0x9dfe000 
mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb780b000 
access("/etc/ld.so.preload", R_OK)      = -1 ENOENT (No such file or directory) 
open("/etc/ld.so.cache", O_RDONLY)      = 3 
fstat64(3, {st_mode=S_IFREG|0644, st_size=126040, ...}) = 0 
mmap2(NULL, 126040, PROT_READ, MAP_PRIVATE, 3, 0) = 0xb77ec000 
close(3)                                = 0 
open("/lib/libc.so.6", O_RDONLY)        = 3 
read(3, "\177ELF\1\1\1\0\0\0\0\0\0\0\0\0\3\0\3\0\1\0\0\0@\236\201\0004\0\0\0"..., 512) = 512 
fstat64(3, {st_mode=S_IFREG|0755, st_size=1876456, ...}) = 0 
mmap2(0x803000, 1636744, PROT_READ|PROT_EXEC, MAP_PRIVATE|MAP_DENYWRITE, 3, 0) = 0x803000 
mprotect(0x98c000, 4096, PROT_NONE)     = 0 
mmap2(0x98d000, 12288, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_DENYWRITE, 3, 0x189) = 0x98d000 
mmap2(0x990000, 10632, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_ANONYMOUS, -1, 0) = 0x990000 
close(3)                                = 0 
mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb77eb000 
set_thread_area({entry_number:-1 -> 6, base_addr:0xb77eb6c0, limit:1048575, seg_32bit:1, contents:0, read_exec_only:0, limit_in_pages:1, seg_not_present:0, useable:1}) = 0 
mprotect(0x98d000, 8192, PROT_READ)     = 0 
mprotect(0x7fb000, 4096, PROT_READ)     = 0 
munmap(0xb77ec000, 126040)              = 0 
fstat64(1, {st_mode=S_IFCHR|0620, st_rdev=makedev(136, 1), ...}) = 0 
mmap2(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb780a000 
write(1, "hello world!\n", 13)          = 13 
exit_group(13)                          = ?

现在知道为什么包含glibc中相应的头文件就能使用里面的函数了吧,它在库/lib/libc.so.6里面,包含头文件只是为了能通过编译期而已。

参考:http://www.cnblogs.com/syntax/archive/2012/11/05/2755129.html


本文参考链接:https://www.cnblogs.com/hellokitty2/p/7440702.html