百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术流 > 正文

揭秘Linux文件系统(linux的文件系统有)

citgpt 2024-07-15 15:19 8 浏览 0 评论

 一

  • 首先对于Linux系统来说,如图所示,系统层级分为用户层、内核层、以及物理设备层、
  • 例如C语言中对于文件的写操作,首先C语言本身会设置缓冲区,来提高读写效率。C写函数会调用linux的系统函数接口write(),这是在用户态下。紧接着write()会调用linux系统内核函数进入到内核层进行写入,这个写操作显然是由文件系统来控制的,而内核中依旧还有一个高速缓冲设备来提高读写效率,之后通过设备驱动写入磁盘中,简单来说从调用C读写函数到将数据操作到磁盘上是这样的流程。

 二

揭秘Linux文件系统(linux的文件系统有)

  • 当我们了解了Linux文件系统所处的位置之后,接下来说明一些基本概念

1)扇区:扇区并不是一个物理概念,而是一个单位,大小是521Byte

2)块:是一个Linux文件系统的基本单元,大小是4096Byte

3)块组:ext2文件系统是以块组为基本单元

4)Inode:存储文件基本信息(除文件名和文件类型),一个文件对应一个Inode;在ext2文件系统中,大小是128Byte

  • 接下来开始解释ext2文件系统,如图所示,ext2采用一下的基本结构来管理数据存储,每一个Block Group为一个基本单元,了解基本单元后就了解了文件系统

Boot Block:启动块,大小是1KB;存储磁盘分区信息和启动信息;PS:一个文件系统只有1份

Super Block:超级块,大小是1块;为了提高系统的健壮性,每一个块组都有一个(ext4采用稀疏拷贝),并且每份内容一致;用来描述整个分区的文件系统信息;例如块大小、文件系统版本号、上次mount的时间等等

GDT:块组描述符表,大小是多个块,块数不确定;由很多块组描述符组成,整个分区分成多少个块组就对应有多少个块组描述符。 每个块组描述符(Group Descriptor)存储一个块组的描述信息,例如在这个块组中从哪里开始是inode表,从哪里开始是数据块,通常内核只用到第0个块组中的拷贝,当执行e2fsck检查文件系统一致性时,第0个块组中的超级块和块组描述符表就会拷贝到其它块组,这样当第0个块组的开头意外损坏时就可以用其它拷贝来恢复,从而减少损失。

Block Bitmap:块位图,原理和Bitmap算法一致(用每位来表示数据);标志每个块的使用情况(0没被使用,1被使用)一个块组中的块是这样利用的:块位图就是用来描述整个块组中哪些块已用哪些块空闲的,它本身占一个块,其中的每个bit代表本块组中的一个块,这个bit为 1表示该块已用,这个bit为0表示该块空闲可用。

Inode Bitmap:和块位图类似,本身占用一个块;其中每一位表示一个inode是否可用;

Inode Table:存储Inode的表,inode表占多少个块在格式化时就要决定并写入块组描述符中,mke2fs格式化工具的默认策略是:一个块组有多少个8KB就分配多少个inode

Data Blocks:存储数据


  • 接下来说明一下Inode结构

如图所示,一个数据指针指针指向一个数据块,后三个多级指针为了拓展数据块


四 文件放入流程:

1. 先找GDT,查看InodeTable所在位置

2. 查找Table里未被使用的最小值分配给文件使用,

3. Inode Bitmap对应位置由0置1

4. Inode存放文件信息,更新Table

注:1)文件系统很复杂,以上只是放入文件大致flow,实际系统还有空闲检测、动态分配等

2)文件删除只是将Inode BItma由1置0,更新block bimap 更行GDT,所以文件并没有真正被删除

五 目录结构

一个目录占一个块或多个块,目录块内容如下:

注:1. 符号连接是新建一个记录项,指向次文件记录项

2. 硬链接是新建一个记录项,指向此文件

附:递归列出目录中的文件列表

#include <sys/types.h>

#include <sys/stat.h>

#include <unistd.h>

#include <dirent.h>

#include <stdio.h>

#include <string.h>

#define MAX_PATH 1024

/* dirwalk: apply fcn to all files in dir */

void dirwalk(char *dir, void (*fcn)(char *)) {

char name[MAX_PATH];

struct dirent *dp; DIR *dfd;

if ((dfd = opendir(dir)) == NULL) {

fprintf(stderr, "dirwalk: can't open %s\n", dir);

return;

}

while ((dp = readdir(dfd)) != NULL) {

if (strcmp(dp->d_name, ".") == 0 || strcmp(dp->d_name, "..") == 0)

continue; /* skip self and parent */

if (strlen(dir)+strlen(dp->d_name)+2 > sizeof(name))

fprintf(stderr, "dirwalk: name %s %s too long\n", dir, dp->d_name);

else {

sprintf(name, "%s/%s", dir, dp->d_name);

(*fcn)(name);

}

}

closedir(dfd);

}

/* fsize: print the size and name of file "name" */

void fsize(char *name) {

struct stat stbuf;

if (stat(name, &stbuf) == -1) {

fprintf(stderr, "fsize: can't access %s\n", name);

return;

}

if ((stbuf.st_mode & S_IFMT) == S_IFDIR)

dirwalk(name, fsize);

printf("%8ld %s\n", stbuf.st_size, name);

}

int main(int argc, char **argv) {

if (argc == 1) /* default: current directory */

fsize(".");

else

while (--argc > 0)

fsize(*++argv);

return 0;

}

相关推荐

js中arguments详解

一、简介了解arguments这个对象之前先来认识一下javascript的一些功能:其实Javascript并没有重载函数的功能,但是Arguments对象能够模拟重载。Javascrip中每个函数...

firewall-cmd 常用命令

目录firewalldzone说明firewallzone内容说明firewall-cmd常用参数firewall-cmd常用命令常用命令 回到顶部firewalldzone...

epel-release 是什么

EPEL-release(ExtraPackagesforEnterpriseLinux)是一个软件仓库,它为企业级Linux发行版(如CentOS、RHEL等)提供额外的软件包。以下是关于E...

FullGC详解  什么是 JVM 的 GC
FullGC详解 什么是 JVM 的 GC

前言:背景:一、什么是JVM的GC?JVM(JavaVirtualMachine)。JVM是Java程序的虚拟机,是一种实现Java语言的解...

2024-10-26 08:50 citgpt

使用Spire.Doc组件利用模板导出Word文档
  • 使用Spire.Doc组件利用模板导出Word文档
  • 使用Spire.Doc组件利用模板导出Word文档
  • 使用Spire.Doc组件利用模板导出Word文档
  • 使用Spire.Doc组件利用模板导出Word文档
跨域(CrossOrigin)

1.介绍  1)跨域问题:跨域问题是在网络中,当一个网络的运行脚本(通常时JavaScript)试图访问另一个网络的资源时,如果这两个网络的端口、协议和域名不一致时就会出现跨域问题。    通俗讲...

微服务架构和分布式架构的区别

1、含义不同微服务架构:微服务架构风格是一种将一个单一应用程序开发为一组小型服务的方法,每个服务运行在自己的进程中,服务间通信采用轻量级通信机制(通常用HTTP资源API)。这些服务围绕业务能力构建并...

深入理解与应用CSS clip-path 属性
深入理解与应用CSS clip-path 属性

clip-pathclip-path是什么clip-path 是一个CSS属性,允许开发者创建一个剪切区域,从而决定元素的哪些部分可见,哪些部分会被隐...

2024-10-25 11:51 citgpt

HCNP Routing&Switching之OSPF LSA类型(二)
  • HCNP Routing&Switching之OSPF LSA类型(二)
  • HCNP Routing&Switching之OSPF LSA类型(二)
  • HCNP Routing&Switching之OSPF LSA类型(二)
  • HCNP Routing&Switching之OSPF LSA类型(二)
Redis和Memcached的区别详解
  • Redis和Memcached的区别详解
  • Redis和Memcached的区别详解
  • Redis和Memcached的区别详解
  • Redis和Memcached的区别详解
Request.ServerVariables 大全

Request.ServerVariables("Url")返回服务器地址Request.ServerVariables("Path_Info")客户端提供的路...

python操作Kafka

目录一、python操作kafka1.python使用kafka生产者2.python使用kafka消费者3.使用docker中的kafka二、python操作kafka细...

Runtime.getRuntime().exec详解

Runtime.getRuntime().exec详解概述Runtime.getRuntime().exec用于调用外部可执行程序或系统命令,并重定向外部程序的标准输入、标准输出和标准错误到缓冲池。...

promise.all详解 promise.all是干什么的
promise.all详解 promise.all是干什么的

promise.all详解promise.all中所有的请求成功了,走.then(),在.then()中能得到一个数组,数组中是每个请求resolve抛出的结果...

2024-10-24 16:21 citgpt

Content-Length和Transfer-Encoding详解
  • Content-Length和Transfer-Encoding详解
  • Content-Length和Transfer-Encoding详解
  • Content-Length和Transfer-Encoding详解
  • Content-Length和Transfer-Encoding详解

取消回复欢迎 发表评论: