器→工具, 开源项目

Linux树型结构文件系统

钱魏Way · · 734 次浏览
!文章内容如有错误或排版问题,请提交反馈,非常感谢!

对于每一个 Linux 学习者来说,了解 Linux 文件系统的目录结构,是学好 Linux 的至关重要的一步。深入了解 Linux 文件目录结构的标准和每个目录的详细功能,对于我们用好 Linux 系统非常重要。

文件系统的是用来组织和排列文件存取的,所以它是可见的,在 Linux 中,我们可以通过 ls 等工具来查看其结构,在 Linux 系统中,我们见到的都是树形结构;比如操作系统安装在一个文件系统中,他表现为由 / 起始的树形结构。Linux 文件系统的最顶端是 /,我们称 / 为 Linux 的 root,也就是 Linux 操作系统的文件系统。Linux 的文件系统的入口就是 /,所有的目录、文件、设备都在 / 之下,/ 就是 Linux 文件系统的组织者,也是最上级的领导者。

由于 Linux 的发行版非常多,为了保持目录结构的统一,Linux 基金会维护了一个标准,叫做文件系统层次结构标准(英语:Filesystem Hierarchy Standard,FHS)标准里面定义了 Linux 操作系统的主要目录及目录内容。当然,并不是所有的 Linux 发行版都严格遵守这个标准。另外,FHS 与 UNIX 的文件目录结构很相似。

事实上,FHS 是根据过去的经验一直再持续的改版的,FHS 依据文件系统使用的频繁与否与是否允许使用者随意更动,而将目录定义成为四种交互作用的形态,用表格来说有点像底下这样:

  • 可分享的:可以分享给其他系统挂载使用的目录,所以包括执行文件与用户的邮件等数据,是能够分享给网络上其他主机挂载用的目录;
  • 不可分享的:自己机器上面运作的装置文件或者是与程序有关的 socket 文件等,由于仅与自身机器有关,所以当然就不适合分享给其他主机了。
  • 不变的:有些数据是不会经常变动的,跟随着 distribution 而不变动。例如函式库、文件说明文件、系统管理员所管理的主机服务配置文件等等;
  • 可变动的:经常改变的数据,例如登录文件、一般用户可自行收受的新闻组等。

FHS 只规定了 /,/usr,/var 三个目录下应该有什么目录,其它的没有规定。下面三个图归纳了这三个目录下的各个次目录和里面放置的内容。

根目录(/)的意义与内容

根目录是整个系统最重要的一个目录,因为不但所有的目录都是由根目录衍生出来的,同时根目录也与开机、还原、系统修复等动作有关。由于系统开机时需要特定的开机软件、核心文件、开机所需程序、函式库等等文件数据,若系统出现错误时,根目录也必须要包含有能够修复文件系统的程序才行。因为根目录是这么的重要,所以在 FHS 的要求方面,他希望根目录不要放在非常大的分区,因为越大的分区内你会放入越多的数据,如此一来根目录所在分区就可能会有较多发生错误的机会。

因此 FHS 标准建议:根目录(/)所在分区应该越小越好,且应用程序所安装的软件最好不要与根目录放在同一个分区内,保持根目录越小越好。如此不但效能较佳,根目录所在的文件系统也较不容易发生问题。说白了,就是根目录和 Windows 的 C 盘一个样。

根据以上原因,FHS 认为根目录(/)下应该包含如下子目录:

srv 可以视为 service 的缩写,是一些网路服务启动之后,这些服务所需要取用的资料目录。常见的服务例如 WWW, FTP 等等。举例来说,WWW 伺服器需要的网页资料就可以放置在 /srv/www/ 里面。

目录 应放置档案内容
/bin 系统有很多放置执行档的目录,但 /bin 比较特殊。因为 /bin 放置的是在单人维护模式下还能够被操作的指令。在 /bin 底下的指令可以被 root 与一般帐号所使用,主要有:cat, chmod(修改权限), chown, date, mv, mkdir, cp, bash 等等常用的指令。
/boot 主要放置开机会使用到的档案,包括 Linux 核心档案以及开机选单与开机所需设定档等等。Linux kernel 常用的档名为:vmlinuz,如果使用的是 grub 这个开机管理程式,则还会存在 /boot/grub/ 这个目录。
/dev 在 Linux 系统上,任何装置与周边设备都是以档案的型态存在于这个目录当中。只要通过存取这个目录下的某个档案,就等于存取某个装置。比要重要的档案有 /dev/null, /dev/zero, /dev/tty, /dev/lp, /dev/hd, /dev/sd* 等等
/etc 系统主要的设定档几乎都放置在这个目录内,例如人员的帐号密码档、各种服务的启始档等等。一般来说,这个目录下的各档案属性是可以让一般使用者查阅的,但是只有 root 有权力修改。FHS 建议不要放置可执行档(binary)在这个目录中。比较重要的档案有:/etc/inittab, /etc/init.d/, /etc/modprobe.conf, /etc/X11/, /etc/fstab, /etc/sysconfig/ 等等。另外,其下重要的目录有:/etc/init.d/:所有服务的预设启动 script 都是放在这里的,例如要启动或者关闭 iptables 的话:/etc/init.d/iptables start、/etc/init.d/iptables stop/etc/xinetd.d/:这就是所谓的 super daemon 管理的各项服务的设定档目录。/etc/X11/:与 X Window 有关的各种设定档都在这里,尤其是 xorg.conf 或 XF86Config 这两个 X Server 的设定档。
/home 这是系统预设的使用者家目录(home directory)。在你新增一个一般使用者帐号时,预设的使用者家目录都会规范到这里来。比较重要的是,家目录有两种代号:~:代表当前使用者的家目录,而 ~guest:则代表用户名为 guest 的家目录。
/lib 系统的函式库非常的多,而 /lib 放置的则是在开机时会用到的函式库,以及在 /bin 或 /sbin 底下的指令会呼叫的函式库而已。什么是函式库呢?妳可以将他想成是外挂,某些指令必须要有这些外挂才能够顺利完成程式的执行之意。尤其重要的是 /lib/modules/ 这个目录,因为该目录会放置核心相关的模组(驱动程式)。
/media media 是媒体的英文,顾名思义,这个 /media 底下放置的就是可移除的装置。包括软碟、光碟、DVD 等等装置都暂时挂载于此。常见的档名有:/media/floppy, /media/cdrom 等等。
/mnt 如果妳想要暂时挂载某些额外的装置,一般建议妳可以放置到这个目录中。在古早时候,这个目录的用途与 /media 相同啦。只是有了 /media 之后,这个目录就用来暂时挂载用了。
/opt 这个是给第三方协力软体放置的目录。什么是第三方协力软体啊?举例来说,KDE 这个桌面管理系统是一个独立的计画,不过他可以安装到 Linux 系统中,因此 KDE 的软体就建议放置到此目录下了。另外,如果妳想要自行安装额外的软体(非原本的 distribution 提供的),那么也能够将你的软体安装到这里来。不过,以前的 Linux 系统中,我们还是习惯放置在 /usr/local 目录下。
/root 系统管理员(root)的家目录。之所以放在这里,是因为如果进入单人维护模式而仅挂载根目录时,该目录就能够拥有 root 的家目录,所以我们会希望 root 的家目录与根目录放置在同一个分区中。
/sbin Linux 有非常多指令是用来设定系统环境的,这些指令只有 root 才能够利用来设定系统,其他使用者最多只能用来查询而已。放在 /sbin 底下的为开机过程中所需要的,里面包括了开机、修复、还原系统所需要的指令。至于某些伺服器软体程式,一般则放置到 /usr/sbin/ 当中。至于本机自行安装的软体所产生的系统执行档(system binary),则放置到 /usr/local/sbin/ 当中了。常见的指令包括:fdisk, fsck, ifconfig, init, mkfs 等等。
/srv
/tmp 这是让一般使用者或者是正在执行的程序暂时放置档案的地方。这个目录是任何人都能够存取的,所以你需要定期的清理一下。当然,重要资料不可放置在此目录啊。因为 FHS 甚至建议在开机时,应该要将 /tmp 下的资料都删除。

事实上 FHS 针对根目录所定义的标准就仅限于上表,不过仍旧有些目录也需要我们了解一下,具体如下:

目录 应放置文件内容
/lost+found 这个目录是使用标准的 ext2/ext3 档案系统格式才会产生的一个目录,目的在于当档案系统发生错误时,将一些遗失的片段放置到这个目录下。这个目录通常会在分割槽的最顶层存在,例如你加装一个硬盘于 /disk 中,那在这个系统下就会自动产生一个这样的目录 /disk/lost+found
/proc 这个目录本身是一个虚拟文件系统 (virtual filesystem) 喔。他放置的资料都是在内存当中,例如系统核心、进程资讯 (process)、周边装置的状态及网络状态等等。因为这个目录下的资料都是在记忆体(内存)当中,所以本身不占任何硬盘空间。比较重要的档案(目录)例如:/proc/cpuinfo, /proc/dma, /proc/interrupts, /proc/ioports, /proc/net/* 等等。
/sys 这个目录其实跟 /proc 非常类似,也是一个虚拟的档案系统,主要也是记录与核心相关的资讯。包括目前已载入的核心模组与核心侦测到的硬体装置资讯等等。这个目录同样不占硬盘容量。

除了这些目录的内容之外,另外要注意的是,因为根目录与开机有关,开机过程中仅有根目录会被挂载,其他分区则是在开机完成之后才会持续的进行挂载的行为。就是因为如此,因此根目录下与开机过程有关的目录,就不能够与根目录放到不同的分区去。那哪些目录不可与根目录分开呢?有底下这些:

  • /etc:配置文件
  • /bin:重要执行档
  • /dev:所需要的装置文件
  • /lib:执行档所需的函式库与核心所需的模块
  • /sbin:重要的系统执行文件

这五个目录千万不可与根目录分开在不同的分区。

/usr 的意义与内容

依据 FHS 的基本定义,/usr 里面放置的数据属于可分享的与不可变动的 (shareable, static),如果你知道如何透过网络进行分区的挂载,那么 /usr 确实可以分享给局域网络内的其他主机来使用。

/usr 不是 user 的缩写,其实 usr 是 Unix Software Resource 的缩写,也就是 Unix 操作系统软件资源所放置的目录,而不是用户的数据。这点要注意。FHS 建议所有软件开发者,应该将他们的数据合理的分别放置到这个目录下的次目录,而不要自行建立该软件自己独立的目录。

因为是所有系统默认的软件 (distribution 发布者提供的软件) 都会放置到 /usr 底下,因此这个目录有点类似 Windows 系统的 C:\Windows\ + C:\Program files\ 这两个目录的综合体,系统刚安装完毕时,这个目录会占用最多的硬盘容量。一般来说,/usr 的次目录建议有底下这些:

目录 应放置文件内容
/usr/X11R6/ 为 X Window System 重要数据所放置的目录,之所以取名为 X11R6 是因为最后的 X 版本为第 11 版,且该版的第 6 次释出之意。
/usr/bin/ 绝大部分的用户可使用指令都放在这里。请注意到他与 /bin 的不同之处。(是否与开机过程有关)
/usr/include/ c/c++ 等程序语言的档头 (header) 与包含档 (include) 放置处,当我们以 tarball 方式 (*.tar.gz 的方式安装软件) 安装某些数据时,会使用到里头的许多包含档。
/usr/lib/ 包含各应用软件的函式库、目标文件 (object file),以及不被一般使用者惯用的执行档或脚本 (script)。某些软件会提供一些特殊的指令来进行服务器的设定,这些指令也不会经常被系统管理员操作,那就会被摆放到这个目录下啦。要注意的是,如果你使用的是 X86_64 的 Linux 系统,那可能会有 /usr/lib64/ 目录产生
/usr/local/ 统管理员在本机自行安装自己下载的软件 (非 distribution 默认提供者),建议安装到此目录,这样会比较便于管理。举例来说,你的 distribution 提供的软件较旧,你想安装较新的软件但又不想移除旧版,此时你可以将新版软件安装于 /usr/local/ 目录下,可与原先的旧版软件有分别啦。你可以自行到 /usr/local 去看看,该目录下也是具有 bin, etc, include, lib… 的次目录
/usr/sbin/ 非系统正常运作所需要的系统指令。最常见的就是某些网络服务器软件的服务指令 (daemon)
/usr/share/ 放置共享文件的地方,在这个目录下放置的数据几乎是不分硬件架构均可读取的数据,因为几乎都是文本文件嘛。在此目录下常见的还有这些次目录:/usr/share/man:联机帮助文件 /usr/share/doc:软件杂项的文件说明 /usr/share/zoneinfo:与时区有关的时区文件
/usr/src/ 一般原始码建议放置到这里,src 有 source 的意思。至于核心原始码则建议放置到 /usr/src/linux/ 目录下。

/var 的意义与内容

如果 /usr 是安装时会占用较大硬盘容量的目录,那么 /var 就是在系统运作后才会渐渐占用硬盘容量的目录。因为 /var 目录主要针对常态性变动的文件,包括缓存 (cache)、登录档 (log file) 以及某些软件运作所产生的文件,包括程序文件 (lock file, run file),或者例如 MySQL 数据库的文件等等。常见的次目录有:

非常重要。这是登录文件放置的目录。里面比较重要的文件如 /var/log/messages, /var/log/wtmp (记录登入者的信息)等。

目录 应放置文件内容
/var/cache/ 应用程序本身运作过程中会产生的一些暂存档
/var/lib/ 程序本身执行的过程中,需要使用到的数据文件放置的目录。在此目录下各自的软件应该要有各自的目录。举例来说,MySQL 的数据库放置到 /var/lib/mysql/ 而 rpm 的数据库则放到 /var/lib/rpm 去
/var/lock/ 某些装置或者是文件资源一次只能被一个应用程序所使用,如果同时有两个程序使用该装置时,就可能产生一些错误的状况,因此就得要将该装置上锁 (lock),以确保该装置只会给单一软件所使用。举例来说,刻录机正在刻录一块光盘,你想一下,会不会有两个人同时在使用一个刻录机烧片?如果两个人同时刻录,那片子写入的是谁的数据?所以当第一个人在刻录时该刻录机就会被上锁,第二个人就得要该装置被解除锁定 (就是前一个人用完了) 才能够继续使用
/var/log/
/var/mail/ 放置个人电子邮件信箱的目录,不过这个目录也被放置到 /var/spool/mail/ 目录中,通常这两个目录是互为链接文件。
/var/run/ 某些程序或者是服务启动后,会将他们的 PID 放置在这个目录下
/var/spool/ 这个目录通常放置一些队列数据,所谓的”队列”就是排队等待其他程序使用的数据。这些数据被使用后通常都会被删除。举例来说,系统收到新信会放置到 /var/spool/mail/ 中,但使用者收下该信件后该封信原则上就会被删除。信件如果暂时寄不出去会被放到 /var/spool/mqueue/ 中,等到被送出后就被删除。如果是工作排程数据 (crontab),就会被放置到 /var/spool/cron/ 目录中。

由于 FHS 仅是定义出最上层 (/) 及次层 (/usr, /var) 的目录内容应该要放置的文件或目录数据,因此,在其他次目录层级内,就可以随开发者自行来配置了。

其他特殊目录

/proc 目录

Linux 内核提供了一种通过 /proc 文件系统,在运行时访问内核内部数据结构、改变内核设置的机制。proc 文件系统是一个伪文件系统,它只存在内存当中,而不占用外存空间。它以文件系统的方式为访问系统内核数据的操作提供接口。

用户和应用程序可以通过 proc 得到系统的信息,并可以改变内核的某些参数。由于系统的信息,如进程,是动态改变的,所以用户或应用程序读取 proc 文件时,proc 文件系统是动态从系统内核读出所需信息并提交的。下面列出的这些文件或子文件夹,并不是都是在你的系统中存在,这取决于你的内核配置和装载的模块。另外,在 /proc 下还有三个很重要的目录:net,scsi 和 sys。Sys 目录是可写的,可以通过它来访问或修改内核的参数,而 net 和 scsi 则依赖于内核配置。例如,如果系统不支持 scsi,则 scsi 目录不存在。

除了以上介绍的这些,还有的是一些以数字命名的目录,它们是进程目录。系统中当前运行的每一个进程都有对应的一个目录在 /proc 下,以进程的 PID 号为目录名,它们是读取进程信息的接口。而 self 目录则是读取进程本身的信息接口,是一个 link。

子文件或子文件夹:

  • /proc/buddyinfo 每个内存区中的每个 order 有多少块可用,和内存碎片问题有关
  • /proc/cmdline 启动时传递给 kernel 的参数信息
  • /proc/cpuinfo cpu 的信息
  • /proc/crypto 内核使用的所有已安装的加密密码及细节
  • /proc/devices 已经加载的设备并分类
  • /proc/dma 已注册使用的 ISA DMA 频道列表
  • /proc/execdomains Linux 内核当前支持的 execution domains
  • /proc/fb 帧缓冲设备列表,包括数量和控制它的驱动
  • /proc/filesystems 内核当前支持的文件系统类型
  • /proc/interrupts x86 架构中的每个 IRQ 中断数
  • /proc/iomem 每个物理设备当前在系统内存中的映射
  • /proc/ioports 一个设备的输入输出所使用的注册端口范围
  • /proc/kcore 代表系统的物理内存,存储为核心文件格式,里边显示的是字节数,等于 RAM 大小加上 4kb
  • /proc/kmsg 记录内核生成的信息,可以通过 /sbin/klogd 或 /bin/dmesg 来处理
  • /proc/loadavg 根据过去一段时间内 CPU 和 IO 的状态得出的负载状态,与 uptime 命令有关
  • /proc/locks 内核锁住的文件列表
  • /proc/mdstat 多硬盘,RAID 配置信息 (md=multiple disks)
  • /proc/meminfo RAM 使用的相关信息
  • /proc/misc 其他的主要设备 (设备号为 10) 上注册的驱动
  • /proc/modules 所有加载到内核的模块列表
  • /proc/mounts 系统中使用的所有挂载
  • /proc/mtrr 系统使用的 Memory Type Range Registers (MTRRs)
  • /proc/partitions 分区中的块分配信息
  • /proc/pci 系统中的 PCI 设备列表
  • /proc/slabinfo 系统中所有活动的 slab 缓存信息
  • /proc/stat 所有的 CPU 活动信息
  • /proc/sysrq-trigger 使用 echo 命令来写这个文件的时候,远程 root 用户可以执行大多数的系统请求关键命令,就好像在本地终端执行一样。要写入这个文件,需要把 /proc/sys/kernel/sysrq 不能设置为 0。这个文件对 root 也是不可读的
  • /proc/uptime 系统已经运行了多久
  • /proc/swaps 交换空间的使用情况
  • /proc/version Linux 内核版本和 gcc 版本
  • /proc/bus 系统总线 (Bus) 信息,例如 pci/usb 等
  • /proc/driver 驱动信息
  • /proc/fs 文件系统信息
  • /proc/ide ide 设备信息
  • /proc/irq 中断请求设备信息
  • /proc/net 网卡设备信息
  • /proc/scsi scsi 设备信息
  • /proc/tty tty 设备信息
  • /proc/net/dev 显示网络适配器及统计信息
  • /proc/uptime 就是用 uptime 的时候会出现的资讯
  • /proc/version 核心的版本,就是用 uname -a 显示的内容
  • /proc/vmstat 虚拟内存统计信息
  • /proc/vmcore 内核 panic 时的内存映像
  • /proc/diskstats 取得磁盘信息
  • /proc/schedstat kernel 调度器的统计信息
  • /proc/zoneinfo 显示内存空间的统计信息,对分析虚拟内存行为很有用

以下是 /proc 目录中进程 N 的信息:

  • /proc/N pid 为 N 的进程信息
  • /proc/N/cmdline 进程启动命令
  • /proc/N/cwd 链接到进程当前工作目录
  • /proc/N/environ 进程环境变量列表
  • /proc/N/exe 链接到进程的执行命令文件
  • /proc/N/fd 包含进程相关的所有的文件描述符
  • /proc/N/maps 与进程相关的内存映射信息
  • /proc/N/mem 指代进程持有的内存,不可读
  • /proc/N/root 链接到进程的根目录
  • /proc/N/stat 进程的状态
  • /proc/N/statm 进程使用的内存的状态
  • /proc/N/status 进程状态信息,比 stat/statm 更具可读性
  • /proc/self 链接到当前正在运行的进程

/dev 目录

dev 是设备(device)的英文缩写。/dev 这个目录对所有的用户都十分重要。因为在这个目录中包含了所有 Linux 系统中使用的外部设备。但是这里并不是放的外部设备的驱动程序,这一点和 windows, dos 操作系统不一样。它实际上是一个访问这些外部设备的端口。我们可以非常方便地去访问这些外部设备,和访问一个文件,一个目录没有任何区别。

Linux 沿袭 Unix 的风格,将所有设备认成是一个文件。设备文件分为两种:块设备文件(b)和字符设备文件(c)。设备文件一般存放在 /dev 目录下,对常见设备文件作如下说明:

  • /dev/hd[a-t] IDE 设备
  • /dev/sd[a-z] SCSI 设备
  • /dev/fd[0-7] 标准软驱
  • /dev/md[0-31] 软 raid 设备
  • /dev/loop[0-7] 本地回环设备
  • /dev/ram[0-15] 内存
  • /dev/null 无限数据接收设备,相当于黑洞
  • /dev/zero 无限零资源
  • /dev/tty[0-63] 虚拟终端
  • /dev/ttyS[0-3] 串口
  • /dev/lp[0-3] 并口
  • /dev/console 控制台
  • /dev/fb[0-31] framebuffer
  • /dev/cdrom => /dev/hdc
  • /dev/modem => /dev/ttyS[0-9]
  • /dev/pilot => /dev/ttyS[0-9]
  • /dev/random 随机数设备
  • /dev/urandom 随机数设备

WEB 应用应该放在哪个文件夹下?

Debian 以及一些其它较老的系统仍然使用 /var/www 作为 web 服务的默认根目录,然而 Arch 却使用的是 /srv/http. 比较优雅地解决方案是建立符号连接: sudo ln -s /srv/http /var/www

/srv

指定 /srv 的主要目的是为了让用户可以找到特定服务的文件所在的位置,因此这些需要一个单独的目录来存放只读的数据,可写的数据以及脚本(例如 cgi scripts)的服务就能够放在合理的位置.某个特定用户感兴趣的数据应该适用于所有用户的 home 目录.

命名 /srv 子目录的方法没有具体指定,因为对于应该如何命名现在还没有达成共识。其中一种方法是通过协议来组织 /srv 目录下的数据,例如 ftp, rsync, www 以及 cvs。对于大型的系统,通过管理环境来组织 /srv 是很有用的,例如 /srv/physics/www, /srv/compsci/cvs 等等.这一步因服务器不同而不同.因此,任何程序都不能依靠一种具体的 /srv 的组织结构而存在,任何数据也不能必须被存储在 /srv 目录下.但是在 FHS 标准的系统里, /srv 目录应该总是存在的,而且也应该作为这些数据存放的默认目录.

各个发行版一定要注意,在没有管理员权限的情况下是不能把本地文件放入这些目录里的.

/var

/var 存放的是可变的数据文件.包括 spool 目录和文件,管理和日志数据,以及临时文件.

/var 的一些部分在不同的系统间是不共享的.比方说, /var/log, /var/lock 以及 /var/run.其他的部分是可以共享的,特别是 /var/mail, /var/cache/man, /var/cache/fonts 以及 /var/spool/news.

指定 /var 是为了有可能只读地挂载 /usr.如果有文件一旦到了 /usr 里,在系统运行期间就是可写的(相对于安装和软件维护)了的话,那这个文件一定要放在 /var 里.

如果 /var 不能成为独立的一部分,那么比较好的方法是,把根目录下的 /var 移到 /usr 里.(这有时候用来减少根目录的大小,或者根目录的空间没剩多少时也可以这样做.)但是, /var 一定不能连接到 /usr,因为这使得分开 /usr 和 /var 更加困难了,而且很可能会导致命名冲突.相反,把 /var 连接到 /usr/var.

应用通常都不会在 /var 的顶级目录下增加新的目录。只有当这些目录有系统范围的应用的时候,并且咨询了 FHS 的邮件列表之后才能被添加。

例如:

  • /var/log for logs
  • /var/tmp for temporary files
  • /var/cache for cache
  • /var/lock for lock files

参考链接:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注