A Libertine of Computer Science

Dijkstra algorithm [Dijkstra最短路径算法]

前文介绍的Floyd-Warshell算法是解决多源最短路径问题[mutiple-source shortest-paths problem],即多个起始点的最短路径,而Dijkstra最短路径算法则是解决单源最短路径问题[single-source shortest-paths problem],也即是给定一个点,只需计算出该点到达另一点的最短路径即可。Dijkstra算法是贪心算法思想的成功应用,其核心思想是每次找到离源点最近的一个顶点,然后以该顶点为中心进行扩展,最终得到源点到其余所有点的最短路径

Log-structured File Systems(LFS) [基于日志结构文件系统]

LFS[Log-structured File System]也是由Berkeley的研究人员最先提出并实现的,他们当时认为随机I/O和顺序I/O之间存在着巨大性能差异,其实就是顺序I/O快,随机I/O慢[因为要磁盘需要seek和rorate的时间]。所以说随机I/O成了bottleneck拖了后腿。但是记得在介绍FFS的blog中说过,即便在FFS中,一个write操作其实是至少5次write操作,因为写入一个data block还要更新对应的metadata信息,这里面就比不可少的需要随机I/O。要是能够只用顺序读写就好了,可以大幅度提高I/O效率了。同时Berkeley的研究人员还认为write操作占据了全部操作的很大一部分,因为Memory在快速增长,能够Cache的数据也越来越多那么就要涉及更多的write操作。所以基于这样两个考虑:(1)write占所有disk操作大部分;(2)随机IO性能比连续IO差很多,要是能只用连续I/O就会大幅度提高性能,LFS不更新任何数据只提供append[追加]操作,同时会建立buffer将多次操作放进一个segment里一次性写入来有效利用顺序IO。

Fast File System [快速文件系统]

Fast File System,快速文件系统,是由Berkeley大学研究人员设计并实现的建立在UNIX操作系统的一套文件系统。这个系统主要目标已经体现在它的名字上,就是建立一个快速的文件系统。因为他们发现之前的UNIX的文件系统(参考之前的Blog文章“Concepts of Unix File System”)在性能方面存在问题,主要问题是在磁头定位,位置转化过程中浪费了大量的时间,导致效率不高。所以FFS的一大设计思路就是降低磁头的seek时间,而解决方案也很简单,keep related stuff together,这样seek的时候就可以节省时间。整个FFS涉及几个关键概念

Andrew File System [安德鲁文件系统]

Andrew File System,最初是由CMU和IBM联合开发的分布式文件系统。按照在NFS中说的,系统最重要的是要先看它的目标是什么,对于AFS来说,目标只有一个large scale[大规模]。也就是说一个server能支持愈多的client越好。

Network File System [网络文件系统]

NFS最初是由Sun Microsystems公司提出,全名Sun Network Filesystem,旨在提供一个独立于机器和操作系统的能够快速从错误(crash,failure)中恢复的分布式文件系统。任何系统都要从这个系统的定位来看,也就是这个系统要达到什么目标。提出NFS的论文Design and Implemenatation of the Sun Network Fielsystem阐明,主要目标有五个:

[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17]