Andrew File System [安德鲁文件系统]

Andrew File System，最初是由CMU和IBM联合开发的分布式文件系统。按照在NFS中说的，系统最重要的是要先看它的目标是什么，对于AFS来说，目标只有一个large scale[大规模]。也就是说一个server能支持愈多的client越好。

回想一下NFS的特点，其中一个就是client要不停地和server交互以确定当前适用的文件是最新的，这种情况下，越多的client必然造成更大的网络开销和更频繁的client-server交互，以至于在达到一定client数量后server就不能再支持更多的client。所以这里一点个人思考就是，在single-server-muliple-clients的环境下，要想保证large scale就要最大限度的减少server-client之间的交互，同时为了保证系统的可靠性，server应该最小限度的保存最重要的信息。

基于large scale的定位，AFS有着和NFS截然不同的架构。

Callback

首先，不同于NFS中client要频繁的checkserver的文件状态，AFS提供了callback机制，AFS会记录每个client都读取并cache了那些文件，一旦一个文件被一个client修改并update到server，server会callback所有拥有这个文件的其他client，告诉他们这个文件已经过期，请更新。如此就避免了多次client向server询问或请求文件的过程。

Whole-file Caching

另外一个巨大区别是，NFS是通过file handle逐步获得请求文件，AFS则是将所有文件统统cache到client，这样client也不用频繁的获取文件，因为几乎所有文件都在本地。具体说来是，当client请求/root/doc/foo.txt的时候，AFS会把root文件夹所有文件给client（这里使用file identifier）并建立对应的callback，然后再把doc路径下所有文件都给client并建立callback，这样如果client以后需要请求任何在root目录下的文件，都不需要再请求server而可以直接进行本地操作。同时，因为建立的对应的callback，任何一个文件的修改，server都会通知client，并要求其进行更新操作。

Consistency

如同前文所述，consistency主要通过callback机制实现。同时需要注意的是，AFS采用last writer win机制，也就是，当不同client同时修改了一个文件并update到server，那么server会采用最后一个更新，也就是说之前所有其它client的update会被最后一个update覆盖。这里也和NFS不同，因为AFS的consistency是文件级别所以最后的update就是server文件的最终状态，但是NFS提供的是block-based protocol，所以一个文件的最终状态可能是不同client的几次不同update的混合。

Crash Recovery

因为AFS的设计目标并不是recovery，所以这方面AFS要远逊色于NFS。尤其是当server crash之后，恢复的工作是非常复杂的，因为server存储了很多状态信息，client必须能够知道server什么时候crash的，然后和server进行交互来恢复server之前的状态信息。具体的实现方式可以有很多，但是basic idea就是如此。

About This Blog

Categories

Tags

Andrew File System [安德鲁文件系统]

Callback

Whole-file Caching

Consistency

Crash Recovery