CCF 201604-3 路径解析

  • 作者:Moilk
  • 最后编辑:2016年09月09日
  • 标签: CCF 算法

问题描述   在操作系统中,数据通常以文件的形式存储在文件系统中。文件系统一般采用层次化的组织形式,由目录(或者文件夹)和文件构成,形成一棵树的形状。文件有内容,用于存储数据。目录是容器,可包含文件或其他目录。同一个目录下的所有文件和目录的名字各不相同,不同目录下可以有名字相同的文件或目录。
  为了指定文件系统中的某个文件,需要用路径来定位。在类 Unix 系统(Linux、Max OS X、FreeBSD等)中,路径由若干部分构成,每个部分是一个目录或者文件的名字,相邻两个部分之间用 / 符号分隔。
  有一个特殊的目录被称为根目录,是整个文件系统形成的这棵树的根节点,用一个单独的 / 符号表示。在操作系统中,有当前目录的概念,表示用户目前正在工作的目录。根据出发点可以把路径分为两类:

  • 绝对路径:以 / 符号开头,表示从根目录开始构建的路径。
    *Ÿ 相对路径:不以 / 符号开头,表示从当前目录开始构建的路径。
      例如,有一个文件系统的结构如下图所示。在这个文件系统中,有根目录 / 和其他普通目录 d1、d2、d3、d4,以及文件 f1、f2、f3、f1、f4。其中,两个 f1 是同名文件,但在不同的目录下。
      fileTree
      对于 d4 目录下的 f1 文件,可以用绝对路径 /d2/d4/f1 来指定。如果当前目录是 /d2/d3,这个文件也可以用相对路径 ../d4/f1 来指定,这里 .. 表示上一级目录(注意,根目录的上一级目录是它本身)。还有 . 表示本目录,例如 /d1/./f1 指定的就是 /d1/f1。注意,如果有多个连续的 / 出现,其效果等同于一个 /,例如 /d1///f1 指定的也是 /d1/f1。
      本题会给出一些路径,要求对于每个路径,给出正规化以后的形式。一个路径经过正规化操作后,其指定的文件不变,但是会变成一个不包含 . 和 .. 的绝对路径,且不包含连续多个 / 符号。如果一个路径以 / 结尾,那么它代表的一定是一个目录,正规化操作要去掉结尾的 /。若这个路径代表根目录,则正规化操作的结果是 /。若路径为空字符串,则正规化操作的结果是当前目录。
    输入格式
      第一行包含一个整数 P,表示需要进行正规化操作的路径个数。
      第二行包含一个字符串,表示当前目录。
      以下 P 行,每行包含一个字符串,表示需要进行正规化操作的路径。
    输出格式
      共 P 行,每行一个字符串,表示经过正规化操作后的路径,顺序与输入对应。
    样例输入
      7
      /d2/d3
      /d2/d4/f1
      ../d4/f1
      /d1/./f1
      /d1///f1
      /d1/
      ///
      /d1/../../d2
    样例输出
      /d2/d4/f1
      /d2/d4/f1
      /d1/f1
      /d1/f1
      /d1
      /
      /d2
    评测用例规模与约定
      1 ≤ P ≤ 10。
      文件和目录的名字只包含大小写字母、数字和小数点 .、减号 - 以及下划线 _。
      不会有文件或目录的名字是 . 或 .. ,它们具有题目描述中给出的特殊含义。
      输入的所有路径每个长度不超过 1000 个字符。
      输入的当前目录保证是一个经过正规化操作后的路径。
      对于前 30% 的测试用例,需要正规化的路径的组成部分不包含 . 和 .. 。
      对于前 60% 的测试用例,需要正规化的路径都是绝对路径。

解题说明
  这道题要讲究操作的顺序。首先,如果字符串的第一个字符不是’/’, 就不管别的先把当前目录方在前面, 这样所有字符串就都变成了绝对路径。然后再把中间所有多余的’/’去掉,末尾的保留。如果末尾没有’/’, 其实加上会比较好, 这样可以发现如果末尾是当前目录或者上级目录,操作变得方便多了。接着,所有的当前目录符号都是多余的,全部去掉,这时要注意搜索的是”/./”, 因为目录或者文件名可以包含’.’。做到这一步就发现只剩下上级目录符号了, 我想不用我再多说也知道该怎么办了。最后去掉末尾的’/’, 就全部搞定了(注意,如果之前末尾没有自己追加一个’/’,这时还要额外考虑末尾是”/..”和”/.”的情况, 我下面给的代码就是这样, 写到这里的时候才发现可以追加斜杠变得简单)。

#include <iostream>

using namespace std;

string str[10];

string::size_type refind(const string &str,string::size_type pos,const char c) {
	int p=pos;
	while(1) {
		if(p==-1) {
			return (string::npos);
		}
		if(str[p]==c) {
			return p;
		}
		p--;
	}

	return (string::npos);
}

int main(void) {
	int N;
	string pwd,pwdf,tmp;
	cin>>N;
	cin>>pwd;
	getchar();
	string::size_type pre=0;
	string::size_type post;
	while(1) {
		post=pwd.find('/',pre+1);
		if(post==string::npos) {
			break;
		}
		pre=post;
	}
	if(pre==0) {
		pwdf="/";
	} else {
		pwdf=pwd.substr(0,pre);
	}

	for(int i=0; i<N; i++) {
		getline(cin,tmp);
		// 头部的处理
		if(tmp[0]!='/') {
			tmp=pwd+"/"+tmp;
		}
		// 去掉多于斜杠
		pre=0;
		while(1) {
			post=tmp.find('/',pre);
			if(post==string::npos) {
				break;
			}
			pre=post+1;
			post++;
			while(1) {
				if(post>=tmp.size()||tmp[post]!='/') {
					break;
				}
				post++;
			}
			tmp.erase(pre,post-pre);
		}
		// 去掉中间的单点
		pre=0;
		while(1) {
			post=tmp.find("/./",pre);
			if(post==string::npos) {
				break;
			}
			tmp.erase(post+1,2);
			pre=post;
		}
		// 去掉中间的双点
		pre=0;
		while(1) {
			post=tmp.find("/../",pre);
			if(post==string::npos) {
				break;
			}
			pre=refind(tmp,post-1,'/');
			if(pre!=string::npos) {
				pre++;
			} else {
				pre=post+1;
			}
			tmp.erase(pre,post+4-pre);
			pre--;
		}

		//去掉末尾的点
		int len=tmp.size();
		if(len>=2&&tmp[len-1]=='.'&&tmp[len-2]=='/') {
			tmp.erase(len-1,1);
		}
		len=tmp.size();
		if(len>=3&&tmp[len-1]=='.'&&tmp[len-2]=='.'&&tmp[len-3]=='/') {
			pre=refind(tmp,len-4,'/');
			if(pre!=string::npos) {
				pre++;
			} else {
				pre=len-2;
			}
			tmp.erase(pre,len);
		}

		// 去掉末尾的斜杠
		len=tmp.size();
		if(len>1&&tmp[len-1]=='/') {
			tmp.erase(len-1,1);
		}
		cout<<tmp<<endl;
	}

	return 0;
}