wiki:patch&diff

Wiki: patch & diff

2006/10/11

diff和patch是一对工具

在数学上来说

    • diff是对两个集合的差运算

    • patch是对两个集合的和运算。

    • diff比较两个文件或文件集合的差异,并记录下来,生成一个diff文件,这也是我们常说的patch文件,即补丁文件。

    • patch能将diff文件运用于 原来的两个集合之一,从而得到另一个集合。

举例

举个例子来说文件A和文件B,经过diff之后生成了补丁文件C。

    • 那么diff的过程相当于 A -B = C

    • 那么patch的过程就是 B+C = A 或 A-C =B。

因此我们只要能得到A, B, C三个文件中的任何两个,就能用diff和patch这对工具 生成另外一个文件。

diff用法

diff后面可以接两个文件名或两个目录名。 如果是一个目录名加一个文件名,那么只作用在那么个目录下的同名文件。

如果是两个目录的话,作用于该目录下的所有文件,不递归。如果我们希望递归执行,需要使用-r参数。

命令diff A B > C ,一般A是原始文件,B是修改后的文件,C称为A的补丁文件。

不加任何参数生成的diff文件格式是一种简单的格式,这种格式只标出了不一样的 行数和内容。我们需要一种更详细的格式,可以标识出不同之处的上下文环境,这 样更有利于提高patch命令的识别能力。这个时候可以用-c开关。

patch用法

patch用于根据原文件和补丁文件生成目标文件。还是拿上个例子来说

patch A C 就能得到B, 这一步叫做对A打上了B的名字为C的补丁。

之一步之后,你的文件A就变成了文件B。如果你打完补丁之后想恢复到A怎么办呢?

patch -R B C 就可以重新还原到A了。

所以不用担心会失去A的问题。

其实patch在具体使用的时候是不用指定原文件的,因为补丁文件中都已经记载了原 文件的路径和名称。patch足够聪明可以认出来。但是有时候会有点小问题。比如一 般对两个目录diff的时候可能已经包含了原目录的名字,但是我们打补丁的时候会 进入到目录中再使用 patch,着个时候就需要你告诉 patch命令怎么处理补丁文件中 的路径。可以利用-pn开关,告诉patch命令忽略的路径分隔符的个数。举例如下:

A文件在 DIR_A下,修改后的B文件在DIR_B下,一般DIR_A和DIR_B在同一级目录。我 们为了对整个目录下的所有文件一次性diff,我们一般会到DIR_A和DIR_B的父目录下 执行以下命令

diff -rc DIR_A DIR_B > C

这个时候补丁文件C中会记录了原始文件的路径为 DIR_A/A

现在另一个用户得到了A文件和C文件,其中A文件所在的目录也是DIR_A。 一般,他 会比较喜欢在DIR_A目录下面进行patch操作,它会执行

patch < C

但是这个时候patch分析C文件中的记录,认为原始文件是./DIR_A/A,但实际上 是./A,此时patch会找不到原始文件。为了避免这种情况我们可以使用-p1参数如下

patch -p1 < C

此时,patch会忽略掉第1个”/”之前的内容,认为原始文件是 ./A,这样就正确了。

注意

    1. 一次打多个patch的话,一般这些patch有先后顺序,得按次序打才行。

    2. 在patch之前不要对原文件进行任何修改

    3. 如果patch中记录的原始文件和你得到的原始文件版本不匹配(很容易出现),那 么你可以尝试使用patch, 如果幸运的话,可以成功。大部分情况下,会有不匹配的 情况,此时patch会生成rej文件,记录失败的地方,你可以手工修改。

举例

如果有源文件a,现在做了修改变成b, 需要将其它地方的a改成b

    1. 生成输出统一格式(unified format)的diff比较结果

      1. diff -u a b > p

    2. 修改其它a文件

      1. patch a < p

如果包含了目录的许多文件的修改使用下面的开关

diff -ruNa dir_old dir_new

    • \-r 递归处理目录

    • -u 输出统一格式(unified format)

    • -N patch里包含新文件

    • -a patch里可以包含二进制文件

patch -pn -b dir <p

    • \-pn 中n是目录的第几层

    • -b 表示将旧的备份成*.orig