git文件的操作

什么是git仓库?

让我们来重温一下三个区域的概念:

git有三个工作区域:工作目录(Working Directory),暂存区(Staging Area)和git仓库(.git directory)(Repository)。

在每个git项目的根目录下,都会有一个.git目录,这个目录就是git仓库。暂存区是git仓库中的一个文件(index文件),它保存着下次要提交到git仓库的文件列表。

作为分布式版本控制系统,git中的git仓库被保存在每一份项目文件中,而没有中央服务仓库。

我们平时工作的地方,也就是项目的文件夹,叫做工作目录。

一个git仓库包括:

  • 一系列提交对象(commit objects).
  • 一系列指向这些提交对象的索引,叫做heads。

一个提交对象(commit objects)包括:

  • 一系列文件在某个时间的快照。
  • 一系列指向父提交对象的索引。
  • 一个SHA-1名字,这个名字40个字符长,是独一无二的。
  • 作者的姓名和邮箱,以及提交时对提交的描述。

用户在修改完版本A后提交得到版本B,版本A就是版本B的父提交对象。一个提交对象可以有多个父提交对象。

整个项目中的第一个提交对象没有父提交对象。

总的来说,git仓库包含很多提交对象,并且每个提交对象都指向自己的父提交对象,直到第一个提交对象。

head与HEAD

head只是一个指向提交对象的索引,每一个head都有一个名字。git默认有一个叫做master的head。一个git仓库可以有多个head。

在任何时候,当前使用的head的别名叫作HEAD

每一次提交之后,HEAD都会自动地从父提交对象指向本次提交对象。

综上所述,git仓库的示意图如下:

git仓库

在提交之后,会生成新的提交对象,并且HEAD会指向新的提交对象。

修改了什么?git diff [–staged]

现在将README.txt文件中的最后一行Git is very fast.修改为Git is very fast and convenient.可以得到如下结果:

 git diff diff --git a/README.txt b/README.txt index f3401b9..a695b86 100644 --- a/README.txt +++ b/README.txt @@ -1,3 +1,4 @@  Hi, Git!  Git is a free and open source distributed version control system.  Git is very easy to learn. +Git is very fast and convenient.  git add README.txt 
 git diff  

可见,git diff将工作目录中现在的文件状态同暂存区中的文件相比较。如果要比较暂存区中下次要提交文件同已提交文件的更改,可以使用git diff --staged命令,这个命令会比较HEAD指向的文件版本与暂存区中的版本的区别(git diff --cached是此命令的老用法):

$ git diff --staged
diff --git a/README.txt b/README.txt
index f14261d..a695b86 100644
--- a/README.txt
+++ b/README.txt
@@ -1,2 +1,4 @@
 Hi, Git!
 Git is a free and open source distributed version control system.
+Git is very easy to learn.
+Git is very fast and convenient.

就像之前所说,_HEAD_指向当前的提交对象,因此git diff HEAD -- README.txt可以比较当前git仓库中的文件版本和工作目录中的文件版本。

移除文件 git rm [-f | –cached]

如果要从已被跟踪的文件列表中删除某个文件,可以使用git rm命令,它会同时删除工作目录中的文件。如果文件已经被修改并且纳入暂存区,那么需要使用-f选项。下面是一个例子,省略了部分输出:

 touch a.txt  git add a.txt
 git commit -m "add a.txt"  ls
a.txt  README.txt
 git rm a.txt rm 'a.txt'  git status
On branch master
Changes to be committed:
  (use "git reset HEAD <file>..." to unstage)

    deleted:    a.txt

 git commit -m "delete a.txt"  ls
README.txt

如果仍然需要在工作目录中使用该文件,而不想被跟踪,可以使用--cached选项。

 touch b.txt  git add b.txt
 git commit -m "add b.txt"  git rm --cached b.txt
 git commit -m "delete cached b.txt"  git status
On branch master
Untracked files:
  (use "git add <file>..." to include in what will be committed)

    b.txt

nothing added to commit but untracked files present (use "git add" to track)

重命名文件 git mv

使用git mv命令对文件进行重命名:

 git mv README.txt README.md  git status
On branch master
Changes to be committed:
  (use "git reset HEAD <file>..." to unstage)

    renamed:    README.txt -> README.md

忽略文件 .gitignore

项目中可能有一些文件不需要,或者不应该被git跟踪,比如私人配置文件、日志文件、临时文件等。这时候就用到了.gitignore文件,最好在项目一开始就配置好这个文件,以免将来错误的提交此类文件。.gitignore文件中记录的文件列表不会被git跟踪。

现在以a.txt为例,将它加到.gitignore文件中:

 echo "a.txt" >> .gitignore  git add .gitignore ; git commit -m "add a.txt to .gitignore"
 touch a.txt  git status
On branch master
nothing to commit, working directory clean

可见,虽然a.txt是新的文件,但是git却现实工作目录是干净的,原因就是a.txt被加到了.gitignore中。

.gitignore文件的语法如下:

  • 开头的行表示注释,都会被 Git 忽略。
  • 可以使用标准的 glob 模式匹配。
  • 匹配模式可以以(/)开头防止递归。
  • 匹配模式可以以(/)结尾指定目录。
  • 要忽略指定模式以外的文件或目录,可以在模式前加上惊叹号(!)取反。

标准的glob模式指的是:

  • *表示匹配零或者任意多个任意字符;
  • [abc]表示匹配括号中的任意一个字符,此例表示比配一个a,或者一个b,或者一个c。
  • ?表示匹配任意一个字符;
  • 方括号中用短线表示断线两端内的字符会被匹配,[0-9]表示会匹配0至9之间的数字。
  • **表示任意中间目录,比如a/**/z匹配a目录中的z文件,中间可以有零至多级目录。

下面的例子来自《Pro Git》(written by Scott Chacon and Ben Straub and published by Apress)书籍,2.2节,遵循Creative Commons Attribution Non Commercial Share Alike 3.0 license协议。我对原本例子进行了翻译。这是一个.gitignore文件的例子:

# 忽略 .a 文件
*.a 

# 跟踪 lib.a, 即使在上一句中已经忽略了 .a 文件 
!lib.a 

# 仅仅忽略本目录的 TODO,不要忽略子目录的 TODO
/TODO 

# 忽略 build 目录中的所有文件
build/ 

# 忽略 doc/notes.txt, 但会跟踪 doc/server/arch.txt 
doc/*.txt 

# 忽略所有的 doc/ 目录中的 .pdf 文件
doc/**/*.pdf

GitHub上有数十种语言的.gitignore文件,请移步 https://github.com/github/gitignore。

留下评论

电子邮件地址不会被公开。 必填项已用*标注