# 追踪、缓存对仓库的更新

本地仓库的目录下每一个文件都不外乎处于两种状态：已追踪的 (tracked) 或未追踪的 (untracked)。
- 已追踪的文件包括上一次 git 所记录的快照中的文件，以及新的缓存文件；它们可能是未编辑的 (unmodified)、已编辑的 (modified) 或已缓存的 (staged) —— Git 会将编辑后的文件标记为已编辑状态，此时我们可以根据需要，将若干修改过的文件移入缓存区，远程提交时只会提交已缓存的修改；
- 工作目录下除已跟踪文件外的其它所有文件都属于未追踪文件，这些文件既不存在于快照记录中，也没有被放入缓存区；


![](https://git-scm.com/book/en/v2/images/lifecycle.png)

### 1 查看各文件的状态

通过`git status`命令即可查看仓库中当前所有文件所处的状态

In [6]:
! git status

On branch master
Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
	modified:   ../.ipynb_checkpoints/tmp-checkpoint.ipynb
	new file:   .ipynb_checkpoints/01 Setting up Git-checkpoint.ipynb
	new file:   .ipynb_checkpoints/02 Getting a repo-checkpoint.ipynb
	new file:   .ipynb_checkpoints/03 Tracking and Staging Changes-checkpoint.ipynb
	modified:   .ipynb_checkpoints/Git-checkpoint.ipynb
	new file:   00 Specifications
	new file:   01 Setting up Git.ipynb
	new file:   02 Getting a repo.ipynb
	new file:   03 Tracking and Staging Changes.ipynb
	modified:   Git.ipynb
	renamed:    ../Help_Viewer_Python/Python_Basic/.ipynb_checkpoints/Lexical_Analysis-checkpoint.ipynb -> ../Help_Viewer_Python/00_Python_Basic/.ipynb_checkpoints/Lexical_Analysis-checkpoint.ipynb
	renamed:    ../Help_Viewer_Python/Python_Basic/.ipynb_checkpoints/Namespace and Scope-checkpoint.ipynb -> ../Help_Viewer_Python/00_Python_Basic/.ipynb_checkpoints/Namespace and Scope-checkpoint.ipynb
	rename

输出内容通常会显示当前所在的分支 `On branch master` 、已缓存的文件`Changes to be committed`、未缓存的文件 `Changes not staged for commit`、未追踪的文件 `Untracked files`

### 2 添加要追踪的文件

使用命令`git add <FILES>`可以对一个新创建的文件进行追踪，其中 `<FILES>` 可以是文件或目录的路径，对于目录路径的情况，该命令会递归地追踪目录下的所有文件。此外，也可以一次性地传递`--all`或`-A`参数来对所有文件进行追踪

In [None]:
! git add --all

In [9]:
# check the status
! git status

On branch master
Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
	modified:   ../.ipynb_checkpoints/tmp-checkpoint.ipynb
	new file:   .ipynb_checkpoints/01 Setting up Git-checkpoint.ipynb
	new file:   .ipynb_checkpoints/02 Getting a repo-checkpoint.ipynb
	new file:   .ipynb_checkpoints/03 Tracking and Staging Changes-checkpoint.ipynb
	modified:   .ipynb_checkpoints/Git-checkpoint.ipynb
	new file:   00 Specifications
	new file:   01 Setting up Git.ipynb
	new file:   02 Getting a repo.ipynb
	new file:   03 Tracking and Staging Changes.ipynb
	modified:   Git.ipynb
	renamed:    ../Help_Viewer_Python/Python_Basic/.ipynb_checkpoints/Lexical_Analysis-checkpoint.ipynb -> ../Help_Viewer_Python/00_Python_Basic/.ipynb_checkpoints/Lexical_Analysis-checkpoint.ipynb
	renamed:    ../Help_Viewer_Python/Python_Basic/.ipynb_checkpoints/Namespace and Scope-checkpoint.ipynb -> ../Help_Viewer_Python/00_Python_Basic/.ipynb_checkpoints/Namespace and Scope-checkpoint.ipynb
	rename

### 3 缓存文件

对于那些修改后的文件，若希望在远程推送时将其纳入推送文件列表中，还需要将该文件放入缓存区。缓存文件的命令依旧是 `git add` —— 该命令既可以追踪新文件，也可以将已跟踪的文件放到暂存区，还可以在合并时将有冲突的文件标记为已解决状态等等；

现在我们来修改一个已被跟踪的文件。例如修改一个名为`README.md`的已被跟踪的文件，然后运行`git status`命令，会看到下面内容：
```bash
git status
On branch main
Your branch is up to date with 'origin/main'.

Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
        new file:   README

Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git restore <file>..." to discard changes in working directory)
        modified:   README.md
```
`README.md`出现在`Changes not staged for commit`这行下面，说明已跟踪文件的内容发生了变化，但还没有放到暂存区；此时运行`git add`命令便可暂存这次更新——`git add`可以开始跟踪新文件，或者把已跟踪的文件放到暂存区，还能用于合并时把有冲突的文件标记为已解决状态等；
```bash
$ git add CONTRIBUTING.md
$ git status
On branch main
Your branch is up to date with 'origin/main'.

Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
        new file:   README
        modified:   README.md
```
如果此时再在`README.md`中加条注释，此时运行`git status`会显示：
```bash
$ git add CONTRIBUTING.md
$ git status
On branch main
Your branch is up to date with 'origin/main'.

Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
        new file:   README
        modified:   README.md

Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git restore <file>..." to discard changes in working directory)
        modified:   README.md
```
可以看到`README.md`文件同时出现在暂存区和非暂存区，其中暂存区为上次运行`git add`命令时的版本，如果现在提交便会提交此版本，如果需要提交这次修改后的版本，则需要再次运行` git add`命令；


### 3.4 状态简览




`git status`输出详细但有些繁琐，而使用`git status -s`命令或`git status --short`命令可以得到更为紧凑的输出，以更简洁的方式查看更改：
```bash
git status -s
 M README
MM Rakefile
A  lib/git.rb
M  lib/simplegit.rb
?? LICENSE.txt
```
其中`??`表示新添加的未跟踪文件，`A`表示新添加到暂存区中的文件，`M`表示修改过的文件；输出部分左侧中有两栏，左栏指明了暂存区的状态，右栏指明了工作区的状态；例如上面的状态报告显示，`README`文件在工作区已修改但尚未暂存，而`lib/simplegit.rb`文件已修改且已暂存；`Rakefile`文件已经过修改，暂存后又作了修改，因此该文件的修改中既有已暂存的部分，又有未暂存的部分；



### 3.5 忽略文件




对于一些无需纳入 Git 管理的文件，例如自动生成的文件、大文件等，可以创建一个名为`.gitignore`的文件，列出要忽略的文件的模式；例如
```bash
cat .gitignore
*.[oa]
*~
```
第一行告诉 Git 忽略所有以`.o`或`.a`结尾的文件，一般这类对象文件和存档文件都是编译过程中出现的；第二行告诉 Git 忽略所有名字以波浪符结尾的文件，许多文本编辑软件如 Emacs 都用这样的文件名保存副本；此外可能还需要忽略`log`，`tmp`或者`pid`目录，以及自动生成的文档等等；要养成一开始就为新仓库设置好`.gitignore`文件的习惯，以免将来误提交这类无用的文件。

`.gitignore`的格式规范如下：
- 所有空行或者以`#`开头的行都会被 Git 忽略；
- 可以使用标准的 glob 模式匹配，它会递归地应用在整个工作区中；
- 匹配模式可以以`/`开头防止递归；
- 匹配模式可以以`/`结尾指定目录
- 要忽略指定模式以外的文件或目录，可以在模式前加上`!`取反；

所谓的 glob 模式是指 shell 所使用的简化了的正则表达式；`*`匹配零个或多个任意字符；`[abc]`匹配任何一个列在方括号中的字符；`?`只匹配一个任意字符；如果在方括号中使用短划线分隔两个字符，表示所有在这两个字符范围内的都可以匹配，比如`[0-9]`表示匹配所有 0 到 9 的数字；使用`**`表示匹配任意中间目录，比如`a/**/z`可以匹配`a/z`、`a/b/c/z`等；

我们再看一个 .gitignore 文件的例子：
```bash
# ignore all .a files, but do track lib.a
*.a
!lib.a
# only ignore the TODO file in the current directory, not subdir/TODO
/TODO
# ignore all files in any directory named build
build/
# ignore doc/notes.txt, but not doc/server/arch.txt
doc/*.txt
# ignore all .pdf files in the doc/ and any of its subdirectories
doc/**/*.pdf
```
GitHub 有个针对数十种项目及语言的 .gitignore 文件列表，可参见https://github.com/github/gitignore ；最简单的情况下，一个仓库只在根目录下有`.gitignore`文件，它递归地应用到整个仓库中；此外，子目录下也可以有额外的`.gitignore`文件，其只作用于它所在的目录中；多`.gitignore`文件的具体细节超出了本手册的范围，更多详情见`man gitignore`；


### 3.6 查看已暂存和未暂存的修改


如果希望知道文件具体修改了什么内容，可以用`git diff`命令查看。例如再次修改`README`文件，运行`git diff`将会看到：
```bash
git diff
warning: LF will be replaced by CRLF in README.
The file will have its original line endings in your working directory
diff --git a/README b/README
index 56266d3..081c913 100644
--- a/README
+++ b/README
@@ -1 +1 @@
-My Project
+This is a file used for testing
```
该命令不加参数时默认比较当前文件和暂存区快照之间的差异，若要查看已暂存文件与最后一次提交的文件差异，可以用`git diff --staged`或`git diff --cached`：
```bash
git diff --staged
diff --git a/README b/README
new file mode 100644
index 0000000..56266d3
--- /dev/null
+++ b/README
@@ -0,0 +1 @@
+My Project
diff --git a/README.md b/README.md
index 942b086..769cd36 100644
--- a/README.md
+++ b/README.md
@@ -1,2 +1,2 @@
 # Git_Maniulation
-Repository for Git manipulation
+This is a repository for Git manipulation.
```
需要注意的是，`git diff`只显示尚未暂存的改动，而不是自上次提交以来所做的所有改动。 所以有时候你一下子暂存了所有更新过的文件，运行 git diff 后却什么也没有，就是这个原因。

像之前说的，暂存 CONTRIBUTING.md 后再编辑，可以使用 git status 查看已被暂存的修改或未被暂存的修改。 如果我们的环境（终端输出）看起来如下：


### 3.7 提交更新



当所有需要提交的文件都已被暂存后，可通过`git commit`提交修改，之后会自动启动指定的文本编辑器来输入提交说明；启动的编辑器是通过 Shell 的环境变量`EDITOR`指定的，一般为 vim 或 emacs，当然也可以按照第一节中介绍的方式进行设置；编辑器会显示类似下面的文本信息（本例为 vim 显示内容）：
```bash

# Please enter the commit message for your changes. Lines starting
# with '#' will be ignored, and an empty message aborts the commit.
#
# On branch main
# Your branch is up to date with 'origin/main'.
#
# Changes to be committed:
#       new file:   README
#       modified:   README.md
```
可以看到，默认的提交消息包含最后一次运行`git status`的输出，开头还有一个空行以用于输入提交说明；用户可以去掉这些注释行，或保留以记录此次更新内容；若需要将文件更改的`diff`作为默认备注，可以附加`-v`选项来实现；退出编辑器时，Git 会丢弃注释行，用所输入的提交说明信息生成一个提交请求；此外，也可以在`commit`命令通过`-m`选项将提交信息与命令放在同一行，如下所示：
```bash
git commit -m "create README"
[main 64a9471] create README
 1 file changed, 1 insertion(+), 1 deletion(-)
```
从返回信息可以看出，当前是哪个分支（`main`）提交的，本次提交的 SHA-1 校验和是什么（`64a9471`），以及在本次提交中，有多少文件修订过，多少行添加和删改过。每次提交时记录的是只放在暂存区的快照，而未暂存文件的仍保持已修改状态，可在下次提交时纳入版本管理；每一次运行提交操作，都是对项目进行一次快照记录，以后可以回到这个状态，或者进行比较；



### 3.8 跳过暂存区域



尽管使用暂存区域可以处理提交细节，但有时候这么做略显繁琐。Git 提供了一个跳过使用暂存区域的方式，通过`git commit -a`便可以自动把所有已经跟踪过的文件暂存起来一并提交，从而跳过`git add`步骤：
```bash
git commit -a -m "modified README"
[main 57f7417] modified README
 1 file changed, 1 insertion(+), 1 deletion(-)
```
请注意，该命令不会将未追踪的文件进行暂存，同时可能将不需要的文件添加到提交中；



### 3.9 移除文件



要从 Git 中移除某个文件，则须从暂存区域移除该文件并提交；`git rm`可以实现移除的操作，同时连带从工作目录中删除指定文件，这样该文件就不会再出现在未跟踪文件清单中了；而如果只是简单地从工作目录中删除文件，运行`git status`时仍会在未暂存列表中看到：
```bash
$ rm PROJECTS.md
$ git status
On branch master
Your branch is up-to-date with 'origin/master'.
Changes not staged for commit:
  (use "git add/rm <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)

        deleted:    PROJECTS.md

no changes added to commit (use "git add" and/or "git commit -a")
```
然后再运行 git rm 记录此次移除文件的操作：
```bash
$ git rm PROJECTS.md
rm 'PROJECTS.md'
$ git status
On branch master
Your branch is up-to-date with 'origin/master'.
Changes to be committed:
  (use "git reset HEAD <file>..." to unstage)

    deleted:    PROJECTS.md
```
下一次提交时，该文件就不再纳入版本管理了；如果要删除之前修改过或已经放到暂存区的文件，则须使用强制删除选项`-f`，这是一种安全特性，用于防止误删尚未添加到快照的数据，这样的数据不能被 Git 恢复；若希望把文件从暂存区域移除，但仍保留在当前工作目录中，例如没有在`.gitignore`文件中声明，误将一个很大的日志文件添加到暂存区时，这中方法尤其有用；次操作可以通过`--cached`选项实现，命令后面可以列出文件或者目录的名字，也可以使用 glob 模式，例如：
```bash
$ git rm --cached README
$ git rm log/\*.log
```
`*`前的`\`是 Git 自有的的文件扩展匹配方式；此命令删除`log/`目录下扩展名为`.log`的所有文件；



### 3.10 移动文件
与其它 VCS 系统不同，Git 并不显式跟踪文件移动操作；如果在 Git 中重命名了某个文件，仓库中存储的元数据并不会体现出这是一次重命名操作，不过 Git 可以推断出究竟发生了什么；进而在 Git 中，重命名是通过`git mv`命令实现的：
```bash
$ git mv README ReadMe
$ git status
On branch main
Your branch is ahead of 'origin/main' by 3 commits.
  (use "git push" to publish your local commits)

Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
        renamed:    README -> ReadMe
```
其实`git mv`相当于运行了下面三条命令：
```bash
$ mv README.md README
$ git rm README.md
$ git add README
```
如此分开操作，Git 也会意识到这是一次重命名，所以不管何种方式结果都一样；在用其他工具批处理重命名时，要记得在提交前删除旧的文件名，再添加新的文件名；