避免文件混乱:Git 文件操作技巧
- 一、Git工作原理概述
 - 二、删除文件
 - 三、查看指定文件的修改
 - 四、指定不需要 Git 管理的文件
 - 五、总结
 
一、Git工作原理概述
Git是一种分布式版本控制系统,其核心在于其高效的快照机制、强大的分支与合并功能、本地开发的灵活性。
-  
数据结构:Git 将项目的历史记录看作是一个由多个快照组成的链条。每次提交,Git会捕捉当前文件状态并记录这段快照。
 -  
树和对象:Git使用三种主要类型的对象:Blob(文件内容)、Tree(目录结构)和Commit(提交记录)。每次提交都会生成一个Commit对象,指向一个Tree对象,该Tree对象又指向若干Blob对象。
 -  
本地操作:Git是分布式的,每个开发者的本地仓库都是一个完整的版本库,包含了项目的所有历史。开发者可以在本地进行提交、分支、合并等操作,而不需要联网。
 -  
分支管理:Git的分支操作非常轻量,可以快速创建、切换和合并分支。每个分支代表了一个独立的开发线,方便团队协作和功能开发。
 -  
数据完整性:Git使用SHA-1哈希值来唯一标识每个对象,提供强大的数据完整性保护。任何文件或历史记录的改变都会导致哈希值的变化,从而能够检测到数据是否被篡改。
 -  
暂存区:Git 引入了一个暂存区,允许开发者在提交之前选择要提交的更改。这使得开发者可以更精细地控制提交内容。
 -  
远程仓库:虽然Git是分布式的,但它也支持远程仓库。开发者可以使用
git push和git pull命令将本地更改推送到远程仓库或从远程仓库拉取更新。 

 在进行任何文件操作之前,了解当前工作目录的状态是至关重要的。使用以下命令可以查看当前的文件状态:
git status
 
这个命令将显示已修改、已添加和未跟踪的文件,便于了解需要处理的文件。
二、删除文件
进行代码重构,有些类已经不需要了,那对应的源码文件也应该删除,此时怎么操作?比如删除
 timer.cpp和timer.h,这两个文件已经push到远程仓库了。

 想从 Git 中删除文件,可以使用git rm命令。这个命令不仅会删除文件,还会将删除操作记录到版本控制中:
git rm 文件名
 
操作步骤如下:
git rm -rf timer.cpp timer.h
git commit –m "remove timer mudlue"
git push
 
有时希望只是从版本控制中删除文件,但保留本地副本。这时候可以使用--cached选项:
git rm --cached 文件名
 
要删除所有未跟踪的文件,可以使用git clean命令。请小心使用,以免误删重要文件:
git clean -f
 
有的时候可能会不小心上传了一些无用的文件,尤其是使用C和C++开发的同事,一不小心上传很多编译的中间文件,当然这个操作是可以通过.gitignore来避免的;还有的时候可能是上传了一个秘钥文件,这样关键的东西一般是很保密的,一般开发人员不应该能看到这样的秘钥文件。那commit且push到远程仓库了,该怎么把它给删除呢?而且记录里也不应该存在,比如我们永久删除sort.hpp:
git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch sort.hpp' --prune-empty --tag-name-filter cat -- --all  
# sort.hpp也可以替换成文件夹, 此时要在git rm后添加-r参数
 

git push origin master --force  
# 从上图也能看出来远程仓库没有被修改
 
三、查看指定文件的修改
查看文件所有的commit:
git log --oneline filename   # 显示文件的所有修改记录
 
示例:
$ git log --oneline src/flyMemTest.cc
ac75ee8 (HEAD -> master) Optimize log and print.
53cc38f (origin/master, origin/HEAD) Add Configures class and modify makeFile.
a60663f feat: add test0 algorithm
3235113 optimized code
71d5555 optimize code
1be415f Add os class and update src
66f95bb feat: add asynLogger class
5a29202 feat:update JsonValue and JsonParser
909a271 feat:add src file(JsonValue,JsonParser)
 
查看所有commit的修改内容:
git log –p filename  # 显示所有commit的修改
 
示例:
 
查看某个commit里的修改:
git show commit-id filename   # 显示某个commit里文件的修改
 
查看本地修改的差异:
git diff filename   # 查看本地对某个文件做了那些具体修改
 
与某个commit做比较:
git diff commit-id filename   
# 显示与某个commit间所有的差异,commit-id可以替换成HEAD,比如HEAD~2
 
两个commit间的差异:
git diff commit-id1 commit-id2   # 显示两个commit所有的差异
 

四、指定不需要 Git 管理的文件
在使用 Git 的时候,对于 java 和 c/c++ 类的程序员尤其会遇到一件事情,就是使用git add .的时候或者其它命令的时候会把编译生产的中间文件,比如.class,.obj,.o等文件提交到库里。Git使用一个.gitignore文件来定义规则,用于忽略那些文件不提交到 Git 中去。
.gitignore可以提交到远程仓库中,这样这些规则就可以共享给所有的开发人员了,在.gitignore文件中每一行都定义了忽略的规则,比如:
*.[oa]
*~
 
第一行就是表示忽略所有的以.o或者.a结尾的文件,第二行表示忽略所有的以“~”结尾的文件。
在使用.gitignore时,一般遵循这么一个规则:
- 忽略操作系统自动生成的文件,比如缩略图等;
 - 忽略编译生成的中间文件、可执行文件等,也就是如果一个文件是通过另一个文件自动生成的,那自动生成的文件就没必要放进版本库,比如
Java编译产生的.class文件,比如c++的.obj文件; - 忽略自己的带有敏感信息的配置文件,比如存放口令的配置文件,比如日志文件等。
 
那这个.gitignore文件按照什么样的规则去定义的呢?
-  
空格不匹配任意文件,可作为分隔符,可用反斜杠转义。
 -  
以“
#”开头的行都会被 Git 忽略。即#开头的文件标识注释,可以使用反斜杠进行转义。 -  
可以使用标准的
glob模式匹配。所谓的glob模式是指shell所使用的简化了的正则表达式。 -  
以斜杠“
/”开头表示目录;“/”结束的模式只匹配文件夹以及在该文件夹路径下的内容,但是不匹配该文件;“/”开始的模式匹配项目跟目录;如果一个模式不包含斜杠,则它匹配相对于当前.gitignore文件路径的内容,如果该模式不在.gitignore文件中,则相对于项目根目录。比如:/TODO:表示仅仅忽略repo跟目录下的TODO文件,不包含子目录下的TODO文件。/build/:表示忽略整个build目录及其下的所有文件。bin/:表示忽略当前目录下的bin目录及其下所有的文件,bin文件不会被忽略。build.sh:表示忽略当前目录下的build.sh文件。
 -  
以星号“
*”通配多个字符,即匹配多个任意字符;使用两个星号“**” 表示匹配任意中间目录。比如:doc/*.txt:表示忽略当前doc目录下的所有的以.txt结尾的文件,但是doc/design/arch.txt文件不会被忽略掉。/*.c:表示忽略根目录下的所有的.c文件。build/*.obj:表示忽略build目录下的所有.obj文件,但是build/http/http_core.obj不会忽略掉。build/**/*.obj:表示忽略build目录,及其子目录,及其子目录的子目录和子子目录等等下的所有.obj文件。**/*.a:表示忽略所有目录下的.a文件,*.a/bin/*:表示忽略/bin/下的全部文件,不包含/bin/rtmp/hello文件。bin/*:表示忽略所有文件路径带有bin字符串的文件,比如/bin/,/bin/subdir/等目录下的内容都会被忽略。
 -  
以问号"
?"通配单个字符,即匹配一个任意字符。 -  
以方括号"
[]"包含单个字符的匹配列表,即匹配任何一个列在方括号中的字符。比如[abc]表示要么匹配一个a,要么匹配一个b,要么匹配一个c;如果在方括号中使用短划线分隔两个字符,表示所有在这两个字符范围内的都可以匹配。比如[0-9]表示匹配所有0到9的数字,[a-z]表示匹配任意的小写字母)。 -  
以叹号"
!“表示不忽略(跟踪)匹配到的文件或目录,即要忽略指定模式以外的文件或目录,可以在模式前加上惊叹号(!)取反。需要特别注意的是:如果文件的父目录已经被前面的规则排除掉了,那么对这个文件用”!“规则是不起作用的。也就是说”!“开头的模式表示否定,该文件将会再次被包含,如果排除了该文件的父级目录,则使用”!"也不会再次被包含。可以使用反斜杠进行转义。#下面两条规则一起就是忽略掉/mtk/目录下所有的文件,但是不忽略/mtk/protocol.txt文件 /mtk/* !/mtk/protocol.txt #下面这两条规则表示忽略掉/mtk/目录下所有内容,也忽略掉/mtk/protocol.txt文件 /mtk/ !/mtk/protocol.txt 
推荐一个自动生成 .gitignore 文件的网址:http://www.gitignore.io/。
五、总结
掌握好的Git文件管理技巧,可以让你的开发过程更加顺畅和高效。利用这些命令和方法,你可以轻松地管理文件,删除不必要的内容,以及忽略那些不需要跟踪的文件与文件夹。希望本文能帮助到你,让你的Git使用体验更上一层楼!
 


















