
此篇文章主要是讲讲 一些 git 操作发生的时候 , .git 文件如何变化,git 背后发生了什么。磨刀不误砍柴工嘛!算是一篇视频观后笔记(文末取视频地址)
基础概念
Git 是一个代码版本管控的工具,是一个内容寻址文件系统,即简单的键值对数据库。
Git 的一些基础基础知识
-
版本库:git在本地开辟的一个存储空间,一般在 .git 文件里。
-
工作区(workspace): 就是编辑器里面的代码,平常开发直接操作的就是工作区。
-
索引区/暂存区(index/stage):暂时存放文件的地方,
git add后也就将工作区代码放到了暂存区(缓冲区)。 -
本地仓库(Repository):
git commit后就是将暂存区的代码放到本地仓库。 -
远程仓库(Remote):线上代码存放的地方,如 github/gitee。
他们之间的关系是这样子的:

本文伊始,需要知晓一些git 相关 基础命令,
如果对基础linux的命令不熟悉请查看 这里
git cat-file -t <sha1-hash> # 查看文件类型 commit 取前四位即可
git cat-file -p <sha1-hash> # 查看文件内容
cat .git/refs/heads/master # 查看master指向的文件
git ls-files # 查看索引区文件, 也就是index的内容
git ls-files -s #查看 索引/暂存 区的文件内容
初始化
本文环境 前面是
win10=>cmder,后面是mac=>iterm2+zsh
先在 porn…呸,github 先创建一个清爽的远程仓库
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cU6Bh2tL-1685028681289)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2022-08-10-23-09-41-image.png?msec=1684158868612)]41-image.png" title="" alt="" width="50">](https://img-blog.csdnimg.cn/eb308db2b3ad4a31b564efb35aed0344.png)
推荐三种方式 往空仓库“填充”代码。
咱们先别顺着 Git 这小子,先把它克隆下来, 看看 .git 文件
D:\assets
λ git clone https://github.com/OFreshman/gitTest.git
Cloning into 'gitTest'...
warning: You appear to have cloned an empty repository.
λ rm -rf .git/*.sample # 为了看起来干净,删除了sample文件
D:\assets\gitTest (main -> origin)
λ tree .git /f # 以树形结构递归查看所有文件夹即文件夹,
D:\ASSETS\GITTEST\.GIT
│ config # 仓库本地配置文件
│ description # 描述 用于GitWeb
│ HEAD # 工作区目录指向的分支
├─hooks # 存放一些shell脚本,可以设置特定的git命令后触发相应的脚本
├─info # 附加信息
│ exclude # git文件排除规则。类似 .gitnore
├─objects # 所有文件存储对象
│ ├─info # 对象存储的附加信息,存储着打包后的文件名
│ └─pack # git 压缩对象
└─refs # 夹存储着分支和标签的引用
├─heads # 分支对应对象
└─tags # 标签
各文件详情补充
.git/info
info/exclude,初始化时只有这个文件,用于排除提交规则,与 .gitignore 功能类似。区别在于**.gitignore 这个文件本身会提交到版本库中去,用来保存的是公共需要排除的文件**;而info/exclude 设置的则是你自己本地需要排除的文件,他不会影响到其他人,也不会提交到版本库中去。
info/refs,如果新建了分支后,会有info/refs文件, 用于跟踪各分支的信息。对于刚克隆下来的仓库 可以通过命令去生成 info/refs 文件

FETCH_HEAD
指向上一次的 fetch 的commit
➜ gitTest git:(main) cat .git/FETCH_HEAD
> d4166b7319f1c85b7a86718f6a0387e0e9b1fa2c branch 'main' of github.com:OFreshman/gitTest
如果需要合并可以这样
git merge FETCH_HEAD
因为刚刚 fetch 的是main分支, 上面命令相当于执行 git merge remote/main
.git/index
二进制暂存区(stage)
COMMIT-EDITMSG
COMMIT-EDITMSG是一个临时文件,存储最后一次提交的message。有提交才会有这个文件夹。
logs
存储提交、操作日志,git reflog 依赖此文件夹。

refs
refs/heads/ 文件夹内的 ref 一般通过 git branch 生成。git show-ref --heads 可以查看;
refs/tags/ 文件夹内的 ref 一般通过 git tag 生成。git show-ref --tags 可以查看。
refs/remotes/ 文件一般是存放远程的分支。git fetch 就会更新里面的内容
上面大概说明了.git 各子文件的作用。因为这是个空仓库(warning: You appear to have cloned an empty repository),所以没有分支,即使看起来像有(main -> origin), 此时已经初始化了一个git仓库了(相当于执行了 git init),再次执行 git init 会提示 重复初始化已经存在的仓库了。
λ git init
> Reinitialized existing Git repository in D:/assets/gitTest/.git/
注意:线上的默认分支是main,本地是master。
另外此时本地
git branch无法查看分支,需要git add && git commit后才能查看。如果是 git init 初始化 会有 分支,且 存在.git/branchs文件夹。
refs/heads, refs/tags 目前都为空(因为克隆的就是空仓库), HEAD 指向工作区的分支
λ cat .git/HEAD
ref: refs/heads/main
git status 查看到未提交的代码时为啥不一样,其实就是对比了暂存区和工作区的文件内容。index(索引区) 始终保存着最新的待提交的文件
工作区到暂存区(add)
新建一个文件,并写入内容 hello txt
echo 'hello txt'>hello.txt
此时 该文件在工作区(workspace),未被追踪(untracked),将其添加至 索引区(index)
git add hello.txt

可以看到增加了两个文件 index, objects/32,objects 里面是一个个hash对象,hash值前两位为一级文件夹名,剩余值为相应二级文件夹名,前两位相同的会被归到同一个文件夹,而index是存放暂存区文件的文件夹。
这里就产生了一个疑问:为什么Git要这么设计目录结构,而不直接用Git对象的40位hash作为文件名?原因是有两点:
- 有些文件系统对目录下的文件数量有限制。例如,FAT32限制单目录下的最大文件数量是65535个,如果使用U盘拷贝Git文件就可能出现问题。
- 有些文件系统访问文件是一个线性查找的过程,目录下的文件越多,访问越慢。
objects 一级子目录数量就变成了 <= (10+26)^2。大大减少了数量,相应的也提升了检索速度
objects 里面的hash对象类型有三种: blob、commit、tree
git 提供了相应的命令去查看类型, 查看的时候只需要带上文件夹名(32)+ hash子文件前四位(4b9a)。四位也可以只要是唯一。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rQktlLkM-1685028681289)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-09-23-21-03-image.png?msec=1684158868494)]](https://img-blog.csdnimg.cn/0eefd4e38f2f48afae213f85f6d1a2b7.png)
可以查看该文件内容
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OM8IvIw4-1685028681289)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-09-23-25-24-image.png?msec=1684158868493)]](https://img-blog.csdnimg.cn/3ae73aa414f0448091ace79e46464576.png)
也可以查看文件长度
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-O0X47B72-1685028681289)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-00-13-46-image.png?msec=1684158868495)]](https://img-blog.csdnimg.cn/b4d5d94a746d4ce4a963632b2f363d95.png)
当重复添加相同内容的不同文件时,objects 不会改变,因为 32-4b9a6927b8f2217f751be4f8379e0d093856ab 存的是文件内容且Git有重复检测。
但 32-4b9a6927b8f2217f751be4f8379e0d093856ab 不止是文件内容的hash,而是包含 类型 + 长度 + \0(linux字符串结束符) + 文件内容 的 sha1 hash 值,可验证一下。(shasum 是mac 安装的命令包,默认输出sha1 hash)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hyUJlU3G-1685028681289)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-00-04-16-image.png?msec=1684158868517)]](https://img-blog.csdnimg.cn/27cdac35d8d8427989c15a04d299d5a7.png)
还有个命令可以佐证 得到的hash
how-is-the-git-hash-calculated
(printf "commit %s\0" $(git cat-file commit 324b9a | wc -c); git cat-file commit 324b9a)|shasum
> 324b9a6927b8f2217f751be4f8379e0d093856ab
shasum 是获取文件的各种hash值 的函数,默认SHA1。参考mac下如何获取文件MD5校验值和SHA1校验值 - 掘金
此时索引区文件(-s 是 --stage 的缩写)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-O52fyC4A-1685028681289)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-20-49-38-image.png?msec=1684158868513)]](https://img-blog.csdnimg.cn/a42dd0f1e6ae4dda95aeb4d5672f7a0a.png)
加 -s 得到的事索引区 文件的 权限 + blob对象 + 0 + 文件名
为了对比看效果,此时 增加新文件hello.txt并去修改文件 hello.txt , git status查看状态的时候 之前是 未跟踪(untracked), 现在是修改(modify)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-40I0ffRc-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-21-07-48-image.png?msec=1684158868639)]](https://img-blog.csdnimg.cn/5555076a12984c0fa2110e2fe34b6008.png)
将新文件提交,那么 .git/objects 中的 blob 对象就会改变
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j0JCRMHb-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-21-11-33-image.png?msec=1684158868529)]](https://img-blog.csdnimg.cn/b33d13160c694500b5054a2765ae3ef2.png)
索引区到本地仓库(commit)
接下来对上面的文件进行commit
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-x20P3EEC-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-21-23-41-image.png?msec=1684158868530)]](https://img-blog.csdnimg.cn/f707fd5a7e9e461bbd87033c04159e83.png)
附带的信息:这是根提交(root-commit ,第一次),提交对象的hash值,文件改变数量和行数,文件权限(之前提到过),文件名。
commit 之后 可使用
git rev-parse HEAD:<file>查看当前版本对象的 sha1值git rev-parse HEAD:hello.txt 5b10c6a97b7b4132c2ad4d6d80ceddd2b8a4fdba
此次提交的对象类型为 commit
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YGy1N4xG-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-21-32-03-image.png?msec=1684158868580)]](https://img-blog.csdnimg.cn/b1c9d14befa5465c848dc4e68fdb6ba9.png)
这个 commit 对象的内容含有 tree 类型对象,以及仓库作者和提交者信息,提交信息。
.git 文件 也有一些变化
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GveYfJNT-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-21-38-50-image.png?msec=1684158868655)]](https://img-blog.csdnimg.cn/cdeb4792be224f0eb8cd65ca5f8ba7a4.png)
logs 是 git 历史相关的文件。objects 里增加了前面提的的两个对象(commit,tree)以及heads 里面增加了main。也就在此时本地也有了分支 main (git branch 查看)。
HEAD 是一个指向当前工作分支的指针,目前指向main, refs/heads/main 是啥?就是 main 分支指向的 最新提交对象。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZYiKGGuY-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-21-59-31-image.png?msec=1684158868512)]](https://img-blog.csdnimg.cn/cbc7c253671c4ccd935fc4ea57dbfa31.png)
tree 对象含有两个blob 文件,仔细观察可以发现就是之前 add 时 添加的两个blob对象
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CEfEvQZp-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-21-46-34-image.png?msec=1684158868529)]](https://img-blog.csdnimg.cn/6a545fbb35b54bc8a34db0e317199424.png)
现在 objects 的里对象的关系如下
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kzrKIdz1-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-23-42-54-image.png?msec=1684158868514)]](https://img-blog.csdnimg.cn/b53cef4561244858b1aee066daa3a238.png)
为了探究其中的奥秘,再次更改 hello.txt(vim hello.txt, git add, git commit),具体细节就不展示了,给一个objects对比图
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nmM4VbCJ-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-23-17-26-image.png?msec=1684158868655)]](https://img-blog.csdnimg.cn/d7c77f0c87964bc385135efc4457796b.png)
新增了 四个对象, git cat-file -p 一一查看新增的四个内容
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-t6geeXsx-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-10-23-24-32-image.png?msec=1684158868627)]](https://img-blog.csdnimg.cn/873cd41bde444c19aeca181062ab4bfc.png)
对于这次commit 对象 多了一个 父级对象(parent)。 简单梳理一下就是
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FQLAvLEE-1685028681290)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-12-45-57-image.png?msec=1684158868563)]](https://img-blog.csdnimg.cn/3fed3abb639f48fa8a9e3f3239da6314.png)
或许能从前面两张图总结出一些规律
-
每次 add 都会生成一个blob 对象
-
每次 commit 都会生成 commit 和 tree 对象以及若干个blob对象 (blob数量 = 新增/修改的文件数)
-
tree 对象 始终包含最新的所有文件
接着验证一下,更改 test.txt、hello.txt, 增加文件 demo.txt。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-njdaANQO-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-00-16-05-image.png?msec=1684158868596)]](https://img-blog.csdnimg.cn/e518f5c85aa34e63bc1ab211f1031109.png)
git add . 时会增加三个 对象
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-F61JFFRb-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-00-10-30-image.png?msec=1684158868687)]](https://img-blog.csdnimg.cn/192f3ac273ae48918fbf5ca3f056bc32.png)
git commit 之后增加了两个对象, 一个是commit类型(), 一个是commit类型包含的tree类型
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GLWlH6r9-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-08-36-44-image.png?msec=1684158868661)]](https://img-blog.csdnimg.cn/3a537f4cadee48e09038db0ba9af2a77.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7rkRWOaC-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-08-43-34-image.png?msec=1684158868607)]](https://img-blog.csdnimg.cn/f5e1a6443666416b8fd945dccfc5c200.png)
总共增加了五个对象,它们的关系如下图
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TORAD9KZ-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-21-02-03-image.png?msec=1684158868591)]](https://img-blog.csdnimg.cn/e8a829564a7b4b06870d1d566c0cef67.png)
至此,前面的推断被证实,且在用户添加/提交文件的时候,objects 的内部变化也能很好的体现。objects 里保存在暂存区和本地仓库的文件对象。
main 分支指向最新的提交,暂存区包含最新的所有文件。
➜ gitTest git:(main) cat .git/refs/heads/main
0d8d0eb0446d7bf92a32512089fa927314675ac9
➜ gitTest git:(main) git ls-files -s
100644 598bc0d8552fb08de29c7fcd317cacf09c0f237b 0 demo.txt
100644 acdf79a141b2f07dca7b715d606b23307d669f94 0 hello.txt
100644 ba0ba9399c8a2336b1aab6a61fa499b012561588 0 test.txt
此时提交历史就是上图中 三个 commit 的提交
git log --oneline
* 0d8d0eb (HEAD -> main) 2nd commit
* de07e86 change hello.txt
* 779c005 added two files
仓库含有文件
这是常见的情况,但是前面为了简化变化,仅仅使用了文件。
使用文件夹有一些不一样,前面说过 每次提交都会产生一个 commit、tree、若干个blob(取决于文件数量) 对象,当有文件夹时,commit 和 tree(root) 依旧会存在, 仓库的一级 文件/文件夹 会分别作 blob/tree(1-level) 被包含在 tree(root) 下面,如果一级文件夹里面包含文件夹,那么其子文件依旧会作为 tree(2-level), 包含在 其 父级 tree(1-level) 下, 该子文件夹的子文件 会被作为blob包含在子 tree(1-level) 下
比如仓库有 一个文件夹 F,F里有个文件 f.txt,两个文件 a.txt, b.txt。
add 会产生 三个 blob(f.txt, a.txt, b.txt)
commit 会产生 两个tree(本身一个, F文件夹一个), 一个commit

commit > tree > [tree(F) > blob(f.txt) , blob(a.txt), blob(b.txt)]
不一样的就是 文件F 也作为一个tree, 这个 tree 含有一个 blob, 即该文件夹下的子文件。
前面文字说的可能有点绕,补一张图(某仓库下添加了若干个文件夹,文件,在第一次提交之后 .git/objects 的情况)
现在再举个🌰,我在仓库建立一些文件

第一次 add 后,有五个 blob 对象,就是那五个文件

commit 后 会有 1个 commit、6个tree(1+5),总共 12 个对象

和Objects对象图
分支
分支大家都不陌生, 在Git 里,分支就是一个特殊(具有名字)的指针,指向某个 commit。
另外 git 里面还有个 HEAD 文件
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hD9ekjuZ-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-21-23-17-image.png?msec=1684158868476)]](https://img-blog.csdnimg.cn/462d07f14fc84e11b309062f37dcac0a.png)
这也是个指针,在活跃的分支上指向最新的提交。简单理解就是 切到哪个分支,它就指向哪个分支。可以相关命令查看一下
➜ gitTest git:(main) cat .git/HEAD
ref: refs/heads/main
➜ gitTest git:(main) cat .git/refs/heads/main
0d8d0eb0446d7bf92a32512089fa927314675ac9
有这样的关系: HEAD => main => lastest commit
接着新建一个 dev 分支,此时 .git/refs, .git/logs 都改变了
tree -I <ignore-file> <file>树形展开file文件并忽略 ignore-file
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IDGbxYh5-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-21-46-45-image.png?msec=1684158868611)]](https://img-blog.csdnimg.cn/d62a67cb3c604188a18b6ed9f771e5ce.png)
前面说过 logs 表示git 的提交历史,此时查看提交历史
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-r9YS86lW-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-21-51-21-image.png?msec=1684158868475)]](https://img-blog.csdnimg.cn/caa40099070942239c423bb11ae04700.png)
括号里面表示分支 main 和 dev 都指向 0d8d0ed 的 commit 对象,且 HEAD 指向 main(当前在main分支上);
简单画了个图
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nMxaaEbY-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-22-07-02-image.png?msec=1684158868497)]](https://img-blog.csdnimg.cn/cfa5283f18e14d3c84c2238be04b2eeb.png)
在 master 上产生一个 commit,dev 也产生一个(停在此分支),就有如下关系
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AOKr67Oi-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-22-21-07-image.png?msec=1684158868514)]](https://img-blog.csdnimg.cn/a1589dbc9f57478d8538e840ed4d5299.png)
然后 再去合并main 会发生什么?
- 产生一个新的 commit;
- dev 指向新的 commit;
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WNL3i4p1-1685028681291)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-22-45-48-image.png?msec=1684158868532)]](https://img-blog.csdnimg.cn/fbf3c53ef1ce42c0b6d075223e93d2a1.png)
那么删除分支会删除分支指向的 commit 吗?答案是不会的
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QqaSdn9B-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-11-22-55-28-image.png?msec=1684158868626)]](https://img-blog.csdnimg.cn/afb7f93b9eaf4dde88cbbc58fa08efd9.png)
至此,分支的 创建、切换、合并、删除都演示完了。
记住一句话: 分支是一个有名字的指针,指向 某个 commit。
变基 Rebase
有了上面的知识,变基就很好理解了。主要有两种情况
-
git rebase <branch>变基分支 -
git rebase -i <commit-id>变基提交
先说情况2,理解了情况2,情况1就很好理解了。
变基到某个提交
变基,变基,就是改变基底,通俗一些就是基于哪个commit。变基到某个提交也有两种情况, 本分支或者其它的分支上的提交。其实原理差不多,这里演示变基其他分支的提交。
为了方便查看效果,删除原有仓库及文件,重新初始化,并且进行一个提交。
# 清空仓库
➜ gitTest git:(new) rm -rf .git
➜ gitTest rm hello.txt test.txt
# 初始化
➜ gitTest git init
已初始化空的 Git 仓库于 /Users/Public/Learn/git/gitTest/.git/
➜ gitTest git:(master) echo "master txt" > master.txt
➜ gitTest git:(master) ✗ git add . && git commit -m "1st commit"
[master(根提交) b505c69] add master.txt
1 file changed, 1 insertions(+), 0 deletions(-)
create mode 100644 one.txt
接着切出 dev 分支,产生三个提交, master 上产生两个
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5C3gr4yJ-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-12-35-45-image.png?msec=1684158868578)]](https://img-blog.csdnimg.cn/bfe24438ebc84b8eadc16a6ba7de5225.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zvt2l8MM-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-12-36-12-image.png?msec=1684158868564)]](https://img-blog.csdnimg.cn/b593c4ee76af49a0953f9d6041d948e1.png)
可以看到 b505c6 是他们的共同提交,也可成为基底。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UGmPtfnb-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-12-54-42-image.png?msec=1684158868515)]](https://img-blog.csdnimg.cn/b5cc13d9ae0f469aadb369f41c9eaf89.png)
然后 dev 上变基 到 master上第一个提交 80b77b
git rabse -i 80b77b
我选择 sword 更改三条提交注释, 后面都加上了 rebase
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ziqKnS3c-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-12-58-50-image.png?msec=1684158868515)]](https://img-blog.csdnimg.cn/ef3a739c4fa84212b2eb62155d00e61e.png)
变基成功。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CxMniO6y-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-08-45-09-image.png?msec=1684158868592)]](https://img-blog.csdnimg.cn/06132a16f553409d81df743683b2b467.png)
新产生了三个 commit 对应着 dev 上原来的三个 commit, 并且原来的三个commit 消失了,dev的提交历史如下
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gfamxwTg-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-16-18-56-image.png?msec=1684158868533)]](https://img-blog.csdnimg.cn/6dee16d0a92246c7a87cc01f858e78a4.png)
master 分支不受影响,关系如下图。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vppbmqEU-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-16-36-35-image.png?msec=1684158868549)]](https://img-blog.csdnimg.cn/41ab0c3a884a4c5e8920e2f3e8e907db.png)
变基分支
假设现在 main 分支有1个提交 9b789c,新建分支 dev, 此时 main 、dev 分支的基底就为9b789c2。
接着 在 dev 上产生了一个提交, main 上产生了2个提交,
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8uouHjBo-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-17-03-15-image.png?msec=1684158868498)]](https://img-blog.csdnimg.cn/ef8711404efb4bdeb170f045b71d534e.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-paXVdaVD-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-17-30-12-image.png?msec=1684158868498)]](https://img-blog.csdnimg.cn/346409b762e14ab7b3eb2525a2d06e42.png)
用图总结一下
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BxXeZB69-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-17-14-12-image.png?msec=1684158868498)]](https://img-blog.csdnimg.cn/60af11e6f446442ba34fb9cff9f62821.png)
此时 在 dev 分支上执行 git rebase main(不加 -i 就是啥都不改变,就是直接产生若干新提交到 main指向的提交后)。
dev 提交历史
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wT3iLKN7-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-17-18-13-image.png?msec=1684158868516)]](https://img-blog.csdnimg.cn/a5b730725619405f9d0c140e90ff25fe.png)
main分支不受影响
关系如图。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-R3VmyYnS-1685028681292)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-17-23-35-image.png?msec=1684158868516)]](https://img-blog.csdnimg.cn/88b1e3a623dd496aa8a0093f8b0d5fda.png)
总结
变基就是 将当前分支 的所有commits都变为新的 commits,这些新commits的第一个的上一个提交为变基的目标 commit。前面说过,分支其实是个有名字的指针(类似HEAD),指向当前分支的最新 commit,分支变基不过是变基目标commit 不一样而已!
远程仓库
本地初始化仓库,并添加 远程(remote)配置, 远程名为 origin
git init
git remote add origin https://github.com/OFreshman/gitTest.git
配置 文件 .git/config 会增加 origin 的配置
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UehRhyso-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-17-49-10-image.png?msec=1684158868565)]](https://img-blog.csdnimg.cn/dcda427165474131be7080ac84cf88c9.png)
此时再建立本地与远程追踪,并推送至远程
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RKfyYeS4-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-18-18-45-image.png?msec=1684158868566)]](https://img-blog.csdnimg.cn/ad08c0c0b66f4c81b6daccae351d8d33.png)
objects也有一些小变化
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LAEdvas6-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-18-20-13-image.png?msec=1684158868609)]](https://img-blog.csdnimg.cn/7b005001892947abb4ca115054089565.png)
去查看这两个文件可以看到文件内容 含有的对象都是一个 29906142d145c9bcf6438088b7e4e5ac13853174
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5E43BQsy-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-18-23-21-image.png?msec=1684158868551)]](https://img-blog.csdnimg.cn/275ee4b80ab0407aa87f5b5328220b6c.png)
此时日志也表明 main与 origin/main 都指向 299061 ,
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V3H37E9R-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-18-24-42-image.png?msec=1684158868479)]](https://img-blog.csdnimg.cn/92eb4e8fdf3b4f428bd2ab05614e9118.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PAUU7X11-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-13-18-29-52-image.png?msec=1684158868499)]](https://img-blog.csdnimg.cn/41a8b5fd4e1e461a96bbfa0463e61b63.png)
总结起来就是远程仓库其实就相当于一个分支,只是 分支名有些特殊: origin/main, 相关的数据配置保存在 根目录和logs 的 refs/remotes 里
对象压缩
git作为代码库,有的代码仓库上G,甚至更大,如果不对这些仓库 代码文件做优化策略那么只要涉及文件的读取存改(在git这又是高频操作)会变得很慢,且存储下载占用大量带宽! 所以 Git 采取压缩的策略
现在 gitTest 文件夹下有两个文件 init.txt 、test.txt, 并且初始化仓库
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fc4bELan-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-22-20-06-19-image.png?msec=1684757179198)]](https://img-blog.csdnimg.cn/dcc969f41a174e0cb772db38d1e0d86b.png)
接着提交,objects 里增加了一些对象,9d、d5 为相应的blob 对象,可以看到大小都得到了压缩。
压缩使用的是zlib的deflate算法
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7leDBfFY-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-23-08-39-24-image.png?msec=1684802364701)]](https://img-blog.csdnimg.cn/69a326f603934b8b8ea6cb09cb94a59d.png)
之前是 2.3M,155k。
通过 命令 git gc 主动压缩
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-leyLrvfM-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-23-23-24-42-image.png?msec=1684855483007)]](https://img-blog.csdnimg.cn/8ad50e50ab5b4e069102a95d31a1f8dc.png)
压缩之后,info 和 pack 增加了一些文件,主要关注 pack,里面含有 idx 和 pack 后缀的文件,压缩的所有文件对象都含在 pack 文件里, idx 相当于是个索引文件
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-axz5tks5-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-23-23-36-03-image.png?msec=1684856163533)]](https://img-blog.csdnimg.cn/1d99254c77be4825a9126e370d817771.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ww7BpYrW-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-23-23-46-55-image.png?msec=1684856815098)]](https://img-blog.csdnimg.cn/7710e4e3a5c140f4a7bbb466f8241f4e.png)
git 提供了命令去查看压缩文件内容 git verify-pack -v [<file>]
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ckvMrc6F-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-23-23-41-25-image.png?msec=1684856485745)]](https://img-blog.csdnimg.cn/2a349cc6d6154730b74df1098c0d1f4c.png)
显示的信息依次为
SHA-1 type size size-in-packfile offset-in-packfile
git 也提供解压缩的 命令
git unpack-objects < <pack-file> #解压 .pack 文件
解压缩需要注意,需要将压缩文件移动位置(比如到 .git 根目录),因为
Objects that already exist in the repository will not be unpacked from the packfile Therefore, nothing will be unpacked if you use this command on a packfile that exists within the target repository.
git push 也是一个压缩的过程。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bTOgxIG5-1685028681293)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-23-23-23-43-image.png?msec=1684855423555?msec=1684856335821)]](https://img-blog.csdnimg.cn/9275673756314ea7a69737113365be7f.png)
git clone 也会产生压缩
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M6gWIXCh-1685028681294)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-25-22-09-19-image.png?msec=1685023759822)]](https://img-blog.csdnimg.cn/181380115eeb4c948b894d476baccc51.png)
刚克隆的仓库只有 objects/pack 含有相应的压缩文件
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2W2aVuEH-1685028681294)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-25-22-11-39-image.png?msec=1685023899506)]](https://img-blog.csdnimg.cn/7b6e02e1b89d4f6d85e088fad455be80.png)
对于修改文件。 .idx内 只保留最新版本(因为用的最频繁),以前版本只保留diff
垃圾对象
垃圾对象是指 .git/objects 里面那些无用的对象。常见的两种情况下会产生:
-
git add n次,执行commit,n-1次的add就会产生 n-1 个垃圾对象。TODO diff 差量存储咋做的。
-
分支删除后该分支上产生的 objects。
针对情况1,涉及到对象压缩(git gc)的操作时会去清除对象,这里我主动触发
In most cases, users should run git gc, which calls git prune.
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v5OA2dZV-1685028681294)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-25-22-51-23-image.png?msec=1685026283958)]](https://img-blog.csdnimg.cn/efd05a3dc550444cb03f01bb26ab0535.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HNgBkX9U-1685028681294)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-25-22-52-29-image.png?msec=1685026349793)]](https://img-blog.csdnimg.cn/a3b62b29aa1d4ac28a7dceea3ef3da25.png)
没被压缩的就被视为了垃圾对象(前两次修改时添加的), 执行 git prune 取清理掉垃圾对象(96,b1), 加 -n 可以看到 此命令会清除哪些对象。
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AgyW3LbB-1685028681294)(file:///Users/ethanyin/Library/Application%20Support/marktext/images/2023-05-25-23-00-06-image.png?msec=1685026806455)]](https://img-blog.csdnimg.cn/744d2c93288e4794865c84af80ecec0e.png)
针对情况2,就复杂一些,分支被删除,我们可以 通过reflog找到想要的提交再去拿出来。这也是 Git 的的想法:这些提交对象被视为将来可能会被用,所有就不会被当做垃圾对象,即使 执行 git prune 。但是有些情况下我确定那分支上的提交永远不会用了,而且这个分支上的提交对象都还比较大,不删除的话空间资源比较浪费(磁盘,云)。那该如何删除呢,网友提供了这样一条命令:
参考 #How to remove unused objects from a git repository?
git -c gc.reflogExpire=0 -c gc.reflogExpireUnreachable=0 \
-c gc.rerereresolved=0 -c gc.rerereunresolved=0 \
-c gc.pruneExpire=now gc "$@"
最后
全文主要介绍了 git 常规的一些场景下 .git 文件的变化,主要是 .git/objects,基本讲清楚了git 背后的那些事。
本文拖了很久,前期看到自己文章池(写了,但没有写完的文章)有git 的一篇,去年开始写的,每天下班就补一补,总算是写完了。
参考
Git基本原理介绍-Blibli
一文讲透 Git 底层数据结构和原理
用21张图,把Git 工作原理彻底说清楚-腾讯云开发者社区-腾讯云
这才是真正的Git——Git内部原理 - 掘金
这个 git 命令你每天都在用,但你却不知道 - 掘金
Git不要只会pull和push,试试这5条提高效率的命令 - 掘金
45个 GIT 经典操作场景,专治不会合代码 - 掘金
前端架构师的 git 功力,你有几成火候? - 掘金
「一劳永逸」一张脑图带你掌握Git命令 - 掘金
多年 Git 使用心得 & 常见问题整理 - 掘金
Git原理与高级使用(2) - 掘金



















![Linux [权限]](https://img-blog.csdnimg.cn/3d399d3cb3e94394bfc8cb8209bf7738.png)