チャプター ▾ 第2版

7.13 Git Tools - Replace

Replace

これまで強調してきたように、Gitのオブジェクトデータベース内のオブジェクトは変更できませんが、Gitはデータベース内のオブジェクトを他のオブジェクトで「置き換えるふりをする」興味深い方法を提供します。

`replace` コマンドを使用すると、Git内のオブジェクトを指定して、「このオブジェクトを参照するたびに、それは`別の`オブジェクトであると見なす」ということができます。これは、例えば `git filter-branch` を使って履歴全体を再構築することなく、履歴内のあるコミットを別のコミットに置き換える場合に最も一般的に役立ちます。

たとえば、巨大なコード履歴があり、リポジトリを新規開発者向けの短い履歴と、データマイニングに関心のある人向けのより長く大きな履歴の2つに分割したいとします。新しい履歴の最初のコミットを古い履歴の最新のコミットに「置き換える」ことで、一方の履歴をもう一方に結合できます。これは、通常、履歴を結合するために新しい履歴のすべてのコミットを書き換える必要がないため(親がSHA-1に影響するため)、便利です。

これを試してみましょう。既存のリポジトリを、最近の履歴と過去の履歴の2つのリポジトリに分割し、`replace` を介して最近のリポジトリのSHA-1値を変更することなく、それらを再結合する方法を見ていきます。

5つの単純なコミットを含むシンプルなリポジトリを使用します。

$ git log --oneline
ef989d8 Fifth commit
c6e1e95 Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

これを2つの履歴ラインに分割したいとします。1つはコミット1からコミット4までのラインで、これが過去の履歴になります。もう1つのラインはコミット4と5だけで、これが最近の履歴になります。

Example Git history
図163. Git履歴の例

さて、過去の履歴を作成するのは簡単です。履歴にブランチを作成し、そのブランチを新しいリモートリポジトリの`master`ブランチにプッシュするだけです。

$ git branch history c6e1e95
$ git log --oneline --decorate
ef989d8 (HEAD, master) Fifth commit
c6e1e95 (history) Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit
Creating a new `history` branch
図164. 新しい`history`ブランチの作成

これで、新しい`history`ブランチを新しいリポジトリの`master`ブランチにプッシュできます。

$ git remote add project-history https://github.com/schacon/project-history
$ git push project-history history:master
Counting objects: 12, done.
Delta compression using up to 2 threads.
Compressing objects: 100% (4/4), done.
Writing objects: 100% (12/12), 907 bytes, done.
Total 12 (delta 0), reused 0 (delta 0)
Unpacking objects: 100% (12/12), done.
To git@github.com:schacon/project-history.git
 * [new branch]      history -> master

これで履歴が公開されました。次に難しいのは、最近の履歴を小さくするために短縮することです。一方のコミットをもう一方の同等のコミットで置き換えることができるように、重複が必要です。そのため、これをコミット4と5だけに短縮します(コミット4が重複します)。

$ git log --oneline --decorate
ef989d8 (HEAD, master) Fifth commit
c6e1e95 (history) Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

この場合、履歴を拡張する方法の手順を記したベースコミットを作成すると便利です。これにより、他の開発者が短縮された履歴の最初のコミットに到達したときに、さらに履歴が必要な場合に何をすべきかを知ることができます。そこで、最初のコミットオブジェクトを指示付きのベースポイントとして作成し、残りのコミット(4と5)をその上にリベースします。

そのためには、分割するポイントを選択する必要があります。ここでは3番目のコミット、SHA-1でいうと`9c68fdc`がそれにあたります。したがって、私たちのベースコミットはそのツリーに基づいて作成されます。`commit-tree`コマンドを使用してベースコミットを作成できます。これはツリーを受け取り、新しい親なしコミットオブジェクトのSHA-1を返します。

$ echo 'Get history from blah blah blah' | git commit-tree 9c68fdc^{tree}
622e88e9cbfbacfb75b5279245b9fb38dfea10cf

`commit-tree`コマンドは、「plumbing(配管)」コマンドと呼ばれる一連のコマンドの1つです。これらは通常、直接使用されることを意図していませんが、**他の**Gitコマンドによってより小さなジョブを実行するために使用されます。今回のような奇妙なことを行う場合、これらのコマンドは非常に低レベルなことを可能にしますが、日常的な使用を意図したものではありません。plumbingコマンドの詳細については、PlumbingとPorcelainで読むことができます。

Creating a base commit using `commit-tree`
図165. `commit-tree` を使用したベースコミットの作成

これでベースコミットができたので、残りの履歴を`git rebase --onto`でその上にリベースできます。`--onto`引数は、`commit-tree`から取得したSHA-1で、リベースポイントは3番目のコミット(保持したい最初のコミット`9c68fdc`の親)になります。

$ git rebase --onto 622e88 9c68fdc
First, rewinding head to replay your work on top of it...
Applying: fourth commit
Applying: fifth commit
Rebasing the history on top of the base commit
図166. ベースコミットの上に履歴をリベースする

これで、最近の履歴を、必要に応じて履歴全体を再構築する方法の指示を含む使い捨てのベースコミットの上に書き換えました。その新しい履歴を新しいプロジェクトにプッシュすると、人々がそのリポジトリをクローンしたときに、最新の2つのコミットと、指示付きのベースコミットのみが表示されるようになります。

では、ここで役割を切り替えて、プロジェクトを初めてクローンする人で、全履歴が必要な場合を考えます。この切り詰められたリポジトリをクローンした後で履歴データを取得するには、履歴リポジトリ用の2番目のリモートを追加してフェッチする必要があります。

$ git clone https://github.com/schacon/project
$ cd project

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
622e88e Get history from blah blah blah

$ git remote add project-history https://github.com/schacon/project-history
$ git fetch project-history
From https://github.com/schacon/project-history
 * [new branch]      master     -> project-history/master

これで、共同作業者は`master`ブランチに最近のコミット、`project-history/master`ブランチに過去のコミットを持つことになります。

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
622e88e Get history from blah blah blah

$ git log --oneline project-history/master
c6e1e95 Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

それらを結合するには、置き換えたいコミットと、それで置き換えたいコミットを引数にして、`git replace`を呼び出すだけです。つまり、`master`ブランチの「4番目の」コミットを、`project-history/master`ブランチの「4番目の」コミットに置き換えたいのです。

$ git replace 81a708d c6e1e95

さて、`master`ブランチの履歴を見ると、このようになっているように見えます。

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

素晴らしいでしょう? upstreamのすべてのSHA-1を変更することなく、履歴内の1つのコミットをまったく別のコミットに置き換えることができ、通常のツール(`bisect`、`blame`など)は期待通りに動作します。

Combining the commits with `git replace`
図167. `git replace` を使ってコミットを結合する

興味深いことに、置き換えた`c6e1e95`コミットデータを使用しているにもかかわらず、SHA-1としては`81a708d`と表示されます。`cat-file`のようなコマンドを実行しても、置き換えられたデータが表示されます。

$ git cat-file -p 81a708d
tree 7bc544cf438903b65ca9104a1e30345eee6c083d
parent 9c68fdceee073230f19ebb8b5e7fc71b479c0252
author Scott Chacon <schacon@gmail.com> 1268712581 -0700
committer Scott Chacon <schacon@gmail.com> 1268712581 -0700

fourth commit

`81a708d`の実際の親は、ここで示されている`9c68fdce`ではなく、プレースホルダーコミット(`622e88e`)であったことを思い出してください。

もう一つ興味深いのは、このデータが私たちの参照に保持されていることです。

$ git for-each-ref
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/heads/master
c6e1e95051d41771a649f3145423f8809d1a74d4 commit	refs/remotes/history/master
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/remotes/origin/HEAD
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/remotes/origin/master
c6e1e95051d41771a649f3145423f8809d1a74d4 commit	refs/replace/81a708dd0e167a3f691541c7a6463343bc457040

これは、私たちの置き換えを他の人と簡単に共有できることを意味します。なぜなら、これをサーバーにプッシュでき、他の人が簡単にダウンロードできるからです。これは、ここで説明した履歴の結合シナリオではあまり役に立ちません(結局誰もが両方の履歴をダウンロードすることになるので、なぜ分けるのか?)。しかし、他の状況では役立つことがあります。

scroll-to-top