チャプター ▾ 第2版

7.13 Git Tools - Replace

Replace

以前にも強調したように、Gitのオブジェクトデータベース内のオブジェクトは変更不可能ですが、Gitはデータベース内のオブジェクトを別のオブジェクトに置き換える「ふり」をする興味深い方法を提供します。

replaceコマンドを使用すると、Git内のオブジェクトを指定し、「このオブジェクトを参照するたびに、別のオブジェクトであると見せかける」と指示できます。これは、git filter-branchなどを使って履歴全体を再構築することなく、履歴内のあるコミットを別のコミットに置き換える場合に最も役立ちます。

例えば、膨大なコード履歴があり、リポジトリを新しい開発者向けの短い履歴と、データマイニングに関心のある人向けのより長く大きな履歴の2つに分割したいとします。新しい履歴の最も古いコミットを、古い履歴の最も新しいコミットで「置き換える」ことで、一方の履歴をもう一方に接合できます。これは、通常、履歴を結合するために行う必要があるような、新しい履歴内のすべてのコミットを書き換える必要がないため、便利です(親がSHA-1に影響するため)。

これを試してみましょう。既存のリポジトリを、最近のものと履歴のもの、2つのリポジトリに分割し、replaceを使って最近のリポジトリのSHA-1値を変更することなく、それらを再結合する方法を見ていきます。

5つのシンプルなコミットを持つシンプルなリポジトリを使用します。

$ git log --oneline
ef989d8 Fifth commit
c6e1e95 Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

これを2つの履歴ラインに分割したいと考えています。1つのラインはコミット1からコミット4までで、これは歴史的なものになります。2つ目のラインはコミット4と5のみで、これは最近の履歴になります。

Example Git history
図163. 例としてのGit履歴

さて、歴史的な履歴の作成は簡単です。履歴にブランチを作成し、そのブランチを新しいリモートリポジトリのmasterブランチにプッシュするだけです。

$ git branch history c6e1e95
$ git log --oneline --decorate
ef989d8 (HEAD, master) Fifth commit
c6e1e95 (history) Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit
Creating a new `history` branch
図164. 新しいhistoryブランチの作成

これで、新しいhistoryブランチを新しいリポジトリのmasterブランチにプッシュできます。

$ git remote add project-history https://github.com/schacon/project-history
$ git push project-history history:master
Counting objects: 12, done.
Delta compression using up to 2 threads.
Compressing objects: 100% (4/4), done.
Writing objects: 100% (12/12), 907 bytes, done.
Total 12 (delta 0), reused 0 (delta 0)
Unpacking objects: 100% (12/12), done.
To git@github.com:schacon/project-history.git
 * [new branch]      history -> master

よし、これで履歴が公開されました。次に難しいのは、最近の履歴を短くして小さくすることです。一方のコミットをもう一方の同等のコミットで置き換えられるように重複が必要なので、これをコミット4と5だけに短縮します(コミット4が重複するようになります)。

$ git log --oneline --decorate
ef989d8 (HEAD, master) Fifth commit
c6e1e95 (history) Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

この場合、履歴を拡張する方法に関する指示を含むベースコミットを作成すると便利です。これにより、他の開発者が短縮された履歴の最初のコミットに到達し、さらに情報が必要な場合に何をすべきかを知ることができます。そこで、私たちは指示を含む初期コミットオブジェクトをベースポイントとして作成し、その上に残りのコミット(4と5)をリベースすることにします。

そのためには、分割する点を選択する必要があります。この場合、それは3番目のコミットであり、SHA-1で言えば9c68fdcです。したがって、私たちのベースコミットはそのツリーに基づきます。commit-treeコマンドを使用してベースコミットを作成できます。これはツリーを受け取るだけで、新しい親のないコミットオブジェクトのSHA-1を返します。

$ echo 'Get history from blah blah blah' | git commit-tree 9c68fdc^{tree}
622e88e9cbfbacfb75b5279245b9fb38dfea10cf

commit-treeコマンドは、「配管 (plumbing)」コマンドと総称されるコマンド群の1つです。これらは通常、直接使用されることを意図していませんが、代わりに**他の**Gitコマンドによってより小さなジョブを実行するために使用されます。今回のような奇妙なことを行う場合、これらのコマンドは非常に低レベルなことを可能にしますが、日常的な使用を意図したものではありません。配管コマンドの詳細については、配管と磁器で読むことができます。

Creating a base commit using `commit-tree`
図165. commit-treeを使用したベースコミットの作成

よし、ベースコミットができたので、git rebase --ontoを使って残りの履歴をその上にリベースできます。--onto引数は、commit-treeから返されたばかりのSHA-1になり、リベースポイントは3番目のコミット(保持したい最初のコミット9c68fdcの親)になります。

$ git rebase --onto 622e88 9c68fdc
First, rewinding head to replay your work on top of it...
Applying: fourth commit
Applying: fifth commit
Rebasing the history on top of the base commit
図166. 履歴をベースコミットの上にリベースする

これで、不要なベースコミットの上に最近の履歴を書き換えました。このベースコミットには、必要であれば履歴全体を再構成する方法に関する指示が含まれています。この新しい履歴を新しいプロジェクトにプッシュすると、人々がそのリポジトリをクローンしたときに、最も最近の2つのコミットと、指示を含むベースコミットだけが表示されます。

では、初めてプロジェクトをクローンし、完全な履歴を必要とする人の役割に切り替えてみましょう。この切り詰められたリポジトリをクローンした後、履歴データを取得するには、履歴リポジトリ用の2番目のリモートを追加し、フェッチする必要があります。

$ git clone https://github.com/schacon/project
$ cd project

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
622e88e Get history from blah blah blah

$ git remote add project-history https://github.com/schacon/project-history
$ git fetch project-history
From https://github.com/schacon/project-history
 * [new branch]      master     -> project-history/master

これで、共同作業者はmasterブランチに最新のコミットを、project-history/masterブランチに過去のコミットを持つことになります。

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
622e88e Get history from blah blah blah

$ git log --oneline project-history/master
c6e1e95 Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

それらを結合するには、置き換えたいコミットと、それに置き換えたいコミットを指定して、単にgit replaceを呼び出すだけです。つまり、masterブランチの「4番目の」コミットを、project-history/masterブランチの「4番目の」コミットで置き換えたいのです。

$ git replace 81a708d c6e1e95

これで、masterブランチの履歴を見ると、このように見えるはずです。

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

すごいでしょう?上流のSHA-1をすべて変更することなく、履歴内の1つのコミットをまったく異なるコミットに置き換えることができ、すべての通常のツール(bisectblameなど)は期待通りに機能します。

Combining the commits with `git replace`
図167. git replaceを使用したコミットの結合

興味深いことに、実際に置き換えたc6e1e95コミットデータを使用しているにもかかわらず、SHA-1は81a708dと表示されます。cat-fileのようなコマンドを実行しても、置き換えられたデータが表示されます。

$ git cat-file -p 81a708d
tree 7bc544cf438903b65ca9104a1e30345eee6c083d
parent 9c68fdceee073230f19ebb8b5e7fc71b479c0252
author Scott Chacon <schacon@gmail.com> 1268712581 -0700
committer Scott Chacon <schacon@gmail.com> 1268712581 -0700

fourth commit

81a708dの実際の親は、ここで示されている9c68fdceではなく、プレースホルダーコミット(622e88e)だったことを思い出してください。

もう一つ興味深いのは、このデータが参照に保持されていることです。

$ git for-each-ref
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/heads/master
c6e1e95051d41771a649f3145423f8809d1a74d4 commit	refs/remotes/history/master
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/remotes/origin/HEAD
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/remotes/origin/master
c6e1e95051d41771a649f3145423f8809d1a74d4 commit	refs/replace/81a708dd0e167a3f691541c7a6463343bc457040

これは、この置き換えを他の人と共有するのが簡単であることを意味します。なぜなら、これをサーバーにプッシュでき、他の人々が簡単にダウンロードできるからです。私たちがここで取り上げた履歴の接合シナリオでは、これはそれほど役に立ちません(誰もがどうせ両方の履歴をダウンロードすることになるので、なぜ分ける必要があるのか?)が、他の状況では役に立つことがあります。

scroll-to-top