Git
章 ▾ 第2版

7.13 Gitツール - 置換

置換

前にも強調したように、Gitのオブジェクトデータベース内のオブジェクトは変更できません。ただし、Gitにはデータベース内のオブジェクトを別のオブジェクトで*置き換えるふり*をするための興味深い方法が用意されています。

replaceコマンドを使用すると、Gitでオブジェクトを指定し、「*この*オブジェクトを参照するたびに、*別の*オブジェクトであるとみなしてください」と言うことができます。これは、例えばgit filter-branchを使って履歴全体を再構築することなく、履歴内の1つのコミットを別のコミットで置き換える場合に最も一般的に役立ちます。

例えば、巨大なコード履歴があり、リポジトリを新しい開発者向けの短い履歴と、データマイニングに関心のある人向けのより長く大きな履歴に分割したいとします。新しい履歴の最も古いコミットを古い履歴の最新コミットで「置換」することにより、一方の履歴を他方に接ぎ木することができます。これは、(親子関係がSHA-1に影響を与えるため)通常は結合するために行う必要がある新しい履歴内のすべてのコミットを実際に書き換える必要がないことを意味するので、便利です。

試してみましょう。既存のリポジトリを、最近のリポジトリと履歴のリポジトリの2つに分割し、replaceを介して最近のリポジトリのSHA-1値を変更せずに再結合する方法を見ていきます。

5つの簡単なコミットがある単純なリポジトリを使用します。

$ git log --oneline
ef989d8 Fifth commit
c6e1e95 Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

これを2つの履歴ラインに分割したいと思います。1つのラインはコミット1からコミット4までであり、これは履歴ラインになります。2番目のラインは、コミット4とコミット5のみであり、これは最近の履歴になります。

Example Git history
図163. Git履歴の例

さて、履歴を作成するのは簡単です。履歴にブランチを配置し、そのブランチを新しいリモートリポジトリのmasterブランチにプッシュすることができます。

$ git branch history c6e1e95
$ git log --oneline --decorate
ef989d8 (HEAD, master) Fifth commit
c6e1e95 (history) Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit
Creating a new `history` branch
図164. 新しいhistoryブランチの作成

これで、新しいhistoryブランチを新しいリポジトリのmasterブランチにプッシュできます。

$ git remote add project-history https://github.com/schacon/project-history
$ git push project-history history:master
Counting objects: 12, done.
Delta compression using up to 2 threads.
Compressing objects: 100% (4/4), done.
Writing objects: 100% (12/12), 907 bytes, done.
Total 12 (delta 0), reused 0 (delta 0)
Unpacking objects: 100% (12/12), done.
To git@github.com:schacon/project-history.git
 * [new branch]      history -> master

はい、履歴が公開されました。次に、難しいのは最近の履歴を小さく切り詰めることです。一方のコミットを他方の同等のコミットで置き換えることができるように、オーバーラップが必要です。そのため、コミット4とコミット5だけに切り詰めます(コミット4がオーバーラップします)。

$ git log --oneline --decorate
ef989d8 (HEAD, master) Fifth commit
c6e1e95 (history) Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

この場合、履歴を拡張する方法に関する指示を含むベースコミットを作成すると役立ちます。これにより、切り詰められた履歴の最初のコミットに遭遇してより多くの情報が必要な場合、他の開発者はどうすればよいかを知ることができます。そこで、指示付きのベースポイントとして初期コミットオブジェクトを作成し、その上に残りのコミット(4と5)をリベースします。

そのためには、分割するポイントを選択する必要があります。このポイントは、3番目のコミットであり、SHA-speakでは9c68fdcです。したがって、ベースコミットは、そのツリーに基づいて作成されます。commit-treeコマンドを使用すると、ツリーを取得して、親のない新しいコミットオブジェクトSHA-1を返すベースコミットを作成できます。

$ echo 'Get history from blah blah blah' | git commit-tree 9c68fdc^{tree}
622e88e9cbfbacfb75b5279245b9fb38dfea10cf

commit-treeコマンドは、「配管」コマンドと呼ばれるコマンドセットの1つです。これらは一般に直接使用することを意図しておらず、代わりに**他の**Gitコマンドがより小さなジョブを実行するために使用するコマンドです。このような奇妙なことを行う場合、これらにより非常に低レベルなことを実行できますが、日常的に使用することを意図していません。配管コマンドの詳細については、配管と陶器を参照してください。

Creating a base commit using `commit-tree`
図165. commit-treeを使用したベースコミットの作成

さて、ベースコミットができたので、git rebase --onto を使って、残りの履歴をその上にリベースすることができます。--onto 引数には、先ほど commit-tree から取得した SHA-1 を指定し、リベースの起点には、保持したい最初のコミットの親コミットである3番目のコミット(9c68fdc)を指定します。

$ git rebase --onto 622e88 9c68fdc
First, rewinding head to replay your work on top of it...
Applying: fourth commit
Applying: fifth commit
Rebasing the history on top of the base commit
図166. ベースコミットの上への履歴のリベース

これで、最近の履歴は、破棄してもよいベースコミットの上に書き換えられ、ベースコミットには、必要に応じて履歴全体を再構成する方法が記述されています。この新しい履歴を新しいプロジェクトにプッシュすると、リポジトリをクローンした人は、最新の2つのコミットと、手順が記述されたベースコミットのみを見ることになります。

次に、プロジェクトを初めてクローンし、履歴全体を必要とする人の立場に立ってみましょう。この切り詰められたリポジトリをクローンした後で履歴データを入手するには、履歴リポジトリ用の2つ目のリモートを追加してフェッチする必要があります。

$ git clone https://github.com/schacon/project
$ cd project

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
622e88e Get history from blah blah blah

$ git remote add project-history https://github.com/schacon/project-history
$ git fetch project-history
From https://github.com/schacon/project-history
 * [new branch]      master     -> project-history/master

これで、コラボレーターは、master ブランチに最近のコミットを、project-history/master ブランチに履歴コミットを持つことになります。

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
622e88e Get history from blah blah blah

$ git log --oneline project-history/master
c6e1e95 Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

それらを結合するには、置き換えたいコミットと、置き換えるコミットを指定して git replace を呼び出すだけです。ここでは、master ブランチの「4番目」のコミットを、project-history/master ブランチの「4番目」のコミットに置き換えたいと考えます。

$ git replace 81a708d c6e1e95

さて、master ブランチの履歴を見ると、次のようになっているように見えます。

$ git log --oneline master
e146b5f Fifth commit
81a708d Fourth commit
9c68fdc Third commit
945704c Second commit
c1822cf First commit

すごいですよね?アップストリームのすべての SHA-1 を変更する必要なしに、履歴内の1つのコミットを全く異なるコミットに置き換えることができ、通常のツール(bisectblame など)は期待どおりに機能します。

Combining the commits with `git replace`
図167. git replace を使用したコミットの結合

興味深いことに、実際には置き換えた c6e1e95 コミットのデータを使用しているにもかかわらず、SHA-1 は依然として 81a708d と表示されています。cat-file のようなコマンドを実行しても、置き換えられたデータが表示されます。

$ git cat-file -p 81a708d
tree 7bc544cf438903b65ca9104a1e30345eee6c083d
parent 9c68fdceee073230f19ebb8b5e7fc71b479c0252
author Scott Chacon <schacon@gmail.com> 1268712581 -0700
committer Scott Chacon <schacon@gmail.com> 1268712581 -0700

fourth commit

81a708d の実際の親コミットは、ここにある 9c68fdce ではなく、プレースホルダーコミット(622e88e)だったことを思い出してください。

もう1つ興味深い点は、このデータが参照に保持されることです。

$ git for-each-ref
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/heads/master
c6e1e95051d41771a649f3145423f8809d1a74d4 commit	refs/remotes/history/master
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/remotes/origin/HEAD
e146b5f14e79d4935160c0e83fb9ebe526b8da0d commit	refs/remotes/origin/master
c6e1e95051d41771a649f3145423f8809d1a74d4 commit	refs/replace/81a708dd0e167a3f691541c7a6463343bc457040

つまり、置き換えを他の人と共有するのが簡単です。なぜなら、これをサーバーにプッシュすれば、他の人が簡単にダウンロードできるからです。これは、ここで行った履歴の移植シナリオではそれほど役立ちません(誰もが両方の履歴をダウンロードすることになるため、なぜ分離する必要があるのでしょう?)が、他の状況では役立つ可能性があります。

scroll-to-top