/ 最近 .rdf 追記 編集 設定 本棚

脳log[20181122] RestoreCommitterDate.ps1: 初めて書いた .ps1 スクリプト | RestoreCommitterDateRoughly.ps1



2018年11月22日 (木) バッチを新しい環境で実行するのに cmd /C を頭に付けて必要なら引数を二重引用符でくくってって面倒くさい。|a.bat とは書けなかったけど call|a.bat とか echo>nul|a.bat なら呼び出し元に影響を与えない新しい環境でバッチを呼び出せた。普通に何も出力しない NOOP コマンドがあれば意図が明確なんだけどなあ。残念、rem|a.bat は無理だった。■あとバッチファイル衝撃の事実。入力を受け取って処理して出力するフィルタを書こうとしたら、標準入力に対して繰り返すコマンドが存在しなかった。for にそういう専用のオプションがあってしかるべきだと思う。これってバッチの用途のど真ん中にあると思うんだ。他のコマンドをパイプで繋ぐのはお手のものなのに、バッチファイルがそのコマンドの一翼を担うことができないのはなんで?

最終更新: 2019-04-12T22:46+0900

[Git] RestoreCommitterDate.ps1: 初めて書いた .ps1 スクリプト

タイムスタンプを保持してくれないために更新日時がチェックアウト日時になってしまう Git のために。

文法が手探りなので何時間もかかった。とりあえず覚えるべきは help *|gm.GetType()。セルフドキュメンテッドである。map は foreach {$_}、filter は where {$_}。式やコマンドをくくるのは $(...)。演算子は -band だったりするからリファレンスを見るしかない。リファレンスが手元にない。

いやあった。Windows SDK > Win32 and COM Development > Administration and Management > Windows PowerShell もしくは、スタートメニュー > すべてのプログラム > アクセサリ > Windows PowerShell > Windows PowerShell ISE を起動して F1。インストールはしたけど興味がないだけだった。

git ls-files | foreach { @{
	File = "$(pwd)\$_" -as [System.IO.FileInfo]
	Time = $(git log --pretty=format:%ci -n 1 -- "$_") -as [DateTime]
} } | where {
	$_.File
} | foreach { try {
	$_.File.LastWriteTime = $_.Time
} catch { Write-Error $_ } }

明らかに git log をパスでフィルタリングして最新の時刻を取り出す処理が遅い。SQL ではないけど構造的には N+1 問題。

ls-files の段階でコミットオブジェクトを取得してそれの時刻を取り出せないかと考えたが、--stage オプションで取り出せた ID を git show した結果はファイルの内容だけだった。

post-checkout フックに仕込むのは無理だなあ。


 @2018-12-21 N+1 問題を解決した新版

N+1 問題を抱えてるのは日本語で公開されているスクリプトであって、Perl と英語で書かれた「ExampleScripts - Git SCM Wiki」はたぶんそうではない。Perl は読めないけどたぶん。

このバージョンだとログの長さに比例した時間がかかるものの、サクラエディタのリポジトリ(ログ数3600)で "Roughly" バージョンのたかだか3倍の時間(6秒)で完了する。

<#
	.SYNOPSIS
	Git ワーキングツリーに含まれるファイルの更新日時に最終コミット日時を設定します。

	.DESCRIPTION
	Git でチェックアウトしたファイルの更新日時はチェックアウト日時になります。これはファイルのタイムスタンプを比較する場合に不都合なことがあり、代わりに最終コミット日時をタイムスタンプに設定します。

	Git リポジトリ内で実行します。すべての階層のファイルが対象になります。
#>
$TopDir = (git rev-parse --show-toplevel)
$waiting = @{}
(git ls-files --full-name "$TopDir") | foreach {
	$waiting[$_] = $NULL
}
(git log --format=format:?%ci --name-only) | foreach {
	if ($_ -eq "") {
	} elseif ($_[0] -eq "?") {
		$t = $_.Substring(1)
	} else {
		$f = [System.IO.FileInfo] "$TopDir\$_"

		# run once a file.
		$c = $waiting.Count
		$waiting.Remove($_)
		if ($waiting.Count -ne $c -and $f.Exists) { try {
			$t = [System.DateTime] $t
			$f.LastWriteTime = $t
		} catch {
			Write-Debug $_
		} }
	}
}
  • かつては Git 管理下にあったが現在はそうではないファイルを対象外にするために git ls-files を使っている。
  • git subtree によって追加されて以後変更されていないファイルのコミット日時が取れない。「Subtrees allow subprojects to be included within a subdirectory of the main project, optionally including the subproject’s entire history.

 @2019-03-09「-m オプションに対する考察

たぶん git log-m --first-parent を付けるのが一番期待するものになる。

最終更新: 2019-04-12T22:46+0900

[Git] RestoreCommitterDateRoughly.ps1

RestoreCommitterDate.ps1 が実行に1分から1分半かかるとしたら、この RestoreCommitterDateRoughly.ps1 は2、3秒で終わる。

"Roughly" が意味するところは、1か月分のログだけを遡ってワーキングツリーにあるファイルのタイムスタンプを設定するのであって、それ以上前に変更されたファイルは一律で1か月前のタイムスタンプが設定されること。

このスクリプトの目的はキャッシュしたビルド産物を再利用することで再コンパイルを省略することにあって、そのためにはファイルのタイムスタンプがチェックアウト日時であっては困る。Git はそうだ。AppVeyor は必ず git clone、git checkout からビルドを始めるから、チェックアウトしたソースファイルが必ず前回のビルド産物より新しくなってしまう。

変更がなくても1か月経てば再コンパイルされてしまうけど、まあ、リーズナブルなスパンでしょう。

<#
	.SYNOPSIS
	Git ワーキングツリーに含まれるファイルの更新日時に最終コミット日時を設定します。

	.DESCRIPTION
	Git でチェックアウトしたファイルの更新日時はチェックアウト日時になります。これはファイルのタイムスタンプを比較する場合に不都合な場合があり、代わりに最終コミット日時をタイムスタンプに設定します。

	Git リポジトリ内で実行します。すべての階層のファイルが対象になります。

	制限: ログを遡りすべてのファイルの最終コミット日時を取得することは1分以上かかることがあるため、このスクリプトでは1か月を上限としてログを遡ります。そのため最も古いタイムスタンプは実行日時を基準として前月同日の00:00:00になります。
#>
$TopDir = (git rev-parse --show-toplevel)
$Oldest = [DateTime]::Today.AddMonths(-1) # Of course, this is incorrect for the oldest timestamp. That's what "Roughly" means.

$waiting = @{}
(git ls-files --full-name "$TopDir") | foreach {
	$waiting[$_] = $NULL
}

@(
	(git log --format=format:?%ci --name-only --since="$($Oldest.ToString("yyyy-MM-dd HH:mm:ss"))")
	, "?$($Oldest.ToString("yyyy-MM-dd HH:mm:ss"))"
	, (git ls-files --full-name "$TopDir")
) | foreach { $_ | foreach {
	if ($_ -eq "") {
	} elseif ($_[0] -eq "?") {
		$t = $_.Substring(1)
	} else {
		$f = [System.IO.FileInfo] "$TopDir\$_"

		# run once a file.
		$c = $waiting.Count
		$waiting.Remove($_)
		if ($waiting.Count -ne $c -and $f.Exists) { try {
			$t = [System.DateTime] $t
			$f.LastWriteTime = $t
		} catch {
			Write-Debug $_
		} }
	}
} }

 @2019-03-09「-m オプションに対する考察

たぶん git log-m --first-parent を付けるのが一番期待するものになる。

何もなしもありっちゃあり。-m のみ付けるのはぴったりはまる状況がわからない。

-m オプションのみの場合に、双方のブランチから見た修正内容が2つのコミットとして出力されています。一方が長大なリストを出力しているのはブランチの側で master を追いかけて pull/merge/rebase した結果だと見られます。

というのはたぶん間違い。むしろ rebase しなかった結果、分岐から合流までのあいだに master が進んだその差分が現れている。

この間違いで論旨(「明らかに無視すべきものです。」)は変わらない。

See also...

listed by...