最終更新: 2020-10-31T00:45+0900
数弱さんには頭が痛い問題だった。
経験値1を加算して増える強さを A と B で比較する。
強さが増加するに従って必ず A を掛けた方が B を足すよりも強さの増加量が増える。(A が1より大きい整数だから)
対数を使って強さの増加量が逆転する境目を求めたのだけど、それは A,B,X の関数であって、Y による制限が考慮されない。
WA だった提出では Y を考慮して上限を定めていたのだけど、境目が負になる場合を考慮して下限を 0 に規正することができていなかった。
コンテストが終わってから問題を明らかにするテストケースが見つかってデバッグができたが、遅すぎた。
10^{18}
という制約の大きさにびびって対数を持ち出したけど、A が最小の 2 であっても 10^{18}
<= 2^{60}
だから、A を使用した方が得する境目は高々 60 なのだった。頭痛の種を自分で作り出していた。
いや違う。比較対象は上限が 10^9
の B だから、境目の上限は高々 30 か 29 だ。
どちらにしろ簡単なループで求められたのだな。同じ手は食わない>#17612685 (翌週の ARC にて)
コンテストが終わってから問題文を読んだ。イメージが湧きやすくていい問題名だと思う>Aerial。
2**17*17*17(=約3800万)回のループであり、サンプルですら TLE になるのがわかっていたが、ビギナーはワーシャルフロイド法が書けただけで満足なのです。これ以上は解らないのです。
以前解けなかった問題で参考にした提出。「後半はワーシャル-フロイド法に見える3重ループ。ただし街と街を結ぶ中継地点(一番外側のループ)は街ではなく経由地のリスト」。これをチラ見しながら書いた。
ダイクストラ法でコスト順に点を繋いでも時間がかかりすぎるのは確かめていた。問題に合わせたチューニングが何かできないか、そもそも総当たりのワーシャルフロイド法で可能なチューニングがあるのだろうか、と考えていたが思い付かない。コードを眺めてみよう。
という感じの苦肉の策で AC をもらった。E 問題だからこんなものかも(というのはコンテスト中に解いてから言おうね)。
集合 S をビット表記により 0,1,…,2N−1 までの自然数にエンコードしてしまうと、S=0,1,2,… 順にループするだけでトポロジカル順序が守られることなどから、実装が簡潔になります。
自分はこの条件を知らないままなんとなくでうまくいく方法を真似しているだけだなあ。
頂点0からスタートするが、訪問済み頂点集合を考える上で頂点0は最初は含めない
こうすることで「訪問済み頂点集合が全集合になった」時「頂点0に戻ってきた」ことを意味するので、戻り道も含めた問題条件に適用できる
これを考慮するなら自分の AC 提出の 10 行目を NP[0][0] = 0
としなければいけないが、実際にそうしなければいけないだろうか。
NP = Array.new(N){ [Float::INFINITY]*2**N } NP[0][1] = 0
NP[現在地][経由地] = 移動コスト
であり、ゴールは NP[都市1][全都市網羅]。ゴールに初期値以外のコストが設定されているとき、それは全都市を経由してから現在は都市1にいる(またそれにかかるコストがいくらか)ということなので、スタートが NP[都市1][都市1] でも NP[都市1][無] でも関係はないかな。
「スタートが NP[都市1][都市1] でも NP[都市1][無] でも関係はない
」ということと関係するのだけど、konayuki さんの提出 #17520925 のこの行……
dp[0][1] = 0 for i in 0..goal next if i&1 == 0
17 行目は、自分も全く同じように書いたが、スタート地点の初期化。だけど 19 行目のスキップが目新しい。これは経由地点にスタート地点を含まない場合を除外している。当然これに関わるコストを記録した配列の中身は初期値の Infinity で間違いない。
2^N
が 2^{N-1}
になるだけでループの回数が半分になるのだからこれはとてもうまい。これもひとつのケチビットだな、ということで、メモ配列からもループの繰り返しからも最初から除外しておけば条件分岐すら不要。
ところで、コストを記録するメモは Array[N][1<<N(-1)] よりも Array[1<<N(-1)][N] としている提出がほとんどだった(例外が自分と konayuki さん)。これは「一番内側のループで変化しない配列参照をループの外に出せばちょっとは良くなるかも
」の発展として理解できる。行列計算ともたぶん関係する。多重ループの最内ループが多次元配列の何次元目をイテレートするかは性能と無関係ではない。スクリプトにおいても、途中までの配列参照をローカル変数にメモすることでコスト削減が期待できる。
この2点で 1933 ms が 1283 ms になった。
負数を習う中学1年生らしい言い換え。
さっきの提出で意図せず -1 ビットシフトしている部分があったが、エラーにもならず正しい答えが出ていた。Ruby に助けられた怪我の功名。この仕様は特に明記されていないし知らなかった。
これまでは 1<<N が取り得る値の最小が1だとばかり思っていたから、0にしたい場合を例外扱いしていた。活用したい仕様。
「同じ都市を2度以上訪れて得することはない
」、という考察を何か所かで読んだので、next if 0 < v[f-1]
という条件を真ん中のループに足してみたら、1283 ms が 852 ms になった。わーお。
ちなみに Integer#[] である桁のビット(0,1)が得られるのだけど、最下位(右端)のビットが0番目になっている。負の添字は必ず0が返るっぽいので、今度は意図してこの仕様を利用した。
「負の添字は必ず0が返るっぽいので、今度は意図してこの仕様を利用した
」とか書いたけど、0は望ましい結果ではなく、結果的にスタート地点である都市1だけは何度も発着を繰り返していた。
真ん中のループの繰り返しから都市1の分を引いて N 回を N-1 回にしたら、852 ms が 769 ms になった。もうこれ以上は無理でしょ。
Integer#times の方が Range#each より速いようだったので Integer#times を使っている。そのせいで f(rom) と t(o) で都市番号への対応付けがずれているのが罠。
経由地を記録したビットフラグ(v)から0のビットを抽出して真ん中のループと一番内側のループに利用したら、769 ms が 627 ms になった。さすがにもうこれ以上はないでしょ。
TLE を初めての AC に変えた立役者である next if NP[0][-1] <= c0
が、変形を受けながらずっと残っていたのだけど、いつの間にか用無しになっていたことがわかったので消したら、627 ms が 583 ms になった。沼っぽくなってきたぞ。
メモ配列を見たら 0 番目の要素が 0 と Infinity に決まっていて無駄なので、長さ N の配列が N-1 にできるけど、ちょっとした省メモリにはなっても速くはならない感じ。
沼といえばゴルフ。217 バイト。
(N,),*Z=$<.map{_1.split.map &:to_i} V,=C=Z.map{|a,b,c|Z.map{(_1-a).abs+(_2-b).abs+[0,_3-c].max}} V+=[9e9]*N*M=1<<N-1 M.times{|v|N.times{|f|g=N.*v|1<<f-1;w=V[v*N+f];N.times{|t|V[g+t]=[V[g+t],w+C[f][t]].min}}} p V[-N-N]
TLE になったら元も子もないので削れない一時変数と -1 がある。そういうのは Crystal (Ruby に似たコンパイル型言語)で投稿するという手があるらしいが知らないので。
うん、沼だ。207 バイト。
配列の初期化を省いて ||
で初期値を補うようにしたら 10 文字短くなって 200 ms ほど遅くなった。
(N,),*Z=$<.map{_1.split.map &:to_i} V,=C=Z.map{|a,b,c|Z.map{(_1-a).abs+(_2-b).abs+[0,_3-c].max}} (1<<N-1).times{|v|N.times{|f|g=N.*v|1<<f-1;w=V[v*N+f];N.times{|t|V[g+t]=[V[g+t]||9e9,w+C[f][t]].min}}} p V[-N]
整形すれば普通に読めるあたり変態度が足りないと思うんだよなあ。発想に飛躍がない。
||
が二重ループの内にあるけど、大差ないみたい。とりあえず大きな数としての初期値に Float::INFINITY を使うと、10**9 のような整数型を使うより比較にコストがかかる。
余計なコストがかかるはかかるんだけど、今の段階に至っては初期値は nil で構わないのだった。比較されない。
こんな感じの配列を事前定義すると手元ではちょっと速いようだけど、スマートじゃないので却下。
01 = [[[0],[]],[[],[0]]] (1...N1).each{|n| 01.concat 01.map{ next (_1<<n)[0,_1.size-1],_2+[n] } }
(1<<N1).times{|v| c = CV[v] 0,1 = 01[v] 0.each{|f| f2 = C[f] CV[v|1<<f][f] = 1.map{|t| f2[t]+c[t] }.min||s2[f] } }