/ 最近 .rdf 追記 設定 本棚

脳log[2019-10-29~]



2019年10月29日 (火) 日曜日にあった ABC。ちょっと毛色が違った D 問題。「D - Water Bottle」■難しポイント。sin と tan 間違えた。弧度法から度数法への変換を間違えた。高校数学では tan/sin/cos しか習わないので Ruby の Math モジュールのドキュメントを漁って atan と atan2 と atanh のどれが自分の求めるものか確かめないといけなかった(しかも最初 sin 系の関数を試していて角度の変換も間違えた)。これが難しいとか高校生に鼻で笑われる。


2019年10月26日 (土) もうはばかる理由もないので最初(sourceforge.net)から思っていたことを書くけど、「定石だから」ってのは理由になりはしない。そもそもその「定石」がローカルルールや迷信の類ではないのかという疑いがあるが、そこをクリアしたとしてもやはり同じ。デザインパターンがそうだ。広く流布し認められたパターンであっても、パターンカタログに載っていること自体が、パターンを採用する理由になるわけではない。これまで読んだどのパターン本でも、パターンが適用できる具体的なシナリオと、パターンが持つメリットとデメリットの両方と、同時に比較考量すべき別のパターンが併記されていた。「定石だから」で留まるのは浅はかなんだ(「手段を目的化してしまうと見失いがち。手段は常に目的に対してテストされ、いつでも置き換えられなければいけない」)。盲信するならせめて対象として権威を選ぶくらいはしないと馬鹿なんだ。


2019年10月25日 (金) Android 9 Pie にインストールした VLC for Android 3.1.4。ファイルからの相対パスで音楽ファイルを列挙した m3u プレイリスト(文字コードは UTF-8)。パスに [] を含んでるファイルを再生してくれないので、それぞれ %5B%5D に置換する必要があった(※手を加えたのはファイルシステム上のパスではなく、プレイリスト内のパス)。なんで? 二重にパーセントエンコードされても不思議じゃないんだけど、なんで OK なの? これじゃ %5B という3文字を含むパスと [ という1文字を含むパスを区別できないじゃない。


2019年10月21日 (月) 旅行予約サイトの「今あなた以外に○○人が見ています」はウソだったことが判明 - GIGAZINE」■まじめに実装すると人とサーバーにコストがかかるし、下手すると逆効果(「今あなた以外にゼロ人が見ています」)の可能性があるので、完璧にコスト(手段)とパフォーマンス(効果)を最適化した結果だと思う。手段を目的化してしまうと見失いがち。手段は常に目的に対してテストされ、いつでも置き換えられなければいけない。


2019年10月17日 (木) 提出 #8002336 - AtCoder Beginner Contest 088」に対して1バイト縮めた「提出 #8002578 - AtCoder Beginner Contest 088」。でも Ruby で *最速* である hanada3355 という人の「提出 #5777010 - AtCoder Beginner Contest 088」を手直しするだけで 151 バイトのスクリプトになるんだよなあ(※p の引数解釈とか条件演算子と文字リテラルの解釈揺れをバージョン2.3.3に最適化すると多少縮むかも)。196 バイト、195 バイトのレベルではない。手法としては「ちょっとだけGOLFに走った」と同じなんだけど、見てしまってから真似はできない。発想の転換が欲しい。■とか書いている間に 187 バイトの「提出 #8002816 - AtCoder Beginner Contest 088」と 186 バイトの「提出 #8002824 - AtCoder Beginner Contest 088」。目の付け所がずれている。でも自分としては添削を受けているようでテクニックの引き出しが増えて良い。■■■矢継ぎ早にくり出される新アイディアが楽しい。特に出力変数 c に例外値 -1 の役割まで持たせてループのストッパーにするこれが白眉。「提出 #8007594 - AtCoder Beginner Contest 088」。■これもえげつない。「提出 #8007675 - AtCoder Beginner Contest 088」 Integer#to_i(2) のリテラル2を再利用するために t の初期値を1から2にしてしまう。つじつまを合わせるために問題由来のビット列 s の方を2倍してしまう。それでは釣り合わないんだけど W の代入文が省けるのと、2倍した s がループの停止条件としてそのまま使えるので総合して得する。■短いソースに何重にも意味を重ねてすべてがすべてと必然的に絡み合う感じ。最適化の極みよな。アルゴリズムと言語と個々の問題に対する深い理解がないとここまで自由にいじくれませんよ。


2019年10月15日 (火) 宇宙ツイッタラーXさんのツイート: "AtCoder Problems を更新しました。難易度推定アルゴリズムが改善され、いくつかの問題で難易度が低めに出ていたものが修正されました。 by @pepsin_amylase"」■AtCoder Problems が推薦する過去問がいい具合に苦しめてくるので時間が溶ける。ここ数日の睡眠不足はこれのせい。とても良い。


2019年10月14日 (月) ガソリンスタンドで見た注意書き。「給油中はエンジンを切りましょう」■思わず「え、そんなことができるの? 給油口を開けたあとですぐにキーを差し直してエンジンをかけるの?」と思ったのだけど、たぶん運転席周りのレバーでぱかっと開けられるのだろうなと気がついた。■プレス機なんかは両手で操作をしないと作動しないような仕組みになってるんじゃないかと思う。「両手操作式安全装置」というのがそうではないか。本の裁断に使っているカッターには「一人で作業するように」という注意書きがある。もともと片手で押し下げられるようなレバーではないので、そういう注意になっている。■給油口を鍵なしで開けられる車はなんと「便利」なんだろう。■最近のキーは鍵穴を必要としないみたい。そういう時代に合った車のインテリジェントさに期待してもいいのだろうか。実際どうなの?■アクセルを踏んだら自動でパーキングブレーキを解除しますよ、ってな「スマートさ」だけは知ってるんだけど。俺は信頼できない自分を縛るために信号停止のたび、渋滞中の一進一退のたびにサイドブレーキを引くんだけど、自動で解除されたら困るんだけど。


2019年10月12日 (土) ちょっとだけGOLFに走った (311 Byte / 60 ms / 1916 KB)」「悪ノリしたが空白を詰めただけでは変態ゴルファーの背が遠い (188 Byte)」からの派生。■俺は「可読性」という言葉を、そうとう眉に唾をつけて見ている。これが「表面的なこと」「主観的なこと」に不相応な大義名分を与えている気がするから。典型例が「条件演算子は可読性が~云々」。絵本しか読めない人間がすべきは決して、「じをよみなれないぼくにもわかるようにもっと *可読性* をたかめてください」と主張・要求することではない。早く読めるようになって最初に内容を議論できるようになるといいですね。がんばりましょう。■たまたま例に挙げたけど、俺は条件演算子が好き。理由もある>20181029。if が値を返さない C++ では使わずに const を徹底できないという理由もある。■俺は可読性が Easy を志向していると言っている。そのように使われがちな現実がある。それでは紛糾するし迷走するから、志向するのは Simple な何かにして、そこから可読性が生じるように仕向けるのが正しい順序ではないか。■Ich! Ich! Ich!■■■たまたま見つけた9年前に書かれた文章。「ソースコードの可読性や保守性:地方からの戯言:エンジニアライフ」■最後の方から引用。保守性については定見はないが、まったくその通りだと思う。「プログラムの組み方、という点においては、私は保守性や可読性というものを持ち出すのは避けるべきと感じています。ある人の基準がそのまま別の人に通じるとは限りません、むしろ経験や思想などが異なることの方がほとんどです。通じないことの方が多いでしょう。そのような状態で議論を続けるのはある種の押し付けでしかありません。それを分かったうえで議論を続けることが建設的ではないでしょうか。個人個人によって大きく意見が異なる保守性・可読性といった指標を用いるのではなく、何か別の伝わりやすく明確な基準、それが何かは非常に難しいかもしれませんが、レスポンスなどの比較的判断しやすい要素が必要なのだと感じます。」■同じ人からさらに。大いに共感する。「誰にでもわかるような仕事:地方からの戯言:エンジニアライフ


2019年10月06日 (日)

最終更新: 2020-05-06T23:26+0900

[AtCoder] AtCoder Grand Contest 039B問題 Graph Partition

もはや毎週恒例。たかだか B 問題に一日散々苦しんでおいてなんだけども、実行速度にハンデのあるスクリプトで、何の工夫もない総当たりを通されては、まったく釈然としない。

 最初の AC (AC / 1053 ms / 4476 KB)

Ds 関数1回は10数msで完了するみたい。Ds 関数1回2回でまあまあ AC (accepted) は出る。でも当てもんではないし、なんだかんだ残った WA (Wrong Answer) が潰せなくて総当たりにした結果、最長タイムが 1053 ms になったと、予期していた TLE ではなかったと。何か手を抜く洞察があれば。

Python でひとつだけ抜けた提出が 100 ms を切ってる。事前作成した実行ファイルを書き出して実行したり、コンパイル&実行したりの飛び道具は使ってないみたいだし、NumPy の文字も見えない。集合演算をよく使っている。ちょっとわかる気がしない。Python という時点で「for 文に else? これと同じ話?」>「なぜreturn -1にelseはいらないのか」というところから始まるのだが、それが主たる理由ではない。

 2番目のAC (AC / 849 ms / 4220 KB)

目新しいアイデアはない。ただ、「あるノードからあるノードへ移動可能かどうか」というデータを「あるノードから移動可能なノードの配列」へと事前処理しただけ。効果はめざましく、600 ms 台だった入力を処理する時間が軒並み2桁msに落ちた。たぶんほとんどのノード間に交通がなかったのだろう。

残る3桁msは3つだけで、それぞれ 100 ms、849 ms、840 ms。特に 800 ms 台の2つの入力がどういう特性を持っているのか(たぶん辺が多い密なグラフ)。対策したい。

 3番目のAC (AC / 74 ms / 2300 KB)

目新しいアイデアはない。Ds 関数の中心にある二重ループを効率的に回すことを考えただけ。ループが総体としてどのように歩を進めているかを低レベルで考える。そしてそれを縮約する方法を。やることは関数の仕様を変えない関数内部のコード変換なので、機械になったつもりで意味をはぎ取った記号(ビット列)を操作して、入力と出力を最短で結ぶイメージ。

Ruby は200ビット整数が普通に扱えて便利。その結果できあがったのが DsMax 関数なんだけど、副作用として……

  • ある点からその他の点への距離一覧(※Ds 関数の戻り値)の代わりに、最も遠い点までの距離しか得られなくなった。
  • -1 を返すパターンを検出できなくなった。

答えには最も遠い点までの距離しか使わないので1点目はいい。-1 パターンを検出するために、1回だけ Ds 関数を呼び出すことにして、それ以外で DsMax 関数を呼び出している。

いやあ、またしても Python に勝ってしまったなあ。(そういうコンテストではないし、コンテストは終了している。でもゴルフを楽しんでる人もいるし、なんでもいいじゃない)

あ、r -= sr ^= s の方が良かったかも。

 極まってるね! 提出 #7878842 (C++14 / 1 ms / 256 KB)

こんなん問題も見んと printf("%s", "答え"); してるんかと思うやん? 普通に二重ループを回してるんだよなあ。でも自分みたいに総当たりをするために三重ループになってしまってはいない。二重ループのある bfs を2回だけ呼び出して済ませてる。

この bfs 関数、すごく既視感があるんだけど、これを2回呼び出すだけで問題が解決する理屈が知りたいなあ。

 4番目のAC (AC / 26 ms / 2300 KB) と、その1文字違いのWA

ベースは2番目のAC。それの総当たりをやめて、2回だけ Ds 関数を呼び出すことにした。キモは、最初の呼び出しで引数に 0 を選んではいけない、ということ。それが WA と AC を分ける。たぶん 0 だと当たりを引いてしまうんだろうなあ。代わりに何を選ぶかは先の「極まってる」提出を参考にした。

正直言ってこれは入力依存のヒューリスティクスなので、時計を見て時間いっぱいまでランダムな試行を繰り返してまぐれ当たりを期待する手法と代わりがない。Ruby で一番に AC を獲得した提出がそういうものだった。

自分にとって真の提出は「3番目のAC」でいい。総当たりで間違いのない答えを求めても、3倍しかタイムが違わないのだから。

 5番目のAC (AC / 58 ms / 2044 KB)

3番目のACの改良版。DsMax 関数で -1 を返すパターンを検出できるようにして、Ds 関数を用済みにした。3重ループの総当たりでも、インチキの約2倍のタイムにまで迫ってきた。(でもこれをベースにインチキをしたら……)

 ちょっとだけGOLFに走った (311 Byte / 60 ms / 1916 KB)

短い方がすぐに読み終えられて理解が早いよね(大嘘)。でもね、コードはソルーションなのだから、理解するヒントは問題の中に存在している。問題を見て、答えを考えたら、コードが理解できる。それができないなら、どれだけ注釈があっても理解はできない。読みやすいコメントのおかげで理解した気になれるだけ。……というのが、20191002からリンクした「わかりやすさについて」からリンクした「C++で3秒だという人のコードを読んでいた」経験からの実感。

同じく20191002からリンクした「ドキュメントについて」に書いたが、ちょっとだけGOLFに走ったコードに足りないのは「基本がわかっている人間に向けた内部を理解する時間を節約するための勘所」だというのが自分の答え。そのために使えるのが意味のある変数名であり、プリミティブすぎるビット演算に意味を与える注釈であり、採用したアルゴリズムや入出力を説明する関数冒頭のコメントなどだ。

但し、但しだ。Easy はコードの性質ではないのだから、Easy なコードという概念はそれ単独では存在しない。猿でもわかる Easy を求めることは理解が伴わないので意味がない。猿を教育するのは自分の役割ではない。求めるのは、第一に「理解すること」。理解しない人間は読者ではないので。第二に「不明瞭な点を浮かび上がらせる質問」。第三があるとすれば「どう書いてあれば理解に要する時間が省けたかという提案」。Easy が主観だからこそ複数の視点に意味がある。

しかしその提案が「ヨーダ記法は目が受け付けないから NG」や「条件演算子は見慣れないから NG」や「unless は一旦 if に変換しないとわからないので NG」や「for や while に付く else は流れがよくわからないので NG」のレベルであれば合意はできないでしょうな。自分だって「大なり記号が混じると条件式が理解しにくくなるから右が正の数直線上に変数と数値を並べるようにしてほしい」とは言わない。そんなのは慣れや癖や縛りの類であり、自分にあるのと同じように他人にも馴染んだルールがあり、それが一部の判断を安全に短絡させ理解を早めるのである。ジャイアニズムには抵抗する。数を恃んで来ようものなら決裂は決定的だ。

俺は数が力だということを否定したいのだと思う(20181228, 20130228)。だから受け入れられなくなる。面白いよね、逆ではないんだ。否定するために受け入れないのではなく、受け入れられない現実が先にあって、その原理に対する理解があとから来る。これをこじつけと言う?

 悪ノリしたが空白を詰めただけでは変態ゴルファーの背が遠い (188 Byte)

るびまのゴルフ記事がめっちゃ楽しみだった。Rubyist Magazine 0021 号が第一回。著者の日記もゴルフ場もすでに知っていたけどゴルフに興味はなかった。でも解説記事は表層的な意味をはぎ取った言語への(身も蓋もない)理解が深まる楽しい読み物だった。さっき書いた「やることは関数の仕様を変えない関数内部のコード変換なので、機械になったつもりで意味をはぎ取った記号(ビット列)を操作して、入力と出力を最短で結ぶイメージ」にも通じる。「意味」に縛られて「実質」が見えないようでは、「抽象化」が覚束ないと思うのだ。これがまたさっき書いた、「変数名や注釈で意味を与えること」との間でバランスをとるもう一方の考え。

連載を読み直していたら最終回にいいことが書いてあった。「我々が努力して、そして楽しんでいる部分は、基本的なテクニックを抑えた上での膨大な時間を投下して行なう 論理的思考や発想の転換の勝負 なのです。」 基本的なテクニックっていうのが記号盛り盛りの変態的な見た目になってしまうアレ。アレの先にゴルフの真髄があるのだと。

しかし、ゴルフでも Python (191 Byte) に勝ってしまったのだなあ。>「すべての AC (コード長 昇順)

塗り替えるのが早い!!! (Python / 182 Byte)

燃えるね(160 Byte) タイムが約60msから約90msに増えてるのは、入力に対して String#to_i(2) を都度都度呼び出しているせい。ゴルフに魂を売ったようで心苦しい。パフォーマンスを追求する余録で無駄が削ぎ落とされたスクリプトが手に入った、という体でいたい。表記が変態的になるのは「本質」には影響しないから心が痛まないのだけど。

たぶん Perl 勢が参戦してきたらどちらも勝てないね。

ゴルフもまた沼なのか…… (146 Byte)

どっぷりはまっている(144 Byte)

最終更新: 2020-05-06T23:26+0900

[AtCoder] AtCoder Beginner Contest 138E問題 Strings of Impurity

Project Euler の人、という認識の人の日記でこの問題が触れられていた。参加していなかった回。「なんということもない問題」だが Python で TLE とのことなので、Ruby で挑戦。

 提出 #7886543 (AC / 432 ms / 10364 KB)

これが、Ruby の力!(違う)

ICache 変数抜きの提出では見事に(同じ)轍を踏みました>提出 #7886442 (TLE)。

ちなみに Ruby での最速タイムはちょうど3分の1の時間だった>144 ms。文字ごとに出現位置リストを作ってバイナリサーチらしい。魔法は無しか。

あるいはメモリをケチらずに文字列全長に渡って文字種ごとに次の出現位置を……、というのも魔法ではないな。オーバーヘッドでかいし。


2019年10月02日 (水) "simple"と"easy"はどう違う? Simple Made Easyを解説 Part1 - ログミーTech」「Part2」※Made Easy は常套句らしく、雰囲気で読んで間違えた。過去形にする理由がないし、実は p.p. らしい。「本のタイトルなどの...made easyの意味 - IT系の英語表現を学ぶ」■要点。Simple と Easy は対立概念ではないってことと、Simple こそが目指すべき価値であるということ。そのために Easy を手放す必要はないが、Easy のために Complex を選ぶ(Simple から離れる)のはどうかという問い。とても良い。20190218でも似たような趣旨のスライドへリンクを張った。■ブコメがひとつあるがこれをどう取り扱うか。「両者を比較してsimpleの方が良いなんて奴は、アセンブリ言語でもやってなさいってこった。 - mz88av40のコメント / はてなブックマーク」 比較して一方を選ぶという考え方はおかしい。Part 1 で強調されていたことが読めていない。ではアセンブリが Simple という価値を大事にしている尊ぶべき言語というのは事実だろうか。アセンブリは極めて限定された局面でしか現実的な選択肢ではないので、Simple の行き着く先がこれでは論から説得力・影響力が失われる。■結論がどこにあるにせよ、おそらく、抽象化がキーワードとして出てくると思う。抽象化が Simple を助けるものであり、Easy/Complex とは必ずしも結びつかないことを示せなければ、Simple を Easy より優先させようという主張が弱いものになると思う。で、実際のところは?■■■問題に対処するのに対照的なアプローチがあって、深く潜って基礎の歪みを修正してその影響(1か所ではないかもしれないし、問題が発生した元の場所とは違うかもしれない)を手当てするものと、表面に現れた亀裂を埋めるだけで問題がなかったことにするものと。リンクしたログで触れられていたけど、Simple は客観的な性質で、Easy は主観だという。静的な性質から自ずと生じる Easy は悪くないが、猿でもわかる Easy を目的にしてしまうと、針路を見失うのは必至、良くて怪我の功名だと思う。■元の話題との関連がわからない? Simple を追求することがどのような姿勢であるかと、主観概念である Easy を目的にするとどのように道を誤ることがあるかがわかると思って。抽象化というキーワードは出てこないけど連想してアセンブリにも言及すると、何もしないこと、簡単に済ませることは Simple でも何でもない。だってそれが「Simple な何」であるというのか。■無能ゆえに Easy な対処しかできなくて、問題を解決する代わりに一度あらわになった問題を隠そうとする現象が見られる。見えている。そもそも問題を解決しない問題に対する対処というのが、Simple に対する攻撃であるという点で付け加えられた別の問題に他ならない。船が沈むのは時間の問題だろう。マッチをどうにかせずに懸命にポンプを動かす徒労など御免蒙る。問題を解決する、Simple を追求するってつまり、マッチをどうにかしてポンプを不要にすることであり、俺は火を消せなかった。だから対岸に避難した。■客観と主観を Simple と Easy の区別・対比に関連づけたことはなかったけど、対象から分離すべき Easy の主観性を過去の一文が示していた。「Easy は端から眼中にない。それは道具を使いこなせない、対象を理解できない、自分の問題。」「~するところの解読がまだ。プログラム全体としては無駄がなくて、そういう意味ではわかりやすいんだけど。」■■■ちょっと逸れるけど Simple と Easy を包含する「わかりやすさ」についてはこれも関連する。「ドキュメントについて」。お客さんが相手なら Easy が求められるのは否定しない、お客さんが相手なら。とはいえ俺は客の立場でも仕組みから説明されたい。「要するに同じことなんだろうけど、仕組みと指示の理由を説明するダイキンの方が俺は好き。」「シマノのハブの説明書にクイックリリースのハンドルの向きを規定する記述があって、それに続けて、茂みに突っ込んだりしたときに強制的に開放されないためだとかなんだとか、そうする理由が一緒に書かれていた。とてもとても素晴らしいと思います。」 つまるところ、自分にとって Easy を含む「わかりやすさ」は、Simple な構造・仕組みからしか出てこない。Simple でなければ、Easy ではない。全てを覆い隠して無知であることを許されても、それを Easy とは受け取れない。Complex はもちろんわかりやすくない。■ちょっと話題が戻るかな? 本当に、機械が Simple であるかどうかは客の立場からはうかがい知れない。そこは問うていない。ここで、(メンタル)モデルと抽象化が出てくると思う。抽象化が Simple を助けるって話だ。それがどういうことかは考えたことがないので説明できない。ひょっとしたら「Easy とは抽象化の果実である」なんて予想外の論がもっともらしく語られる可能性だってある。だけどそれは間違いであるか、良くて飛躍した結論でしかないと思ってる。


2019年09月29日 (日)

最終更新: 2020-05-06T23:25+0900

[AtCoder] AtCoder Beginner Contest 142E問題 Get Everything

アルゴリズムがどうとか、タイムがどうとかではない。答えが出たのが嬉しい! WA (Wrong Answer) はもう見飽きた!

 初めてのAC (AC / 1886 ms / 3960 KB)

全然実装方針が固まらなかった。何について繰り返し、どうなれば終了していいのか、さっぱりわからなかった。だから初めてまとまった数の AC が出た提出は総当たりだったし、AC でなければ当然 TLE だった。

そのうち N の上限が12と非常に小さいぞ、とか、コスト(a_i)の上限(10^5)は14ビットだぞ、とか気がついて、鍵を32ビット整数(※)にエンコードすることにした。※Ruby の埋め込み整数は32ビットないかもだけど>http://www.a-k-r.org/pub/2016-09-08-rubykaigi-unified-integer.pdf<実装依存ということでスクリプトからは隠されたらしい。

その鍵をどうすれば答えにつながるかという点 は、20110826p01.02の記憶がうっすら影響してる。今回は間違えずに、不安から慎重(無駄)な処理をすることは避けられたと思う。

あとは AC の数より多い WA を潰す長い長い迷路。もうお疲れなのであとは他人の提出を見てネタバレを楽しむのみ。

 Ruby による提出一覧

Ruby でも 500 ms を切ることができるらしい。200バイトちょっとのスクリプトで答えが出るらしい。ネタバレはもうちょっと先にしよう。

 2番目のAC (AC / 565 ms / 2684 KB)

タイムとメモリの代表値には最悪の数字が選ばれる。条件式をひとつ付け加えたら、最悪だった 1886 ms が 223 ms に縮まった。これはしてやったり。

鍵の包含関係は気になっていたんだけど(※このときの経験から。「他ののサブセットになってるのがあったら除外できる」)、チェックして除外する適所がわかっていなかった。WA を潰すのでそれどころではなかったし、そのために処理と負荷が増えては本末転倒だし。

あとはこの、完全に手続き指向で長ったらしい解答を根本から覆す天啓が降っては来ないものか。

 他人の提出を見た。

使われている変数名 dp がすべてを語っているのではないだろうか。このパターンは何度も経験している。「それ DP で」案件だったのだろう。でも DP(動的計画法)の一語で理解できたことがないまま今に至ってるんだよなあ。持つデータに対して頭の整理が追いつかないもので。

平均タイムで見ると自分の解法も悪くないと思う。Ruby の提出で一番速いタイムが 481 ms だから、最悪タイム(565 ms)を記録した最後の入力に対策できれば一矢報いられるのでは?

 チューニングした (AC / 476 ms / 3836 KB)

狙い通りに最悪タイムだった 565 ms が 476 ms に改善した。スクリプトって書けば書くほど遅くなるのが普通だから珍しい。

しかし、多くの入力で実行時間とメモリ使用量が微減している中、02-random-17 という入力だけ特異的に 1788 KB が 3836 KB に増大している。これってつまり何が起こっているんだろう。大量の使い捨てオブジェクト? どこから? Array#shift(n)?

 さらにチューニングした (AC / 25 ms / 2424 KB)

桁が違っていて効果に自分でびびっている。「インタープリタ型言語でトップクラスの速さ」。やったぜ。でもやっぱり、ソースが長たらしくて汚い。

(組み合わせではなくコストによる)順序をつけて、不要な処理をスキップし(※nextステートメントの数を見よ。あ、<= にできるところが1か所 < になってる。無駄だ)、ソートにコストをかけないように2本目3本目のキューを細かに操作し(※あ、bsearch_indexの条件が潜在的にバグってる。+ を | にして <= を < にしないと)、答えが見つかり次第打ち切るからこその速さであって、(1本のキューと)手続きが中心になるのは避けられないとは思うが……。

ちなみに、Corvvs という人の提出(https://atcoder.jp/contests/abc142/submissions/7795963)を参考にした(「あ、全適用は S の要素だけでいいんだ」)。この人の ID はもう覚えてしまっていて、この前「あとで知ったのだけど、Ruby には Integer#bit_length という便利メソッドが予め用意されていた」と書いたのだけど、その「あとで」がこの提出だった>https://atcoder.jp/contests/abc141/submissions/7557027。ひと味違った解答を書く人だと思う、それを Ruby で。

そうそう、最初の遭遇はこれだった「Rubyで一番速いのはこれ」。それが「「Rubyで一番速いの」を真似して勉強」へと繋がり、現在の AtCoder との付き合い方が決まった。「自ら取り組み考えた「問題・課題」に対する異なる方向からのアプローチは、よく身に付く貴重な学びの機会」の実践。優れたお手本に事欠かないし、自分の方でもそれを理解する準備が整っている。


2019年09月22日 (日)

最終更新: 2020-05-06T23:25+0900

[AtCoder] AtCoder Grand Contest 038B問題 Sorting a Segment

A 問題よりは難しい B 問題。C, D, E, F は一目見て問題文の理解を諦めたよね。

 最初の提出 (WA/TLE/AC 混在)

TLE(時間切れ)は潜在的な AC だという期待が持てるから、はっきり WA (Wrong Answer)だと告げられる方が問題。AC と混在しているあたり、微妙なケースの考慮が漏れている。

問題にあたる方針はこう。長さ K のウィンドウを数列 P に重ねて1ずつスライドしながらウィンドウの中の要素をソートするとする。

スライドに伴いウィンドウからはみ出た要素が直前のウィンドウの中で最小(最大)の要素であったかどうか、また、新しくウィンドウに入った要素が現在のウィンドウの中で最大(最小)の要素であるかどうか。この2点に注目するだけで全体の数列の並びに変化があったかどうかがわかる。

ただしこれだけでは足りない。

 2番目の提出 (WA/TLE/AC 混在)

pm という変数によりウィンドウ内の要素が最初からソート済みだった場合の考慮を試みている。だがまだ整理し切れておらず、AC が WA になったケースや、逆に WA が AC になったケースがある。

 3番目の提出 (TLE)

WA がなくなり、AC と TLE のみに。ちなみにこの時点でコンテストはとうに終了している。

 4番目の提出 (TLE)

答えが得られる main 関数が確定しているのであとは TLE を解消すべく、意味を変えないように注意しながら効率の良い実装に置き換えるリファクタリングに励むだけ。

……なんだけど、3番目より効率が落ちて TLE が増えた。しかし頭の中を整理する役には立った。ウィンドウ内の要素をソートしない手法への転換もこのとき。これが5番目の気づきにつながった。

 5番目の提出 (AC / 427 ms / 30132 KB)

ウィンドウの中で最大(最小)の要素かどうかを判定するのに、先日の20190907p01.03のデータ構造が使えると気づき、Next メソッドと Gen メソッドをコピペして利用したところ AC に。

ウィンドウ内の要素の並びが最初からソート済みかどうかの判定には、右方向に単調増加の要素がいくつ続くか、というデータを利用した。これを作成するループは、やはり先日の「小細工」としてのデータ LXRX を作成したものと同じ構造をとっている。

 6番目の提出 (AC / 329 ms / 42816 KB)

同じく先日の20190907p01.06で使ったインデックスの作成方法とソート方法を利用してタイムを改善した。

係数がいくつでも O(N) だとはいえ、長さ N のフルスキャンを4回も5回もやり、長さ N のデータ配列を10も11も作成すればオーバーヘッドはいかばかりか。一部の入力に対しては初期の提出に比べて3倍の時間をかけているし、メモリ使用量は倍以上。

他からの流用そのままではなく、この問題に最適化した手法であるとか、根本から別物の優れた手法であるとかがないものか。No Idea なんだけども。

 7番目の提出 (AC / 295 ms / 36544 KB)

主として NextIndex メソッドの無駄と NextIndex メソッドの変数名の間違いを修正したリファイン。ちょっと速くなってちょっと省メモリだが、まあ、小細工。

 Ruby による提出一覧

 Ruby で一番新しい提出>https://atcoder.jp/contests/agc038/submissions/7648285

WA が2つある以外は AC で、タイムもメモリ使用量も優れている。

cnt_up, cnt_k は自分の提出における UP に相当するものだけど、min_deq, max_deq を中心としたその他の大部分は、ちょっと見当が付かないくらい違っていて面白い。どういう着想を持つとこういうコードになるんだろう。

ウィンドウをスライドするものとして扱うのではなく、両端の要素に着目してウィンドウを分類し、カウントしているのだろうか。このあたり(ウィンドウの処理順)、適当な制限条件を付けて最適化が可能な雰囲気がなきにしもあらず。

 他の提出を見てると多いのは

最大値、最小値それぞれについて待ち行列を用意するものみたい。「Ruby で一番新しい提出」もそう。ポイントは

  • 待ち行列の要素数は K 以下。
  • 追加する要素との大小関係によって、待ち行列の末尾から、永遠に最大要素(最小要素)としての順番が来ない要素を追い出す。

8番目の提出 (AC / 243 ms / 19124 KB)

いいね。時間もメモリ使用量も「7番目」からさらに改善した。

気がついてる提出を見なかったけど(※主に見たのは Python。Ruby とは提出数が桁違いなんだよなあ)、最小値の方の待ち行列の長さを見れば最初から昇順にソート済みだったかどうかがわかる。

Queue から追い出す処理に while 文が使われてるけど、そこと Array#shift に目をつむると(※)、N 回のループ1つで終わり。余分なメモリ要求も計 2×K 要素の配列だけ。

※キュー1つあたり push がループ全体で N 回なので、pop/shift を合わせた回数も全部で N 回以下にとどまる。Array#shift がどうしても気になるなら、メモリ要求を 2×K でなく 2×N にすれば定数時間にできる。

9番目の提出 (AC / 243 ms / 18428 KB)

Array#shift を定数時間の処理に置き換えようとしたら追加のメモリ要求が 2×N になるどころか N だけになったが、2<=K<=N なので 2×K と N の大小関係は一概には言えない(※最悪の場合がマシだとは言える)。しかも Ruby では速度の改善にはつながらず……。

ところで、C配列のシフト操作と、Ruby の Array#shift の実装が別物なのは言うまでもない。あくまでも原理的な話であって、タダで手に入るオールマイティはないのだから気にして損はないだろうということ。Ruby 1.9 の array.c を見たら内部ポインタのインクリメントで済ませているようだったので、得することもなかったみたい。(そうか。unshift はダメだけど shift は気易く使っていいのか)


2019年09月16日 (月)

最終更新: 2020-05-06T23:25+0900

[AtCoder] AtCoder Beginner Contest 141D 問題 Powerful Discount Tickets

Ruby による提出一覧

  1. 最初の提出 (TLE)

    問題文に書かれた操作をそのままコードにしたらほとんどが TLE で全然ダメだった。ソート済み配列に find_index を使ったのが間違い。

  2. 2番目の提出 (TLE)

    find_index を bsearch_index に置換したら3つを除いて AC になったが、やはり時間をかけすぎている。

  3. 後日の提出 (AC / 221 ms / 30216 KB)

    Ruby で一番スマートな解法にくらべてメモリも時間も倍以上かかる力業。例によって例のごとく風呂場で思い付いた。

    あとで知ったのだけど、Ruby には Integer#bit_length という便利メソッドが予め用意されていた。Ruby 1.9 にはなかったメソッドだ。しかしこの前ランタイムエラーを食らったから、AtCoder の Ruby(2.3.3) には Array#sum なんていかにもありそうなメソッドがまだ実装されていないことは知っている。参照してるドキュメントのバージョン(複数)も、ローカルにインストールしてる Ruby のバージョン(複数)も、全部がばらばらなんだよなあ。

  4. 後日の提出(bit_length を使った版) (AC / 149 ms / 11776 KB)

    少し前(20190628)に見かけた MSB 関数をコピペ利用する代わりに組み込みの Integer#bit_length を使うようにしたら、アルゴリズムの優劣は覆せないものの、メモリは同程度、時間は倍に至らない程度にまで改善した。たぶん2回ソートしてるのが良くない。割る2をシフト演算に読み替えて応用が利かなくなってるのに、速さで負けてるあたりがなお良くない。

  5. 番外1:最初の提出でソート済み配列の代わりにヒープを使っていたら (AC / 803 ms / 13604 KB)

    TLE(2秒越え)にくらべたらまあまあ悪くないタイムでやんの。

    訂正:提出したスクリプトに max, min = @h[0], @h.pop という行があるが、min は最小の要素ではない。単に末尾の要素。

  6. 番外2:番外1のチューニング (AC / 549 ms / 10252 KB)

    1. loop メソッド を while 文に。(Q#up_heap, Q#dn_heap)
    2. 要素の交換を繰り返すのではなく、位置が確定してから一度だけ代入するように。(Q#up_heap, Q#dn_heap)
    3. @h.size 値をキャッシュ。(Q#dn_heap)

    これで3割ちょっとの時短。でも JavaScript(Node.js)の提出でもヒープを実装してるのだけど、そちらは 100 ms 台で完了しているのだな。それも値の合計に Q.pop を使用していながら。値の取り出しとそれに続くノードの降下が一番時間を食うというのに。

 Ruby で一番速い解答に学ぶ

2本目の待ち行列(FIFO)を用意すればそれをソート済みに保つのは雑作もない(※)、というのがこの問題の肝であった。長さ M を確保しておけば固定長配列で十分でもある。

1本でやろうとするから、余計な面倒と時間コストがかかる。

※やっぱりまだちょっとわかってないかも。割る2をして2本目の待ち行列の末尾に加える要素と、それまで末尾だった要素の大小関係が一見ではわからない。これがわからないから、毎度のソート(順序維持)操作をしてしまう。

たぶん2番目の待ち行列に飛び込むタイミングがキー。そこから導かれる。でも、うーん、はっきり見えない。操作の前後で2本目の待ち行列の全要素が重なりなく前後に位置するというのが。