以下、変更点のリスト。(\bの使い方が適当なのでスペースの少ないソースで問題が出る可能性あり。\bの使いどころが全然わかってないせい)
{ // part of Kernel methods.
'regex': /\b(?:defined\?|Array|Floar|Integer|String|abort|callcc|exec|exit!?|fork|proc|lambda|set_trace_func|spawn|syscall|system|trace_var|trap|untrace_var|warn)\b/g,
'style': 'sh_preproc'
},
なくてもいいかな、と思うけど defined?と Kernelモジュールのメソッドの一部を sh_preprocとして追加。Rubyで sh_preprocなのは requireだけなので sh_preprocの配色を流用した。選んだのは abort、callcc、exit、fork、systemなど比較的重要そうなもの。(loopなど一部の他のメソッドは sh_keywordとして既に分類されている)
{
'next': 4,
'regex': /<(?=[\w\/])/g,
'style': 'sh_string'
},
正規表現を /</g から変更。<<メソッドやヒアドキュメント(<<HOGE)にマッチしないように。
{ // Symbol
'regex': /:(?:(?:@@|@|\$)?\w+[\?!]?|\+=?|!=?|~|\*\*=?|-=?|\*=?|\/=?|%=?|<<=?|>>=?|&=?|\|=?|^=?|>=?|<=?|<=>|===?|=~|!~|&&=?|\|\|=?|\.\.|\.\.\.|=)(?=\s|$)/g,
'style': 'sh_string'
},
新ルール。シンボル(:hoge)を sh_stringとして色付け。
{ // %!string!
'regex': /%[Qq]?([!-'*-\/:;=?^]).*?\1/g,
'style': 'sh_string'
},
新ルール。%!string!、%Q!string!、%q!string!を sh_stringとして色付け。残念ながら %Q[]のように括弧を使ったものは入れ子になった括弧を数えられないので非対応。対応した。詳しくは下の方。
{
'regex': /(?:\b(?:alias|begin|BEGIN|at_exit|break|case|do|else|elsif|end|END|ensure|for|if|in|include|loop|next|raise|redo|rescue|retry|return|super|then|undef|unless|until|when|while|yield|and|not|or|def|class|module|catch|fail|load|throw)\b|&&|\|\|)/g,
'style': 'sh_keyword'
},
ここにはプログラムの流れや定義に関するキーワードや Kernelメソッドが集められているようなので、既に登録されている ENDと同じ働きの at_exitを追加し、definedを削除(上で sh_preprocとして defined?を登録済み)、false、nil、self、true、__FILE__、__LINE__を削除し、あとで定数として定義。&& と || を and、orに対応するものとして追加。
{ // global variables
'regex': /\$(?:[_&~`'\+\?!@=\/\\,;\.<>\*\$:"]|-?[A-Za-z0-9_]+)/g,
'style': 'sh_type'
},
グローバル変数の定義を追加。sh_typeはインスタンス変数やクラス変数のクラス名として使用されているもの。
{ // Constants
'regex': /\b[A-Z]\w+[!\?]?(?=\b|$)/g,
'style': 'sh_function'
},
{ // Constants
'regex': /\b(?:false|nil(?!\?)|true|self|__FILE__|__LINE__)(?=\b|$)/g,
'style': 'sh_function'
},
定数のルールを追加。sh_functionは Rubyでは使われていないクラス。
{
'regex': /[a-z0-9_]+(?:\?|!)/g,
'style': 'sh_normal'
},
正規表現を /[A-Za-z0-9_]+(?:\?|!)/g から変更。定数は区別したいじゃない。
{
'exit': true,
'regex': /$/g
},
文字列リテラルの終了条件に上のは必要ない、むしろこれがあることで複数行にまたがったリテラルを正しく認識できない、のだけど強力すぎる正規表現は誤認識があったときにソースを最後まで一色に染めてしまう危険性があるのでそのままにしている。ヒアドキュメントに対応しないのも同じ理由。
{ // %r(regexp)
'next': 6,
'regex': /%r[\(<\[\{]/g,
'style': 'sh_regexp'
},
{ // %x(command), %w(array)
'next': 7,
'regex': /%[xWw][\(<\[\{]/g,
'style': 'sh_normal'
},
{ // %(string)
'next': 8,
'regex': /%[Qq]?[\(<\[\{]/g,
'style': 'sh_string'
},
[
{
'exit': true,
'regex': /$/g
},
{
'next': 6,
'regex': /[\(<\[\{]/g,
'style': 'sh_regexp'
},
{
'exit': true,
'regex': /[)>\]}]/g
}
],
[
{
'exit': true,
'regex': /$/g
},
{
'next': 7,
'regex': /[\(<\[\{]/g,
'style': 'sh_normal'
},
{
'exit': true,
'regex': /[)>\]}]/g
}
],
[
{
'exit': true,
'regex': /$/g
},
{
'next': 8,
'regex': /[\(<\[\{]/g,
'style': 'sh_string'
},
{
'exit': true,
'regex': /[)>\]}]/g
}
],
括弧の対応をチェックすることはするけどカッコの種類を区別しないので
%(foo{bar)baz}
こんなのも通る。でも現実的には区別する必要ないよね。HTML断片を組み立てるときに問題がありそう。そしてそういうときにこそダブルクォーテーションを使わずに %[]を使うんだよね。試してみる。
html << %[<option value="#{h hoge}"] << (selected? ? ' selected="selected">' : '>') << h(hoge) << "</option>\n";
やっぱりダメだ〜。
上で出した「こんなのも通る」と「やっぱりダメだ〜」の例が、言葉とは裏腹に「通ってない」と「ちゃんとできてる」状態になってると思う。だとしたら成功。
変更点は20080102p01で。
# for variable interpolation, #{ is not a comment
というコメントを付けて #{}のハイライトルールを定義しているにも関わらず、それが #コメントルール よりも後ろにあるために機能していなかった。#コメントルールを後ろに持ってきて解決。
続きは20080105p01で。
最終更新: 2010-01-06T04:21+0900
こちらを参考にしました。http://www.revulo.com/blog/?date=20070817#p01
http://shjs.sourceforge.net/doc/download.html の download a binary distribution をたどってダウンロードした ZIPファイルを tDiaryのインストールディレクトリの下に展開する。
今日まで複数行PRE記法の存在すら知らなかったわけだけど、hikidoc.rbには複数行PREにシンタックスハイライト機能を簡単に追加するためのコードが既に存在していた。(参照:http://kazuhiko.tdiary.net/20060915.html#p01)
けれど、もう SHJSを使うことに決めているので、その部分の二行をコメントアウトしてその下に一行付け加えた。
def parse_pre( text )
ret = text
ret.gsub!( /^#{MULTI_PRE_OPEN_RE}[ \t]*(\w*)$(.*?)^#{MULTI_PRE_CLOSE_RE}$/m ) do |str|
begin
raise if $1.empty?
# convertor = Syntax::Convertors::HTML.for_syntax($1.downcase)
# "\n" + store_block( convertor.convert( unescape_html( restore_pre( $2 ) ) ) ) + "\n\n"
"\n" + store_block( %Q[<pre class="sh_#{$1.downcase}">%s%s</pre>] % [parse_plugin( %Q{{{ shjs('#{$1.downcase}') }}} ), restore_pre( $2 )] ) + "\n"
rescue
これにより
<<<ruby ruby script here >>>
が
<pre class="sh_ruby"> ruby script here </pre>
へと変換される。あとはブラウザが javascriptに従って構文を色分けしてくれるというわけだ。
SHJSのスタイルシートとスクリプトを日記に埋め込むためのプラグイン。SHJSに同梱されているたくさんの CSSファイルのプレビュー機能が欲しくて設定画面も作った。
日記の中で明示的に呼び出して使うプラグインではないので、shjs.rbを有効にして一度 設定を済ませてしまえば、あとは複数行PRE記法で言語名を指定したときに勝手に構文がハイライトされる。(ではどこで呼び出されるのかといえば、前項の misc/lib/hikidoc.rbに忍ばせてあったのだ)
動作テストもかねて shjs.rbの全文を貼り付けてみる。(後半は Rubyスクリプトというより HTMLなんだけど、なんで HTMLタグがうまく色づけされてるんだ?)
def shjs_init
@shjs_required_langs = [];
'';
end
def shjs(lang, code=nil)
@shjs_required_langs.push(lang) if(@shjs_required_langs and not @shjs_required_langs.include?(lang));
return code.nil? ? '' : %Q[</p>\n<pre class="sh_#{h lang}">#{h code}</pre>\n<p>];
end
def shjs_footer
return (@shjs_required_langs && !@shjs_required_langs.empty?) ? <<"HTML" : '';
<link rel="stylesheet" type="text/css" href="#{h shjs_style_url}">
<script type="text/javascript" src="#{h shjs_js_url}"></script>
#{@shjs_required_langs.sort.map{|lang|
%Q[<script type="text/javascript" src="#{h shjs_js_url(lang)}"></script>]
}.join("\n")}
<script type="text/javascript">
sh_highlightDocument();
sh_languages = null;
</script>
HTML
end
def shjs_style_url(css=@options['shjs_style'])
url = '';
url << (@options['shjs_url'] || 'shjs');
url << (css ? "/css/#{u css}.css" : "/sh_style.css");
return url;
end
def shjs_js_url(lang=nil)
url = '';
url << (@options['shjs_url'] || 'shjs');
url << (lang ? "/lang/sh_#{u lang}.min.js" : '/sh_main.min.js');
return url;
end
add_header_proc{
shjs_init;
'';
}
add_footer_proc{
shjs_footer;
}
if(@mode.index('conf'))
def shjs_csslist
unless(@shjs_csslist)
@shjs_csslist = [];
Dir.chdir("#{@options['shjs_dir'] || 'shjs'}/css"){
Dir.glob('*.css').sort.each{|css|
@shjs_csslist.push(css.chomp('.css'));
}
}
end
return @shjs_csslist;
rescue Exception
@shjs_csslist_errmsg = $!.to_s;
return [];
end
def shjs_saveconf
@conf['shjs_style'] = @cgi.params['shjs_style'][0].to_s;
@conf['shjs_url'] = @cgi.params['shjs_url'][0].to_s.chomp('/');
@conf['shjs_dir'] = @cgi.params['shjs_dir'][0].to_s.chomp('/');
%w(shjs_style shjs_url shjs_dir).each{|key|
@conf.delete(key) if(@conf[key].empty?);
}
end
add_conf_proc( 'shjs', 'SHJS シンタックスハイライト', 'theme' ){
shjs_saveconf if(@mode == 'saveconf');
shjs_init; shjs('ruby');
<<-"CONFFORM".sub('RUBYSCRIPT', h(<<-'RUBYSCRIPT'.gsub(/^\t+/, '')))
<h2 class="subtitle">SHJS - Syntax Highlighting in JavaScript</h2>
<p>http://shjs.sourceforge.net</p>
<h3>配色設定 (shjs_style)</h3>
<p><select name="shjs_style"><option value="">sh_style</option>#{
shjs_csslist.map{|style| %Q[<option#{' selected="selected"'if(style==@conf['shjs_style'])}>#{h style}</option>] }.join('')
}</select></p>
<p>サンプル Rubyスクリプト</p>
<pre class="sh_ruby">RUBYSCRIPT</pre>
<p>デフォルトは <nobr>#{h @conf.base_url}shjs/sh_style.css</nobr></p>
<p>すこし上にスタイルシートのリストが表示されていないときは shjs_dirを先に設定してください。</p>
<p><strong>#{@shjs_csslist_errmsg}</strong></p>
<h3>SHJSをインストールしたフォルダ (shjs_dir)</h3>
<p>sh_main.min.jsファイルと sh_style.cssファイル、cssフォルダと langフォルダが入ったフォルダです。</p>
<p>デフォルトは <nobr>#{h Dir.pwd}/shjs</nobr></p>
<p><input name="shjs_dir" type="text" value="#{h @conf['shjs_dir']}" style="width:90%"></p>
<h3>shjs_dirにブラウザでアクセスするときの URL (shjs_url)</h3>
<p>デフォルトは <nobr>#{h @conf.base_url}shjs</nobr></p>
<p><input name="shjs_url" type="text" value="#{h @conf['shjs_url']}" style="width:90%"></p>
CONFFORM
$KCODE = 's'
require 'shjs'
def say_hello
puts :hello
end
10000.times{ say_hello }
%w[this is not string literal but array.]
if @mode =~ /\A(save)?conf\z/i
# show config form.
end
exit unless defined? Const;
RUBYSCRIPT
}
end
プラグインメソッド shjs()に二番目のパラメータ(code)を追加。これで、SHJSをサーバーへコピーして、shjs.rbを有効化&設定するだけでシンタックスハイライトを使うことができる。hikidoc.rbの変更は不要。
{{shjs 'ruby', <<RUBY
print "hello"
print "hello"
print "hello"
RUBY}}
と書くと
print "hello" print "hello" print "hello"
こうなる。複数行PRE記法よりタイプ数は多くなるけど、プラグインの枠内におさまってるので tDiary本体をいじるハードルはなくなった。この前書いたようにスタイル関連のスクリプトで迂闊に NameErrorを発生させるとその日の日記がなかったことになるので、避けられる危険は避けるに越したことはない。
shjs.rbで埋め込む SCRIPTタグに defer="defer"を付けようかと思っていたら逆に window.onloadで実行していた sh_highlightDocument() をその場で実行することに。
window.onloadって画像も含めた全ての外部ファイル読み込みが終わってから呼ばれるんだよね。でもページが読める状態になっても読み込みが完了していないことってザラにあるわけで、それじゃ遅い。色のついてないコードを見せてしまうことになる。
今度 sh_highlightDocument()を呼ぶ場所(タイミング)は HTMLのほとんど末尾なので操作対象の DOMは既にアクセス可能になっている。問題なし。ではスクリプトの方は?
sh_highlightDocument()を定義する sh_main.js(sh_main.min.js)ファイルの評価が終わる前に sh_highlightDocument()を呼ぶことはできない。sh_main.min.jsを読み込む SCRIPTタグに試しに defer="defer"を付けたら Firefoxでは問題はなかったが IE7は期待通りにエラーを出してくれた。defer="defer"を付けるわけにはいかない。(付けなければ大丈夫なのかは別の問題だけど、今のところエラーは出ていない)
そんなわけで HTMLのレイアウトを優先するつもりがスクリプトの実行を優先する結果になってしまった。
<link>は <head>内に置かなければいけない。
ハイライト機能を使ったときだけ SHJS関連の CSSや JSファイルを参照したいから footer_procで <link>や <script>を出力しているが、これは本文が評価される前の header_procの時点*では SHJSが使われているか否か判断できないからこうなっている。
Firefox2も IE7もよきに計らってくれるので実害はない。
--- hikidoc.rb.002 Sun Jan 13 01:19:03 2008
+++ hikidoc.rb Sun Jan 13 04:02:25 2008
@@ -668,6 +669,12 @@ class HikiDoc
syntax = info ? info.downcase : nil
if syntax
begin
+ # Use "Syntax Highlighting in JavaScript"
+ # instead of Syntax::Convertors::HTML.
+ @f.print %Q(<pre class="sh_#{escape_html_param syntax}">), text(str), "</pre>\n"
+ @f.puts inline_plugin(%Q(shjs #{syntax.dump}))
+ return
+
convertor = Syntax::Convertors::HTML.for_syntax(syntax)
@f.puts convertor.convert(str)
return
* Hikiでは header_procの呼び出しより本文の評価の方が早い気がする。header_procで初期化とかしてるとはまる。