split()の第一パラメータ separatorが空文字列にマッチするかどうかで結果が異なる。
"".split(" ").length; // 1 (空文字列にマッチしないから)
"".split("").length; // 0 (空文字列にマッチするので)
"".split(/\s+/).length; // 1 (空文字列にマッチしないから)
"".split(/^$|\s+/).length; // 0 (空文字列にマッチするので)
function getClasses(element) {
return element.className.split(/^$|\s+/);
}
上の functionでは classNameが空っぽの時には空文字列の要素を作らないが、頭や尻尾に空白が付いていると空文字列の要素が残る (IEを除いて)。事前にトリミングする手間をかけるくらいなら一個二個の空文字列を気にせず(だけど連続する空文字列の要素は気にしてる) className.split(/\s+/) とする方が好みだな。
IE7と Firefox2で異なる。Firefox2の方が正しいが無限ループに陥りやすい。
var re = /\b/g; // 単語境界にマッチする、幅0のメタ文字。
var str = "012 456 89A";
re.lastIndex = 0;
for(var i = 0; i !== 5; ++i) {
alert("("+ re.exec(str).index +","+ re.lastIndex +")");
// IE7: (0,1) (3,4) (4,5) (7,8) (8,9) ...
// Fx2: (0,0) (0,0) (0,0) (0,0) (0,0) ...
}
空文字列にマッチしていれば(IE7でスキップされるマッチがでてくる) exec()の前後で lastIndexの値が変わっていなければ(Fx2でのマッチ回数が IE7より増える) indexと lastIndexが同じならば lastIndexを 1インクリメント、としておくとどちらでも間違いが起こらない。
var re = /\b/g;
var str = "012 456 89A";
re.lastIndex = 0;
for(var i = 0; i !== 5; ++i) {
var index = re.exec(str).index;
alert("("+ index +","+ re.lastIndex +")");
// IE7: (0,1) (3,4) (4,5) (7,8) (8,9) ...
// Fx2: (0,0) (3,3) (4,4) (7,7) (8,8) ...
if(index === re.lastIndex) {
++re.lastIndex;
}
}
ループで
if(index === re.lastIndex) {
++re.lastIndex;
}
なんて分岐を増やすより、文字列末尾にマッチする /$/ を例外として*、正規表現から空文字列にマッチする可能性を排除する方が良さそう。
* /$/.exec("str") の後の lastIndexプロパティは IE7、Fx2とも、最後の文字の次を指す。