/
最近
.rdf
追記
編集
設定
本棚
翌日へ
前日へ
脳
l
o
g
[
2
0
1
2
0
1
0
8
]
2
0
1
2
年
0
1
月
0
8
日
(
日
)
[
正規表現
]
[
R
u
b
y
]
\
w
と
\
b
の話
。
俺は
T
a
k
a
t
a
さんが期待したように
、
P
e
r
l
と
P
y
t
h
o
n
に倣
った動作が自然なものだと思う
。
正規表現の利用者として
、
正規表現にはカギ括弧付きで使われ
る
「改行
」と
「単語
」
という言葉が一部のメタ文字の動作仕様に現れると思
ってきた
。
$
と
^
と
.
と
\
w
と
\
b
のことだ
。
\
w
の意味を規定す
る
「単語
」
と
、
\
b
の意味を規定す
る
「単語
」
が別物だなんて事態は
、
事をややこしくするだけではない
か
。
一体どれだけの正規表現利用者が
R
u
b
y
に固有のこだわり仕様に気付くというの
か
。
他の実装の利用経験から手探りで使う人間も多いだろうに
、
落とし穴を掘るまねはよせ
。
■
「
\
b
は
\
p
{
W
o
r
d
}
に従う
」
というル
ールはいただけない
。
\
p
{
W
o
r
d
}
は知らなくても
\
w
と
\
b
は知
ってるという人間は大勢いる
。
■もしかして
、
R
u
b
y
1
.
8
では
/
\
w
/
s
とか
/
\
w
/
e
が
A
S
C
I
I
範囲外の全ての文字にマ
ッチしてた
?
ドキ
ュメ
ン
トでは
[
0
-
9
A
-
Z
a
-
z
_
0
-
9A
-
Za
-
z
]
のようなものだと言いながら?
\
d
は全角数字にマ
ッチしないままで?その精神がわからん
。
そして俺は
(
R
u
b
y
の
)
\
w
を知
っていたとはいえないようだ
。
もはやどうにでもなれ
。
■
(
ドキ
ュメ
ン
トを読んだつい
で
)
「
\
b
文字クラス指定の外では語境界
(
\
w
と
\
W
のあいだにマ
ッチ
)
。
文字クラス指定内ではバ
ックスペ
ース
(
0
x
0
8
)
。
」
翌日へ
前日へ