OHDL - match

メタ文字一覧

文字	説明
.	\n 以外の任意の1文字に一致します。\r とは一致する事に注意してください。
*	直前のパターンの0回以上の繰り返しに一致します。たとえば、HSP!* は "HSP" と "HSP!" と "HSP!!" いずれにも一致します。
+	直前のパターンの1回以上の繰り返しに一致します。たとえば、HSP!+ は "HSP!" と "HSP!!" には一致しますが、"HSP" には一致しません。
?	直前のパターンの0回または 1 回の繰り返しに一致します。たとえば、HSP!? は "HSP" と "HSP!" に一致します。
{n,m}	直前のパターンの n 回以上 m 回以下の繰り返しに一致します。たとえば、\d{3,4} は 3桁または4桁の数字に一致しますが 2桁の数字には一致せず、5桁の数字には最初の4桁だけが一致します。mを省略するとn 回以上の繰り返しに一致し、カンマとmを省略するとn 回ちょうどの繰り返しに一致します。{0,1} は ? と同じ意味になり、{1,} は + と、{0,} は * と同じ意味になります。{ }の間には余分な空白などを入れてはいけません。
*? +? ?? {n,m}?	* + ? {n,m} のような繰り返し指定のメタ文字は通常、最も長い文字列と一致しますが、これらのメタ文字直後に ? をおくと最も短い文字列と一致します。たとえば、"<abc><def>" という文字列をパターン <.> で検索した場合、文字列全体と一致しますが <.?> と検索した場合は "<abc>" と "<def>" の二つに分けて一致するようになります。
[string]	string に含まれるいずれかの一文字と一致します。たとえば、HSP[123] は "HSP1" と "HSP2" と"HSP3" に一致しますが "HSP4" には一致しません。また、二つの文字を-でつなげば範囲指定が可能です。例えば [a-z] は任意の英小文字一文字に一致し、[a-zA-Z] は任意の英字一文字に一致します。-自体を検索する場合は [-a-z] のようにします。stringには $ などのメタ文字を使用してもメタ文字と解釈されませんが、一部を除く \ で始まるメタ文字は機能します。
[^string]	[string] とは逆に string に含まれない任意の一文字と一致します。たとえば、HSP[^1-3] は "HSP4" や "HSP5" に一致しますが "HSP1" と "HSP2" と"HSP3" には一致しません。
\|	論理和(OR)検索をします。たとえば、abc\|def は "abc" と "def" に一致します。\| は他の文字より評価の優先順位が低いので ( ) と組み合わせるのが便利です。
(pattern)	pattern を一つのグループとします。たとえば、20(09\|10) は "2009" と "2010" に一致します。また、pattern に一致する文字列をサブマッチとして後方参照することが出来ます(最大99個)。
(?:pattern)	サブマッチとして利用できない以外は (pattern) といっしょです。(pattern)を使う場合に比べてメモリの節約になります。
(?=pattern)	pattern に一致する文字列の直前の位置に一致します。たとえば、HSP(?=2\|3) は "HSP2" と "HSP3" の"HSP"に一致しますが "HSP1" の"HSP"には一致しません。また、サブマッチとしての利用は出来ません。
(?!pattern)	pattern に一致しない文字列の直前の位置に一致します。たとえば、HSP(?!2)\d は "HSP1" や "HSP3" に一致しますが "HSP2" や "HSPa" には一致しません。また、サブマッチとしての利用は出来ません。
\num	サブマッチと同じ文字列に一致します。一つ目のサブマッチは\1で最大\99まで指定できます。たとえば、(.)(.)\1\2 は "abab" や "0101" のような交互に繰り返す文字列に一致し、<(.?)>.</\1> は "<a>hoge</a>" や "<b>hoge</b>" に一致します。対応するサブマッチがない場合は8進文字コードと見なされます。
^	行頭に一致します。つまり、文字列の先頭および \n または \r の直後の位置に一致します。
$	行末に一致します。つまり、文字列の最後および \n または \r の直前の位置に一致します。
\	\の次にメタ文字をおくと、その文字と一致します。たとえば、\( は "(" に一致し \? は "?" に一致します。また、\\ は "\" に一致します。
\n	改行(LF)に一致します。\x0a および \cJ と同じです。
\r	改行(CR)に一致します。\x0d および \cM と同じです。
\t	タブに一致します。\x09 および \cI と同じです。
\f	フォームフィードに一致します。\x0c および \cL と同じです。
\v	垂直タブに一致します。\x0b および \cK と同じです。
\c	Ctrlキーで入力できる制御文字に一致します。\cに続けて英字一文字を指定します。たとえば、\cM は Ctrl + M キー(改行文字)に一致します。
\b	単語の境界に一致します。たとえば、run\b は "run" には一致しますが "running" の "run" には一致しません。
\B	単語の境界でない位置に一致します。たとえば、run\B は "running" の "run" には一致しますが "run" には一致しません。
\d	数字一文字に一致します。[0-9] と同じです。
\D	数字以外の一文字に一致します。[^0-9] と同じです。
\s	スペースやタブなどの空白文字に一致します。[ \f\n\r\t\v] と同じです。
\S	空白文字以外の任意の一文字に一致します。[^ \f\n\r\t\v] と同じです。
\w	単語に使用される任意の一文字に一致します。[A-Za-z0-9_] と同じです。
\W	単語に使用される文字以外の任意の一文字に一致します。[^A-Za-z0-9_] と同じです。
\x	16進文字コードです。\xに続けて2桁の16進数を指定します。たとえば、\x41 は "A" に一致します。
\	8進文字コードです。\に続けて3桁の8進数を指定します。たとえば、\101 は "A" に一致します。
\u	Unicodeです。\uに続けて4桁の16進数を指定します。たとえば、\u3042 は "あ" に一致します。

submatch	正規表現で検索して最初に一致したサブマッチ文字列を返す	(mod_regexp)
matches	正規表現で検索した複数の結果を取得する	(mod_regexp)
replace	正規表現で文字列の置換を行う	(mod_regexp)

プラグイン / モジュール	mod_regexp
備考	Internet Explorer 5.5 以上が必要
グループ	正規表現検索命令
ヘッダファイル	common\mod_regexp.as

match

解説

サンプル

関連項目

情報