正規表現 (regex) の基本

次の表では、ViDi GUI 内で正規表現を使用するためのいくつかの基本について説明します。

アンカー

^

先頭の文字列またはラインを指定します。たとえば、^0 は 0 で始まる文字列を照合します。

:  かっこ内で ^ 文字を使用すると、たとえば、[^0] で ^ は先頭ではないことを意味します。

$

末尾の文字列またはラインを指定します。たとえば、0$ は 0 で終わる文字列を照合します。

基本的な照合

.

単一の文字を照合します。

:  ピリオドを照合するには、スラッシュを使用してドットをエスケープする必要があります。たとえば、「\.」のように入力します。

\d

0123456789 の範囲の任意の数字を照合します。

実際の数字、0~9 は数字を入力することで表現することもできます。

\w

任意の文字、数字、およびアンダースコア文字 (_) を照合します。

実際の文字は大文字と小文字が区別され、文字 a~z または A ~ Z を入力することで表現することができます。

\s

空白を照合します。

特定の文字

[...]

特定の文字の照合には、角かっこ [ ] が使用されます。特定の文字は角かっこ内で定義されます。たとえば、[a-z] は a から z までの小文字を照合し、T[ao]p は Tap または Top を照合します。かっこは、[A-C][0-3][g-i] などの複合構造体で使用できます。この場合、A0g、A0h、B1i、および C3g の文字列を照合します。

繰り返し

{...} 中かっこ { } は、繰り返しを示すために使用されます。たとえば、t{2} は 2 つの「t」を返します。[def]{3} は「d」、「e」、または「f」が含まれる 3 文字を返します。.{1,4} は任意の 1 文字と 4 文字間を照合します。

*

文字または数字の 0 以上のインスタンスを示します。たとえば、a* は 0 以上の文字を照合します。

+

文字の 1 つ以上のインスタンスを示します。たとえば、[nop]+ は、1 つ以上の「n」、「o」、または「p」文字を照合します。

オプションの文字

?

疑問符 ? は 0 または 1 つの先行する文字またはグループの照合に使用されます。たとえば、12?3 は「123」または「13」を照合します。

:  疑問符を照合するには、スラッシュを使用して疑問符をエスケープする必要があります。たとえば、「\?」のように入力します。

グループ分け

(...)

かっこは、1 ペアのかっこ内のサブパターンがグループを構成するように、文字のグループを定義するために使用されます。これは、画像のファイル名から情報を抽出する場合に非常に有用です。たとえば、Good_0001.png のような特定の命名規則を使用する画像を抽出し、それら画像のみを返すようにしたい場合、^(Good.+)\.png$ を使用することができます。

また、かっこを使用して、ネストされたグループをキャプチャすることもできます。上記の例を使用した場合、^(Good(\d+))\.png$ などで、数字に基づいて検索を絞り込むことができます。

また、前述の量指定子をかっこ内で使用して、パターンをキャプチャすることもできます。たとえば、1000 より大きい領域の候補をキャプチャする場合、(\d{4})x(\d{4}) を使用することができます。

論理的 OR 識別子 | を使用すると、異なる文字セットの候補を示すことができます。たとえば、ファイル名のセットで「scratch」、「dent」、または「hole」 を返すようにしたい場合、^(Bad(\d+)(scratch|dent|hole))\.png$ を使用することができます。