便利正規表現
結構便利だなぁ~と思われる正規表現です。
ちゃんと動くかチェックはしてくださいね(^_^;)
- タグの全消去(複数行にまたがるとNG)
<!--(.|¥n)*-->|<[^>]*>
- /* コメント */の削除(複数行にまたがるとNG)
/¥*/?([^/]|[^*]/)*¥*/
※¥は半角です。
略記法
正規表現の略記版です。
たとえば、本当は、「[a-zA-Z0-9_]」とかかなければならないところを「¥w」だけで済ませられたりして便利です。
- アルファベット、数字、下線(英単語)
¥w
[a-zA-Z0-9_]
- アルファベット、数字、下線(英単語)以外
¥W
[^a-zA-Z0-9_]
- 空白文字(スペース、復帰文字、タブ、改行文字、ラインフィード)
¥s
[¥r¥t¥n¥f]
- 空白文字以外
¥S
[^¥r¥t¥n¥f]
- 数字
¥d
[0-9]
- 数字以外
¥D
[^0-9]
- いずれかの文字列以外(aもbもcも含まない)
[^abc]
- バックスペース
¥b
- タブ
¥t
- 改行
¥n
- 垂直タブ
¥v
- 英単語の始まり
¥<
- 英単語の終わり
¥>
- 文字列(行)の最初
^
- 文字列(行)の最後
$
複数の文字を一度に検索する場合
たとえば「うふふふ」と「うふふふふふ」という単語を探す場合。
「うふ」と「ふ×○」を探す事になります。
もちろん、そのパターンの分だけ検索せずとも一回で検索が終了してしまうのが正規表現の良いところです。
- 0回以上
*
- 1回以上
+
- 0回、1回
?
- ちょうどm回
{m}
- m回以上
{m,}
- m回以上、n回以下
{m,n}c
- ひとつのグループ(aもbもcも含まずabcのみ)
(abc)
- または~(adまたはbc)
ad|b
うふ+
で検索すると両方とも検索されます。
「+」以外も含め上記パターンで試してみてください。
一文字を検索する場合
単体の文字を検索する場合です。たとえば、「あ」という文字だけを検索する場合、普通に「あ」で検索するだけでいいのですが、「あ」と「か」と「さ」を一度の検索だけで見つけたい場合など、とても便利だったりします。
複数のものを検索する時の基本にもなるので覚えておくと◎です(^-^)/
- 「a」が含まれる文字列
a
- ある1文字(ここではa)と任意の1文字
a.
- 漢字だけを検索
[亜-黑]
- ある複数の文字の中のどれか(aもbもcも)
[abc]
- 数字1文字(0~9の数字を書く)を探す
[0-9]
※「1」を探す場合は⇒[1]
- 含まれていない場合を探す
[^0-9]
※「1」以外を探す場合は⇒[^1]
- 特殊文字('*','?','+','¥','[',']','^','ー','|')を検索
¥特殊文字
A HAPPY NEW YEAR!!
あけましておめでとうございます。
今年も宜しくお願いします。
という文章から該当する漢字、数字、英語を探してみてください。
たとえば「a.」など上記のパターンでやってみてください。
正規表現
正規表現は、文字列のパターンを表現する表記法で、文字列の検索・置換を行なうときに利用するものです。
といってもこの便利さを知らない方は、頭に?が浮かぶかもしれません。
正規表現を使えば、パターンで検索を行なったり、複数の異なる文字列を一括して置換したりすることができます。
たとえば、この長い文字列の中から、最初が「a」のものを全部探したいとか、行の先頭の文字だけどうしたいとか…どう考えてもこれを一つずつ探して置換していたら日が暮れてしまう!
といった、検索・置換を恐るべき速さで行えるある意味、魔法です。
私の文章はおかしいので↑あまり有用性が分からないかもしれませんが…
便利な正規表現を紹介していきますので試しに体験してみてください。
表など、たくさんの情報を管理・生成・修正したりするのにとても便利で、一度覚えたらやめられません。
ちなみに正規表現を使うには正規表現に対応したエディタが必要です。
※ほしい方は、正規表現が使える無料のテキストエディタをチェックしてくださいな。
無料でも正規表現に対応したテキストエディタはたくさんあるので活用してみてください。
※分類の分け方はちょっと私的なもので分類しているのでおかしいかもしれません(^_^;)
正規表現サンプル
テキストエディタ