CJコラム

【初心者向け】Grep検索で特定の文字列を抽出する手順まとめ

こんにちは。WebディレクターのNです。

普段、ファイルの中に記述されているキーワードや文字列を抽出したいとき、皆さんはどのように検索していますか?まずはファイルを開いてショートカットキーCtrl+F(またはCommand+F)で検索してます、という方がほとんどかと思いますが、

例えば、
・そもそもどのファイルに目的の文字列が記述されているかわからない
・検索対象のファイルが大量にある

こんなケースの場合、ファイルを一つ一つ開いて検索…をひたすら繰り返すのはなかなか大変な作業ですよね。
そこで今回は、Grep検索なを使って、より効率的に特定の文字列を抽出する手順を紹介してみたいと思います。
それではさっそくいってみましょう!

 

目次
——————————–
1.Grep検索とは
2.検索の手順
3.まとめ
——————————–

 

{1.Grep検索とは}


手順紹介の前に、まずは自分への忘備録もかねてGrep検索とはなんぞや?ついてまとめておきます。
Grepとは「Global Regular Expression Print」の略称で、文字通り「 (Global) ファイル全体から / (Regular Expression) 正規表現*に一致する行を / (Print) 表示」する検索プログラムのことです。

*正規表現とは

検索する文字列を「パターン」で表現する方法です。
特定の「パターン」を検索するために、さまざまな記号(=メタ文字と呼ばれるもの)を用いて条件を指定します。
たとえば、複数ファイルのどこに「犬」という1文字が含まれているかを検索したい場合、[ ]というメタ文字を使って指定します。

[]

Grep検索結果では「犬」が含まれているファイルの文字列が抽出されます。
1.かわいい大型
2.中型はかわいい
3.かわいい小型とあそぶ

参照元:Wikipedia


{2.検索の手順}

今回はサンプルとして、Webサイトで構築したアーカイブファイルの中から「iframe」タグを組み込んでいるファイルのみを抽出してみたいと思います! ※PC環境はWindows10Pro、テキストエディタは「秀丸」を使用しました。

① まずは秀丸エディタを起動し、メニューの「検索」から「grepの実行」を選択。

② grepのダイアログボックスが表示されます。

③ 次に、検索したいファイルが格納されているフォルダの階層を選択します。

④ 検索する文字列、検索するファイルを指定し、正規表現のチェックボックスをONにします。
サンプルでは正規表現を次のように指定しました。

検索する文字列–.iframe(正規表現–.(ピリオド)を使って、iframeという任意の一文字を検索)

検索するファイル–*html


⑤「ON」ボタンをクリックすると、検索結果が一覧表示されます。
リストの並び順はこんな感じです。

ファイル名+行数+半角空白+検索キーワード(黄色ハイライト)が含まれている行

⑥ さらに、文字列(赤枠)をダブルクリックすると抽出元のファイルを開くことができます。

具体的にソースの記述を確認することができるので、便利ですね…

 

{3.まとめ}

以上、Grep検索の手順でした。いかがでしたでしょうか?
正規表現をつかうと、色々な多文字列のパターンを抽出検索することができるのですが、慣れないうちは、どのように指定をすればよいかわからないと思います。まずは今回のサンプルのように、シンプルな1文字検索あたりから初めてみてはいかがでしょうか。
正規表現の動作チェックができる便利ツールもありますので、ぜひ活用してみてくださいね。



▼初心者向け・おすすめ正規表現チェックツール

WEB ARCH LABO Tools
正規表現チェッカー様


今回の記事がみなさまのお役に立てれば幸いです。
それではまた!

 

最新5件の記事