テキストファイルをあとから利用するときには、検索機能がよく使われます。必要な情報がどこにあるかを調べるためです。
情報がどのファイルの中にあるかがわかっていれば、この方法は有効ですが、ファイルがたくさんあり、どこに情報があるかわからない場合、順番に全部のファイルを見ていくのは非効率ですね。そのような場合に使いたい技が「Grep+タグジャンプ」です。利用するツールは、Windows用の無料のエディタ(テキスト編集)ソフト「サクラエディタ」です。Mac用のエディタ「miエディタ」でも同じことが行えます。
Grepとは
Grepとは、複数のファイルから特定の文字を検索する機能です。複数のファイルから検索する文字を含むファイルと、その文字が何行目に含まれるか、その行にはなにが書かれているかといった情報を一覧することができます。結果を新しいテキストファイルとして保存することも可能です。
Grep機能を使うときに最低限必要な情報は、「検索文字列」と「ファイルのある場所」です。対象となるのはテキスト系のファイルです。テキストファイルはもちろん、テキストで構成されるHTMLファイルなども対象に含まれます。ただし、Word文書などのバイナリファイルは、残念ながら検索できません。
というわけで、Grepが役立つのは「テキスト系のファイルがたくさんある」という状況であることがわかります。
たとえば、筆者は日々の行動記録をテキストファイルに綴っています。「日記」フォルダのなかに約3000個のファイルがあり、日々、増加しています。
また、仕事で書いた原稿は「原稿」フォルダに保存しています。Word文書で提出する場合も元原稿はテキストファイルで作成し、最終的にWordに落とし込んで提出しています。テキストでも保存しておいたほうがあとからの検索性がよくなるからです。こうした環境では、Grepは非常に有効と言えます。
Grepを使ってみる
それでは、実際にGrepによる検索を行ってみましょう。
筆者は今年はじめに昨年読んだ本を振り返ってみました。「なにを読んだっけ?」と思ったときに、すべての日記を読み返すのは現実的ではありません。そこで、Grep検索を使い、「読了」というキーワードを使っている行だけを抜き出してみましょう。まず、去年書いた日記をひとつ、サクラエディタで開いてみます。ツールバーの「検索」から「Grep」を開きます。
▲サクラエディタを開く。ツールバーの「検索」から「Grep」を選ぶ
すると、Grep画面があらわれます。
たくさん指定項目がありますが、そのままにして、まず「条件」の項目にキーワード(検索語)を入力します。今回は「読了」としました。続いて「検索場所」を指定します。「…」をクリックし、フォルダを選択しましょう。今回はすでに日記ファイルのひとつを開いているので「現フォルダー」をクリックすればOKです。「サブフォルダーも検索」はデフォルトでオンになっています。必要なければオフにしてもかまいません。
▲検索するフォルダーを指定する。一から選ぶなら「…」をクリック。いま開いているファイルの場所を指定するなら「現フォルダー」ボタンをクリックする
「対象ファイル」に指定されている「*.*」はすべてのファイルという意味です。テキストファイルだけに限定するなら「*.txt」としますが、とくに指定する必要はないでしょう。
同じく、「除外ファイル」「除外フォルダー」などもこのままにしておきましょう。「結果出力」「結果出力形式」「その他」は、一旦そのままで大丈夫です。Grep検索に慣れてきたら、いろいろ試してみてください。文字コードセットは「自動選択」で問題ありません。検索を実行するには「検索」ボタンをクリックします。
▲「検索」ボタンをクリックすると、一覧リストが表示される
一覧リストが新規ファイルとして表示されます。目視なら数日はかかったであろう作業が数秒で終わりました。内容は、ファイルの場所、ファイルの名称、()内に文字数、文字コード、キーワードの含まれる行の五つです。行の内容は長文の場合もありますが、一列一行になるように設定されているので、表示は見やすいです。
さきほど「対象ファイル」で特に指示をしなかったので、ここでは記録を残し始めた2015年以降の「読了」本がすべて表示されました。余談ですが、私は日記のタイトルを年月日にしているので、たとえば、対象ファイルを「2022*.*」とすれば、2022年の日記だけを一覧表示することも可能です。一覧はテキストファイルですので、自由にコピーが行えます。編集する場合は、必要な部分だけコピーして新規ファイルとして編集しましょう。
目的のファイルに直接ジャンプする
一覧のなかに目的のファイルを見つけたとしても、フォルダの中から目視で探し出すのは面倒です。そこで、次にこの一覧ファイルから、目的のファイルを直接開く方法を説明します。この方法を「タグジャンプ」と呼びます。ここでは12月17日の「読了」箇所にジャンプしてみましょう。
まず一覧の中からカーソルを目的の位置に移動します。次にツールバーの「検索」から「タグジャンプ」を実行するか、キーボードの「F12」キーを押します。
▲一覧から目的の行を選択し、「検索」メニューから「タグジャンプ」を選択する
すると、別ファイルとして「2022年12月17日(土).txt」ファイルが開き、直接目的の場所にカーソルが移動します。いちいちキーワードのある場所を探す必要がないので、長文のときにとくに重宝します。
▲探しているファイルが別ウインドウで開く
情報をうまく見つけるコツ
情報をうまく見つけるには、あらかじめ見つけやすい仕組みにしておくことが大事です。
筆者は日録をつけるときに、あとから検索することを意識して、なるべく言葉を統一することを心がけています。「読了」「完読」「読み終わる」などといろいろな表記をしていると、抜けが出てしまうからです。ほかには、なるべくものごとを具体的に記述すること、とくに固有名詞を調べて書くことを意識しています。自分だけにわかるような省略の仕方をしていると、そのときには大丈夫でも、数年後には忘れてしまったりするので要注意です。データは蓄積するほど役に立つものですから、なるべく、
- キーとなる言葉を統一する
- 固有名詞を使う
を意識して書くといいのではないでしょうか。
今回はたくさんのファイルの中から一覧表を作る例を紹介しましたが、ひとつの長文を対象にして、同様のやり方でキーワードの出てくる部分の一覧を作ることもできます。
仕事にプライベートにさまざまなシーンで活用できるので、ぜひGrepとタグジャンプの組み合わせを試してみてください。
インターネットを最大限楽しむには「ビッグローブ光」の光回線がオススメ!
「インターネット回線が遅い」
「インターネット料金が高い」
などのお悩みはありませんか?
安定した速度とリーズナブルな光回線なら、
IPv6接続(IPoE方式)*1で最大1Gbps*2の「ビッグローブ光」がオススメです。
「ビッグローブ光」なら他社の光回線(フレッツ光・コラボ光)をお使いでもお乗り換えはかんたんです。
工事費実質無料、おトクな特典もご用意しています。
*1 IPv6に対応していないサービス/サイトはIPv4接続となります。
*2 最大通信速度は光回線タイプによって異なります。最大通信速度はお客さまのご利用機器、宅内配線、回線の混雑状況などにより低下します。