運用自動化ツール

【RHEL系Linux】ファイルやログを自動圧縮する汎用スクリプトの実装と活用法

システムの開発や検証を進めていく中で、ログや一時ファイルが大量に蓄積されていくのが常でした。手動での圧縮や削除は時間の無駄であり、運用中のタスクに組み込むにはある程度汎用性と安全性を備えたスクリプトが必要だと感じていました。

そこで、自分の開発環境で実際に使うことを前提に、任意のファイルやディレクトリを自動的に圧縮し、必要に応じて削除まで行う汎用スクリプトを作成しました。

この記事では、そのスクリプトの構成や設計方針、実行方法までを具体的に解説していきます。

自動圧縮スクリプトの概要と役割

日々の開発作業や検証作業を行っていると、ログファイルや一時ディレクトリが大量に生成され、定期的な整理が必要になります。これらを手動で圧縮・削除する作業は時間と労力を奪うため、自動化によって大幅な効率化が期待できます。

本記事では、私自身が開発環境での運用効率を上げるために作成した、自動圧縮スクリプトの設計とその目的、活用方法について解説します。

圧縮処理にはzstd形式を採用し、ログ出力やエラーハンドリングにも対応しているため、システム運用の一部としても実用的に利用できます。

自動圧縮スクリプトの目的

圧縮スクリプトを作成した背景には、開発中に発生する多量のログファイルやテンポラリデータの存在があります。

特に複数のスクリプトやアプリケーションをテストしている環境では、ディスク容量を圧迫し、パフォーマンス低下やファイル断片化の要因にもなりかねません。 このスクリプトの目的は、単にファイルを圧縮するだけではなく、以下のようなニーズに応えることです。

目的

  • 任意のファイルまたはディレクトリを対象とした圧縮処理
  • 圧縮後に元ファイルを削除するか保持するかを選択可能
  • cronなどと連携し、定期的な運用処理に組み込み可能
  • エラー発生時にもログで追跡できる堅牢な構成

このように、現場の実運用を強く意識した設計思想に基づいています。

スクリプトの特長と設計方針

このスクリプトの設計には、次のような方針を採用しています。用途をログファイルに限定せず、任意のファイル・ディレクトリに対応しているため、アーカイブやバックアップ処理にも応用可能です。

方針

  • 対象ファイル・出力先・モード(削除 or 保持)を引数で指定
  • 圧縮にはzstdを使用し、高速かつ高圧縮率を実現
  • 圧縮レベルを環境変数で制御できる柔軟性
  • 一時ファイルや出力ファイルの存在チェック・整合性検証を内蔵

特に安全性を重視し、以下のような保護ロジックも実装しています:

対策内容説明
再帰圧縮の防止出力先がソースパス配下である場合はエラー終了
不正な出力先の排除ディレクトリパスが出力先に指定された場合は異常終了
圧縮レベルの検証1〜20以外の圧縮レベル指定はエラー扱い
出力ファイルの上書き制御同名ファイルが存在する場合は削除してから再出力

これらの要素によって、実行時の安全性とトラブル時の保守性が確保されており、開発者・管理者双方の運用負担を大きく軽減する構成となっています。

スクリプト構造と設計要素

この自動圧縮スクリプトは、日常の開発業務において即戦力となるよう設計されています。複数のファイル形式や実行環境に柔軟に対応できるよう、構造は極力シンプルかつ汎用性を重視したものとなっています。

ここでは、スクリプトを構成する要素を理解するために、事前に必要となる環境や定義済みの変数、内部関数の概要について解説します。

スクリプトの前提条件と依存関係

このスクリプトを正しく動作させるためには、いくつかの前提となる環境と依存ツールが必要です。まず、共通のログ出力処理を行うために logger.shrcutils.shrc の読み込みが必要です。これらは共通のログ出力関数やエラー処理、文字コード設定処理などを含んでいます。
また、圧縮処理には zstd コマンドが使用されているため、対象サーバーに以下のパッケージがインストールされている必要があります。

dnf install -y zstd

事前に環境変数 TMP_PATH が有効であることも重要です。一時ファイルの生成や処理状況ファイルの保存先としてこの変数を利用しています。

使用される変数と引数一覧

スクリプト内では、実行にあたって以下の変数や引数が使用されています。すべての処理は、getoptsを用いたコマンドライン引数から取得される形式となっています。

項目内容補足
src_path圧縮対象のファイルまたはディレクトリ-s オプションで指定
dst_file出力先となる.zstファイルのフルパス-d オプションで指定
mode0=保持 / 1=削除-m オプションで指定
ZSTD_LEVEL圧縮レベル(1〜20)環境変数で制御可能
tmp_tar中間tarファイルの一時保存パス内部で自動生成

これらの変数に対してバリデーションを行い、未定義・不正な形式・ディレクトリの階層関係などを厳密にチェックします。

実装されている関数の解説

このスクリプトにはいくつかの独自関数が定義されており、それぞれに役割があります。以下に主要な関数の概要を示します。

関数名役割
checkArgs入力引数と環境条件の整合性チェック
usage使い方を標準出力へ表示(エラー時や不正オプション時)
terminateスクリプト終了時の一時ファイル削除処理

特に checkArgs は中心的な関数であり、存在しないファイルや出力先がディレクトリになっていないか、削除モード時に再帰圧縮となる危険がないかなど、実行前にすべてチェックしています。

また trap によってスクリプトが終了した場合でも、一時的に作成された .tar ファイルを安全に削除する設計となっています。

trap 'terminate; [ -f "$tmp_tar" ] && rm -f "$tmp_tar"' 0 1 2 3 15

このように、単純な処理でありながら、実運用で想定されるエラーや事故を事前に防止できる構造を意識しています。

自動圧縮スクリプトの導入手順

ここからは、自動圧縮スクリプトを実際に導入して運用するための具体的な手順を解説します。ファイルの配置先や権限の考慮点、実行オプションの指定方法、さらにzstd圧縮時のパフォーマンスやファイル処理の挙動についても触れていきます。

前提となる実行環境

Beエンジニアでシェルスクリプトを実行する環境は下記の通りとします。

実行環境

BASE_DIR(任意のディレクトリ)

  • scripts
    • bin(実行スクリプト格納領域)
      • <<各種実行スクリプト>>.sh (実行ファイル)
    • com(共通スクリプト格納領域)
      • logger.shrc(共通ログ出力ファイル)
      • utils.shrc(共通関数定義ファイル)
    • etc(設定ファイル等の格納領域)
      • infraMessage.conf(メッセージ定義ファイル)
    • log(スクリプト実行ログの格納領域)
      • スクリプト名.log 
    • tmp(テンポラリ領域)
    • rep(レポート出力領域)

汎用Zstandard圧縮スクリプト

以下は、任意のファイルやディレクトリを対象にzstd形式で圧縮し、必要に応じて元ファイルを削除できる汎用スクリプトです。cronやlogrotateと連携した定期処理にも組み込みやすく、開発・検証環境を問わず幅広く活用できます。

共通ログ出力関数(logger.shrc)、共通ユーティリティ関数(utils.shrc)を前提とした構成となっているため、実行前にこれらの読み込み設定もご確認ください。

スクリプトの配置と権限設定

スクリプトは、他の管理系シェルスクリプト群と統一的に扱えるよう、適切なディレクトリに配置することを推奨します。下記は想定されるディレクトリ構成の例です。

ディレクトリ用途
/home/bepro/projects/scripts/bin実行スクリプト格納場所
/home/bepro/projects/scripts/com共通ライブラリ(logger.shrcなど)
/home/bepro/projects/scripts/tmp一時ファイル格納用

配置後は、以下のコマンドで実行権限を付与してください。

chmod +x /home/bepro/projects/scripts/bin/compress.sh

必要に応じてスーパーユーザー権限での実行も検討します。

スクリプトの実行方法とモード指定

スクリプトは、 -s に対象ファイルまたはディレクトリ、 -d に出力先ファイル、 -m に削除フラグ(0または1)を指定して実行します。
以下は保持モード(元ファイルを残す)の例です。

sh compress.sh -s /var/log/hoge.log -d /tmp/hoge.zst -m 0

元ファイルを削除する場合は -m 1 を指定します。

sh compress.sh -s /var/log/hoge.log -d /tmp/hoge.zst -m 1

どちらのモードでも、圧縮前に出力先ファイルが存在していれば自動的に削除されます。また、出力先がソースディレクトリ配下にある場合はエラーで終了します。

zstd圧縮レベルと一時ファイル処理の動作仕様

スクリプトは、圧縮前に中間ファイル( .tar)を一時的に作成し、それをzstdで圧縮する形式です。これにより複数ファイルを含むディレクトリもまとめて圧縮可能となります。

/home/bepro/projects/scripts/tmp/tmp_compress_12345.tar

この一時ファイルは処理完了後に自動的に削除され、圧縮失敗時も残りません。
圧縮レベルは環境変数 ZSTD_LEVEL によって制御できます。標準では9に設定されていますが、任意に変更可能です。

export ZSTD_LEVEL=19

圧縮レベルは 1〜20 の範囲で指定可能ですが、パフォーマンスと圧縮率のバランスを考慮すると、9〜15程度が推奨です。
また、スクリプト実行時には trap 処理が有効となっており、強制終了された場合でも .tar 一時ファイルは安全に削除されます。

このように、安全性と運用性を両立した仕組みによって、定期処理や手動圧縮などさまざまな場面で安心して活用できるスクリプトとなっています。

実運用における活用例と応用展開

この自動圧縮スクリプトは、単なる手動実行ツールとしてだけでなく、運用現場での定期処理やエラー監視の一部として組み込むことが可能です。ここではlogrotateやcronとの連携による活用例や、ディレクトリごとの定期バックアップ、エラー処理ログの可視化といった実践的な応用例をご紹介します。

ログローテート後の自動圧縮への応用

Linuxシステムでは、 logrotate によってログを日次や週次で分割・退避する運用が一般的です。自動圧縮スクリプトをこの処理の直後に組み合わせることで、ログファイルを不要に保持することなく、圧縮して退避できます。

以下は logrotate の postrotate セクションでスクリプトを呼び出す例です。

/var/log/hoge.log {
  daily
  rotate 7
  missingok
  notifempty
  postrotate
    /home/bepro/projects/scripts/bin/compress.sh -s /var/log/hoge.log.1 -d /tmp/hoge.log.1.zst -m 1
  endscript
}

このように連携させることで、ログローテート直後に古いログを即座に圧縮・削除でき、ディスク使用量の抑制に役立ちます。

logrotateとの機能的な違い

logrotateという仕組みがLinuxには標準搭載されており、ログファイルのローテートや圧縮、世代管理などを自動で行うことができます。しかしこのスクリプトは、logrotateではカバーしきれない運用ニーズを補う目的で設計しています。

logrotateは通常 /var/log/ 配下のログファイルなど、あらかじめ定義された対象に対して設定ファイルベースで動作します。そのため、アプリケーションが吐き出す中間ファイルや、開発中に発生する作業ログ、CSVやバックアップファイルなどの圧縮には不向きです。また、圧縮形式はデフォルトでgzipとなっており、圧縮率や速度の調整も限定的です。

それに対して本スクリプトは、任意のファイルやディレクトリを対象に、zstd形式による高速かつ高圧縮な処理を行えるよう設計しています。圧縮レベルも環境変数で制御可能であり、cronやバッチから直接呼び出すことができるため、柔軟な運用が可能です。

以下に、logrotateとの違いを整理した比較表を掲載します。

比較項目logrotate本スクリプト
対象/var/log配下のログが中心任意のファイル・ディレクトリ
圧縮形式gzip(zstdは別途設定要)zstd(レベル制御可)
実行方式設定ファイル+自動実行コマンド+引数で直接実行
主な用途ログファイル管理ログ以外も含めた柔軟な圧縮

このように、logrotateとは用途も思想も異なるため、補完的に併用することで幅広い圧縮・保守業務に対応できるようになります。

定期バックアップやデータ退避の自動化

cronなどのスケジューラを用いることで、特定ディレクトリを日次や週次で自動圧縮し、バックアップ用ストレージや退避先ディレクトリへ保存する運用も実現可能です。
以下は、毎日3時に /home/user/workdir/ を圧縮して /backup/ に保存するcron設定の例です。

0 3 * * * /home/bepro/projects/scripts/bin/compress.sh -s /home/user/workdir -d /backup/workdir_$(date +\%F).zst -m 0

このようにcronと組み合わせることで、システム運用中の一部として圧縮処理を完全自動化することが可能です。

エラー処理とログ出力による保守性の向上

スクリプトは logger.shrc と連携しており、INFO・DEBUG・ERRORレベルでのログ出力に対応しています。これにより、圧縮成功・失敗、入力エラー、削除処理などの履歴をすべてログファイルに記録することができ、トラブル発生時の原因特定が容易になります。
たとえば、圧縮対象が存在しない場合や出力ファイルが誤ってディレクトリになっていた場合には、以下のようなログが出力されます。

[ERROR] Not found such file or directory [ /var/log/not_exist.log ]
[ERROR] [ /tmp/ ] directory is set as an output file.

また、処理成功時には以下のようなログが記録されます。

[INFO] Succeeded in compression [ /tmp/archive.zst ]

これにより、定期処理としてcronなどで実行する場合でも、後からログを確認するだけで処理成否を把握することができます。
保守・運用フェーズでは、このようなログ出力の仕組みがあることで、人的トラブル対応の時間を大幅に短縮できます。

アーカイブの解凍方法について

このスクリプトで作成されるファイルは、 .tar でまとめた内容を .zst で圧縮した形式となっています。そのため、解凍には unzstd で展開した後に tar で中身を取り出すという手順が必要です。
以下がその手順です。

.zst を .tar に展開します

unzstd archive.zst

展開された .tar を解凍します

tar -xf archive.tar

一行で完結させたい場合は、以下のコマンドで .zst ファイルを直接解凍できます。

zstd -d --stdout archive.zst | tar -xf -

この方法で、圧縮時と同じディレクトリ構造でファイルを復元することができます。

本サイトにて記載のすべてのスクリプト利用により発生した利用者の損害全てに対し、いかなる責任をも負わないものとし、損害賠償をする一切の義務はないものとします。また、この記事は、実際の案件対応を通じて得た知見をもとに筆者が作成したものであり、全コードと解説は著者本人による設計・検証結果に基づいています。

よく読まれている記事

1

「シェル」と「シェルスクリプト」という言葉を聞いたことがありますか?どちらもLinuxやMacのターミナルで使われるものですが、それぞれの役割や使い方には違いがあります。 本記事では、「シェル」と「シ ...

2

「私たちが日々利用しているスマートフォンやインターネット、そしてスーパーコンピュータやクラウドサービス――これらの多くがLinuxの力で動いていることをご存じですか? 無料で使えるだけでなく、高い柔軟 ...

3

この記事は、Linuxについて勉強している初心者の方向けに「Shellスクリプト」について解説します。最後まで読んで頂けましたら、Shellスクリプトはどのような役割を担っているのか?を理解出来るよう ...

-運用自動化ツール