サーバがトラブルを起こして止まった後のトラブルシューティングで気づく、入れ忘れていたパッケージランキングのトップがsysstatでしょう。sarと言うコマンドを提供するこのパッケージは以下のようなCPUやメモリなどの使用状況を記録してくれます。

Ubuntuなどでは、sudo apt install sysstatで簡単にインストールできますが。私は毎回入れ忘れるので標準的にセットアップするサーバには以下のようなAnsibleのPlaybookを適用させてインストールするようにしています。
ansible playbook
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
| ---
- hosts: all
tasks:
- name: Install packages for server management
apt:
name:
- sysstat
- name: Activate sysstat
lineinfile:
path: /etc/default/sysstat
regexp: '^ENABLED='
line: ENABLED="true"
- name: Restart service sysstat
service:
name: sysstat
state: restarted
|