伺服器監控管理平台
自主開發的內部伺服器管理工具,整合硬體監控、安全防護、網站可用性、異常偵測與 LINE 通知,統一管理 9 台雲端主機。
9 台 Vultr VM 即時監控,CPU / 記憶體 / 磁碟 / 網路一覽無遺
66+ Nginx domain 自動探查,SSL 憑證到期預警
Fail2ban 攻擊地圖 + GeoIP 視覺化,爆量自動 LINE 推播
EWMA 統計異常偵測,z-score ≥ 3 持續 5 分鐘即告警
管理 9 台主機的痛點
主機分散難以掌握
9 台 VM 分散在不同區域,每台要個別 SSH 進去看狀態。CPU 飆高、磁碟快滿、服務掛掉,往往要等客戶反映才知道。
安全事件無法即時反應
每天數百次暴力登入嘗試,fail2ban 各機獨立運作,無法統一檢視攻擊來源與趨勢,也不知道是否有排程被植入惡意指令。
網站掛了不知道
66 個以上的 domain 分佈在 9 台主機,SSL 憑證到期、nginx 錯誤設定,都要等客戶通報才發現,缺乏主動探查機制。
異常偵測靠人工
伺服器偶發的 CPU 飆高或記憶體洩漏,沒有統計基準可判斷是否為顯著異常,只能事後看 log 回溯。
我們的解法
即時儀表板總覽
一個頁面看完 9 台主機的 CPU、記憶體、磁碟、網路、負載。支援排序與篩選,數據每 10 秒自動更新。
Nginx Domain 自動探查
自動從 9 台主機收集所有 nginx domain,每 5 分鐘檢查回應狀態、延遲與 SSL 到期日。狀態異動自動 LINE 推播。
攻擊地圖 + 入侵偵測
整合 fail2ban 與 GeoIP 資料庫,在互動式世界地圖標示攻擊來源與密度。5 分鐘內 ≥10 次封鎖自動告警。
EWMA 統計異常偵測
Agent 即時追蹤 8 項指標的 EWMA z-score,持續異常 5 分鐘自動通知。低值指標自動過濾,避免無意義告警。
功能模組
| 模組 | 說明 |
|---|---|
| 系統總覽 | 9 台主機 CPU / 記憶體 / 磁碟 / 網路 / 負載即時監控 |
| Nginx Domain | 66+ domain 探查、SSL 憑證到期預警、24 小時歷史趨勢 |
| Fail2ban | 攻擊地圖、Jail 狀態、封鎖 IP、Top 國家統計 |
| 異常偵測 | EWMA z-score 統計分析,8 項指標全機監控 |
| 排程稽核 | crontab / systemd timer 掃描 + 14 種可疑命令偵測 |
| UFW 防火牆 | 各機防火牆規則一覽,預設策略與備註 |
| LINE 通知 | 6 種觸發條件,彙整推送、cooldown 30 分鐘防重複 |
LINE 通知觸發條件
| 通知類型 | 觸發條件 |
|---|---|
| 每日摘要 | 每天 09:00 彙整推送 |
| 系統離線 / 恢復 | 狀態變化即時通知 |
| 異常偵測 | z-score ≥ 3 持續 5 分鐘 |
| Fail2ban 爆量 | 5 分鐘內 ≥ 10 次封鎖 |
| 網站異常 / 恢復 | 每 5 分鐘探查狀態變化 |
| SSL 憑證到期 | ≤ 14 天到期預警 |
系統總覽與監控

所有系統概覽 — 9 台主機即時狀態

單機深入檢視 — CPU、記憶體、負載、網路圖表

Nginx Domain 清單 — 66+ domain 探查狀態與 SSL 到期日
安全防護

Fail2ban 攻擊地圖 — GeoIP 視覺化與 Jail 狀態

單機 Fail2ban — Jail 詳情與封鎖紀錄

UFW 防火牆規則總覽
異常偵測與排程稽核

跨機異常偵測總覽 — EWMA z-score 分析

單機異常偵測 — 8 項指標追蹤

排程稽核 — crontab 與 systemd timer 掃描

單機排程 — cron 與 timer 詳細清單
LINE 通知設定

LINE 通知設定 — Token、Webhook 與接收者管理
導入前後對比
導入前
SSH 逐台登入查看狀態
客戶通報才知道網站掛了
Fail2ban 各機獨立,看不到全貌
異常靠事後看 log 回溯
導入後
一頁看完 9 台即時狀態
5 分鐘主動探查 + LINE 即時通知
攻擊地圖統一視覺化
EWMA z-score 自動偵測告警
異常處理流程
從偵測到通知,全自動閉環。
1
Agent 採集指標
2
EWMA 分析
3
z-score ≥ 3
4
持續 5 分鐘
5
LINE 推播
6
人工介入
管理主機
9 台
監控 Domain
66+
Agent 佔用
< 20MB / 台
合作狀態
持續維運中






