Python精准监控：系统性能参数获取与文件存储实战指南

作者：有好多问题2025.09.25 23:05浏览量：0

简介：本文详细介绍如何使用Python获取系统CPU、内存、磁盘等基础性能参数，并通过文件操作实现数据持久化存储，为系统监控和性能分析提供实用方案。

Python精准监控：系统性能参数获取与文件存储实战指南

在系统运维和开发过程中，实时获取并分析系统性能参数是保障服务稳定性的关键环节。Python凭借其丰富的标准库和第三方生态，能够高效实现系统性能监控数据的采集与存储。本文将系统阐述如何使用Python获取CPU使用率、内存占用、磁盘I/O等基础性能指标，并将数据结构化写入文件，为后续的性能分析和自动化运维提供数据支撑。

一、系统性能参数采集的核心方法

1. CPU使用率采集

CPU使用率是衡量系统负载的核心指标，Python可通过psutil库实现跨平台采集。psutil提供了cpu_percent()方法，支持按核心或全局统计：

import psutil
def get_cpu_usage():
    # 获取所有CPU核心的使用率（列表形式）
    cpu_percent_per_core = psutil.cpu_percent(interval=1, percpu=True)
    # 获取全局CPU使用率
    cpu_percent_total = psutil.cpu_percent(interval=1)
    return {
        "total_usage": cpu_percent_total,
        "per_core_usage": cpu_percent_per_core
    }

关键参数说明：

interval=1：采样间隔（秒），确保数据准确性
percpu=True：返回各核心使用率，否则返回全局值

2. 内存信息采集

内存状态直接影响系统运行效率，psutil.virtual_memory()可获取详细内存信息：

def get_memory_info():
    mem = psutil.virtual_memory()
    return {
        "total": mem.total,          # 总内存（字节）
        "available": mem.available,  # 可用内存（字节）
        "used": mem.used,            # 已用内存（字节）
        "percent": mem.percent       # 内存使用率（%）
    }

数据解析要点：

available字段比free更准确，包含缓存和缓冲区可回收内存
字节单位需转换为GB/MB便于阅读（1GB=1024^3字节）

3. 磁盘I/O与空间监控

磁盘性能是系统瓶颈的常见来源，需同时监控使用情况和I/O负载：

def get_disk_info():
    # 磁盘分区使用情况
    disk_usage = psutil.disk_usage('/')
    # 磁盘I/O统计（需结合采样间隔计算速率）
    io_before = psutil.disk_io_counters()
    time.sleep(1)  # 间隔1秒
    io_after = psutil.disk_io_counters()
    read_speed = (io_after.read_bytes - io_before.read_bytes) / 1024  # KB/s
    write_speed = (io_after.write_bytes - io_before.write_bytes) / 1024
    return {
        "usage": {
            "total": disk_usage.total,
            "used": disk_usage.used,
            "free": disk_usage.free,
            "percent": disk_usage.percent
        },
        "io_speed": {
            "read_kbps": read_speed,
            "write_kbps": write_speed
        }
    }

实现注意事项：

磁盘I/O速率需通过两次采样差值计算
路径'/'可根据需要替换为其他分区

二、性能数据结构化存储方案

1. CSV文件存储实现

CSV格式适合结构化数据存储，可使用Python内置csv模块：

import csv
from datetime import datetime
def write_to_csv(data, filename="system_metrics.csv"):
    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    flat_data = {
        "timestamp": timestamp,
        "cpu_total": data["cpu"]["total_usage"],
        "cpu_core1": data["cpu"]["per_core_usage"][0] if len(data["cpu"]["per_core_usage"]) > 0 else 0,
        "mem_used_percent": data["memory"]["percent"],
        "disk_used_percent": data["disk"]["usage"]["percent"],
        "disk_read_kbps": data["disk"]["io_speed"]["read_kbps"],
        "disk_write_kbps": data["disk"]["io_speed"]["write_kbps"]
    }
    fieldnames = ["timestamp", "cpu_total", "cpu_core1", "mem_used_percent", 
                  "disk_used_percent", "disk_read_kbps", "disk_write_kbps"]
    # 写入模式（追加）
    with open(filename, mode='a', newline='') as file:
        writer = csv.DictWriter(file, fieldnames=fieldnames)
        # 仅在文件为空时写入表头
        if file.tell() == 0:
            writer.writeheader()
        writer.writerow(flat_data)

优化建议：

使用mode='a'实现数据追加
通过file.tell()判断是否为空文件，避免重复写入表头
添加时间戳字段实现时序数据分析

2. JSON文件存储方案

JSON格式适合嵌套数据存储，可使用json模块：

import json
def write_to_json(data, filename="system_metrics.json"):
    timestamp = datetime.now().isoformat()
    full_data = {
        "timestamp": timestamp,
        "metrics": data
    }
    # 读取现有数据（如果存在）
    try:
        with open(filename, 'r') as file:
            existing_data = json.load(file)
    except FileNotFoundError:
        existing_data = []
    # 追加新数据
    existing_data.append(full_data)
    # 写入文件
    with open(filename, 'w') as file:
        json.dump(existing_data, file, indent=4)

适用场景：

需要保留完整数据结构的场景
后续需用Python或其他语言解析的场景
数据量较小（JSON不适合超大文件）

三、完整监控系统实现

1. 主监控程序框架

import time
import psutil
from datetime import datetime
def collect_metrics():
    return {
        "cpu": get_cpu_usage(),
        "memory": get_memory_info(),
        "disk": get_disk_info()
    }
def main(interval=5, output_format="csv"):
    while True:
        metrics = collect_metrics()
        if output_format == "csv":
            write_to_csv(metrics)
        elif output_format == "json":
            write_to_json(metrics)
        print(f"[{datetime.now()}] Metrics collected and saved")
        time.sleep(interval)
if __name__ == "__main__":
    main(interval=5, output_format="csv")

2. 高级功能扩展

（1）异常处理机制

def safe_collect_metrics():
    try:
        return collect_metrics()
    except Exception as e:
        error_data = {
            "timestamp": datetime.now().isoformat(),
            "error": str(e),
            "metrics": None
        }
        write_to_json(error_data, "error_log.json")
        return None

（2）数据压缩存储

对于长期监控，可使用gzip压缩JSON文件：

import gzip
import json
def write_compressed_json(data, filename="system_metrics.json.gz"):
    with gzip.open(filename, 'wt', encoding='utf-8') as file:
        json.dump(data, file, indent=4)

四、实际应用建议

采样间隔选择：
- 短间隔（1-5秒）：适合实时监控
- 长间隔（60秒+）：适合长期趋势分析

数据轮转策略：

import os
def rotate_log(filename, max_size_mb=10):
    if os.path.exists(filename) and os.path.getsize(filename) > max_size_mb * 1024 * 1024:
        backup_name = f"{filename}.{datetime.now().strftime('%Y%m%d%H%M%S')}"
        os.rename(filename, backup_name)

可视化集成：
- 使用pandas读取CSV文件进行数据分析
- 结合matplotlib或Plotly生成可视化图表

五、性能优化技巧

减少I/O操作：
- 批量写入代替频繁单次写入
- 使用内存缓冲区暂存数据

多线程实现：

import threading
def async_write(data, writer_func):
    thread = threading.Thread(target=writer_func, args=(data,))
    thread.start()

选择高效存储格式：
- 小数据量：JSON/CSV
- 大数据量：Parquet/HDF5（需pandas支持）

六、完整代码示例

import psutil
import csv
import json
from datetime import datetime
import time
import gzip
import os
def get_cpu_usage():
    return {
        "total_usage": psutil.cpu_percent(interval=1),
        "per_core_usage": psutil.cpu_percent(interval=1, percpu=True)
    }
def get_memory_info():
    mem = psutil.virtual_memory()
    return {
        "total": mem.total,
        "available": mem.available,
        "used": mem.used,
        "percent": mem.percent
    }
def get_disk_info():
    disk_usage = psutil.disk_usage('/')
    io_before = psutil.disk_io_counters()
    time.sleep(1)
    io_after = psutil.disk_io_counters()
    read_speed = (io_after.read_bytes - io_before.read_bytes) / 1024
    write_speed = (io_after.write_bytes - io_before.write_bytes) / 1024
    return {
        "usage": {
            "total": disk_usage.total,
            "used": disk_usage.used,
            "free": disk_usage.free,
            "percent": disk_usage.percent
        },
        "io_speed": {
            "read_kbps": read_speed,
            "write_kbps": write_speed
        }
    }
def write_to_csv(data, filename="system_metrics.csv"):
    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    flat_data = {
        "timestamp": timestamp,
        "cpu_total": data["cpu"]["total_usage"],
        "cpu_core1": data["cpu"]["per_core_usage"][0] if len(data["cpu"]["per_core_usage"]) > 0 else 0,
        "mem_used_percent": data["memory"]["percent"],
        "disk_used_percent": data["disk"]["usage"]["percent"],
        "disk_read_kbps": data["disk"]["io_speed"]["read_kbps"],
        "disk_write_kbps": data["disk"]["io_speed"]["write_kbps"]
    }
    fieldnames = ["timestamp", "cpu_total", "cpu_core1", "mem_used_percent", 
                  "disk_used_percent", "disk_read_kbps", "disk_write_kbps"]
    with open(filename, mode='a', newline='') as file:
        writer = csv.DictWriter(file, fieldnames=fieldnames)
        if file.tell() == 0:
            writer.writeheader()
        writer.writerow(flat_data)
def write_compressed_json(data, filename="system_metrics.json.gz"):
    timestamp = datetime.now().isoformat()
    full_data = {
        "timestamp": timestamp,
        "metrics": data
    }
    try:
        with gzip.open(filename, 'rt') as file:
            existing_data = json.loads(file.read())
    except (FileNotFoundError, json.JSONDecodeError):
        existing_data = []
    existing_data.append(full_data)
    with gzip.open(filename, 'wt', encoding='utf-8') as file:
        json.dump(existing_data, file, indent=4)
def main(interval=5, output_format="csv"):
    while True:
        metrics = {
            "cpu": get_cpu_usage(),
            "memory": get_memory_info(),
            "disk": get_disk_info()
        }
        if output_format == "csv":
            write_to_csv(metrics)
        elif output_format == "json_gz":
            write_compressed_json(metrics)
        print(f"[{datetime.now()}] Metrics collected ({output_format})")
        time.sleep(interval)
if __name__ == "__main__":
    # 使用示例：python script.py 5 csv
    import sys
    interval = int(sys.argv[1]) if len(sys.argv) > 1 else 5
    output_format = sys.argv[2] if len(sys.argv) > 2 else "csv"
    main(interval, output_format)

七、总结与展望

本文系统阐述了Python实现系统性能监控的核心方法，涵盖CPU、内存、磁盘等关键指标的采集技术，以及CSV/JSON两种主流存储方案的实现细节。通过完整的代码示例和优化建议，开发者可以快速构建定制化的监控系统。

未来发展方向包括：

集成Prometheus/Grafana构建可视化监控平台
添加网络性能监控（带宽、延迟）
实现异常检测与自动告警机制
支持容器化部署（Docker/K8s）

建议开发者根据实际需求选择合适的存储格式和采样间隔，并考虑添加数据压缩和轮转策略以应对长期监控场景。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

开发者热搜

Python精准监控：系统性能参数获取与文件存储实战指南

Python精准监控：系统性能参数获取与文件存储实战指南

一、系统性能参数采集的核心方法

1. CPU使用率采集

2. 内存信息采集

3. 磁盘I/O与空间监控

二、性能数据结构化存储方案

1. CSV文件存储实现

2. JSON文件存储方案

三、完整监控系统实现

1. 主监控程序框架

2. 高级功能扩展

四、实际应用建议

五、性能优化技巧

六、完整代码示例

七、总结与展望

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者