Python跨平台监控：系统性能参数获取与文件存储实践指南

作者：c4t2025.09.25 23:05浏览量：1

简介：本文详细介绍如何使用Python获取系统CPU、内存、磁盘等基础性能参数，并通过代码示例演示如何将数据结构化写入文件，适用于系统监控、性能分析等场景。

Python跨平台监控：系统性能参数获取与文件存储实践指南

一、技术背景与需求分析

在云计算、容器化部署和分布式系统快速发展的背景下，实时监控系统性能参数已成为运维和开发工作的核心需求。通过Python获取系统基础性能参数并写入文件，不仅能够实现历史数据追溯，还可为自动化运维提供数据支撑。相较于传统监控工具（如Zabbix、Prometheus），Python方案具有轻量级、可定制化强的优势，尤其适合中小规模系统的快速部署。

二、核心性能参数解析

1. CPU使用率

CPU使用率反映处理器在特定时间内的活跃程度，包含用户态、内核态、空闲时间等细分指标。在Python中，可通过读取/proc/stat（Linux）或使用psutil库获取。例如，Linux系统下/proc/stat第一行数据包含CPU总时间统计，计算差值可得到使用率。

2. 内存使用情况

内存监控需关注总物理内存、可用内存、缓存/缓冲区占用等。Windows系统通过psutil.virtual_memory()获取，Linux则需结合/proc/meminfo中的MemTotal、MemAvailable等字段。值得注意的是，Linux的”可用内存”包含缓存回收空间，与Windows的”可用”定义存在差异。

3. 磁盘I/O性能

磁盘监控包含读写速度、IOPS、磁盘利用率等指标。psutil.disk_io_counters()可获取全局磁盘I/O统计，而分区级数据需遍历psutil.disk_partitions()并调用psutil.disk_usage()。对于SSD设备，还需关注write_amplification等特殊指标。

4. 网络带宽

网络监控涉及发送/接收字节数、错误包数等。psutil.net_io_counters()提供网卡级统计，结合时间差计算可得到实时带宽。在多网卡环境下，需通过psutil.net_if_addrs()识别各网卡流量。

三、跨平台实现方案

1. psutil库的安装与使用

pip install psutil

psutil支持Windows、Linux、macOS等主流系统，提供统一的API接口。例如获取CPU使用率：

import psutil
import time
def get_cpu_usage(interval=1):
    # 第一次调用获取基准值
    cpu_percent1 = psutil.cpu_percent(interval=0)
    time.sleep(interval)
    # 第二次调用获取实际使用率
    cpu_percent2 = psutil.cpu_percent(interval=0)
    return cpu_percent2  # 实际应计算两次调用的差值

2. 系统原生接口调用（Linux示例）

对于需要深度定制的场景，可直接解析/proc文件系统：

def get_linux_cpu_info():
    with open('/proc/cpuinfo', 'r') as f:
        cpu_cores = 0
        for line in f:
            if line.startswith('processor'):
                cpu_cores += 1
    return cpu_cores
def get_linux_mem_info():
    mem_info = {}
    with open('/proc/meminfo', 'r') as f:
        for line in f:
            if line.startswith(('MemTotal', 'MemAvailable')):
                key, value = line.split(':')
                mem_info[key.strip()] = int(value.split()[0]) * 1024  # 转换为字节
    return mem_info

四、数据结构化与文件存储

1. JSON格式存储

JSON因其可读性和跨语言支持成为首选格式：

import json
from datetime import datetime
def write_to_json(data, filename='system_metrics.json'):
    # 添加时间戳
    data_with_timestamp = {
        'timestamp': datetime.now().isoformat(),
        'metrics': data
    }
    # 追加模式写入（需处理文件锁定）
    mode = 'a' if os.path.exists(filename) else 'w'
    with open(filename, mode) as f:
        if mode == 'w':
            json.dump([data_with_timestamp], f)  # 首次写入创建列表
        else:
            existing_data = json.load(f)
            existing_data.append(data_with_timestamp)
            f.seek(0)
            json.dump(existing_data, f)

2. CSV格式存储

对于时间序列数据，CSV更利于表格处理工具分析：

import csv
def write_to_csv(data, filename='system_metrics.csv'):
    fieldnames = ['timestamp', 'cpu_percent', 'mem_available']
    # 首次写入需创建文件并写入表头
    is_new_file = not os.path.exists(filename)
    with open(filename, 'a', newline='') as f:
        writer = csv.DictWriter(f, fieldnames=fieldnames)
        if is_new_file:
            writer.writeheader()
        writer.writerow({
            'timestamp': datetime.now().isoformat(),
            'cpu_percent': data['cpu_percent'],
            'mem_available': data['mem_available']
        })

3. 数据库存储方案

对于长期监控需求，可集成SQLite等轻量级数据库：

import sqlite3
def init_db(db_name='system_metrics.db'):
    conn = sqlite3.connect(db_name)
    c = conn.cursor()
    c.execute('''CREATE TABLE IF NOT EXISTS metrics
                 (timestamp TEXT PRIMARY KEY,
                  cpu_percent REAL,
                  mem_available INTEGER)''')
    conn.commit()
    conn.close()
def insert_metric(data, db_name='system_metrics.db'):
    conn = sqlite3.connect(db_name)
    c = conn.cursor()
    c.execute('''INSERT INTO metrics VALUES (?, ?, ?)''',
              (datetime.now().isoformat(),
               data['cpu_percent'],
               data['mem_available']))
    conn.commit()
    conn.close()

五、性能优化与异常处理

1. 采样频率控制

高频采样可能导致性能开销，建议通过线程控制：

import threading
import time
class MetricCollector:
    def __init__(self, interval=5):
        self.interval = interval
        self.running = False
    def collect(self):
        while self.running:
            metrics = self.get_metrics()  # 实现具体采集逻辑
            self.save_metrics(metrics)
            time.sleep(self.interval)
    def start(self):
        self.running = True
        threading.Thread(target=self.collect, daemon=True).start()
    def stop(self):
        self.running = False

2. 异常处理机制

def safe_get_cpu():
    try:
        return psutil.cpu_percent(interval=1)
    except psutil.AccessDenied as e:
        print(f"权限不足: {e}")
        return None
    except psutil.NoSuchProcess as e:
        print(f"进程不存在: {e}")
        return None
    except Exception as e:
        print(f"未知错误: {e}")
        return None

六、完整实现示例

import psutil
import json
import os
from datetime import datetime
def get_system_metrics():
    return {
        'cpu_percent': psutil.cpu_percent(interval=1),
        'mem_info': {
            'total': psutil.virtual_memory().total,
            'available': psutil.virtual_memory().available,
            'used_percent': psutil.virtual_memory().percent
        },
        'disk_info': {
            'total': sum(f.total for f in psutil.disk_partitions()),
            'used': sum(f.used for f in psutil.disk_partitions()),
            'free': sum(f.free for f in psutil.disk_partitions())
        },
        'net_io': {
            'bytes_sent': psutil.net_io_counters().bytes_sent,
            'bytes_recv': psutil.net_io_counters().bytes_recv
        }
    }
def write_metrics_to_file(metrics, filename='system_metrics.log'):
    entry = {
        'timestamp': datetime.now().isoformat(),
        'metrics': metrics
    }
    with open(filename, 'a') as f:
        f.write(json.dumps(entry) + '\n')
if __name__ == '__main__':
    # 首次运行创建文件
    if not os.path.exists('system_metrics.log'):
        with open('system_metrics.log', 'w') as f:
            f.write('')  # 创建空文件
    while True:
        metrics = get_system_metrics()
        write_metrics_to_file(metrics)
        print(f"已采集数据: {metrics['cpu_percent']}% CPU使用率")
        # 每5秒采集一次
        time.sleep(5)

七、应用场景与扩展建议

自动化运维：集成到Ansible/SaltStack剧本中，实现部署后性能基线采集
性能调优：结合Matplotlib生成趋势图，辅助定位性能瓶颈
告警系统：设置阈值，当CPU使用率持续>90%时触发告警
容器监控：在Docker/K8s环境中部署Sidecar模式的数据采集器

建议后续研究方向包括：

使用Prometheus的Python客户端实现远程存储
开发Web界面实时展示监控数据
集成机器学习模型进行异常检测

通过本文介绍的方案，开发者可快速构建轻量级系统监控体系，为性能优化和故障排查提供数据支撑。实际部署时需根据具体场景调整采样频率和数据存储策略。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

Python跨平台监控：系统性能参数获取与文件存储实践指南

Python跨平台监控：系统性能参数获取与文件存储实践指南

一、技术背景与需求分析

二、核心性能参数解析

1. CPU使用率

2. 内存使用情况

3. 磁盘I/O性能

4. 网络带宽

三、跨平台实现方案

1. psutil库的安装与使用

2. 系统原生接口调用（Linux示例）

四、数据结构化与文件存储

1. JSON格式存储

2. CSV格式存储

3. 数据库存储方案

五、性能优化与异常处理

1. 采样频率控制

2. 异常处理机制

六、完整实现示例

七、应用场景与扩展建议

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者