Python精准监控：获取系统性能参数并写入文件全攻略

作者：沙与沫2025.09.25 23:05浏览量：1

简介：本文详细介绍如何使用Python获取系统CPU、内存、磁盘等基础性能参数，并将数据结构化写入文件，适用于系统监控、性能分析等场景。提供跨平台解决方案及代码示例，帮助开发者快速实现自动化数据采集。

Python精准监控：获取系统性能参数并写入文件全攻略

一、系统性能监控的核心价值

在云计算、大数据和物联网快速发展的今天，系统性能监控已成为保障业务稳定运行的关键环节。通过实时采集CPU使用率、内存占用、磁盘I/O等基础性能参数，运维人员可以：

提前发现系统瓶颈，避免服务中断
优化资源配置，提升系统整体效率
建立性能基准，为容量规划提供数据支持
快速定位故障根源，缩短MTTR（平均修复时间）

Python凭借其丰富的标准库和第三方生态，成为实现系统监控的理想工具。本文将详细介绍如何使用Python获取系统基础性能参数，并将数据结构化写入文件。

二、核心性能参数采集实现

2.1 CPU使用率采集

CPU是系统的核心资源，其使用情况直接反映系统负载。在Python中，可以通过以下方式获取：

import psutil
def get_cpu_info():
    """获取CPU详细信息"""
    cpu_info = {
        'physical_cores': psutil.cpu_count(logical=False),
        'logical_cores': psutil.cpu_count(logical=True),
        'freq_current': psutil.cpu_freq().current,  # 当前频率(MHz)
        'freq_max': psutil.cpu_freq().max,         # 最大频率(MHz)
        'usage_percent': psutil.cpu_percent(interval=1),  # 1秒内的平均使用率
        'per_cpu_usage': psutil.cpu_percent(interval=1, percpu=True)  # 各核心使用率
    }
    return cpu_info

关键点说明：

psutil.cpu_count()区分物理核心和逻辑核心
cpu_freq()获取动态频率信息（适用于支持调频的CPU）
cpu_percent()建议设置interval参数获取更准确的值
对于多核系统，建议同时采集总体使用率和各核心使用率

2.2 内存使用情况采集

内存是影响系统性能的另一关键因素，采集内容包括：

def get_memory_info():
    """获取内存使用情况"""
    mem = psutil.virtual_memory()
    swap = psutil.swap_memory()
    memory_info = {
        'total': mem.total,               # 总内存(字节)
        'available': mem.available,       # 可用内存(字节)
        'used': mem.used,                 # 已用内存(字节)
        'free': mem.free,                 # 空闲内存(字节)
        'percent': mem.percent,           # 使用百分比
        'swap_total': swap.total,         # 交换分区总大小
        'swap_used': swap.used,           # 交换分区已用大小
        'swap_percent': swap.percent      # 交换分区使用百分比
    }
    # 转换为GB单位便于阅读
    for key in ['total', 'available', 'used', 'free', 'swap_total', 'swap_used']:
        memory_info[key] = round(memory_info[key] / (1024**3), 2)
    return memory_info

数据解读技巧：

关注available而非free，前者包含缓存和缓冲区可回收内存
交换分区使用率持续高于20%可能预示内存不足
结合used和percent判断内存压力

2.3 磁盘I/O性能采集

磁盘性能直接影响系统响应速度，需要采集：

def get_disk_info():
    """获取磁盘使用情况和I/O统计"""
    disk_info = {}
    # 磁盘分区使用情况
    partitions = psutil.disk_partitions()
    for partition in partitions:
        if 'cdrom' in partition.opts or partition.fstype == '':
            continue
        usage = psutil.disk_usage(partition.mountpoint)
        disk_info[partition.device] = {
            'mountpoint': partition.mountpoint,
            'fstype': partition.fstype,
            'total': round(usage.total / (1024**3), 2),
            'used': round(usage.used / (1024**3), 2),
            'free': round(usage.free / (1024**3), 2),
            'percent': usage.percent
        }
    # 磁盘I/O统计（需要psutil 5.6.0+）
    try:
        io_counters = psutil.disk_io_counters(perdisk=True)
        for disk, io in io_counters.items():
            disk_info[disk]['io'] = {
                'read_count': io.read_count,
                'write_count': io.write_count,
                'read_bytes': io.read_bytes,
                'write_bytes': io.write_bytes,
                'read_time': io.read_time,    # 读取耗时(ms)
                'write_time': io.write_time   # 写入耗时(ms)
            }
    except AttributeError:
        print("当前psutil版本不支持perdisk I/O统计")
    return disk_info

优化建议：

排除光盘驱动器和未识别文件系统
重点关注根分区和数据库所在分区
I/O统计建议采集间隔不少于5秒以获得有意义的数据

三、数据结构化与文件写入

3.1 JSON格式写入

JSON因其可读性和跨语言支持，成为首选数据格式：

import json
from datetime import datetime
def write_to_json(data, filename='system_metrics.json'):
    """将系统指标写入JSON文件"""
    timestamp = datetime.now().isoformat()
    output = {
        'timestamp': timestamp,
        'metrics': data
    }
    with open(filename, 'a', encoding='utf-8') as f:
        json.dump(output, f, ensure_ascii=False, indent=4)
        f.write('\n')  # 每次写入后添加换行符

实现要点：

使用append模式实现持续记录
添加时间戳便于后续分析
ensure_ascii=False支持中文
indent参数提高可读性

3.2 CSV格式写入

对于需要表格化处理的数据，CSV是更好的选择：

import csv
def write_to_csv(data, filename='system_metrics.csv'):
    """将系统指标写入CSV文件"""
    timestamp = datetime.now().strftime('%Y-%m-%d %H:%M:%S')
    # 准备CSV行数据
    cpu_data = data.get('cpu', {})
    mem_data = data.get('memory', {})
    disk_data = list(data.get('disk', {}).values())[0] if data.get('disk') else {}
    row = [
        timestamp,
        cpu_data.get('usage_percent', 0),
        mem_data.get('percent', 0),
        disk_data.get('percent', 0) if disk_data else 0
    ]
    # 写入文件（首次写入需要写入表头）
    write_header = not os.path.exists(filename)
    with open(filename, 'a', newline='', encoding='utf-8') as f:
        writer = csv.writer(f)
        if write_header:
            writer.writerow(['timestamp', 'cpu_usage(%)', 'mem_usage(%)', 'disk_usage(%)'])
        writer.writerow(row)

优化实践：

检查文件是否存在决定是否写入表头
使用newline=''避免Windows下的空行问题
选择性写入关键指标简化分析

3.3 数据库存储方案

对于长期监控需求，建议考虑数据库存储：

import sqlite3
from contextlib import closing
def init_db(db_file='system_metrics.db'):
    """初始化SQLite数据库"""
    with closing(sqlite3.connect(db_file)) as conn:
        cursor = conn.cursor()
        cursor.execute('''
            CREATE TABLE IF NOT EXISTS metrics (
                id INTEGER PRIMARY KEY AUTOINCREMENT,
                timestamp DATETIME NOT NULL,
                cpu_usage REAL,
                mem_usage REAL,
                disk_usage REAL,
                cpu_cores INTEGER,
                mem_total REAL,
                disk_total REAL
            )
        ''')
        conn.commit()
def save_to_db(data, db_file='system_metrics.db'):
    """将指标数据保存到SQLite数据库"""
    cpu_data = data.get('cpu', {})
    mem_data = data.get('memory', {})
    disk_data = list(data.get('disk', {}).values())[0] if data.get('disk') else {}
    with closing(sqlite3.connect(db_file)) as conn:
        cursor = conn.cursor()
        cursor.execute('''
            INSERT INTO metrics 
            (timestamp, cpu_usage, mem_usage, disk_usage, 
             cpu_cores, mem_total, disk_total)
            VALUES (?, ?, ?, ?, ?, ?, ?)
        ''', (
            datetime.now().isoformat(),
            cpu_data.get('usage_percent', 0),
            mem_data.get('percent', 0),
            disk_data.get('percent', 0) if disk_data else 0,
            cpu_data.get('logical_cores', 0),
            mem_data.get('total', 0),
            disk_data.get('total', 0) if disk_data else 0
        ))
        conn.commit()

数据库设计原则：

使用时间序列数据模型
包含关键指标的原始值和计算值
考虑添加索引优化查询性能
定期归档历史数据防止数据库膨胀

四、完整实现示例

import os
import time
import psutil
import json
from datetime import datetime
def collect_system_metrics():
    """收集所有系统指标"""
    metrics = {
        'cpu': get_cpu_info(),
        'memory': get_memory_info(),
        'disk': get_disk_info(),
        'network': get_network_info()  # 可选网络指标
    }
    return metrics
def get_network_info():
    """获取网络I/O统计（可选）"""
    net_io = psutil.net_io_counters()
    return {
        'bytes_sent': net_io.bytes_sent,
        'bytes_recv': net_io.bytes_recv,
        'packets_sent': net_io.packets_sent,
        'packets_recv': net_io.packets_recv
    }
def main():
    # 初始化数据库（首次运行需要）
    # init_db()
    while True:
        try:
            # 收集指标
            metrics = collect_system_metrics()
            # 写入JSON文件
            timestamp = datetime.now().strftime('%Y%m%d')
            json_filename = f'metrics_{timestamp}.json'
            write_to_json(metrics, json_filename)
            # 写入CSV文件（简化版）
            cpu = metrics['cpu']
            mem = metrics['memory']
            disk = next(iter(metrics['disk'].values())) if metrics['disk'] else {}
            csv_data = [
                datetime.now().isoformat(),
                cpu['usage_percent'],
                mem['percent'],
                disk.get('percent', 0)
            ]
            csv_filename = 'metrics_summary.csv'
            write_header = not os.path.exists(csv_filename)
            with open(csv_filename, 'a', newline='') as f:
                writer = csv.writer(f)
                if write_header:
                    writer.writerow(['timestamp', 'cpu', 'memory', 'disk'])
                writer.writerow(csv_data)
            # 休眠指定间隔
            time.sleep(60)  # 每分钟采集一次
        except KeyboardInterrupt:
            print("监控已停止")
            break
        except Exception as e:
            print(f"采集出错: {str(e)}")
            time.sleep(10)  # 出错后等待10秒再重试
if __name__ == '__main__':
    main()

五、最佳实践与优化建议

采集频率优化：
- CPU/内存：建议1-5秒采集一次
- 磁盘I/O：建议5-30秒采集一次
- 网络指标：根据业务需求调整
资源消耗控制：
- 避免在性能关键路径上运行监控
- 考虑使用异步采集减少对系统的影响
- 对大规模服务器集群，采用分布式采集架构
数据存储策略：
- 原始数据保留30天
- 聚合数据（如每小时平均值）长期保留
- 定期执行数据库维护（VACUUM, REINDEX）

告警机制集成：

def check_thresholds(metrics):
    """检查指标是否超过阈值"""
    alerts = []
    if metrics['cpu']['usage_percent'] > 90:
        alerts.append("CPU使用率过高")
    if metrics['memory']['percent'] > 85:
        alerts.append("内存使用率过高")
    # 添加更多检查...
    return alerts

跨平台兼容性：
- 使用psutil已处理大部分平台差异
- 对特定平台（如AIX、Solaris）可能需要额外处理
- 考虑使用Docker容器化监控程序

六、总结与展望

本文详细介绍了使用Python获取系统基础性能参数并写入文件的完整实现方案。通过psutil库，开发者可以轻松获取CPU、内存、磁盘等关键指标，并通过JSON、CSV或数据库等多种方式持久化存储这些数据。

未来发展方向包括：

集成Prometheus等时序数据库
添加可视化展示层（如Grafana）
实现基于机器学习的异常检测
开发跨云平台的统一监控解决方案

系统性能监控是保障IT系统稳定运行的基础工作。通过本文介绍的Python实现方案，开发者可以快速构建起灵活、可扩展的性能监控系统，为业务连续性提供有力保障。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

Python精准监控：获取系统性能参数并写入文件全攻略

Python精准监控：获取系统性能参数并写入文件全攻略

一、系统性能监控的核心价值

二、核心性能参数采集实现

2.1 CPU使用率采集

2.2 内存使用情况采集

2.3 磁盘I/O性能采集

三、数据结构化与文件写入

3.1 JSON格式写入

3.2 CSV格式写入

3.3 数据库存储方案

四、完整实现示例

五、最佳实践与优化建议

六、总结与展望

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者