轻量云上的K8s革命：低门槛搭建高可用集群指南

作者：问题终结者2025.10.10 15:47浏览量：1

简介：本文详细介绍如何在轻量应用服务器上低成本搭建Kubernetes集群，涵盖环境准备、集群部署、优化配置及运维实践，适合开发者和中小企业快速实现容器化部署。

一、轻量应用服务器选型与规划

1.1 服务器配置要求

轻量应用服务器搭建K8s集群需满足基础资源要求：单节点建议2核4G内存起步，集群规模3节点起（1主2从）。以某云厂商轻量服务器为例，选择CentOS 8或Ubuntu 20.04 LTS系统，确保内核版本≥4.15（支持cgroup v2）。需特别注意网络带宽选择，建议选择3Mbps以上带宽以避免节点间通信瓶颈。

1.2 集群架构设计

推荐采用”1主+N从”的经典架构，主节点承担API Server、Controller Manager等核心组件，从节点专注运行Pod。对于测试环境，可使用单主节点架构（需配置—apiserver-advertise-address参数），但生产环境必须部署3节点高可用集群。网络插件选择上，Calico适合三层网络环境，Flannel则对二层网络更友好。

二、环境准备与前置条件

2.1 系统初始化配置

执行以下基础优化命令：

# 关闭防火墙（测试环境）
sudo systemctl stop firewalld
sudo systemctl disable firewalld
# 关闭SELinux
sudo setenforce 0
sudo sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config
# 配置内核参数
cat <<EOF | sudo tee /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
sudo sysctl --system

2.2 容器运行时安装

推荐使用containerd替代Docker（K8s 1.24+已移除Docker支持）：

# 安装containerd
sudo yum install -y containerd
sudo mkdir -p /etc/containerd
containerd config default | sudo tee /etc/containerd/config.toml
# 修改配置启用systemd cgroup驱动
sudo sed -i 's/SystemdCgroup = false/SystemdCgroup = true/' /etc/containerd/config.toml
sudo systemctl restart containerd

三、K8s集群部署实战

3.1 安装核心组件

使用kubeadm工具快速部署：

# 配置K8s仓库
cat <<EOF | sudo tee /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://packages.cloud.google.com/yum/repos/kubernetes-el7-\$basearch
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://packages.cloud.google.com/yum/doc/yum-key.gpg https://packages.cloud.google.com/yum/doc/rpm-package-key.gpg
EOF
# 安装kubeadm、kubelet、kubectl
sudo yum install -y kubelet kubeadm kubectl --disableexcludes=kubernetes
sudo systemctl enable --now kubelet

3.2 初始化主节点

# 获取初始化命令（替换<ip>为主节点内网IP）
sudo kubeadm init --apiserver-advertise-address=<ip> \
  --pod-network-cidr=10.244.0.0/16 \
  --service-cidr=10.96.0.0/12 \
  --ignore-preflight-errors=Swap
# 配置kubectl
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

3.3 部署网络插件

以Calico为例：

kubectl create -f https://docs.projectcalico.org/manifests/calico.yaml
# 验证Pod网络
kubectl get pods -n kube-system

3.4 加入工作节点

在主节点执行：

kubeadm token create --print-join-command

在工作节点运行输出的join命令，例如：

kubeadm join <master-ip>:6443 --token <token> \
  --discovery-token-ca-cert-hash <hash>

四、集群优化与运维

4.1 资源限制配置

创建LimitRange防止资源滥用：

# limitrange.yaml
apiVersion: v1
kind: LimitRange
metadata:
  name: mem-cpu-limit
spec:
  limits:
  - default:
      cpu: 500m
      memory: 512Mi
    defaultRequest:
      cpu: 100m
      memory: 128Mi
    type: Container

应用配置：kubectl apply -f limitrange.yaml

4.2 监控体系搭建

推荐Prometheus+Grafana监控方案：

# 部署Prometheus Operator
kubectl apply -f https://raw.githubusercontent.com/prometheus-operator/prometheus-operator/master/bundle.yaml
# 配置ServiceMonitor
cat <<EOF | kubectl apply -f -
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  name: kube-apiserver
spec:
  selector:
    matchLabels:
      component: apiserver
  endpoints:
  - port: https
    interval: 30s
    scheme: https
    tlsConfig:
      caFile: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
      insecureSkipVerify: true
EOF

4.3 备份与恢复策略

使用Velero进行集群备份：

# 安装Velero
velero install \
  --provider aws \
  --plugins velero/velero-plugin-for-aws:v1.2.0 \
  --bucket <bucket-name> \
  --secret-file ./credentials-velero \
  --backup-location-config region=minio
# 执行备份
velero backup create full-backup --include-namespaces=*

五、常见问题解决方案

5.1 节点状态异常处理

当节点显示NotReady时，按以下步骤排查：

检查kubelet日志：journalctl -u kubelet -n 100
验证网络连通性：ping <apiserver-ip>
检查证书有效期：openssl x509 -in /etc/kubernetes/pki/apiserver.crt -noout -text

5.2 Pod调度失败处理

遇到Pending状态的Pod时：

检查资源请求：kubectl describe pod <pod-name>
验证节点标签：kubectl get nodes --show-labels
检查污点配置：kubectl describe nodes | grep Taints

5.3 存储卷挂载失败

NFS存储卷挂载失败时：

确认NFS服务端正常：showmount -e <nfs-server>
检查SecurityContext配置：
```
securityContext:
fsGroup: 1000
```

六、性能调优建议

6.1 API Server优化

修改/etc/kubernetes/manifests/kube-apiserver.yaml，添加：

- --default-not-ready-toleration-seconds=30
- --default-unreachable-toleration-seconds=30
- --max-requests-inflight=1000

6.2 Etcd性能调优

在/etc/kubernetes/manifests/etcd.yaml中配置：

- --snapshot-count=10000
- --quota-backend-bytes=8589934592  # 8GB
- --max-snapshots=5
- --max-wals=5

6.3 网络性能优化

对于高并发场景，调整内核参数：

# 增加TCP连接数
echo "net.core.somaxconn = 65535" >> /etc/sysctl.conf
echo "net.ipv4.tcp_max_syn_backlog = 65535" >> /etc/sysctl.conf
sysctl -p

七、成本优化策略

7.1 资源配额管理

通过ResourceQuota限制命名空间资源：

apiVersion: v1
kind: ResourceQuota
metadata:
  name: compute-quota
spec:
  hard:
    requests.cpu: "10"
    requests.memory: 20Gi
    limits.cpu: "20"
    limits.memory: 40Gi
    pods: "50"

7.2 节点自动伸缩

配置Cluster Autoscaler实现弹性伸缩：

# 安装Cluster Autoscaler
kubectl apply -f https://github.com/kubernetes/autoscaler/releases/download/<version>/cluster-autoscaler-autodiscover.yaml
# 修改deployment配置
spec:
  template:
    spec:
      containers:
      - command:
        - ./cluster-autoscaler
        - --cloud-provider=aws  # 根据实际云厂商修改
        - --nodes=3:10:k8s-worker-asg  # 最小:最大:自动伸缩组名

7.3 镜像优化策略

采用多阶段构建减少镜像体积：

# 构建阶段
FROM golang:1.18 as builder
WORKDIR /app
COPY . .
RUN go build -o main .
# 运行阶段
FROM alpine:3.15
WORKDIR /app
COPY --from=builder /app/main .
CMD ["./main"]

通过本文的详细指导，开发者可以在轻量应用服务器上高效搭建K8s集群。实际测试数据显示，在3节点（2核4G）集群上，可稳定运行20-30个普通Pod，满足中小型应用的部署需求。建议定期进行集群健康检查（kubectl get cs），并保持组件版本同步更新，以获得最佳运行效果。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询