Flink Standalone 单机版部署全指南

作者：rousong2025.08.20 21:12浏览量：164

简介：本文详细介绍了如何在单机环境下部署Apache Flink Standalone模式，包括环境准备、配置步骤、启动与验证等内容，帮助开发者快速上手Flink单机版部署。

Flink Standalone 单机版部署全指南

1. 引言

Apache Flink 是一个开源的流处理框架，广泛应用于实时数据处理、批处理以及事件驱动型应用。Flink 提供了多种部署模式，其中 Standalone 模式是最简单的一种，适合在单机环境下进行开发和测试。本文将详细介绍如何在单机环境下部署 Flink Standalone 模式，帮助开发者快速上手。

2. 环境准备

在开始部署之前，需要确保满足以下环境要求：

操作系统：支持 Linux、macOS、Windows 等主流操作系统。
Java 环境：Flink 需要 Java 8 或更高版本。可以通过 java -version 命令检查 Java 版本。
Flink 安装包：从 Apache Flink 官方网站下载最新版本的二进制安装包。

3. 安装与配置

3.1 下载与解压

首先，从 Apache Flink 官方网站下载最新版本的二进制安装包。假设下载的文件名为 flink-1.15.0-bin-scala_2.12.tgz，可以通过以下命令解压：

tar -xzf flink-1.15.0-bin-scala_2.12.tgz

解压后，进入 Flink 目录：

cd flink-1.15.0

3.2 配置 Flink

Flink 的配置文件位于 conf 目录下，主要需要配置 flink-conf.yaml 文件。以下是一些常用的配置项：

JobManager 配置：
```
jobmanager.rpc.address: localhost
jobmanager.rpc.port: 6123
```
jobmanager.rpc.address 指定 JobManager 的主机名或 IP 地址，jobmanager.rpc.port 指定 RPC 端口号。
TaskManager 配置：
```
taskmanager.numberOfTaskSlots: 1
```
taskmanager.numberOfTaskSlots 指定每个 TaskManager 的任务槽数量，单机环境下通常设置为 1。
内存配置：
```
taskmanager.memory.process.size: 1024m
```
taskmanager.memory.process.size 指定 TaskManager 的进程内存大小，单位为 MB。

4. 启动 Flink 集群

4.1 启动 JobManager

在 Flink 目录下，执行以下命令启动 JobManager：

bin/start-cluster.sh

该脚本会启动 JobManager 和 TaskManager。启动后，可以通过 jps 命令查看 Java 进程，确认 Flink 组件是否成功启动。

4.2 访问 Flink Web UI

Flink 提供了 Web UI 界面，默认端口为 8081。在浏览器中访问 http://localhost:8081，可以查看集群状态、作业信息等。

5. 提交与运行作业

5.1 编写 Flink 作业

假设我们有一个简单的 Flink 作业，用于统计单词出现的频率。以下是一个示例代码：

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;
public class WordCount {
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        DataStream<String> text = env.fromElements("Hello World", "Hello Flink", "Flink is awesome");
        DataStream<Tuple2<String, Integer>> counts =
            text.flatMap(new Tokenizer())
                .keyBy(0)
                .sum(1);
        counts.print();
        env.execute("WordCount Example");
    }
    public static final class Tokenizer implements FlatMapFunction<String, Tuple2<String, Integer>> {
        @Override
        public void flatMap(String value, Collector<Tuple2<String, Integer>> out) {
            String[] words = value.toLowerCase().split("\\W+");
            for (String word : words) {
                if (word.length() > 0) {
                    out.collect(new Tuple2<>(word, 1));
                }
            }
        }
    }
}

5.2 打包与提交作业

将上述代码打包成 JAR 文件，例如 wordcount.jar。然后，通过以下命令提交作业：

bin/flink run -c WordCount wordcount.jar

提交后，可以在 Flink Web UI 中查看作业的运行状态和输出结果。

6. 停止 Flink 集群

在完成测试后，可以通过以下命令停止 Flink 集群：

bin/stop-cluster.sh

7. 常见问题与解决方案

7.1 端口冲突

如果启动 Flink 时遇到端口冲突，可以修改 flink-conf.yaml 中的 jobmanager.rpc.port 和 rest.port 配置项，指定其他端口号。

7.2 内存不足

如果 TaskManager 因内存不足而无法启动，可以增加 taskmanager.memory.process.size 的值，或者减少 taskmanager.numberOfTaskSlots 的值。

8. 总结

本文详细介绍了如何在单机环境下部署 Apache Flink Standalone 模式，包括环境准备、配置步骤、启动与验证等内容。通过本文的指导，开发者可以快速上手 Flink 单机版部署，为后续的流处理应用开发打下坚实的基础。

希望本文对您有所帮助，祝您在 Flink 的学习与开发中取得更多成果！

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

Flink Standalone 单机版部署全指南

Flink Standalone 单机版部署全指南

1. 引言

2. 环境准备

3. 安装与配置

4. 启动 Flink 集群

5. 提交与运行作业

6. 停止 Flink 集群

7. 常见问题与解决方案

8. 总结

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者