Flink1.17入门

一、Flink概述

Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。

1.Flink的特点

我们处理数据的目标是:低延迟、高吞吐、结果的准确性和良好的容错性。

Flink主要特点:

(1)高吞吐和低延迟:每秒处理数百万个事件,毫秒级延迟。

(2)结果的准确性:Flink提供了事件时间和处理时间语义。对于乱序事件流事件时间,事件时间     语义依然能提供一致且准确的结果。

(3)精准一次的状态一致性保证。

(4)可以连接到最常用的外部系统,如Kafka、Hive、JDBC、HDFS、Redis等。

(5)高可用: 本身高可用的设置,加上与K8s,YARN 和 Mesos 的紧密集成,再加上从故障中快速恢复和动态扩展任务的能力,Flink能做到以及少的停机时间7*24全天运行。

2.Flink 对比 SparkStreaming

3.Flink的应用场景

4.Flink的分成API