1、流式数据是无边界数据,无边界是指数据无限和无限增长。之所以无边界,是因为随着时间的推移,会有新纪录不断加入。
2、流式处理是一种数据处理方式,其中数据流在实时或接近实时的速度下被处理,以满足实时需求。在流式处理中,数据以连续的流的形式传输,并且数据通常不会被完全存储在内存或磁盘中,而是通过流式处理引擎进行实时处理和分析。流式处理常见的应用场景包括实时分析、实时监控、实时预测等。它可以用于各种类型的数据,包括文本、声音、图像、视频、传感器数据等。流式处理通常需要使用专门的流式处理技术和工具,如Apache Kafka、Apache Flink、Apache Spark等。
3、Kafka除了可用作流式处理框架可靠的数据来源外,还提供了一个强大的流式处理开发库,叫做 Kafka Stream。