Flink中的DataStream任务用于实现data streams的转换,data stream可以来自不同的数据源,比如消息队列,socket,文件等。
Ref
Springboot可以通过redis template和redis进行交互,使用方法如下
可以参考这个系列的文章:
【快学springboot】11.整合redis实现session共享
【快学springboot】13.操作redis之String数据结构
还有python版本的redis实战
下载hadoop的原生版本,版本选择2.6.0,下载地址
SerDe 是Serializer 和 Deserializer 的简称,它提供了Hive和各种数据格式交互的方式。
Amazon的Athena可以理解是Amazon对标hive的一款产品,其中对SerDe的介绍如下
OutputFormat在hadoop源码中是一个抽象类 public abstract class OutputFormat<K, V>,其定义了reduce任务的输出格式
在 scala和java混合编程的时候,需要添加一些额外的配置到pom中,才能将scala文件的class加到最终的jar中