自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 基于flink的协同过滤

最近flink较火,尝试使用flink做推荐功能试试,说干就干,话说flink-ml确实比较水,包含的算法较少,且只支持scala版本,以至flink1.9已经将flink-ml移除,看来是准备有大动作,但后期的实时推荐,flink能派上大用场。所幸基于物品的协同过滤算法相对简单,实现起来难度不大。先看目前推荐整体的架构。先说一下用到的相似算法:X=(x1, x2, x3, … xn),Y=(...

2019-08-30 11:46:27 1127

转载 flink 扩容

因需要,再扩3台flink, 遇到各种报错,折腾了3个小时,最终找到了一种简单可行的方式,该方式,需要清空checkpoint, 暂时没有找到更好的方案。rm -rf /tmprm -rf /data/hadoop/* (checkpoint存储的位置)hadoop namenode -format(所有结点)start-dfs.sh start-yarn.shstart-zookeeper-...

2019-08-06 10:07:32 432

转载 flink 优秀文章集合

说明:为了避免博客被封,*代表c,s,d和n,请自行替换. 水印https://blog.****.net/lmalds/article/details/527041702 python 操作https://blog.****.net/qq_41577045/article/details/86694395...

2019-07-09 19:51:15 191

转载 利用flink统计消息回复情况

其中用到了滑动窗口函数大小30秒,间隔15秒,且大于窗口10秒的数据,被丢弃。(实际业务这三个值 应为是 10 分钟,1分钟,5分钟)。代码先记录一下public static void main(String[] arg) throws Exception { final StreamExecutionEnvironment env = StreamExecutionEnvi...

2019-07-09 14:23:44 264

转载 flink sql-clent MATCH_RECOGNIZE kafka 例子

环境 flink1.7.2增加flink1.7.2 的lib 中的jar, 否则会报类找不到avro-1.8.2.jar flink-connector-kafka-0.10_2.12-1.7.2.jar flink-connector-kafka-base_2.12-1.7.2.jar flink-json-1.7.2.jar kafk...

2019-07-05 14:05:29 315

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除