Go to file
yudan.chen 58d0df6a9d p137 合流输出window join实现 2021-01-27 15:18:21 +08:00
HotItemsAnalysis p105,纯sql方式实现,热门商品结束 2021-01-19 10:14:00 +08:00
LoginFailDetect cep优化 2021-01-25 17:14:18 +08:00
MarketAnalysis p121 排除刷单用户 2021-01-23 10:00:38 +08:00
NetworkFlowAnalysis p115 布隆过滤器解决占用大内存问题 2021-01-21 17:52:05 +08:00
OrderPayDetect p137 合流输出window join实现 2021-01-27 15:18:21 +08:00
.gitignore p100,框架搭建 2021-01-18 09:44:12 +08:00
README.md p137 合流输出window join实现 2021-01-27 15:18:21 +08:00
pom.xml 订单支付实时监控 2021-01-25 18:07:52 +08:00
retailer-ueba.iml p100,框架搭建 2021-01-18 09:44:12 +08:00

README.md

电商用户行为分析

资料: https://www.bilibili.com/video/BV1Qp4y1Y7YN?p=101

软件 版本
flink 1.12.0
kafka 2.4.1
scala 2.11

热门商品项目进阶

1、HotItems
统计最近一小时按pv统计top 5商品5分钟统计一次

2、HotItemsKafka
数据源改kafka

3、KafkaProducerUtil
改成脚本发送kafka数据

4、HotItemsWithSql
使用table方式实现table + sql

5、HotItemsWithPureSql
纯sql方式实现

热门流量统计

1、HotPagesNetworkFlow
统计10分钟内访问前三的url5秒统计一次
数据时间格式转换

2、HotPagesNetworkFlowFilter
过滤掉.css和.js结尾的日志

3、HotPagesNetworkFlowWatermark
优化处理效率正确设置watermark和处理迟到数据

4、TopNHotPagesFixStatus
解决topN中url重复问题

pv统计

1、PageView
统计每小时访问条数

2、PageViewKey
解决并行度无法起作用问题

3、PageViewKeyEnd
解决中间结果刷屏问题

uv统计

1、UniqueVisitor
统计每小时独立用户数

2、UvWithBloom
布隆过滤器解决set操作内存可能爆掉问题

app市场推广统计

1、AppMarketByChannel
分渠道市场统计需要按两个字段分组的场景process代替aggregate的实现

页面广告分析

1、AdClickAnalysis
统计一天页面广告点击量和PageView是一样的

2、AdClickAnalysisFilter
把刷单用户排除1小时内下单超过100次报警

恶意登陆检测

1、LoginFail
2秒内连续两次登陆失败告警

2、LoginFailAdvance
时效性做了改进1秒出现两次失败了就报警

3、LoginFailWithCep
cep实现

4、LoginFailWithCep2
5秒内有3次失败告警

5、LoginFailWithCep3
优化后cep实现

订单支付实时监控

1、OrderTimeOut
cep实现订单成功支付的和15分钟内未支付超时的

2、OrderTimeoutWithoutCep
process实现

3、TxMatch
订单流和到账流合流输出,实时对账

4、TxMatchWithJoin
合流输出window join实现