前言:
此刻看官们对“hive正则提取手机号”大体比较关注,姐妹们都需要分析一些“hive正则提取手机号”的相关知识。那么小编在网络上搜集了一些对于“hive正则提取手机号””的相关知识,希望兄弟们能喜欢,大家一起来学习一下吧!成熟公司业务如下
埋点:按公司要求格式埋点并上传至服务端同学指定的服务器集群日志收集:日志会在1中的集群中找到,现阶段为原始日志,即特定格式的一条条信息(可以用Linux客户端登录hadoop访问集群,查看具体信息) ;例如:
<product=toutiao><info=user><action=login>
或者product=toutiao&info=user&action=login
日志解析:目前一般用hive正则,将2种日志解析成规范字段取值的hive表
SQL查询:一般公司会提供查询平台,用简单的SQL就可以对3种的hive表进行查询计算
select count(*) from hive_user_info where day=20180801
新公司可能需要解决如下问题
埋点需要和服务端同事一起确定日志收集需要数仓团队建立scribe流来专门收集日志需要数仓团队帮忙算数,或者数仓培训业务人员自行算数
版权声明:
本站文章均来自互联网搜集,如有侵犯您的权益,请联系我们删除,谢谢。
标签: #hive正则提取手机号