龙空技术网

0673-6.2.0-通过Nginx获取CDSW的登录信息(续)

Hadoop实操 90

前言:

当前各位老铁们对“nginx抓取数据库”大致比较讲究,姐妹们都需要剖析一些“nginx抓取数据库”的相关资讯。那么小编同时在网上搜集了一些有关“nginx抓取数据库””的相关内容,希望各位老铁们能喜欢,同学们一起来了解一下吧!

作者:余枫

1.文档编写目的

在上一篇文章《6.2.0-通过Nginx获取CDSW的登录信息》中,通过Nginx的配置捕获了用户登陆相关的一些信息,比如登陆成功或失败、登陆时间、用户名等等。在收集了用户的登陆信息后,目前还想对用户的一些操作进行捕获,然后存入数据库中进行查询分析,本文档将介绍如何捕获当用户使用“Share”功能和进行Kerberos绑定时的操作信息。

测试环境:

1.RedHat7.4

2.CDH6.2

3.Nginx1.16.0

4.CDSW1.5

2.实现过程

由于增加了新的需求,需要通过下面几个方面进行改进:

Nginx的配置不用修改,保持和之前一致,如下图:

1.修改脚本,在脚本里加入新的判断条件,对Share功能和Kerberos认证进行捕获

#!/bin/bashHOSTNAME="192.168.0.178"PORT="3306"USERNAME="root"PASSWORD="123456"DBNAME="cdsw_login_info"TABLENAME="login_info"log_dir=/usr/local/nginx/logs/log_name=$(date -d "yesterday" +"%Y%m%d")#将nginx日志中的十六进制引号转为正常显示的引号并定向到前一天日期命令的新日志文件sed 's#\\x22#"#g' ${log_dir}access.log > ${log_dir}${log_name}.log#将nginx日志文件清空,确保每次处理的是前一天的日志cat /dev/null > ${log_dir}access.log#按行读取新的日志文件进行处理cat ${log_dir}${log_name}.log | while read linedoif [[ $line =~ "authenticate" ]] && [[ $line =~ "POST" ]] && [[ $line =~ "login" ]]; then OIFS=$IFS; IFS="|"; set -- $line; aa=$1;bb=$3;cc=$4;source_ip=$5;referer=$6;user_agent=$7 IFS=$OIFS OIFS=$IFS; IFS='""'; set -- $cc; username=$7 IFS=$OIFS occur_time=${aa:0:10}" "${aa:11:8} if [[ $bb = "200" ]]; then login_state='1' elif [[ $bb = "401" ]]; then login_state='0' else login_state='' fi insert_sql="insert into ${DBNAME}.${TABLENAME}(source_ip,name,referer,user_agent,login_state,occur_time) values('$source_ip','$username','$referer','$user_agent',$login_state,'$occur_time')" mysql -h${HOSTNAME} -P${PORT} -u${USERNAME} -p${PASSWORD} -e "${insert_sql}"fiif [[ $line =~ "sharing" ]]; then OIFS=$IFS; IFS="|"; set -- $line; aa=$1;bb=$3;cc=$4;source_ip=$5;referer=$6;user_agent=$7 IFS=$OIFS OIFS=$IFS; IFS='""'; set -- $cc; share_flag=$9 IFS=$OIFS occur_time=${aa:0:10}" "${aa:11:8} if [[ $share_flag = "" ]]; then share_flag="clickShare" fi insert_sql="insert into ${DBNAME}.${TABLENAME}(source_ip,name,referer,user_agent,login_state,occur_time,share_flag) values('$source_ip','$username','$referer','$user_agent',$login_state,'$occur_time','$share_flag')" mysql -h${HOSTNAME} -P${PORT} -u${USERNAME} -p${PASSWORD} -e "${insert_sql}"fiif [[ $line =~ "kerberos-credentials" ]]; then OIFS=$IFS; IFS="|"; set -- $line; aa=$1;request=$2;bb=$3;cc=$4;source_ip=$5;referer=$6;user_agent=$7 IFS=$OIFS OIFS=$IFS; IFS='""'; set -- $cc; IFS=$OIFS occur_time=${aa:0:10}" "${aa:11:8} insert_sql="insert into ${DBNAME}.${TABLENAME}(source_ip,name,referer,user_agent,login_state,occur_time,request) values('$source_ip','$username','$referer','$user_agent',$login_state,'$occur_time','$request')" mysql -h${HOSTNAME} -P${PORT} -u${USERNAME} -p${PASSWORD} -e "${insert_sql}"fidone

2.修改存储信息的表结构,建表语句如下:

CREATE TABLE `login_info` ( `id` int(5) primary key NOT NULL AUTO_INCREMENT, `source_ip` varchar(32) DEFAULT NULL, `name` varchar(16) DEFAULT NULL, `referer` varchar(64) DEFAULT NULL, `user_agent` varchar(256) DEFAULT NULL, `login_state` char(1) DEFAULT NULL, `occur_time` timestamp , `request` varchar(256) DEFAULT NULL, `share_flag` varchar(16) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET=utf8;

3.获取操作信息3.1.用户使用“Share”功能

1.用户点击“Share”功能

获取用户点击“Share”功能的信息

select * from login_info where share_flag='clickShare';

2.用户点击“Share with Others”

获取用户点击“Share with Others”按钮的信息

select * from login_info where share_flag in ('specific','authenticated','all');

3.用户点击“Stop Sharing”

获取用户点击“Stop Sharing”按钮的信息

select * from login_info where share_flag='private';

3.2.用户使用Kerberos绑定功能

1.用户进入Kerberos认证页面

获取用户进入Kerberos认证页面的信息

select * from login_info where request like '%GET%kerberos-credentials%';

2.用户进行Kerberos认证

获取用户点击Kerberos认证按钮的信息

select * from login_info where request like '%POST%kerberos-credentials%';

3.用户取消Kerberos认证

获取用户取消Kerberos认证的信息

select * from login_info where request like '%DELETE%kerberos-credentials%';

4.总结

1.通过Nginx转发请求的方式能够捕获到CDSW上很多的操作信息,获取到操作信息之后可以对保存的信息的表进行进一步的统计分析,这对审计很有帮助。

2.用户在使用这两个功能时,每点击一个按钮都会打印出相应的日志,所以本文档中对点击相应的按钮的日志做了处理,分开存入了数据库中,在分析时可以通过不同的条件查询出需要的结果。

3.在处理信息的过程中,最重要的步骤是对脚本的修改以及在数据库中进行查询时,需要通过分析日志的特征来选择合适的条件过滤出需要的结果。

标签: #nginx抓取数据库 #nginx没有accesslogin