前言:
此时朋友们对“概率论计算公式pnncnn”大概比较着重,各位老铁们都想要知道一些“概率论计算公式pnncnn”的相关资讯。那么小编在网摘上网罗了一些关于“概率论计算公式pnncnn””的相关文章,希望兄弟们能喜欢,朋友们快快来学习一下吧!【#数据简历范文#】一份专业且吸引人的简历是众多求职者中脱颖而出的关键。那么,简历该怎么写呢?以下是1篇数据挖掘工程师简历模板,同时,幻主简历网还提供精美简历模板以及简历在线制作工具,欢迎大家阅读参考。
求职意向
求职类型:全职
意向岗位:数据挖掘工程师
意向城市:广东广州
薪资要求:面议
求职状态:随时到岗
教育背景
时间:20xx.9-20xx.7 学校名称:幻主简历大学 专业名称:电子商务 学校描述:主修课程包括高等数学、线性代数、概率论与数理统计、运筹学、C语言、Java、数据库系统概念、网页设计与制作等,成绩优异,多次获得校级奖学金。
工作经历
时间:20xx.3-至今 公司名称:幻主简历工作经验案例1职位名称:数据挖掘工程师、服务端开发工程师
广告系统(DSP)设计与开发:
架构设计:负责设计了广告系统的整体架构,提高了系统的可扩展性和稳定性。
CTR/CVR预估:通过机器学习算法,提高了广告点击率(CTR)和转化率(CVR)的预估准确率,CTR提升了15%,CVR提升了10%。
系统开发:领导团队完成了广告系统的核心功能开发,包括广告投放、效果跟踪和数据分析等模块。
性能优化:通过优化数据库查询和缓存机制,减少了系统响应时间,提高了广告服务的性能。
推荐系统设计与开发:
架构设计:构建了高效、可扩展的推荐系统架构,支持亿级用户量和百亿级数据量的处理。
召回与排序算法:调研并实现了多种召回和排序算法,包括协同过滤、内容推荐和深度学习等,提高了推荐的准确性和用户满意度。
算法优化:通过A/B测试和用户反馈,不断优化推荐算法,使得用户点击率提升了20%,用户留存率提升了15%。
时间:20xx.10-20xx.11 公司名称:幻主简历工作经验案例2职位名称:Java开发工程师
CAS单点登录项目开发:参与了CAS单点登录项目的开发,实现了多系统间的统一身份验证,提高了用户体验和系统安全性。项目上线后,用户登录成功率提升了10%,同时减少了用户因多次登录不同系统而产生的烦恼。
权限管理项目开发:负责设计和开发了权限管理系统,实现了细粒度的权限控制,保障了系统数据的安全性。通过该系统,企业能够更灵活地管理用户权限,降低了因权限泄露而引发的风险。
门户项目技术支持:为公司的门户项目提供技术支持,解决了在项目开发过程中遇到的技术难题。通过优化代码和数据库性能,提升了门户网站的访问速度和稳定性。在项目期间,网站访问量增加了20%,用户满意度也相应提升。
项目经验
时间:20xx.5-至今 项目名称:幻主简历xxx项目案例项目角色:DSP广告平台(算法负责人、服务端架构设计开发) 项目描述:DSP广告平台是一个面向广告主的广告投放平台,目标是为了提升流量变现效率,增加公司广告营收。DSP广告平台的主要功能包括广告主的注册、添加广告计划、添加广告创意,配置广告投放的定向条件、支持多种类型的结算方式(CPM、CPC、oCPM等)、实时计费、以及最重要的流量优化功能。广告算法的主要目的就是提升流量利用效率。在以CPC结算形式的广告投放中,为了使得每次广告投放的收益最大,需要对下发广告的CTR进行预估预估,并结合广告的CPC出价,计算本次广告投放的ecpm值,按照ecpm从大到小排序,选择ecpm较高的广告下发。在oCPM结算的广告投放中,除了需要预估广告下发的CTR外,还需要预估广告的CVR,然后结合广告的转化出价计算ecpm,选择ecpm收益较大的广告下发。广告算法的主要工作在于CTR预估和CVR预估。工作内容:
广告CTR预估的调研实现及优化:在算法方面,调研并测试业内CTR预估解决方案,比如逻辑回归(FTRL)、Wide&Deep、DeepFM等算法,在通过离线测试之后,进行工程化设计并部署上线;在特征工程方面,根据实际业务场景,探索并测试可能提升模型能力的特征,除了基础的用户特征,物品特征,上下文特征之外,尝试使用各种统计类特征来提升模型能力,经过诸多特征工程的测试后,CTR预估模型的AUC指标提升18%;在模型训练方面,采用负采样的方式,大幅降低模型训练时长,且提升了模型效果和AUC指标的稳定性;在CTR校准方面,探索预估CTR存在偏差的原因、CTR偏差衡量指标(ctr_ratio,Q曲线)、及CTR偏差的解决方案(基于模型预估结果的正负样本分布的方法,基于公式的校准,基于保序回归的校准),在加入CTR预估校准的逻辑后,预估的偏差明显缓解,ctr_ratio指标在1附近小幅波动,Q曲线基本拟合y=x直线;在工程方面,封装算法SDK,提供简便易用的模型调用方法,减少服务端对接模型的开发工作,降低因模型对接而产生bug的可能。
广告CVR预估的调研实现及优化:在算法方面,调研并实现了Yahoo CVR预估算法,测试了阿里ESMM模型;在工程方面,封装CVR预估模型SDK,方便服务端调用,减少模型对接产生的bug;在具体实现上,解决了不同广告主转化标准不一致的问题(使用不同转化标准的数据训练模型,会导致模型预估准确率不高)
服务端的重构设计及开发:快速梳理广告业务逻辑,提出合理的广告平台架构,实现模块之间实现耦合,业务逻辑清晰,易于扩展迭代,并且落地实现。重构后的DSP广告平台对外开放,运行稳定,相比将流量卖给广点通、广告联盟,收入增长翻倍。
项目成果:广告CTR预估模型的上线,平台整体广告点击率提升50+%,CPM提升50+%,大幅提升了平台的流量利用效率。CVR预估模型的上线,使广告平具备以oCPM结算的能力,降低了广告主的广告投放风险,提升广告平台在市场上的竞争能力。项目技术:Python,Spark,Tensorflow,Java,Redis,Hive,Storm时间:20xx.10-20xx.10 项目名称:幻主简历xxx项目案例项目角色:推荐系统(算法调研优化、服务端架构设计开发) 项目描述:推荐系统主要目的是提升用户的产品体验,增加用户粘性,进而提高用户留存和用户活跃时长。信息流推荐的主要功能是为用户提供个性化的内容。从工程的角度来看,信息流推荐系统分为推荐算法和推荐引擎两部分,推荐算法部分是为推荐引擎提供召回列表、用户特征、物品特征及模型等数据,推荐引擎部分则负责读取算法数据,并对内容进行排序,在极短的时间内响应用户的请求。从推荐算法的角度来看,信息流推荐分为两个阶段,第一阶段是召回阶段,该阶段中通过一些召回算法,比如基于规则的召回、协同过滤、用户画像、基于社交关系的召回及基于Embedding类算法的召回等算法,从不同的角度获取到用户可能感兴趣的物品,并将物品存入高速缓存;第二阶段是排序阶段,排序阶段通过使用排序模型,输入用户特征、物品特征、上下文特征等信息,对每个召回的物品输出一个用于排序的分数,推荐引擎按照排序分数从高到底对物品进行排序,再经过一些规则调整之后,取出topK的物品,返回给用户。工作内容:
召回算法的调研实现及优化:包括协同过滤算法(用户协同、物品协同、基于模型的协同)、基于内容主题的召回算法、 基于内容关键词的画像召回算法、基于规则的算法(热榜、新榜等)、基于社交关系的推荐(好友在看)、探索利用类算法(e-greedy、汤普森采样、UCB)、 Embedding类算法(item2vec、deepwalk)
排序算法的调研实现:FTRL算法的调研上线及特征工程,fm及ffm算法的调研测试,深度排序模型的调研测试,如:wide&deep、deepFM、NFM、FNN、PNN、DCN等算法
推荐引擎的重构设计及开发:梳理推荐业务逻辑,将推荐模块从其他业务中剥离,成立独立的推荐服务,并根据推荐业务的具体情况, 加入了日志模块(便于追踪每一次用户请求的处理过程,方便追踪推荐结果及分析推荐结果产生的原因), 流量配置模块(对于特定的流量,配置推荐逻辑,为推荐算法的优化迭代、AB测试提供极大的便利), 重构后的推荐引擎采用大量并行处理逻辑,大幅降低了相应延迟,响应时长100ms内的请求由原来的90%提升到99.9%
推荐效果的监控:在召回阶段,监控各召回算法的召回条目数、点击率,阅读时长、召回内容的多样性等指标;在排序阶段,监控最终排序结果的多样性(包括推荐内容的种类数,推荐内容的信息熵); 分时段的监控请求量,曝光量,点击量,ctr、各召回算法占比以及响应时长等指标。推荐指标的监控对于推荐业务中一些现象的分析, 提供了极大的便利,对于算法的调优有很大的指导作用。
项目成果:整体来看,召回算法的添加,以及排序算法的优化和特征工程等工作,将图文信息流的ctr提升18%。 对于推荐内容的多样性,从用户问卷调查的结果来看,有明显的改善项目技术:Python,Spark,Tensorflow,Java,Redis,Hive
自我评价
善于思考总结,发现问题分析问题,并能给出合理的解决方案,且能落地实现(比如梳理广告业务逻辑,给出清晰的架构设计并落地实现;梳理推荐系统的业务逻辑,并给出合理的架构设计并落地实现;广告CTR预估、CVR预估模型的调研、实现、优化;推荐算法的调研实现、及算法的封装、算法计算效率上的优化等)
有较强的自学能力,自学机器学习、深度学习等算法
有较强的工程化能力,对于项目的设计、开发、部署运维轻车熟路
数学基础扎实,高数、线性代数、概率论基础比较扎实,了解泛函分析、随机过程中的一些概念。对于常见的机器学习模型(比如相对简单的线性回归、逻辑回归算法,相对比较复杂的SVM、EM算法等)、深度学习模型都做过数学推导
英语六级,能够阅读英文文献、做英文文献的技术调研
个人技能
熟悉Linux开发环境,熟练使用python、Java、SQL语言
熟悉常见的传统机器学习算法,如k近邻、朴素贝叶斯、逻辑回归、支撑向量机、决策树、提升方法、EM算法、HMM算法、K-means、SVD等;了解深度学习算法,如MLP、CNN、RNN、Transformer等
熟悉信息流推荐业务及常见的推荐算法,如协同过滤、基于规则推荐、基于社交关系的推荐、探索利用(E&E)算法,Embedding(item2vec、DeepWalk)类算法、FTRL、wide&deep、DeepFM、NFM等
熟悉广告业务及广告相关的算法,对广告CTR预估、特征工程、Calibration、广告CVR预估有丰富的实战经验
熟悉Hadoop生态,对于Spark、Hive、Impala、Storm等大数据组件,有丰富的实际使用经验
熟悉Java服务端开发,有亿级流量服务的设计、开发、部署经验
熟悉常用的python数据分析库、数据可视化库、机器学习库,如numpy、scipy、pandas、matplotlib、scikit-learn、xgboost、gensim、Tensorflow等
数学基础扎实,对于大部分传统的机器学习算法、深度学习算法都做过数学推导
良好的英文阅读能力,能够独立的进行算法调研,并且实现落地。
标签: #概率论计算公式pnncnn