应届生数据分析岗面试题 面试要看数据分析案例
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
1.某APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,活动结束后,作为数据分析师,你如何评估这场活动的效果?
①活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?
②活动关键流程是什么?以及各个流程的漏斗分析(留存,流失率分别是多少),可能的原因有哪些
③活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?
④活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热,中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预
2.什么是漏斗分析?有哪些注意的点?
定义:漏斗分析通常作为一种数据分析工具,主要是衡量应用在各关键路径上的流转情况,从而直观地反映出当前产品阻碍用户继续向下使用的关键节点,从而为后续产品迭代提供数据支撑
最核心的有三点:分解流程,评估转化率和定位问题环节
常见的电商漏斗:首页 - 详情页 - 购物车 - 支付;用户的生命周期AARRR;用户行为周期AIDMA
需要注意的点:①漏斗的各个环节一定是连续的,对应连续的业务流程 ②漏斗的环节不宜过多,一般不超过5个 ③一般以上一环节为基准,计算相邻两个环节的转化率 ④计算每相邻环节的转化率,1 - 转化率即为流失率,但并不意味着转化率最低的环节就是问题环节 ⑤漏斗可以结合其他维度看,看不同维度下的漏斗差异,进而判断是哪个因素导致了问题的出现
3.你是怎么理解数据分析的,流程如何
数据分析是基于对业务的理解,发现业务中的问题或潜在增长点,形成分析思路,并利用数据分析工具进行分析,给出结论和解决方案,并协调各方推动方案落地,解决问题,回到业务中去的完整闭环
主要流程:观察现状 → 留意变化 → 多位交叉分析 → 预测趋势 → 生成策略 → 推动落地 → 复盘效果
4.你认为数据分析的价值如何体现?
数据分析不是数据统计,不能仅仅停留在输出一份数据报告
要给出结论,讲清楚数据背后的业务含义,数字的大小正负说明业务是好还是坏
明确数字背后的业务含义外,还要给出背后的原因:好的方面是否可以复用拓展,坏的方面原因是什么,应对方案是什么
要把方案推动落地到业务执行中,并且跟进执行的效果和复盘,螺旋上升,不断迭代优化
5.指标的异常波动变化(例如日活下跌)如何分析?
①首先对以下内容进行确定
确定数量来源是否可靠
确定指标的计算口径是否一致
确定是否是市场的整体趋势
②其次可以从以下角度进行分析
描述性统计:下跌了多少
观察变化:同比下跌多少,环比下跌多少
评估变化/方差分析:跌幅是否在合理范围
交叉分析/相关性分析:对指标进行拆解,有哪些指标可能和日活下跌有关系,有关系到什么程度
业务分析:这些指标的运营部分,是否有某些运营策略或者活动造成了这些指标的变化,间接导致日活下跌
回归分析/预测:还会跌几天?跌幅最坏到什么程度
风险/损失评估:日活下跌对产品的核心KPI有什么影响
制定策略:如何挽回损失/下次如何避免
6.注册类和活跃类指标,你会看哪个?
不同时期关注的指标不同,应区别对待
产品初期:关注产品的快速增长,会重点关注注册类指标
产品成熟期:关注用户的使用粘性,深度等,会重点关注留存和活跃类指标
7.估算一个某品牌门店的销售额
利用“二八原则”拆分,该门店主要以饮品为主,饮品主要以咖啡为主
①从需求端估算
CBD一共有多少人
喝咖啡的比例
每人每天喝几杯
②从供给端估算
忙时供给:忙时每小时多少杯,一天多少忙时
闲时供给:闲时每小时多少杯,一天多少闲时
8.你理解的数据指标是什么?指标口径是什么?
数据指标:有别于传统意义上的数据指标,它是通过对数据进行分析得到的一个汇总结果,是将业务单元精分和量化后的度量值,使得业务目标可描述,可度量,可拆解
数据指标需要对业务需求进行进一步抽象,通过埋点进行数据采集,设计一套计算规则,并通过BI和数据可视化呈现,最终能够解释用户行为变化及业务变化
数据指标一般与维度一起联合分析,从不同维度看同一个指标可能会有差异和业务上的发现
指标口径:举个简单的例子,很多企业会根据自身特点对“活跃用户数”有不同的定义,例如每日登录用户数(过滤掉匿名用户)即为活跃用户数;每日在线时长超过5分钟的用户数(过滤掉低质量用户)即为活跃用户数;每日访问页面超过5个的用户数(过滤掉低质量用户)即为活跃用户数
9.指标和维度的区别和联系
指标:用于定量评估业务好坏程度而建立
维度:描述指标的角度,可以理解为看问题的方面
唯独不能独立存在,一般都是搭配着指标一起分析,可以分析不同维度下的同一指标,也可以多个维度交叉,分析某一个指标,可能会有一些业务上的发现
10.你理解的指标是什么?有哪些组成部分?
指标是有业务含义的,体现业务变化的,不是瞎拍出来的。指标是复杂的,是有特定业务场景的
指标口径:指标的定义,业务定义比如活跃用户数,打开APP的用户数,指标一般与维度一起联合分析,从不同的维度看同一个指标可能会有差异和业务上的发现。同一个指标可能会被应用与不同业务,需要注意保证指标口径的统一,避免造成指标的歧义和误解
11.什么是指标体系,如何建立?
定义:一个指标不能叫体系,多个不相关的指标也不能叫体系,一个指标体系是多个相关的指标有机结合起来,具有严格的逻辑和分层体系
建立方法:①根据业务特点和生命周期选择第一关键指标或者叫北极星指标 ②贴合业务需求将第一关键指标进行逐层拆解,可以按流程拆,按时间区域拆,按公式加减乘除拆等 ③从上至下,从顶层战略或从KPI拆解 ④从下至上,叶子指标向上汇总成整体指标
12.如果要预测下个月的淘宝销量情况,你将如何进行分析?
收集数据:收集历史数据,汇总近几年每个月的销量
数据分析:观察数据分布结构
选用模型:选取合适的模型进行预测,比如,如果数据是线性增长,那么选用线性模型,如果数据表现不仅存在线性增长,还存在季节性因素,那么选用更复杂的模型,比如,时间序列相关的模型
效果评估:结合历史数据,评估模型预测的准确性。模型效果表现良好,那么可以结合模型给出下个月的淘宝销量,如果模型效果变现较差,返回第二步
13.一些商家为了提高商品的曝光量和排名,常常会进行刷单冲销量买好评,作为平台如何识别刷单呢?
流量方面:一般来说,A商品在刷单之前搜索排名会比较靠后,刷单用户在购买A商品时,只点击查看该商品,甚至存在秒拍的情况。用户下单前没有对比同个同款商品
成交方面:流量访问的转化率异常,因为刷单比例较高,故访问了该商品且转换的订单数占比会很高,在数据上的表现即为转化率异常高;商品成交量异常,刷单商品普遍在刷单之前成交量较低,故刷单之后,商品成交量可能会出现暴增
物流方面:一般来说,电商内部的物流订单号是唯一的,即不会重复,刷单商家为了节约成本,可能会重复利用同一个快递订单号;同时如若刷单,商家所发快递物品可能非真实原物,且会虚假发货,可从商品重量,件数预估物流运费,物流轨迹 + 时间等方面进行甄别
买家方面:建立黑名单库,识别刷单账号;同一个手机设备,不同账号,购买同一商品;对于同一个账号重复购买同一件商品;同一个IP网络地址,不同的手机设备,购买同一个商品
14.某业务部门在上周结束了为期一周的大促,作为业务对口分析师,需要你对活动进行一次评估,你会从哪几个方面进行分析?
不管是微商,电商还是店商,有三大关键要点,分别是人,货,场三个重要的环节
①人(用户)
活跃度:活跃的用户数
转换率:下单的用户数,转换率
成交额:成交总额,人均购买金额,人均购买件数
留存率:大促结束后的留存情况以及后续的成交情况
②货(商品)
曝光的商品数:如果存在大促商品池,那么可看曝光的商品数占比
成交的商品数:统计有成交记录的商品数,及成交商品数占比
商品丰富度:从商品的结构,种类进行分析,不同种类的商品成交曝光情况
商品供应量:分析大促的供需关系,是否存在商品库存情况
商品价格:大促期间商品价格的优惠情况
③场(大促活动)
用户大促活动参与度,,比如大促是否设置小游戏,如天猫盖楼游戏,可以分析游戏的参与度和完成度
漏斗转换,大促活动每一步的漏斗流失和转换情况,指导后续大促活动的设计优化
大促页面的活跃情况
15.GMV提升20%怎么分析?
背景确认:20%提升是指AB实验结果还是日常数据监控类,如果是AB实验,确认试验涉及的方案,如果是日常数据监控类,确认数据计算的业务场景
口径确认:确认数据计算的逻辑,20%中涉及到的指标分别是什么
数据分析:确认绝对提升是多少,比如GMV提升20%,可能绝对提升量为2k。业务场景较小,波动较大
问题分类:确认该问题属于正常波动还是异常类数据问题
16.数据不平衡处理
①定义
通常是指在二分类中,两类数据量悬殊,举个例子,化妆品购买人群中,男性有100人,女性有10000,男女比例严重失衡,称为数据不平衡
②为什么重要?
数据不平衡意味着对少数类别的信息捕捉不充分,刻画的特征缺失,进而导致机器学习算法中,趋向于将测试集预测为多数类别,得到的准确性能降低
③解决方案
A.过抽样
对少数类进行重抽样,至数量与多数类相似
在上述例子中,将男性的100个样本,进行有放回抽样,直至样本数量扩充到10000个为止
优点:简单粗暴,不损失样本量
缺点:导致严重过拟合,模型的泛化性降低
B.欠抽样
对多数类进行删减,直至数量与少数类相似
在上述例子中,对女性的样本进行筛选,从10000个样本中,随机无放回抽取100个样本
优点:简单粗暴
缺点:损失大量有效信息
C.人工合成法(SMOTE)
改良版的过抽样方法
原理:根据现有少数类样本的特征,人工创造更多的少数类样本
SMOTE算法分三步走:
计算距离:以男性的100个样本为基础,计算任意样本Xi与其他99个样本的欧氏距离,得到Xi的neighbors
确定采样倍率Y:Y根据不平衡的比例计算得到。之后,对任意Xi,选取y个neighbors,记其中任意一个neighbors为Xy
创造新样本:Xnew = Xi + rand(0,1) * |Xi - Xy|
17.某一新上线功能,预期提高留存率0.1,实际提高0.05,怎么分析?
确定不是数据异常后,就分析指标下降的原因;确定该数据指标的属性:名称,数值,单位和口径(统计方式,统计范围)
再就是明确问题的描述,指标下降,是什么时间段和什么周期比较
其次定位发生的位置,是谁的销售额变低?不同用户,不同产品,不同渠道来划分
再问题拆解,公式法或业务流程拆解,销售额 = CV * 转化率 * 客单价,CV = 各方面来源的流量(免费和付费)等
确定具体原因后,分析为什么会有这个原因,内部原因:网站改版,产品更新,广告投放;外部原因:采用PEST分析法分析
18.用户流失的分析,老用户的流失和新用户的流失有什么不同?
①用户流失分析
两层模型:细分用户,产品,渠道,看到底是哪里用户流失了,注意由于是用户流失问题,所以这里细分用户时可以细分用户处在生命周期的哪个阶段
指标拆解:用户流失数量=该群体用户数量*流失率。拆解,看是因为到了这阶段的用户数量多了,还是这个用户群体的流失率比较高
内外部分析
内部:新手上手难度大,收费不合理,产品服务出现重大问题,活动质量低,缺少留存手段,用户参与度低等
外部:市场,竞争对手,社会环境,节假日等
②新用户流失和老用户流失有什么不同?
新用户流失:可能是非目标客户,产品不满足需求,难上手,竞品影响;要考虑如何在较少数据支撑下做流失用户识别,提前防止用户流失,并如何对有效的新用户进行挽回
老用户流失:可能是达到生命周期衰退期,低端用户驱逐,满足前期用户需求,竞品影响;老用户产生的消费数据较多,容易识别流失用户,做好防止流失更重要,同时考虑用户生命周期剩余价值,是否需要挽回
19.公司进行了一次活动,需要做评估,从哪些方面着手分析?
①确定促销的目的:拉新?促销活动?还是清库存?
②根据目的确定核心指标
③效果评估:与自身在活动前和活动中比较,与预定目标比,与同期其他活动比,与往期同类活动比
④持续监控:检查活动后情况,避免透支,根据后续数据检验质量
20.深圳有多少理发店?
( 在进行费米问题估算时,需要将很难获得的数据拆分为容易获得的数据
费米问题有专门逻辑套路,一般有需求端,供给端,供需端三个方面
①需求端是从用户需求的角度出发去计算市场的大小,将指标一步步拆解,若还有未知量继续拆解
②供给端是从企业供给能力出发评估企业能够支持多达市场规模
③供需结合,是最简单的方式,分为以小见大和以大见小两个方法 )
广东1.15亿人,深圳1340万人
理发店的服务对象是人,是生活需求,可从城市人口方面预估
理发师总数 = 理发店总数 * 平均每个理发店的理发师人数
平均每个理发店的理发师人数假设为5个
每个理发师每天工作8小时,一个月工作240小时
每个人每个月剪头发一次用一小时
从而每个理发师每个月理发人数 = 240人
即每个理发店每月理发人数 = 240 * 5 = 1200 人
理发店数量 = 1340 万 / 1200 = 1.1 万家左右
21.如果新开一个店,主要关注什么指标?
(可以一边提问,一边回答的方式,梳理一下大致的业务流程,有助于了解整个业务)
新开的店,可以从业务发展的不同阶段思考
既然是新开的店,说明处于业务发展(AARRR模型)的流量获取阶段,我们现阶段的关注点应该是人流量,所以增加到店体验人数为主要目标
初创阶段:要增加到店体验人数,没有历史数据的时候,先进行用户调研,问卷调查,行业研究,竞品分析,找出目标客户的用户画像,精准推广,用户画像关注的用户属性有性别,年龄,省份,行业,是否会员等,常见的行为属性有新/老用户,是否有交易,回访频率,用户来源,会员等级;主要指标有点击率,留资率,到店率,转化率
增长阶段:积累一部分成功案例后,开始重点关注客户体验营销的全流程,推广效果跟踪,售前体验满意度调查,售中流失原因反馈,售后满意度调查。主要指标有:净推荐值,满意度,忠诚度,用户流失率
22.留存率下降如何分析?
以新用户留存率下降为例,从用户,产品,运营侧分析原因
①用户
新用户是否为薅羊毛用户,是否是目标用户
解决办法:根据用户画像判断是否为目标用户,若是,考虑采取调研的方式寻找原因
②产品
产品的新手引导是否体验较差
产品功能是否不吸引用户
解决办法
不要告诉别人(网上的汽车空气滤芯能买吗)汽车空气滤芯长什么样-淘宝上买汽车空滤芯,店家要求提供车架发动机号码,可以给吗?
不要告诉别人(网上的汽车空气滤芯能买吗)汽车空气滤芯长什么样-淘宝上买汽车空滤芯,店家要求提供车架发动机号码,可以给吗?。以下内容由汽配114小编为您整理。
无论在哪里买汽配、4s店、汽修店、汽贸城等,都需要车主提供车架号,这样做的原因有两个,一是要保证零部件和汽车的精准匹配,二是提高销售(零部件)人员的工作效率,因为一辆汽车上的零部件太多,而零部件业务往往卖掉它们。
配件品牌众多,使用EPC系统通过车架号直接匹配适合车辆的配件是最理想的操作方法,车架号是车辆的身份证,车厂里的车架号其实是通过具体的规则来说明是什么车的!这相当于说,只能通过身份证来验证和区分两个人。
我们一般如何确定配件?一般情况下,配件供应商只需要你的车的品牌,发动机的排量和型号,车的型号就知道你需要什么样的空滤,但是为什么我们购物的时候要问车架号在线的?因为它不是100%确定它是正确的。
当您在淘宝上购买汽车空气滤清器时,商店要求买家提供车辆的车架号和发动机号,有什么不对?答案是没有什么棘手的!这是商家的专业服务态度,您可以放心提供,这是商家责任的体现,因为有些车型不同配置版本会使用不同的空气滤清器。
这是很多车主都不知道的事情,有的车主甚至不知道自己买的是什么配置版本.不清楚,它只会说手动或自动,高或低,带或不带天窗,这很容易导致商家发错商品,因为他们无法得到准确的信息,但如果收到的商品不合身。
你就吵着要差评,商家要支付运费为您重新发送,车架号是汽车的身份证,与车主无关,不存在车主个人隐私信息泄露。如果卖家销售某款车型的滤芯,一般不需要车架号和发动机号。
以东风标致车型为例,它的模型很少,说到年份和位移,基本没有错。如果是大众车,但不一定,车型太多,有时某年新旧车型同时销售,只有当年车型和排量难免会出错,汽车上有成千上万的配件。
同一辆车将有不同的配置和年份,每次制造商更换车型,就意味着这辆车上的某些零件会与上一代不同,市场上的车型和版本太多了,即使是最有经验的人也记不住每辆车每个零件的编号。
因此,这里需要应用配件的采购和销售系统,只要输入帧号,基本不会出错。当然,这不是绝对的,比如一些老款车型上的一些配件无法通过车架号进行查询,主要是因为之前的系统不够完善,还有一些损坏率很低的小配件很难通过系统查询。
打开UC浏览器 查看更多精彩图片
通常,一个模型将具有多个排量发动机,我们比较常见的是1.5/1.8/2.0等,空滤的型号不仅和整车有关,而且和发动机也有很大关系,有的车型为了提高发动机性能会安装很多配件,此时会影响发动机舱的大小和位置。
根据排量的不同,发动机的尺寸和配置也会有所不同,大排量的发动机和涡轮增压发动机将需要更大的进气量。一般使用的空气过滤器的尺寸会小于排量大,当车主和销售人员表达需求时,销售人员需要快速、大量地了解车辆信息。
此时,型号、年份、发动机型号的原因还不够,无法获取足够有用的关键信息。并且汽车的所有信息(零件、工厂、保养、更换、维修等)都与车架号直接挂钩,配件销售人员准确找到适用配件的最直接方式是通过车辆识别码(车架号)。
除了登记车辆的制造商型号配置等信息外,底盘号主要是用于日常购买配件和保养的代码。只有车架号才能准确锁定您想要的配件的零件号,与个人隐私信息无关,当我们在网上购买汽车零部件时,我们经常会寄错东西。
购买的汽车配件与您的型号不同,因为汽车配件非常专业,汽车零部件种类繁多,需要通过EPC汽车零部件电子目录图查询软件,借助车架号进行查询,否则错误率会很高
..微信投票互助群算不算作弊,微信投票互助群算不算作弊,各种互助群2023,我们的618 理想生活狂欢季互助群公告文案可以一起完成活动,加入后可以向一起互帮琵助,快速完成任务哦!