快好知 kuaihz订阅观点

 

金秋十月跳槽季 ——为你解答大数据&数...

“金秋十月,尽情挥洒”,国庆节又快要到了,各大企业招聘旺季还在如火如荼地进行着,期盼了好久的7天国庆长假,你是不是打算来场说走就走的旅行,在这之前,也勇敢地进行了一次说走就走的辞职,想给自己全新的开始。想进入或转行到大数据或数据分析领域的朋友们,戳进来好好看看,2018年大数据&数据分析行业的面试机密吧,我亲自为你解答!

为了帮助更多即将进入数据分析行列或大数据领域的朋友找到更好更适合自己的工作,CDA数据分析研究院分享了一份2018年10个常见大数据&数据分析面试题合集,既有基本的业务分析面试题,也有高阶数据挖掘算法试题,更有分析工具应用试题来指导你准备面试,试题均附有答案。

Q1:说明数据分析挖掘的基本流程。

1) 定义问题,获取数据

2) 数据存储和提取,结合相关业务知识理解数据

3) 数据清洗,整合与检查数据,缺失值和异常值处理

4) 数据预处理,特征工程

5) 数据建模与分析

6) 数据可视化

Q2:说明相关分析、回归分析的联系和区别。

A2:联系:二者都是对变量之间不严格依存关系的分析,在理论基础和方法上具有一致性。只有存在相关关系的变量才能进行回归分析,相关程度越高,回归分析的结果越可靠。

区别:相关分析研究的是变量之间的依存关系,这些变量的地位相等,不区分主从因素或因果关系。回归分析却是在控制或给定一个(或多个)变量条件下来观察对应的某一变量的变化,给定的变量为自变量,被观察的变量为因变量。因此回归分析中必须根据研究目的来确定自变量和因变量。

相关关系主要测定的是变量之间关系的密切程度,回归分析则着重于变量之间的具体变量关系,通过建立回归模型,控制或给定自变量进行估计和预测。

Q3:分别简述基于内容推荐算法和基于用户的协同过滤推荐算法的原理。

A3:基于内容推荐算法:基于物品或内容的特征,发现物品之间的相似性,然后基于用户以前的喜好记录推荐给用户相似的物品。本质是对物品或内容进行分析建立特征,基于用户对什么特征的内容感兴趣以及分析一个物品具备什么特征来做推荐。不考虑用户之间的关系,只关注物品本身的特征,根据Item获得与之特征相似的Item进行推荐。简单来说就是根据用户之前喜欢的物品,通过对特征的匹配分析,预测用户的喜好。

基于用户的协同过滤推荐算法:寻找与目标用户有相同喜好的邻居,然后根据邻居的喜好向目标用户进行推荐。基本原理就是利用用户访问行为的相似性来推荐用户可能感兴趣的资源。根据用户-物品的评分矩阵,计算用户的相似度,根据相似用户的喜好进行推荐。主要关注User与Item之间的关联,与具体Item本身的特征没有关系,基于相似用户会喜欢相似物品的假设进行推荐。简单来说就是根据和某一用户有相似喜好的其他用户的喜好,从而预测该用户对物品的可能喜好。

差别在于:协同过滤必须要有用户行为,基于内容的推荐不考虑用户行为。冷启动阶段只能用基于内容的推荐,因为没有用户行为数据,积累一段时间用户行为数据后才可以使用协同过滤。

从用途上来说,协同过滤适合给用户带点新鲜感的使用场景,如“逛”淘宝的用户;而基于内容推荐更适合用户焦点比较集中的使用场景,如垂直领域的内容推送。

Q1-Q3主要考察应聘者对数据分析方法、流程和算法的理解及应用能力。

Q4:A员工12月份总绩效得分为90分,已知:总绩效得分在60分以下时,绩效工资为0元,60-80分时,绩效工资为80元,80-100分时,绩效工资为100元。请用Excel函数判断A员工的绩效工资。

A4:=IF(A<60,0,IF(A<80,80,100))

Q5:列出你知道的Excel函数,并简要介绍使用方法。

A5:Excel常用的函数有: SUM求和函数、AVERAGE求平均值函数,COUNT计数函数、IF逻辑判断函数、NOW日期时间的无参函数、VLOOKUP查找引用函数,ISNUMBER判断是否为数字函数,SUMIFS多条件求和函数等等。

Q4、Q5主要考察业务数据分析师使用Excel处理轻量数据进行业务分析的能力。

Q6:用SQL删除表A中字段B=“b”的重复记录。

A6:delete from A where B in (select B from A having count(B)>1 and B=’b’);

Q7:现有两张表,A表:id,学号,姓名,年龄。B表:学号,语文,数学。用SQL查找语文和数学分数都大于80的同学姓名。

A7:select 姓名 from A where 学号 in (select 学号 from B where 语文>80 and 数学>80);

Q6、Q7主要考察SQL语法,应聘者对数据库的基本操作能力。

Q8:用Python实现以下程序:检测用户输入的手机号码是否合法。

A8:

import datetime

#encoding:utf-8

#这是一个用来检测用户输入手机号码是否合法的小脚本。

def phonecheck(s):

  #号码前缀,如果运营商启用新的号段,只需要在此列表将新的号段加上即可。

  phoneprefix=[""130"",""131"",""132"",""133"",""134"",""135"",""136"",""137"",""138"",""139"",""150"",""151"",""152"",""153"",""156"",""158"",""159"",""170"",""183"",""182"",""185"",""186"",""188"",""189""]

      #检测号码是否长度是否合法。

  if len(s) != 11:

      return("The length of phonenum is 11.")

  else:

      if  s.isdigit():#检测输入的号码是否全部是数字。

          if s[:3] in phoneprefix: #检测前缀是否是正确。

              return("The phone num is valid.")

          else:

              return("The phone num is invalid.")

      else:

          return("The phone num is made up of digits.")

if __name__=="__main__":

  phonenum=input("Input your phone num:")

  valid=phonecheck(phonenum)

  nowTime=datetime.datetime.now().strftime(""%Y-%m-%d %H:%M:%S"")#现在

  if (valid == ""The phone num is valid.""):

      print(nowTime,phonenum[0:3],phonenum[3:7],phonenum[7:],sep="" "")

  else:

      print(""The phone num is invalid."")

Q9:请写一个Python逻辑,计算一个文件中的大写字母数量。

A9:

import os

os.chdir(""C:UserslifeiDesktop"")

with open(""Today.txt"") as today:

count=0

for i in today.read():

if i.isupper():

count+=1

print(count)

Q8、Q9主要考察应聘者的Python基础编程能力。

Q10:逻辑思维题:小王、小张、小赵三个人是好朋友,他们中间其中一个人下海经商,一个人考上了重点大学,一个人参军了。此外他们还知道以下条件:小赵的年龄比士兵的大;大学生的年龄比小张小;小王的年龄和大学生的年龄不一样。请推出这三个人中谁是商人?谁是大学生?谁是士兵?

A10:小赵的年龄比士兵的大,赵是商人或是学生。

学生的年龄比小张大,小张不是学生,张是商人或是士兵。

小王的年龄和大学生的不一样,小王不是学生,王是商人或是士兵。

王和张都不是学生,那么赵就是学生了。

小赵的年龄比士兵大,大学生的年龄比小张小,小张比小赵大,而小赵比士兵大,那么小王是士兵,小张是商人。

Q10考察应聘者的逻辑思维能力,是否具备从海量数据中挖掘有趣关系的分析思维。

数据小白在谋求一份数据分析工作前,必须熟知数据分析的基础知识。除了上文提到的相关知识,一名合格的数据分析师还应该掌握相关的行业动态,能够敏锐的把握数据背后的潜在规律,为业务发展做出正确指导和决策。

整装待发,以待来日!黄金招聘季,你准备好如何脱颖而出了吗?

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:金秋  金秋词条  跳槽  跳槽词条  十月  十月词条  解答  解答词条  数据  数据词条  
求职

 10年之后,你靠什么赚钱?

前几天无意间陷入一对母子的争执之中,事情是这样的。这个儿子呢,大学刚毕业,对于未来一片茫然,有好几位同学都去澳洲游学打工,于是他也跃跃欲试,想在进入职场前来段人...(展开)