【实操】SQL数据清洗&TABLEAU数据可视化操作
背景
想要对数据分析岗位的市场需求、就业情况、岗位技能做一个简单调查。利用爬虫采集完毕数据分析的相关信息。只考虑北上广深的一线是城市。
报告先行~
目标确认与目标拆解
数据清洗
- 缺失数据处理&限定岗位–>data_clean_null_jobname
某字段为null或空字符的删去;限定岗位名称带有“数据”二字
1 |
|
- 处理重复发布的数据–>data_clean_distinc
利用对发布时间的排序可以选择最近发布的重复数据
1 |
|
- 限定城市为北上广深四个–>data_clean_don
建立新的城市字段,方便后续利用字段进行分析
1 |
|
数据分析
市场需求分析
- 各城市招聘数目对比&占比情况
1 |
|
- 各企业类型招聘数目对比&占比情况
1 |
|
- 各工作年限招聘数目对比&占比情况
1 |
|
薪资情况分析
由于薪资字段还没清洗好,所以规范薪资字段,得到最大值、最小值和平均值
1 |
|
- 各城市平均薪酬情况
1 |
|
- 各企业类型平均薪酬情况
1 |
|
- 各工作年限平均薪酬情况
1 |
|
核心技能要求分析
- 各技能出现频率统计
1 |
|
- 各企业类型的核心技能要求情况
由于技能种类太多,所以需要筛选出每种企业类型要求频率前十的技能,并在每个分组里按照技能频率降序排序
1 |
|
- 各工作年限的核心技能要求情况
1 |
|
结论
需求方面
数据分析需求最旺盛的城市是上海
数据分析需求最多的企业类型是民营企业
数据分析最需要的工作经验是3-5年
薪资方面
数据分析师的薪资很有竞争力
北京的平均工资最高
1-3年的平均薪资为9k,10年以上的薪资不具备参考
不同企业的平均薪资相差不大
技能方面
- 核心技能为SQL、大数据、Excel、Python、报告、数据挖掘等
【实操】SQL数据清洗&TABLEAU数据可视化操作
https://liaoweiquan.github.io/2020/11/06/数据分析岗位分析/