欢迎访问生活随笔!

生活随笔

您现在的位置是:首页 > 形式科学 > 统计学 > 数据分析

数据分析

爬了知乎200万数据,图说程序员都喜欢去哪儿工作

发布时间:2022-06-02数据分析 统计学
因为最近和朋友吃饭,大家都到了大三季,都在纠结自己该以哪里作为自己职业发展的起点?也想看看自己的背景,能不能找到靠谱的师哥师姐帮忙,那么师哥师姐都在哪里发光发亮呢?

因为最近和朋友吃饭,大家都到了大三季,都在纠结自己该以哪里作为自己职业发展的起点?也想看看自己的背景,能不能找到靠谱的师哥师姐帮忙,那么师哥师姐都在哪里发光发亮呢?

我当时也是午休的时候想到,知乎有那么多结构化的好的数据,不如抓取之,拿来分析可以看看名校生们都在哪?

我们行业的人都喜欢哪,哪里每年带走一堆人?

然后花半小时写了个多线程爬虫,爬下来几百万数据(其中每个学校的大圆圈占比代表该校学生在调研总数中的占比)

这次抓取的数据量有将近200万,跑了一个下午,然后我把没有公司或者教育学校的筛掉,就还剩25万了~