终于搭好了博客

编程与开发王开新 发表了文章 • 3 个评论 • 140 次浏览 • 2016-04-17 17:10 • 来自相关话题

这里和csdn博客都不太方便用markdown,于是就自己搭了一个博客,感兴趣的同学也可以自己试试。
以后的文章会像本文一样直接给一个链接:http://keson96.github.io/2016/04/17/2016-04-17-终于搭好了博客/​
  查看全部
这里和csdn博客都不太方便用markdown,于是就自己搭了一个博客,感兴趣的同学也可以自己试试。
以后的文章会像本文一样直接给一个链接:http://keson96.github.io/2016/04/17/2016-04-17-终于搭好了博客/
 

2016年阿里巴巴、腾讯等公司暑期实习面试经验分享

求职经验刘伙玉 发表了文章 • 0 个评论 • 590 次浏览 • 2016-04-12 16:28 • 来自相关话题

我的CSDN博客:http://blog.csdn.net/huoyu326/article/details/51134341 
其实我一直不是很喜欢写东西,但我常怀着一颗感恩的心去阅读别人的博客,别人各种形式的分享,希望之后能慢慢培养自己写东西的习惯,学会分享,学会感恩!

那么就从今天开始吧!

我今年研二,其实从研二上学期开始我就已经没有课,研二上学期的计划本来是出国交换,后来没能去成就只能待学校了,然后上学期在学校就过得浑浑噩噩了,在天池数据竞赛平台上打了几场比赛的酱油,然后看了些机器学习方面的课程,总的来说,没有太多的收获。春节期间在家也是整天玩,直到临近寒假结束前班长在群里发消息说可以投腾讯的暑期实习的内推,我才意识到又到了该找实习的时候了,心里突然变得紧张起来,既有对自己上学期表现的反省,又有对未来的思考,毕竟,读了十几年的书,即将要步入新的人生阶段了。

所以,我关注实习基本就是从寒假末期开始。先说下基本情况,大概从2月25日开始投递简历,3月1日开始,阿里、腾讯等公司的内推陆续都开始了,百度开始的比较晚,到此时还没开始春季实习招聘(好像是4月15日简历截止),3月底我拿到了阿里巴巴蚂蚁金服、腾讯sng的实习offer。4月也带着参加其他公司的笔试、面试。

整个找实习的过程大概持续了1个月。这个月真的压力挺大,挺紧张的,一直在学习,修改简历,熟悉以前做过的项目。有人说我太紧张了,一个实习而已,没必要那么拼。其实,我是将这次实习看做是秋招的模拟考场,我想通过这次找实习的经历,增加对各个公司的了解,熟悉面试的各个环节;还可以和面试官了解公司文化,公司的组织架构,公司里现在常用的数据挖掘工具,在校期间如何去学习等等。总而言之,我这次找实习的经历基本达到了我最初的期望。

我估计自己应该投了几十份简历出去,主要的公司有:阿里巴巴、腾讯、百度、网易互联网、网易游戏、ebay、滴滴、万得资讯、星环科技、神马搜索等(一堆之前不是很了解的公司,在实习僧网站上投的)、微软苏州、搜狐、蘑菇街、亚马逊、Morgan Stanley上海、携程、京东等,还有一票银行,招商银行、平安银行等等,还有一些一时没想起来的。基本就是通过学校BBS的JobExpress版,实习僧网站,朋友圈的帖子,好友的推荐,以及百度里搜“**公司招聘”等方式去投的,有时候复习的烦了就去投简历了,一不下心发现投了好多,哈哈哈。目前,还有好多公司投了之后就没消息了,尤其是在实习僧网站上,可能本来招的人少,然后可能也过期了;有些公司要求去现场面的我都拒了。估计后面还会陆续接到笔试面试通知。

接下来主要谈谈几个公司的面试经历。

阿里巴巴蚂蚁金服 数据分析师、算法工程师
阿里巴巴:其实今年阿里的经历有点坎坷。由于我去年暑期在阿里巴巴技术保障部实习过,今年我想换去蚂蚁实习,刚开始内推没成功,因为之前的实习简历被锁了,去找之前团队的主管,主管又想让我留在原来的团队,纠结了几天后就想算了,就留下来吧。到最后主管又和我说,竞争比较大,建议我换个团队,然后…….。然后我又被内推到蚂蚁去了,当时都到3月的第二周了,按照我的经验,内推还是越早越好。反正不管怎样,流程都是要重新走的,要面试,不是说以前实习过就可以免试的。(这当中有一些心理斗争,就不多说了,现在想想都是些浮云)

我官网的title是数据研发工程师,备注里写的是数据分析师,最后应该是去做算法的,所以不要来问我是什么岗位,不过暂且认为是算法工程师吧,因为实习入职之后主要应该是做那方面的工作。所以当时面试压力比较大,一个原因就是我还没做好心理准备去面算法工程师岗。

一面:记得不是很清楚了,主要是项目吧,主要谈了两个,一个是在校期间做的项目,发了一篇论文,用了CRF;另外一个是去年参加的天池大数据竞赛用到的算法,arima模型,如何选择参数等,还问了其他时间序列分析的方法。因为简历上写了本科修了金融学双学位,问我期权等的定价问题,我基本没答上来,都忘了。拿个模型说说参数如何训练,如lr,svm。说一说牛顿法,当时还没怎么看牛顿法。随机森林单棵树在大数据量下如何做并行化处理,加快训练速度。

最后用线上测试平台写了两个简单的算法题(面试官可以实时看到我写的代码),第一道貌似是有序数组,会有重复,给定一个值,返回这个值第一次出现的位置;另一道是链表反转的题。我猜想因为面试官知道我本来投的是数据分析师,所以给我出的题稍微简单点吧。

二面:这一面是主管面。聊了我之前在阿里的实习经历,讲了讲Hbase的原理。然后问了些机器学习算法的问题,面完之后留了一道题当时就没记录面试的题所以基本忘了,我记得有一题是层次聚类如何做并行化。还有一道100亿个浮点数,存储在1000个文件中,怎么选出最大的前10000个数。还问了C++的问题,当时就完全懵了,很久没用过C++了,而且当时最后几个章节的内容老师是带着我们坐飞机的,瞬间结束了后面的课程内容,主要问了虚函数,多态,template等。最后留了一道题,思考1-2天,回邮件。大概的意思是构建一个性价比推荐模型,或者说是:商品性价比排序模型,已知你能想到的所有信息,商品信息,用户行为信息(浏览、购买等等),构建一个性价比推荐模型(不考虑用户的个性化),而且这个性价比当然是针对同类商品来说的,比如说 AB两架钢琴,同时展现给5000个用户,最后有人选择了A,有人选择了B,但是选择了A的远远多于B,说明A的性价比高于B。对题目理解还是有些疑问的,最后写了8-9页的文档交过去了。

三面:交叉面。面试官非常nice,主要和我聊了聊项目和比赛,聊了聊金融学双学位,我说很久没复习了都忘了,面试官也表示理解,哈哈。然后聊了聊之前的实习经历。整个过程非常轻松愉快。

四面:HR面。HR面基本也是围绕简历来吧,我觉得基本HR面不会有太大问题吧,三观不要出大问题就好,始终保持积极、向上、自信的状态就好。


腾讯mig、sng  基础研究

mig一面:最开始的时候被内推到了mig。面试官也是非常nice的,还是非常喜欢腾讯的面试官的,包括后面我还和挺多的腾讯面试官聊过,都非常好。这一次的面试可以说对我的影响非常大,因为被追问的很方(huang)。反正就是围绕一个问题一直被追问下去,越问越深,要求你对问题的理解非常深刻,需要对自己的项目非常了解,而且不仅要了解,还得自己去思考,去多问自己为什么。

1、我的一篇论文:多特征下的科研论文段落划分和构成要素识别研究
        360度了解我这个论文的各个方面,当然叙述性的都是小问题,什么论文的特点,国内外相关研究的现状等,重点在于算法的选择、特征的选择(如何选择有意义重要的特征)、特征的挑选,是否选用其他模型,为什么不选用。面试前真没准备这么多,这篇论文又是一年前写的。
2、他们自己业务中碰到的问题,主要考察特征工程方面的知识 :几千维的特征如何选择(看哪些重要哪些不重要)、正负样本不均衡的问题、如果一个特征是稀疏特征,该如何处理?等。
3、比赛
       比赛的基本介绍,略去。随机森林算法,为什么不用gbdt,样本少特征少为什么还用随机森林;arima,为什么不用ar和ma模型?时间序列的基本含义。

4、随便聊聊
       平时怎么学习,看外文文献吗,深度学习有了解吗,一般看什么会议的论文呢。    
       面试是用微信语音进行的,因此加了面试官的微信,后续有问题也和他交流过,非常不错的一个面试官,值得交朋友。

sng一面:可以说是被mig那个团队刷了,也可以说是因为我不适合他们团队,所以面试官把我推荐到了其他团队,我就开启了sng面试之旅。
1、比赛
2、项目 印象最深的一个
3、算法题,忘了
4、hbase的容灾

sng 二面:
偏安全的团队,为所有sng团队提供安全服务,主要是短文本处理啥啥的。
问的比较深的是之前做过的一个相似性检测项目,项目里用到的算法,算法的设计,算法的时间复杂度等。
问了面试官之后要求的技能:
1、linux 要很熟或者说比较熟,包括操作,和linux开发
2、分布式计算   hadoop mapreduce   spark等都得会
3、语言没关系,c++或者java都行。

sngHR面:
家乡、家人、深圳房价、女朋友啥都问;阿里的企业文化,个人感觉如何;如果同时拿到了阿里和腾讯的offer,最终会选择哪个,求问这类问题如何回答!

最后由于我说我想去偏算法的团队,HR姐姐非常nice地让我和数据中心的主管聊,我基本了解了那边的数据中心主要的工作,也是比较感兴趣的。

写的有些累了,后面的简单概括吧。

其他公司简单回顾下:
ebay搜索部门:GC机制、单例模式、java虚拟机、二分法原理;数据结构:栈和队列的相同点等几道比较简单的;条件随机场模型的原理。

Morgan Stanley:全英文面试。一面:分为三部分,第一部分快速回答十几二十道题,第二部分较为详细地回答几道问答题,第三部分谈项目。是否通过一面还不知道情况。

携程的笔试:投的岗位是数据挖掘工程师。唯一一次比较有信心的笔试,因为比较简单。4部分,前三部分分别为数字题、推理题、图形题,各10分钟,10道题。最后14道题,90分钟,10道选择题,都是关于机器学习算法的,后面几道问答题,逻辑回归的推导,underfitting和overfitting概念、如何判断、如何避免,距离的定义方式等。

银行的笔试:随便看了看,行测题还是挺多的。

网易:数据挖掘工程师。笔试挂了,一是确实比较难,二是笔试过程中腾讯的HR面来了,直接就去接电话面试去了。

网易游戏:商业智能研究员。笔试三小时,就昨天,下午有事,最后只剩一小时答题时间,直接放弃了。大概浏览了题目,有推理题、sql题、算法题等。

蘑菇街:算法工程师。直接简历被刷了,唯一一家简历被刷的公司。不过很高兴认识了我们学校物理学院的大四的小学弟,他毕业后就入职蘑菇街了(据说蘑菇街去年给工资给的不错啊,学弟学妹也可以关注下,base在杭州,应该快上市了),后来从学弟那得知是他们今年招的人少,极少极少,简历才被刷的。

京东收益管理种子计划:2016年3月种子计划全面启动;2016年5月 收益管理课程培训,由内点-斯坦福教员任教;2016年7月收益管理暑期实习;2017年夏赴斯坦福进行相关培训;2017年秋经选拔后成为京东收益管理团队正式员工。我觉得还是个不错的选择,还在朋友圈分享过,不知道有没有学弟学妹关注过。最后我是通过了简历筛选,通知去上海参加面试,我咨询过通过率在30%-40%,可能性还是比较大。后来由于我觉得这个项目不适合研二的参加,而且也拿到其他offer了,就没去参加面试了。

总结一下:
1、提前准备。我一直觉得任何事情都应该提前准备,机会是给时刻准备着的人的!
2、抓住每一个机会。其实工作机会是有非常多的,有很多好的公司,而且有的时候好的团队会更重要,我们要善于抓住每一个机会,那样你会有更多的选择!
3、简历和实力。个人觉得我面试过程中很多时候谈简历上的东西比较多,这样会占点优势;但这样就需要你有一些项目和比赛会吸引到面试官,因此我建议大家在校期间积极参与到项目中,踏踏实实做点与自己未来就业方向相关的事情,提升自身实力的同时丰富自己的简历!

  查看全部
我的CSDN博客:http://blog.csdn.net/huoyu326/article/details/51134341 
其实我一直不是很喜欢写东西,但我常怀着一颗感恩的心去阅读别人的博客,别人各种形式的分享,希望之后能慢慢培养自己写东西的习惯,学会分享,学会感恩!

那么就从今天开始吧!

我今年研二,其实从研二上学期开始我就已经没有课,研二上学期的计划本来是出国交换,后来没能去成就只能待学校了,然后上学期在学校就过得浑浑噩噩了,在天池数据竞赛平台上打了几场比赛的酱油,然后看了些机器学习方面的课程,总的来说,没有太多的收获。春节期间在家也是整天玩,直到临近寒假结束前班长在群里发消息说可以投腾讯的暑期实习的内推,我才意识到又到了该找实习的时候了,心里突然变得紧张起来,既有对自己上学期表现的反省,又有对未来的思考,毕竟,读了十几年的书,即将要步入新的人生阶段了。

所以,我关注实习基本就是从寒假末期开始。先说下基本情况,大概从2月25日开始投递简历,3月1日开始,阿里、腾讯等公司的内推陆续都开始了,百度开始的比较晚,到此时还没开始春季实习招聘(好像是4月15日简历截止),3月底我拿到了阿里巴巴蚂蚁金服、腾讯sng的实习offer。4月也带着参加其他公司的笔试、面试。

整个找实习的过程大概持续了1个月。这个月真的压力挺大,挺紧张的,一直在学习,修改简历,熟悉以前做过的项目。有人说我太紧张了,一个实习而已,没必要那么拼。其实,我是将这次实习看做是秋招的模拟考场,我想通过这次找实习的经历,增加对各个公司的了解,熟悉面试的各个环节;还可以和面试官了解公司文化,公司的组织架构,公司里现在常用的数据挖掘工具,在校期间如何去学习等等。总而言之,我这次找实习的经历基本达到了我最初的期望。

我估计自己应该投了几十份简历出去,主要的公司有:阿里巴巴、腾讯、百度、网易互联网、网易游戏、ebay、滴滴、万得资讯、星环科技、神马搜索等(一堆之前不是很了解的公司,在实习僧网站上投的)、微软苏州、搜狐、蘑菇街、亚马逊、Morgan Stanley上海、携程、京东等,还有一票银行,招商银行、平安银行等等,还有一些一时没想起来的。基本就是通过学校BBS的JobExpress版,实习僧网站,朋友圈的帖子,好友的推荐,以及百度里搜“**公司招聘”等方式去投的,有时候复习的烦了就去投简历了,一不下心发现投了好多,哈哈哈。目前,还有好多公司投了之后就没消息了,尤其是在实习僧网站上,可能本来招的人少,然后可能也过期了;有些公司要求去现场面的我都拒了。估计后面还会陆续接到笔试面试通知。

接下来主要谈谈几个公司的面试经历。

阿里巴巴蚂蚁金服 数据分析师、算法工程师
阿里巴巴:其实今年阿里的经历有点坎坷。由于我去年暑期在阿里巴巴技术保障部实习过,今年我想换去蚂蚁实习,刚开始内推没成功,因为之前的实习简历被锁了,去找之前团队的主管,主管又想让我留在原来的团队,纠结了几天后就想算了,就留下来吧。到最后主管又和我说,竞争比较大,建议我换个团队,然后…….。然后我又被内推到蚂蚁去了,当时都到3月的第二周了,按照我的经验,内推还是越早越好。反正不管怎样,流程都是要重新走的,要面试,不是说以前实习过就可以免试的。(这当中有一些心理斗争,就不多说了,现在想想都是些浮云)

我官网的title是数据研发工程师,备注里写的是数据分析师,最后应该是去做算法的,所以不要来问我是什么岗位,不过暂且认为是算法工程师吧,因为实习入职之后主要应该是做那方面的工作。所以当时面试压力比较大,一个原因就是我还没做好心理准备去面算法工程师岗。

一面:记得不是很清楚了,主要是项目吧,主要谈了两个,一个是在校期间做的项目,发了一篇论文,用了CRF;另外一个是去年参加的天池大数据竞赛用到的算法,arima模型,如何选择参数等,还问了其他时间序列分析的方法。因为简历上写了本科修了金融学双学位,问我期权等的定价问题,我基本没答上来,都忘了。拿个模型说说参数如何训练,如lr,svm。说一说牛顿法,当时还没怎么看牛顿法。随机森林单棵树在大数据量下如何做并行化处理,加快训练速度。

最后用线上测试平台写了两个简单的算法题(面试官可以实时看到我写的代码),第一道貌似是有序数组,会有重复,给定一个值,返回这个值第一次出现的位置;另一道是链表反转的题。我猜想因为面试官知道我本来投的是数据分析师,所以给我出的题稍微简单点吧。

二面:这一面是主管面。聊了我之前在阿里的实习经历,讲了讲Hbase的原理。然后问了些机器学习算法的问题,面完之后留了一道题当时就没记录面试的题所以基本忘了,我记得有一题是层次聚类如何做并行化。还有一道100亿个浮点数,存储在1000个文件中,怎么选出最大的前10000个数。还问了C++的问题,当时就完全懵了,很久没用过C++了,而且当时最后几个章节的内容老师是带着我们坐飞机的,瞬间结束了后面的课程内容,主要问了虚函数,多态,template等。最后留了一道题,思考1-2天,回邮件。大概的意思是构建一个性价比推荐模型,或者说是:商品性价比排序模型,已知你能想到的所有信息,商品信息,用户行为信息(浏览、购买等等),构建一个性价比推荐模型(不考虑用户的个性化),而且这个性价比当然是针对同类商品来说的,比如说 AB两架钢琴,同时展现给5000个用户,最后有人选择了A,有人选择了B,但是选择了A的远远多于B,说明A的性价比高于B。对题目理解还是有些疑问的,最后写了8-9页的文档交过去了。

三面:交叉面。面试官非常nice,主要和我聊了聊项目和比赛,聊了聊金融学双学位,我说很久没复习了都忘了,面试官也表示理解,哈哈。然后聊了聊之前的实习经历。整个过程非常轻松愉快。

四面:HR面。HR面基本也是围绕简历来吧,我觉得基本HR面不会有太大问题吧,三观不要出大问题就好,始终保持积极、向上、自信的状态就好。


腾讯mig、sng  基础研究

mig一面:最开始的时候被内推到了mig。面试官也是非常nice的,还是非常喜欢腾讯的面试官的,包括后面我还和挺多的腾讯面试官聊过,都非常好。这一次的面试可以说对我的影响非常大,因为被追问的很方(huang)。反正就是围绕一个问题一直被追问下去,越问越深,要求你对问题的理解非常深刻,需要对自己的项目非常了解,而且不仅要了解,还得自己去思考,去多问自己为什么。

1、我的一篇论文:多特征下的科研论文段落划分和构成要素识别研究
        360度了解我这个论文的各个方面,当然叙述性的都是小问题,什么论文的特点,国内外相关研究的现状等,重点在于算法的选择、特征的选择(如何选择有意义重要的特征)、特征的挑选,是否选用其他模型,为什么不选用。面试前真没准备这么多,这篇论文又是一年前写的。
2、他们自己业务中碰到的问题,主要考察特征工程方面的知识 :几千维的特征如何选择(看哪些重要哪些不重要)、正负样本不均衡的问题、如果一个特征是稀疏特征,该如何处理?等。
3、比赛
       比赛的基本介绍,略去。随机森林算法,为什么不用gbdt,样本少特征少为什么还用随机森林;arima,为什么不用ar和ma模型?时间序列的基本含义。

4、随便聊聊
       平时怎么学习,看外文文献吗,深度学习有了解吗,一般看什么会议的论文呢。    
       面试是用微信语音进行的,因此加了面试官的微信,后续有问题也和他交流过,非常不错的一个面试官,值得交朋友。

sng一面:可以说是被mig那个团队刷了,也可以说是因为我不适合他们团队,所以面试官把我推荐到了其他团队,我就开启了sng面试之旅。
1、比赛
2、项目 印象最深的一个
3、算法题,忘了
4、hbase的容灾

sng 二面:
偏安全的团队,为所有sng团队提供安全服务,主要是短文本处理啥啥的。
问的比较深的是之前做过的一个相似性检测项目,项目里用到的算法,算法的设计,算法的时间复杂度等。
问了面试官之后要求的技能:
1、linux 要很熟或者说比较熟,包括操作,和linux开发
2、分布式计算   hadoop mapreduce   spark等都得会
3、语言没关系,c++或者java都行。

sngHR面:
家乡、家人、深圳房价、女朋友啥都问;阿里的企业文化,个人感觉如何;如果同时拿到了阿里和腾讯的offer,最终会选择哪个,求问这类问题如何回答!

最后由于我说我想去偏算法的团队,HR姐姐非常nice地让我和数据中心的主管聊,我基本了解了那边的数据中心主要的工作,也是比较感兴趣的。

写的有些累了,后面的简单概括吧。

其他公司简单回顾下:
ebay搜索部门:GC机制、单例模式、java虚拟机、二分法原理;数据结构:栈和队列的相同点等几道比较简单的;条件随机场模型的原理。

Morgan Stanley:全英文面试。一面:分为三部分,第一部分快速回答十几二十道题,第二部分较为详细地回答几道问答题,第三部分谈项目。是否通过一面还不知道情况。

携程的笔试:投的岗位是数据挖掘工程师。唯一一次比较有信心的笔试,因为比较简单。4部分,前三部分分别为数字题、推理题、图形题,各10分钟,10道题。最后14道题,90分钟,10道选择题,都是关于机器学习算法的,后面几道问答题,逻辑回归的推导,underfitting和overfitting概念、如何判断、如何避免,距离的定义方式等。

银行的笔试:随便看了看,行测题还是挺多的。

网易:数据挖掘工程师。笔试挂了,一是确实比较难,二是笔试过程中腾讯的HR面来了,直接就去接电话面试去了。

网易游戏:商业智能研究员。笔试三小时,就昨天,下午有事,最后只剩一小时答题时间,直接放弃了。大概浏览了题目,有推理题、sql题、算法题等。

蘑菇街:算法工程师。直接简历被刷了,唯一一家简历被刷的公司。不过很高兴认识了我们学校物理学院的大四的小学弟,他毕业后就入职蘑菇街了(据说蘑菇街去年给工资给的不错啊,学弟学妹也可以关注下,base在杭州,应该快上市了),后来从学弟那得知是他们今年招的人少,极少极少,简历才被刷的。

京东收益管理种子计划:2016年3月种子计划全面启动;2016年5月 收益管理课程培训,由内点-斯坦福教员任教;2016年7月收益管理暑期实习;2017年夏赴斯坦福进行相关培训;2017年秋经选拔后成为京东收益管理团队正式员工。我觉得还是个不错的选择,还在朋友圈分享过,不知道有没有学弟学妹关注过。最后我是通过了简历筛选,通知去上海参加面试,我咨询过通过率在30%-40%,可能性还是比较大。后来由于我觉得这个项目不适合研二的参加,而且也拿到其他offer了,就没去参加面试了。

总结一下:
1、提前准备。我一直觉得任何事情都应该提前准备,机会是给时刻准备着的人的!
2、抓住每一个机会。其实工作机会是有非常多的,有很多好的公司,而且有的时候好的团队会更重要,我们要善于抓住每一个机会,那样你会有更多的选择!
3、简历和实力。个人觉得我面试过程中很多时候谈简历上的东西比较多,这样会占点优势;但这样就需要你有一些项目和比赛会吸引到面试官,因此我建议大家在校期间积极参与到项目中,踏踏实实做点与自己未来就业方向相关的事情,提升自身实力的同时丰富自己的简历!

 

本站使用过程中有疑问请咨询@管理员小A或者@王开新@周思佳

帮助中心管理员小A 发表了文章 • 0 个评论 • 75 次浏览 • 2016-04-12 13:31 • 来自相关话题

        大家好!欢迎大家来到ImTech小站,我是管理员小A,这里是南京大学信息管理学院学生自发组织的一个供大家学习交流的学习平台,希望大家能够喜欢上我们这个平台!
       大家以后在使用的过程中有任何疑问,以及需要申请新的权限,或者需要添加新的话题等等任何问题都可以@管理员小A。目前我的主人是@王开新@周思佳 同学,所以大家有疑问也可以@王开新@周思佳。
    查看全部
        大家好!欢迎大家来到ImTech小站,我是管理员小A,这里是南京大学信息管理学院学生自发组织的一个供大家学习交流的学习平台,希望大家能够喜欢上我们这个平台!
       大家以后在使用的过程中有任何疑问,以及需要申请新的权限,或者需要添加新的话题等等任何问题都可以@管理员小A。目前我的主人是@王开新@周思佳 同学,所以大家有疑问也可以@王开新@周思佳。
   

机器学习/数据挖掘学习资源

数据挖掘王开新 发表了文章 • 2 个评论 • 126 次浏览 • 2016-04-12 10:54 • 来自相关话题

想学的东西太多,拥有的时间太少,花点时间把要学的资源整理一下,再慢慢来

Python 基础篇

书籍

《Python for Informatics》: 这是一本python的入门书,浅显易懂,书也很薄。最重要的是,它是一本开源的书,其pdf版本可以免费下载使用。翻译版排版很不好,英文原版没有这个问题。它使用的python版本是python2.x
《Learning Python》(译名:《Python学习手册》):这本书是一本翔实的介绍python基础语法细节的书,很多例子都可以用来作为练习,习题量较少。它涵盖了python2.x和python3.x,而且在书中多处进行了对比说明
《Programming Python》(译名:《Python编程》):与上一本书是同一系列,不过更加偏向Python的实际应用(比如数据库,图形界面,网络编程),分上下两册
《Python Pocket Reference》:这本书国内好像没有译本,和上两本属同一系列,是一本很薄的小册子,用作语法参考
《Data Structure and Algorithms Using Python》:同学推荐,与python本身的关系可能不大,主要讲数据结构和算法,如果看倦了Java/C like类的算法书的可以看看这个

公开课

Cousera:密歇根大学的《零基础 Python 入门》系列课程,部分内容是基于《Python for Informatics》这本书的,可以免费听每一门课
中国大学MOOC:哈工大的《高级语言程序设计(Python)》,不喜欢英语的可以通过这门课入门,顺便学习一下Spyder这个IDE

Python 专项篇

下面所列的课程或书籍不代表比上面的难,只是更专门针对某个方面,需要一定的python基础(仅仅是一定的python基础,完全不需要啃完Oreilly那一个系列)

书籍

《Building Machine Learning System With Python》(译名:《机器学习系统设计》:还没看,挖个坑,以后再填
《Machine Learning in Action》(译名:《机器学习实战》):简单介绍了一些常用的算法和一些例子的python实现(不是调sklearn包,而是直接实现),不是很详细,可以作为大略了解某种算法思想的书来看看
《Scipy Lecture Notes》:生动详细介绍了Numpy,Scipy的基本功能和高级功能,也介绍了一些Scikit-learn等一些包。文档开源,制作精良,强烈推荐
《Pandas:powerful Python dada analysis toolkit》:python数据分析包pandas的官方文档,比较实用

机器学习/数据挖掘篇

书籍

《机器学习》——周志华:国内机器学习第一人,目前还没看这本书,听过他的讲座,还是不错的
《Pattern Classification》(译名:《模式分类》):周志华组里的一位学长推荐的书,数学证明较多,主要偏向模式分类这个具体的方向
《统计学习方法》——李航:另一位大牛学长推荐,目前也还没看,以后再来填坑

公开课

Coursera: 斯坦福大学的《Machine Learning》:五星推荐的入门课程,Prof. Andrew Ng 讲得十分生动仔细,不需要太高数学水平,涵盖了许多机器学习方面的内容。课后作业一定要做,对加深理解很有帮助,有时间还可以再回放一遍,整理一下
Coursera: 斯坦福大学的《Probabilistic Graphical Models》:还没上,以后再填坑
Coursera: 伊利诺伊大学香槟分校的《数据挖掘专项课程》:还没上完,以后再填坑

其他

Stackoverflow : 越来越觉得这个论坛的强大
Quora : 国外的知乎
Scikitlearn:Python机器学习包的官网,有很多例子和大量的API文档
  查看全部
想学的东西太多,拥有的时间太少,花点时间把要学的资源整理一下,再慢慢来

Python 基础篇

书籍

《Python for Informatics》: 这是一本python的入门书,浅显易懂,书也很薄。最重要的是,它是一本开源的书,其pdf版本可以免费下载使用。翻译版排版很不好,英文原版没有这个问题。它使用的python版本是python2.x
《Learning Python》(译名:《Python学习手册》):这本书是一本翔实的介绍python基础语法细节的书,很多例子都可以用来作为练习,习题量较少。它涵盖了python2.x和python3.x,而且在书中多处进行了对比说明
《Programming Python》(译名:《Python编程》):与上一本书是同一系列,不过更加偏向Python的实际应用(比如数据库,图形界面,网络编程),分上下两册
《Python Pocket Reference》:这本书国内好像没有译本,和上两本属同一系列,是一本很薄的小册子,用作语法参考
《Data Structure and Algorithms Using Python》:同学推荐,与python本身的关系可能不大,主要讲数据结构和算法,如果看倦了Java/C like类的算法书的可以看看这个

公开课

Cousera:密歇根大学的《零基础 Python 入门》系列课程,部分内容是基于《Python for Informatics》这本书的,可以免费听每一门课
中国大学MOOC:哈工大的《高级语言程序设计(Python)》,不喜欢英语的可以通过这门课入门,顺便学习一下Spyder这个IDE

Python 专项篇

下面所列的课程或书籍不代表比上面的难,只是更专门针对某个方面,需要一定的python基础(仅仅是一定的python基础,完全不需要啃完Oreilly那一个系列)

书籍

《Building Machine Learning System With Python》(译名:《机器学习系统设计》:还没看,挖个坑,以后再填
《Machine Learning in Action》(译名:《机器学习实战》):简单介绍了一些常用的算法和一些例子的python实现(不是调sklearn包,而是直接实现),不是很详细,可以作为大略了解某种算法思想的书来看看
《Scipy Lecture Notes》:生动详细介绍了Numpy,Scipy的基本功能和高级功能,也介绍了一些Scikit-learn等一些包。文档开源,制作精良,强烈推荐
《Pandas:powerful Python dada analysis toolkit》:python数据分析包pandas的官方文档,比较实用

机器学习/数据挖掘篇

书籍

《机器学习》——周志华:国内机器学习第一人,目前还没看这本书,听过他的讲座,还是不错的
《Pattern Classification》(译名:《模式分类》):周志华组里的一位学长推荐的书,数学证明较多,主要偏向模式分类这个具体的方向
《统计学习方法》——李航:另一位大牛学长推荐,目前也还没看,以后再来填坑

公开课

Coursera: 斯坦福大学的《Machine Learning》:五星推荐的入门课程,Prof. Andrew Ng 讲得十分生动仔细,不需要太高数学水平,涵盖了许多机器学习方面的内容。课后作业一定要做,对加深理解很有帮助,有时间还可以再回放一遍,整理一下
Coursera: 斯坦福大学的《Probabilistic Graphical Models》:还没上,以后再填坑
Coursera: 伊利诺伊大学香槟分校的《数据挖掘专项课程》:还没上完,以后再填坑

其他

Stackoverflow : 越来越觉得这个论坛的强大
Quora : 国外的知乎
Scikitlearn:Python机器学习包的官网,有很多例子和大量的API文档
 

新人报到!

其他郜梦蕊 发表了文章 • 0 个评论 • 68 次浏览 • 2016-04-11 23:37 • 来自相关话题

大家好!我是信管大四郜梦蕊,来报到下!
大家好!我是信管大四郜梦蕊,来报到下!

2016暑期实习面试小记

求职经验阎锦恒 发表了文章 • 0 个评论 • 140 次浏览 • 2016-04-11 23:14 • 来自相关话题

转自我的博客:http://blog.csdn.net/zerohuan/ ... 13106
 楔子

隔了好长时间没写博客了,这一段时间基本忙于实习以及实验室的事情。从2月底到3月18日收到阿里的offer短短十几天,经历了不少面试,这里把主要的经历简单的记录总结一下,也为接下来的学习和工作做一个铺垫。

阿里,蚂蚁金服,Java研发

一面 
3月1日在找到小百合有校友内推投递简历,第二天一面就到了。整体来说不是很难。 
开始同样是自我介绍,结尾我提到了之前做的项目,面试官(一个很nice的JJ)就让介绍下整体的结构,分为几层,其中说到负载均衡和DNS。顺着就让介绍下DNS的原理,这一块我正好比较熟,说完面试官说看来我这一块掌握的挺好(当时小小的窃喜了下)。 
之后就是Java基础知识:HashMap(介绍原理,我提了下Java 8中在rehash阶段一个改进优化),Object有那些方法,异常体系等等(原谅我其他的想不起来了),总的来说比较基础和简单,没有问JVM方面让我有点诧异。 
HTTP方面:几个状态码的含义,Cookie是时效和失效,数量和大小限制等等。 
数据库:事务,解释下脏读。 
最后是一个场景题:搜索框输入关键字时下拉列表提示推荐的相关检索词,我回答的要点:(1)这个操作是频繁触发的,放在缓存层要更好,避免放在数据库中;(2)对于推荐,应当通过日志保留统计搜索的记录;

二面 
隔了1,2天二面就来了,上来就说这是终面了。。。应该是内推所在部门的主管面。同样自我介绍开场。问题: 
堆排序:说明原理,时间复杂度,实际中有没有用过,怎么用的。 
栈:理解和使用过那些数据结构,我就列了下课本里的,面试官就让介绍下栈,我在介绍完基本特性之后,就主动说了下栈的一个应用:后缀表达式(逆波兰式),以及计算器的实现和后缀表达式对于计算机执行的好处,另外我以JVM执行引擎为例,说明字节码结合操作数栈的执行方式也是后缀表达式的应用。 
JVM:为什么要有JVM,我回答JVM就是对计算机底层的抽象,屏蔽底层的细节以及字节码的意义啥的一堆。 
设计模式:面试管顺着问,JVM和底层操作系统怎么用设计模式来解释,我回答了这实际上是适配器模式,JVM相当于一个适配器,它同一实现了“Java字节码执行环境”这一个接口,同时它对应不同的底层OS,之后以char类型解释了下(Java中char是两个字符的,统一采用utf16编码,big-endian字顺)。面试管又问平时有没有用这样的思维思考过,我举了个例子,io多路复用,Java中nio非阻塞io的实现相当于一个观察者模式,不同的channel(Observer)注册到selector(Observerable)中,让selector代替它们对感兴趣的事情进行通知,将复杂度集中到selector上。 
之后就问了职业规划,对技术研究还是产品开发哪个更感兴趣等等。

三面 
三面是交叉面,北京的一个手机号答过来的。。。交叉面是随机抽的其他部门的主管,好像面我的不是搞技术的。。。因此问了一些你有技术上有什么兴趣爱好,做的印象最深的Java项目等等,而且完全没有问细节技术问题。然后问了下什么时候毕业

hr面 
三面两天之后就是hr面了,时间三十多分钟,因为我有创业项目,就问了一些有管团队的问题,hr面只要不是太“耿直”一般应该不会有啥问题。

hr面之后5个工作日就拿到了offer,总的来说效率还是挺高的,实习阿里也很想去的,毕竟Java,毕竟很近,而且杭州也是挺喜欢的城市。

腾讯,SNG,腾讯云,后台开发

我就简单概括下了,前前后后一共面了3面(都是技术面,计算机基础,数据结构和算法考的比较多),我感觉表现一般,3面后通知去深圳现场面试(估计是前面面的不够好的缘故),腾讯云对云计算那块有要求的,我那块的理解明显不足啊。当时已经拿到了阿里offer,而且当时实验室有些事实在没办法离开2,3天(做火车十几个小时)去深圳了,就没去了。。。 
PS:腾讯TST内推
 
后续,之后还是拿到了Offer,但是已经人在蚂蚁金服了,所以还是没去,希望校招时有缘在续!

百度,运营开发,Java

一面的感觉还是不错的,面试官面完也说对我印象挺好,面的效果不错。。。然而二面就要去北京啊,原因同上。。。没去了,好吧,其实对运营开发也有一些不感冒的原因。。。说明下,这个不是正式流程

总结

除了上面的经历,还有2,3个其他的。十几天下来,感觉也学到了很多,也明白了自己需要学习的地方,比如说基础要更加扎实,算法和数据结构还是要精通,多多刷刷题(我刷的很少很少),另外选择一个方向和领域:分布式或者云计算等等(不是说前端,后台这种大方向)深入的学习下去,毕竟你要和别人竞争,总要有自己的长处。只有自己实力强大了才能做到胸有成竹,游刃有余。 查看全部
转自我的博客:http://blog.csdn.net/zerohuan/ ... 13106
 楔子

隔了好长时间没写博客了,这一段时间基本忙于实习以及实验室的事情。从2月底到3月18日收到阿里的offer短短十几天,经历了不少面试,这里把主要的经历简单的记录总结一下,也为接下来的学习和工作做一个铺垫。

阿里,蚂蚁金服,Java研发

一面 
3月1日在找到小百合有校友内推投递简历,第二天一面就到了。整体来说不是很难。 
开始同样是自我介绍,结尾我提到了之前做的项目,面试官(一个很nice的JJ)就让介绍下整体的结构,分为几层,其中说到负载均衡和DNS。顺着就让介绍下DNS的原理,这一块我正好比较熟,说完面试官说看来我这一块掌握的挺好(当时小小的窃喜了下)。 
之后就是Java基础知识:HashMap(介绍原理,我提了下Java 8中在rehash阶段一个改进优化),Object有那些方法,异常体系等等(原谅我其他的想不起来了),总的来说比较基础和简单,没有问JVM方面让我有点诧异。 
HTTP方面:几个状态码的含义,Cookie是时效和失效,数量和大小限制等等。 
数据库:事务,解释下脏读。 
最后是一个场景题:搜索框输入关键字时下拉列表提示推荐的相关检索词,我回答的要点:(1)这个操作是频繁触发的,放在缓存层要更好,避免放在数据库中;(2)对于推荐,应当通过日志保留统计搜索的记录;

二面 
隔了1,2天二面就来了,上来就说这是终面了。。。应该是内推所在部门的主管面。同样自我介绍开场。问题: 
堆排序:说明原理,时间复杂度,实际中有没有用过,怎么用的。 
栈:理解和使用过那些数据结构,我就列了下课本里的,面试官就让介绍下栈,我在介绍完基本特性之后,就主动说了下栈的一个应用:后缀表达式(逆波兰式),以及计算器的实现和后缀表达式对于计算机执行的好处,另外我以JVM执行引擎为例,说明字节码结合操作数栈的执行方式也是后缀表达式的应用。 
JVM:为什么要有JVM,我回答JVM就是对计算机底层的抽象,屏蔽底层的细节以及字节码的意义啥的一堆。 
设计模式:面试管顺着问,JVM和底层操作系统怎么用设计模式来解释,我回答了这实际上是适配器模式,JVM相当于一个适配器,它同一实现了“Java字节码执行环境”这一个接口,同时它对应不同的底层OS,之后以char类型解释了下(Java中char是两个字符的,统一采用utf16编码,big-endian字顺)。面试管又问平时有没有用这样的思维思考过,我举了个例子,io多路复用,Java中nio非阻塞io的实现相当于一个观察者模式,不同的channel(Observer)注册到selector(Observerable)中,让selector代替它们对感兴趣的事情进行通知,将复杂度集中到selector上。 
之后就问了职业规划,对技术研究还是产品开发哪个更感兴趣等等。

三面 
三面是交叉面,北京的一个手机号答过来的。。。交叉面是随机抽的其他部门的主管,好像面我的不是搞技术的。。。因此问了一些你有技术上有什么兴趣爱好,做的印象最深的Java项目等等,而且完全没有问细节技术问题。然后问了下什么时候毕业

hr面 
三面两天之后就是hr面了,时间三十多分钟,因为我有创业项目,就问了一些有管团队的问题,hr面只要不是太“耿直”一般应该不会有啥问题。

hr面之后5个工作日就拿到了offer,总的来说效率还是挺高的,实习阿里也很想去的,毕竟Java,毕竟很近,而且杭州也是挺喜欢的城市。

腾讯,SNG,腾讯云,后台开发

我就简单概括下了,前前后后一共面了3面(都是技术面,计算机基础,数据结构和算法考的比较多),我感觉表现一般,3面后通知去深圳现场面试(估计是前面面的不够好的缘故),腾讯云对云计算那块有要求的,我那块的理解明显不足啊。当时已经拿到了阿里offer,而且当时实验室有些事实在没办法离开2,3天(做火车十几个小时)去深圳了,就没去了。。。 
PS:腾讯TST内推
 
后续,之后还是拿到了Offer,但是已经人在蚂蚁金服了,所以还是没去,希望校招时有缘在续!

百度,运营开发,Java

一面的感觉还是不错的,面试官面完也说对我印象挺好,面的效果不错。。。然而二面就要去北京啊,原因同上。。。没去了,好吧,其实对运营开发也有一些不感冒的原因。。。说明下,这个不是正式流程

总结

除了上面的经历,还有2,3个其他的。十几天下来,感觉也学到了很多,也明白了自己需要学习的地方,比如说基础要更加扎实,算法和数据结构还是要精通,多多刷刷题(我刷的很少很少),另外选择一个方向和领域:分布式或者云计算等等(不是说前端,后台这种大方向)深入的学习下去,毕竟你要和别人竞争,总要有自己的长处。只有自己实力强大了才能做到胸有成竹,游刃有余。

机器学习推荐资料

数据挖掘刘伙玉 发表了文章 • 0 个评论 • 169 次浏览 • 2016-04-11 19:42 • 来自相关话题

我目前看过的或者正在学习的资源,觉得非常不错的,都列举在下面。
 书籍:
李航老师的《统计学习方法》
周志华老师的《机器学习》
 
Coursera免费视频课程:
林轩田老师的《机器学习》,如果感觉听英文课程吃力的可以先听这个课程,国语授课,英文PPT。
Andrew NG的《Machine Learning》
 
小象学院收费课程:
小象学院邹博的《机器学习》,现在开第二期,是一个阿里星朋友推荐给我的。
 
后续再不断更新! 查看全部
我目前看过的或者正在学习的资源,觉得非常不错的,都列举在下面。
 书籍:
李航老师的《统计学习方法》
周志华老师的《机器学习》
 
Coursera免费视频课程:
林轩田老师的《机器学习》,如果感觉听英文课程吃力的可以先听这个课程,国语授课,英文PPT。
Andrew NG的《Machine Learning》
 
小象学院收费课程:
小象学院邹博的《机器学习》,现在开第二期,是一个阿里星朋友推荐给我的。
 
后续再不断更新!

研发工程师(Java)方向书单(包含技术岗计算机基础的书单)

编程与开发阎锦恒 发表了文章 • 0 个评论 • 275 次浏览 • 2016-04-10 20:11 • 来自相关话题

加粗的是重点书籍~
我感觉自己掌握的大概只有百分之六七十,所以不要被吓到
 Java方面:
《深入分析Java Web技术内幕》;
《java编程思想》入门不推荐看;
《java核心技术:卷一卷二》,对java入门非常不错,基本上涵盖了java很多知识;
《java并发编程实战》并发的经典书籍;
《java网络编程》一般般,讲得不是很深,可以对io和网络有进一步的认识;
《java分布式应用:基础与实践》
《how tomcat works》在讲解tomcat的架构和设计模式方面讲得非常不错,虽然和现在的版本上有一些差别,但是影响不大
《Spring技术内幕》比较透彻的解读了spring的源码,浅显易懂
 
设计模式(对Java研发很重要,很重要,很重要):
《大话设计模式》;
GoF《设计模式》;
 
大数据:
《hadoop技术内幕》;
 
JVM方面:
《深入理解java虚拟机》;
 
刷题:
《编程之美》,《剑指offer》;
leetcode; 

数据结构和算法:
《算法导论》,这本书证明很多,一开始可以不看证明集中弄懂算法;
《数据结构和算法分析》;

操作系统:
《深入理解计算机操作系统》;
《现代操作系统》(较简单);
《鸟哥的linux私房菜》主要是linux命令和shell脚本;

计算机网络:
《tcp/ip详解,卷一:协议》深入理解tcp。对tcp各个方面都有更加深刻的认识,正在看
《图解HTTP》(较简单)/《HTTP权威指南》(较难); 查看全部
加粗的是重点书籍~
我感觉自己掌握的大概只有百分之六七十,所以不要被吓到
 Java方面
《深入分析Java Web技术内幕》
《java编程思想》入门不推荐看;
《java核心技术:卷一卷二》,对java入门非常不错,基本上涵盖了java很多知识;
《java并发编程实战》并发的经典书籍;
《java网络编程》一般般,讲得不是很深,可以对io和网络有进一步的认识;
《java分布式应用:基础与实践》
《how tomcat works》在讲解tomcat的架构和设计模式方面讲得非常不错,虽然和现在的版本上有一些差别,但是影响不大
《Spring技术内幕》比较透彻的解读了spring的源码,浅显易懂
 
设计模式(对Java研发很重要,很重要,很重要)
《大话设计模式》
GoF《设计模式》
 
大数据
《hadoop技术内幕》;
 
JVM方面:
《深入理解java虚拟机》
 
刷题
《编程之美》,《剑指offer》
leetcode; 

数据结构和算法
《算法导论》,这本书证明很多,一开始可以不看证明集中弄懂算法;
《数据结构和算法分析》

操作系统
《深入理解计算机操作系统》
《现代操作系统》(较简单);
《鸟哥的linux私房菜》主要是linux命令和shell脚本

计算机网络
《tcp/ip详解,卷一:协议》深入理解tcp。对tcp各个方面都有更加深刻的认识,正在看
《图解HTTP》(较简单)/《HTTP权威指南》(较难);

我是zerohuan~

其他阎锦恒 发表了文章 • 0 个评论 • 95 次浏览 • 2016-04-10 17:29 • 来自相关话题

我是zerohuan,阎锦恒,我的博客:http://blog.csdn.net/Zerohuan,http://zerohuan.github.io;欢迎访问~
我是zerohuan,阎锦恒,我的博客:http://blog.csdn.net/Zerohuanhttp://zerohuan.github.io;欢迎访问~