每日一贴: http://www.mitbbs.com/mitbbs_article_t.php?board=JobHunting&gid=33059349
Read full article from 每日一贴: http://www.mitbbs.com/mitbbs_article_t.php?board=JobHunting&gid=33059349
Pinterest 电面
1. 多叉树的serialize & unserialize
2. 判断一个graph是不是bipartite
Dropbox电面
1. 1) bool match(string pattern, string data)
test case:
pattern = 'abba', data = 'red blue blue red' true
pattern = 'abba', data = 'red blue yellow red' false
pattern = 'aaaa', data = 'red red red red' true
pattern = 'abba', data = red red red red' false
2) followup,remove spaces
pattern = 'abba', data = 'redbluebluered' true
pattern = 'abba', data = 'redblueyellowred' false
pattern = 'aaaa', data = 'redredredred' true
pattern = 'abba', data = redredredred' false
2. 那道很经典的log hitter,版上之前讨论过
Check http://massivealgorithms.blogspot.com/2014/12/dropbox-get-total-hits-in-last-15-mins.html
Google onsite
1. 类似这道题:
给如下的数据格式:<start_time, end_time, value>
For example,
1, 3, 100
2, 4, 200
5, 6, 300
。。。
这些数据时间点可能有重合。在时间段2~3之间,value的和是100+200 = 300. 找出这
组数据中最高的value和
[consider end points]
我的做法是先把区间按照左端点先排序,然后从左往右扫描,同时维护一个变量来记录
当前位置的value sum。如果遇到的是start time就加上当前区间的value,反之就是减
去。当然也有人说用segment tree,那个就没研究过了。。
2.find k most frequent words from a file
3.brainstorming: 一个上传文件的service,之前正常运转,突然有一天挂了,这期间
没改代码。问怎么排查问题。。
-- Whether this is reproducible, whether this happens for all clients or just some clients
面试官引导我的思路是,先排查是client自己的问题还是我们的问题。。然后我就瞎说
了一些可能的情况,比如request突然太多,disk不够了什么的,他依次否决了。。然
后最后落脚到可能是有人不小心修改了write权限= =。。
TripAdvisor 电面&onsite
太杂了记不清了,但都是比较基础经典的, 1维DP,位操作什么的。onsite还有很多
behavior questions, 团队协作,敏捷开发什么的。。
再就是一些小公司比较喜欢问sql语句, linux命令,怎么debug啊之类的...
machine learning相关的,频率比较高的是问logistic regression, reservoir
sampling, cross validation,怎么解决overfitting,怎么做feature selection,
ensemble methods,collaborative filtering, IR evaluation metrics这些。
2. 判断一个graph是不是bipartite
Dropbox电面
1. 1) bool match(string pattern, string data)
test case:
pattern = 'abba', data = 'red blue blue red' true
pattern = 'abba', data = 'red blue yellow red' false
pattern = 'aaaa', data = 'red red red red' true
pattern = 'abba', data = red red red red' false
2) followup,remove spaces
pattern = 'abba', data = 'redbluebluered' true
pattern = 'abba', data = 'redblueyellowred' false
pattern = 'aaaa', data = 'redredredred' true
pattern = 'abba', data = redredredred' false
2. 那道很经典的log hitter,版上之前讨论过
Check http://massivealgorithms.blogspot.com/2014/12/dropbox-get-total-hits-in-last-15-mins.html
Google onsite
1. 类似这道题:
给如下的数据格式:<start_time, end_time, value>
For example,
1, 3, 100
2, 4, 200
5, 6, 300
。。。
这些数据时间点可能有重合。在时间段2~3之间,value的和是100+200 = 300. 找出这
组数据中最高的value和
[consider end points]
我的做法是先把区间按照左端点先排序,然后从左往右扫描,同时维护一个变量来记录
当前位置的value sum。如果遇到的是start time就加上当前区间的value,反之就是减
去。当然也有人说用segment tree,那个就没研究过了。。
2.find k most frequent words from a file
3.brainstorming: 一个上传文件的service,之前正常运转,突然有一天挂了,这期间
没改代码。问怎么排查问题。。
-- Whether this is reproducible, whether this happens for all clients or just some clients
面试官引导我的思路是,先排查是client自己的问题还是我们的问题。。然后我就瞎说
了一些可能的情况,比如request突然太多,disk不够了什么的,他依次否决了。。然
后最后落脚到可能是有人不小心修改了write权限= =。。
TripAdvisor 电面&onsite
太杂了记不清了,但都是比较基础经典的, 1维DP,位操作什么的。onsite还有很多
behavior questions, 团队协作,敏捷开发什么的。。
再就是一些小公司比较喜欢问sql语句, linux命令,怎么debug啊之类的...
machine learning相关的,频率比较高的是问logistic regression, reservoir
sampling, cross validation,怎么解决overfitting,怎么做feature selection,
ensemble methods,collaborative filtering, IR evaluation metrics这些。
Read full article from 每日一贴: http://www.mitbbs.com/mitbbs_article_t.php?board=JobHunting&gid=33059349