当前在线人数15861
首页 - 分类讨论区 - 电脑网络 - 数据科学版 - 同主题阅读文章

此篇文章共收到打赏
0

  • 10
  • 20
  • 50
  • 100
您目前伪币余额:0
未名交友
[更多]
[更多]
Twitter Data Scientist 电面题目
[版面:数据科学][首篇作者:Combi] , 2014年04月21日01:15:04 ,7436次阅读,17次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
Combi
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: Combi (Franco Combi), 信区: DataSciences
标  题: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Mon Apr 21 01:15:04 2014, 美东)

已挂。补充下具体内容,希望对版友有些帮助。、

T家先来一轮ONLINE CODING,题目和LEETCODE类似,有时候有复杂度要求,但我运气比
较好写的代码混过去了。

大概过了一个月,本以为没戏了,RECRUITER A 联系我,然后过了2周RECRUITER B又帮
我安排和HIRING MANAGER 电面,大概45分钟。面试前问了下形式,没鸟我。

面试前网上搜了下题目,貌似都是和统计有关的。面试当天,一张嘴就发现是个印度人
,简单胡侃,介绍下简历里项目。问我Monte Carlo Simulation 和 BIC的步骤。接着
老印让我做一个ONLINE TEST,然后问我用没用过collabedit.com,我告诉他没有。于
是他就用印度英语给我讲背景,听的那叫一个费劲,只听懂大概。中途说道一半,
RECRUITER B发来链接 (后来RECRUITER B说面试前没听说要考我CODING,一半如果有
要求会提前发)。

题目是有3列DATA, 分别代表邮件发送者,接收者和发件时间。
SENDER| RECEIVER | TIMESTAMP
A B 56
A A 7
A C 5
C D 9
B B 12
B A 8
F G 12
B A 18
G F 2
A B 20
。。。
让我用HISTOGRAM来表示用户回信到收信的时间间隔(TimeStep_r-TimeStep_s)。


我直接按照发件人排序,然后从RECEIVER里找MATCH的,然后再排除各种CORNER CASE,
反正写着写着就把自己绕进去了,大概边写边说15分钟,老印就听着,然后说时间到了
,最简单方法应该是先按TIMESTAMP排序。然后就没有然后了。。。

现在想起来题目很弱,还是能力不足,再加上没准备要考CODING,希望对版友有些帮助。
--
※ 修改:·Combi 於 Apr 24 22:24:14 2014 修改本文·[FROM: 97.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 97.]

 
Combi
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: Combi (Franco Combi), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Thu Apr 24 22:24:26 2014, 美东)

已更新
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 97.]

 
andykk
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 3 ]

发信人: andykk (andykk), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Thu Apr 24 23:04:28 2014, 美东)

问一下coding可以用python写吗?


--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 171.]

 
Combi
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 4 ]

发信人: Combi (Franco Combi), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Fri Apr 25 00:33:27 2014, 美东)


【 在 andykk (andykk) 的大作中提到: 】
: 问一下coding可以用python写吗?


应该不限语言。我就PYTHON写的
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 97.]

 
casact
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 5 ]

发信人: casact (奲𨰻瞑觋), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Fri Apr 25 09:52:12 2014, 美东)

当然没人限你语言。但是还是用构造基本算法更容易的而不是有很多外挂包的
【 在 Combi (Franco Combi) 的大作中提到: 】
: 应该不限语言。我就PYTHON写的



--

※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 66.]

 
rrented
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 6 ]

发信人: rrented (rrented), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Fri Apr 25 12:59:13 2014, 美东)

赞一个。

【 在 Combi (Franco Combi) 的大作中提到: 】
: 已挂。补充下具体内容,希望对版友有些帮助。、
: T家先来一轮ONLINE CODING,题目和LEETCODE类似,有时候有复杂度要求,但我运气比
: 较好写的代码混过去了。
: 大概过了一个月,本以为没戏了,RECRUITER A 联系我,然后过了2周RECRUITER B又帮
: 我安排和HIRING MANAGER 电面,大概45分钟。面试前问了下形式,没鸟我。
: 面试前网上搜了下题目,貌似都是和统计有关的。面试当天,一张嘴就发现是个印度人
: ,简单胡侃,介绍下简历里项目。问我Monte Carlo Simulation 和 BIC的步骤。接着
: 老印让我做一个ONLINE TEST,然后问我用没用过collabedit.com,我告诉他没有。于
: 是他就用印度英语给我讲背景,听的那叫一个费劲,只听懂大概。中途说道一半,
: RECRUITER B发来链接 (后来RECRUITER B说面试前没听说要考我CODING,一半如果有
: ...................



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 64.]

 
chaoz
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 7 ]

发信人: chaoz (面朝大海,吃碗凉皮), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Fri Apr 25 13:28:12 2014, 美东)

thanks for sharing!
--
Say NO to SCA 5!

http://www.change.org/petitions/california-state-assembly-vote-no-to-sca-5-3
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 184.]

 
oloolo
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 8 ]

发信人: oloolo (似人非兽), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Fri Apr 25 14:36:59 2014, 美东)

这个SQL行不? 身边没机器,没法测试

rs1 = SELECT a.Sender, a.Receiver, b.Sender, b.Receiver, (b.Timestamp - a.
Timestamp) AS Interval
FROM   table AS a
INNER JOIN table AS b
  ON  a.Receiver == b.Sender
AND  b.Timestamp>a.Timestamp
AND  a.Sender == b.Receiver
;

histogram = SELECT Interval, COUNT(*) AS Cnt FROM rs1 GROUP BY Interval;

如果没有回信的也要算,用LEFT OUTER JOIN
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 131.]

 
Dinu
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 9 ]

发信人: Dinu (Dinu), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Fri Apr 25 17:15:28 2014, 美东)

先理解一下,是按最近的两次通讯的时差算么?如果是的话,根据已有数据,答案应该
是2和10?
A -> B 20-18 = 2
F -> G 12-2  = 10
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 216.]

 
reload2009
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 10 ]

发信人: reload2009 (Keep your feet on the ground.), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Fri Apr 25 22:15:52 2014, 美东)

Monte Carlo Simulation的步骤是什么?

【 在 Combi (Franco Combi) 的大作中提到: 】
: 已挂。补充下具体内容,希望对版友有些帮助。、
: T家先来一轮ONLINE CODING,题目和LEETCODE类似,有时候有复杂度要求,但我运气比
: 较好写的代码混过去了。
: 大概过了一个月,本以为没戏了,RECRUITER A 联系我,然后过了2周RECRUITER B又帮
: 我安排和HIRING MANAGER 电面,大概45分钟。面试前问了下形式,没鸟我。
: 面试前网上搜了下题目,貌似都是和统计有关的。面试当天,一张嘴就发现是个印度人
: ,简单胡侃,介绍下简历里项目。问我Monte Carlo Simulation 和 BIC的步骤。接着
: 老印让我做一个ONLINE TEST,然后问我用没用过collabedit.com,我告诉他没有。于
: 是他就用印度英语给我讲背景,听的那叫一个费劲,只听懂大概。中途说道一半,
: RECRUITER B发来链接 (后来RECRUITER B说面试前没听说要考我CODING,一半如果有
: ...................



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 68.]

 
hotpot2013
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 11 ]

发信人: hotpot2013 (hotpot), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Sat Apr 26 11:05:00 2014, 美东)

应该又是Poisson Process相关的。叫你画histogram,应该不是他原本的问题。



【 在 Combi (Franco Combi) 的大作中提到: 】
: 已挂。补充下具体内容,希望对版友有些帮助。、
: T家先来一轮ONLINE CODING,题目和LEETCODE类似,有时候有复杂度要求,但我运气比
: 较好写的代码混过去了。
: 大概过了一个月,本以为没戏了,RECRUITER A 联系我,然后过了2周RECRUITER B又帮
: 我安排和HIRING MANAGER 电面,大概45分钟。面试前问了下形式,没鸟我。
: 面试前网上搜了下题目,貌似都是和统计有关的。面试当天,一张嘴就发现是个印度人
: ,简单胡侃,介绍下简历里项目。问我Monte Carlo Simulation 和 BIC的步骤。接着
: 老印让我做一个ONLINE TEST,然后问我用没用过collabedit.com,我告诉他没有。于
: 是他就用印度英语给我讲背景,听的那叫一个费劲,只听懂大概。中途说道一半,
: RECRUITER B发来链接 (后来RECRUITER B说面试前没听说要考我CODING,一半如果有
: ...................



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 50.]

 
Combi
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 12 ]

发信人: Combi (Franco Combi), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Sun Apr 27 22:15:53 2014, 美东)


【 在 Dinu (Dinu) 的大作中提到: 】
: 先理解一下,是按最近的两次通讯的时差算么?如果是的话,根据已有数据,答案应该
: 是2和10?
: A -> B 20-18 = 2
: F -> G 12-2  = 10


我的理解是先回复最早发的。
['G', 'F', 2], ['F', 'G', 12]
['B', 'A', 8], ['A', 'B', 20]
['B', 'A', 18], ['A', 'B', 56]
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 97.]

 
promexy
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 13 ]

发信人: promexy (promexy), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Sat May  3 02:44:04 2014, 美东)

谢谢分享,T招的ds感觉偏重于计算机背景啊,而且对统计的要求并不低。


【 在 Combi (Franco Combi) 的大作中提到: 】
: 已挂。补充下具体内容,希望对版友有些帮助。、
: T家先来一轮ONLINE CODING,题目和LEETCODE类似,有时候有复杂度要求,但我运气比
: 较好写的代码混过去了。
: 大概过了一个月,本以为没戏了,RECRUITER A 联系我,然后过了2周RECRUITER B又帮
: 我安排和HIRING MANAGER 电面,大概45分钟。面试前问了下形式,没鸟我。
: 面试前网上搜了下题目,貌似都是和统计有关的。面试当天,一张嘴就发现是个印度人
: ,简单胡侃,介绍下简历里项目。问我Monte Carlo Simulation 和 BIC的步骤。接着
: 老印让我做一个ONLINE TEST,然后问我用没用过collabedit.com,我告诉他没有。于
: 是他就用印度英语给我讲背景,听的那叫一个费劲,只听懂大概。中途说道一半,
: RECRUITER B发来链接 (后来RECRUITER B说面试前没听说要考我CODING,一半如果有
: ...................



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 71.]

 
heli007
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 14 ]

发信人: heli007 (随大流), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Tue May 20 14:31:49 2014, 美东)

刚看到这个版,觉得很有意思

第二题感觉是把爱情片搞了个恐怖片的结局,应该放破送过程才顺
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 98.]

 
maxthon
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 15 ]

发信人: maxthon (JobHunting), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Wed Jun 25 16:55:33 2014, 美东)

对于这种情况,算5-1还是5-3?

A B 1
A B 3
B A 5

【 在 Combi (Franco Combi) 的大作中提到: 】
: 已挂。补充下具体内容,希望对版友有些帮助。、
: T家先来一轮ONLINE CODING,题目和LEETCODE类似,有时候有复杂度要求,但我运气比
: 较好写的代码混过去了。
: 大概过了一个月,本以为没戏了,RECRUITER A 联系我,然后过了2周RECRUITER B又帮
: 我安排和HIRING MANAGER 电面,大概45分钟。面试前问了下形式,没鸟我。
: 面试前网上搜了下题目,貌似都是和统计有关的。面试当天,一张嘴就发现是个印度人
: ,简单胡侃,介绍下简历里项目。问我Monte Carlo Simulation 和 BIC的步骤。接着
: 老印让我做一个ONLINE TEST,然后问我用没用过collabedit.com,我告诉他没有。于
: 是他就用印度英语给我讲背景,听的那叫一个费劲,只听懂大概。中途说道一半,
: RECRUITER B发来链接 (后来RECRUITER B说面试前没听说要考我CODING,一半如果有
: ...................



--
386765
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 38.]

 
maxthon
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 16 ]

发信人: maxthon (JobHunting), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Wed Jun 25 17:01:52 2014, 美东)

一个简单的做法,
对timestamp排序,
然后建一个hash table,对所有的(sender receiver)pair,先在 hash table里找是不
是有(receiver, sender) pair存在了。如果有了,做减法,fill histogram, erase
原来的(sender receiver)数据,加入(receiver, send)数据。然后依次类推。

为什么T家把我给直接据了,连面试都没有给,求内推。

【 在 Combi (Franco Combi) 的大作中提到: 】
: 已挂。补充下具体内容,希望对版友有些帮助。、
: T家先来一轮ONLINE CODING,题目和LEETCODE类似,有时候有复杂度要求,但我运气比
: 较好写的代码混过去了。
: 大概过了一个月,本以为没戏了,RECRUITER A 联系我,然后过了2周RECRUITER B又帮
: 我安排和HIRING MANAGER 电面,大概45分钟。面试前问了下形式,没鸟我。
: 面试前网上搜了下题目,貌似都是和统计有关的。面试当天,一张嘴就发现是个印度人
: ,简单胡侃,介绍下简历里项目。问我Monte Carlo Simulation 和 BIC的步骤。接着
: 老印让我做一个ONLINE TEST,然后问我用没用过collabedit.com,我告诉他没有。于
: 是他就用印度英语给我讲背景,听的那叫一个费劲,只听懂大概。中途说道一半,
: RECRUITER B发来链接 (后来RECRUITER B说面试前没听说要考我CODING,一半如果有
: ...................




--
386765
※ 修改:·maxthon 於 Jun 25 17:03:08 2014 修改本文·[FROM: 38.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 38.]

 
Thoreau
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 17 ]

发信人: Thoreau (welch双绿道高手), 信区: DataSciences
标  题: Re: Twitter Data Scientist 电面题目
发信站: BBS 未名空间站 (Sat Aug  2 10:32:20 2014, 美东)

为什么要对timestamp排序?是为了一个人对另外一个重复发信吗?

【 在 maxthon (JobHunting) 的大作中提到: 】
: 一个简单的做法,
: 对timestamp排序,
: 然后建一个hash table,对所有的(sender receiver)pair,先在 hash table里找是不
: 是有(receiver, sender) pair存在了。如果有了,做减法,fill histogram, erase
: 原来的(sender receiver)数据,加入(receiver, send)数据。然后依次类推。
: 为什么T家把我给直接据了,连面试都没有给,求内推。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 24.]

[分页:1 ]
[快速返回] [ 进入数据科学讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996