mitbbs.com
  首页 -分类讨论区 - 海外生活 - 待字闺中版 - 同主题阅读文章
  首页
  分类广告
分类讨论区
  移民专栏
新闻中心
  精华区
  未名博客
  俱乐部
  未名形象秀
  未名黄页
  未名交友
  未名人才
未名交友
[更多]
[更多]
同主题阅读:g电面,新鲜面经
[版面:待字闺中][首篇作者:akak4648] , 2013年01月28日15:16:40
[分页:1 ]
akak4648
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: akak4648 (victor), 信区: JobHunting
标  题: g电面,新鲜面经
发信站: BBS 未名空间站 (Mon Jan 28 15:16:40 2013, 美东)


1. 一个log里有页面的访问记录,如何获得前1000popular的(hash_map + heap)
followup,log里存在多个machine里,我原先说每个maintain heap,后来经提醒不work,
改用每个存heap,然后merge,再提了些优化的方案.面试官基本满意。

2.一个很大的table存了query -> occurrence,如何随机获得1个query,概率是基于每个
query的occurrence,

1  2  3
20 10 30
获得第一个数的概率是 20/60.

这题我很纠结,我上来就想到因为大数据量,用resevior sampling的变版做(
constant space),边想边写边测弄了快半小时才弄出来,最后也解释了半天,其实也
有很直接的方法,把累加做个数组就行了,用bst搜素log(n),当时面试就是有点一根
筋。最后问了问组的情况,听口音感觉是同胞里的一个大牛,希望能水过。(突然想起
来介绍的时候他的名字不像是同胞的)



--

※ 修改:·akak4648 於 Jan 28 16:16:16 2013 修改本文·[FROM: 50.]
※ 来源:·WWW 未名空间站 海外: mitbbs.com 中国: mitbbs.cn·[FROM: 50.]

 
[分页:1 ]
[快速返回] [ 进入待字闺中讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996