当前在线人数11486
首页 - 分类讨论区 - 电脑网络 - 葵花宝典版 - 同主题阅读文章
未名交友
[更多]
[更多]
Machine Learning 问题
[版面:葵花宝典][首篇作者:aaaa33] , 2017年09月14日11:57:58 ,694次阅读,1次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
aaaa33
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: aaaa33 (中英文不限), 信区: Programming
标  题: Machine Learning 问题
发信站: BBS 未名空间站 (Thu Sep 14 11:57:58 2017, 美东)

请教个问题: 我想用机器学习来帮助提高搜索的相关性. 从搜索记录我得到关键字和点
击的文件:
关键字1 --> 文件1
关键字2 --> 文件2
关键字3 --> 文件3
...

问题是,我应该用什么模型来训练它,下一次当我看到一个新的关键字时,我可以将其
关联到一组文件? 对我来说,这是一个聚类(clustering),对吗?K-Means or HMM?
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 168.]

 
silverhawk
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: silverhawk (silverhawk), 信区: Programming
标  题: Re: Machine Learning 问题
发信站: BBS 未名空间站 (Thu Sep 14 12:07:56 2017, 美东)

按照你的有限信息,要是我来做,会把关键字和文件都在做处理(比如简单的word2vec
之后,或者文件的metadata feature提取),投影到一个embedding空间,然后算相似
度。
【 在 aaaa33 (中英文不限) 的大作中提到: 】
: 请教个问题: 我想用机器学习来帮助提高搜索的相关性. 从搜索记录我得到关键字和点
: 击的文件:
: 关键字1 --> 文件1
: 关键字2 --> 文件2
: 关键字3 --> 文件3
: ...
: 问题是,我应该用什么模型来训练它,下一次当我看到一个新的关键字时,我可以将其
: 关联到一组文件? 对我来说,这是一个聚类(clustering),对吗?K-Means or HMM?



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 216.]

[分页:1 ]
[快速返回] [ 进入葵花宝典讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996