cmu的大概包括
信息表示存储,query,检索模型,evaluation,文本分类(category,cluster),special:降维,search log分析,协同过滤,信息抽取
评价:2个大牛做,所以明显分成检索+分类,2个重要的方向
5个作业:
1 构造query,使得检索效果最好
2 构造ranking算法,使得结果最好
3 几个feature selection方法,以及query expansion
4 evluation metrics and significance tests
PKU的WBIA
信息的发现(包括文本抓取,去噪,link分析),信息检索(标引,检索,ranking,评价,分类), special:anti-spamming,text mining
评价:本身就做搜索引擎,非常有基础,所以会讨论如何信息发现,所以能发现topic, anti-spamming, 最近发现搜索引擎是会报告这个网站是不是有病毒啥的,估计就是他们做的过程中发现的,“实践出真知”
早在这个课时候就听李老师提Carbonell的名字,可惜呀,本来选到这个家伙课了,可惜呀,只能退了
2个作业
1 关于crawler的
2 用lemur做工具,用3种模型做检索,用trec进行评价
project
多是做某个domain的信息收集,存储和检索
加上: 多媒体检索,并行分布检索,数字图书馆,其他(CLIR, QA)
他还收集了很多文献和课程
UIUC Chengxiang Zhai
他介绍natural language processing,后面还介绍texting mining,2个课时是HMM, 还有一个是interface&visualizaiton,
作业包括: statistical NLP, NORMALIZAITON, SE, CLUSTER, feedback
No comments:
Post a Comment