Monday, January 14, 2008

retrieval课

cmu的大概包括

信息表示存储,query,检索模型,evaluation,文本分类(category,cluster),special:降维,search log分析,协同过滤,信息抽取

评价:2个大牛做,所以明显分成检索+分类,2个重要的方向

5个作业:

    1  构造query,使得检索效果最好

    2  构造ranking算法,使得结果最好

    3  几个feature selection方法,以及query expansion

    4  evluation metrics and significance tests

 

 

PKU的WBIA

信息的发现(包括文本抓取,去噪,link分析),信息检索(标引,检索,ranking,评价,分类), special:anti-spamming,text mining

评价:本身就做搜索引擎,非常有基础,所以会讨论如何信息发现,所以能发现topic, anti-spamming, 最近发现搜索引擎是会报告这个网站是不是有病毒啥的,估计就是他们做的过程中发现的,“实践出真知”

早在这个课时候就听李老师提Carbonell的名字,可惜呀,本来选到这个家伙课了,可惜呀,只能退了

2个作业

    1  关于crawler的

    2  用lemur做工具,用3种模型做检索,用trec进行评价

project

    多是做某个domain的信息收集,存储和检索

 


加上: 多媒体检索,并行分布检索,数字图书馆,其他(CLIR, QA)

他还收集了很多文献和课程

 

UIUC Chengxiang Zhai


他介绍natural language processing,后面还介绍texting mining,2个课时是HMM, 还有一个是interface&visualizaiton,

作业包括: statistical NLP, NORMALIZAITON, SE, CLUSTER, feedback

 

No comments:

Post a Comment