Qi's: retrieval课

cmu的大概包括

信息表示存储，query，检索模型，evaluation，文本分类（category，cluster），special:降维，search log分析，协同过滤，信息抽取

评价：2个大牛做，所以明显分成检索+分类，2个重要的方向

5个作业：

1 构造query，使得检索效果最好

2 构造ranking算法，使得结果最好

3 几个feature selection方法，以及query expansion

4 evluation metrics and significance tests

PKU的WBIA

信息的发现（包括文本抓取，去噪，link分析），信息检索（标引，检索，ranking，评价，分类）, special：anti-spamming，text mining

评价：本身就做搜索引擎，非常有基础，所以会讨论如何信息发现，所以能发现topic， anti-spamming, 最近发现搜索引擎是会报告这个网站是不是有病毒啥的，估计就是他们做的过程中发现的，“实践出真知”

早在这个课时候就听李老师提Carbonell的名字，可惜呀，本来选到这个家伙课了，可惜呀，只能退了

2个作业

1 关于crawler的

2 用lemur做工具，用3种模型做检索，用trec进行评价

project

多是做某个domain的信息收集，存储和检索

加上：多媒体检索，并行分布检索，数字图书馆，其他（CLIR, QA）

他还收集了很多文献和课程

UIUC Chengxiang Zhai

他介绍natural language processing，后面还介绍texting mining，2个课时是HMM, 还有一个是interface&visualizaiton，

作业包括： statistical NLP, NORMALIZAITON, SE, CLUSTER, feedback

Qi's