Thursday, January 31, 2008

不要以为洋和尚都能念经

终于见识了有多水的老师和有多水的课

 

号称algorithm design

上课不讨论时间空间复杂度

今天具体还讨论图论

搞笑的是,上了至少1个小时的归纳法证明,ft,当我白痴了

 

气死了,拿我cmu一个牛人的课换这种烂课,

在北大早被骂死了,

 

只能证明北大牛校

Sunday, January 27, 2008

人实在老得太快了

25岁的时候,发现熬夜之后的黑眼圈再也下不去了

30岁的时候,骤然发现额头上的皱纹

 

呆呆就像红舞鞋里面的小姑娘,用自己的生命跳舞,不停歇,说不如活得更精彩

我中学的同座看着我说,你死了也会大喊,不行,我好多事情还没做

 

生活应该更精彩

Saturday, January 19, 2008

男人女人

今天听到的,

说为什么男人喜欢回国,女人喜欢呆这里

在这里,你的男人只有你一个女人

在国内,你的男人有无数不同版本的你

 

哈哈

 

Tuesday, January 15, 2008

Tim O'Reilly的web 2.0



 

“2-8”定律 (Pareto Principle, 20/80 rule)vs“长尾”定律 (long tail), incremental web

DoubleClick vs Overture&AdSense

Akamai vs BitTorrent

vs Yahoo!, Open Directory Project

vs. Google

vs. eBay

Barnesandnoble vs Amazon

encyclopedia vs Wikipedia

subjects vs folksonomy (del.icio.us, flickr)

vs open source

vs paypal

vs google map

 

easy to publishing, RSS aggregator, the wisdom of crowds (from James Suriowecki), syndication

 

 

 

Monday, January 14, 2008

retrieval课

cmu的大概包括

信息表示存储,query,检索模型,evaluation,文本分类(category,cluster),special:降维,search log分析,协同过滤,信息抽取

评价:2个大牛做,所以明显分成检索+分类,2个重要的方向

5个作业:

    1  构造query,使得检索效果最好

    2  构造ranking算法,使得结果最好

    3  几个feature selection方法,以及query expansion

    4  evluation metrics and significance tests

 

 

PKU的WBIA

信息的发现(包括文本抓取,去噪,link分析),信息检索(标引,检索,ranking,评价,分类), special:anti-spamming,text mining

评价:本身就做搜索引擎,非常有基础,所以会讨论如何信息发现,所以能发现topic, anti-spamming, 最近发现搜索引擎是会报告这个网站是不是有病毒啥的,估计就是他们做的过程中发现的,“实践出真知”

早在这个课时候就听李老师提Carbonell的名字,可惜呀,本来选到这个家伙课了,可惜呀,只能退了

2个作业

    1  关于crawler的

    2  用lemur做工具,用3种模型做检索,用trec进行评价

project

    多是做某个domain的信息收集,存储和检索

 


加上: 多媒体检索,并行分布检索,数字图书馆,其他(CLIR, QA)

他还收集了很多文献和课程

 

UIUC Chengxiang Zhai


他介绍natural language processing,后面还介绍texting mining,2个课时是HMM, 还有一个是interface&visualizaiton,

作业包括: statistical NLP, NORMALIZAITON, SE, CLUSTER, feedback

 

Sunday, January 13, 2008

web info system





 
WWW 07 http://www2007.org/cfp.php

Web Intelligence 07 http://www.cs.sjsu.edu/wi07/wi/?index=cfp


WEBIST07: http://www.webist.org/cfp.htm

Friday, January 11, 2008

07十大好书

亚洲周刊二零零七年中文十大非小说揭晓:(一)、余英时的《知识人与中国文化的价值》(美国);(二)、樊树志的《大明王朝的最后十七年》(中国大陆);(三)、萨苏的《国破山河在》(日本);(四)、章诒和的《云山几盘江流几湾》(中国大陆);(五)、王小强的《摸著石头过河的困惑》(香港);(六)、龙应台的《亲爱的安德烈》(台湾);(七)、李零的《丧家狗》(中国大陆);(八)、林博文的《张学良、宋子文档案大揭秘》(美国);(九)、吕大乐的《四代香港人》(香港);(十)简媜的《老师的十二样见面礼》(台湾)。

 

有空弄来翻翻,

 

8g 刚看见,就大概检索了一下,就见过2个关键词,章诒和的另外一本书将她爹和民盟历史的书当时非常的出名,但是忘记名字了

另外一个是萨苏,我看他东西,完全是jezer发的各种可爱东西里面的一个,是他写的关于老北京的一些传统呀,历史呀,我称为8g的东西,巧的是,看东西的时候,正好被同事看见,同事说那是她同学,一起学生会混,毕业以后去日本了,曾经吧就时候的热血人物。他的文章透着北京人的那种东西

想想似乎更喜欢北方文化,

Tuesday, January 8, 2008

Social Web

facebook上建一个页


 

作业:

 

讨论版,用来贴每周的阅读问题

讨论版:Comtella-D http://fire.usask.ca/Login.aspx qili

 

每次课后,找出3个更多的相关文献贴上

social bookmarking: http://www.citeulike.org/ qili

 

blog上贴上你的每周总结


 

做一个小时的presentation, 贴这个上


 

final project用courseweb交

 


 

Resource sharing:http://umtella.usask.ca

 


 

Social web - Web2.0

Web 2.0 -- Semantic Web (User Centric -- Data Centric)

Web 2.0的3个关键特性:

1 collective intelligence (集体智慧)

2 Long Tail (终结二八定律)

3 Data Reuse