搜索引擎维护的两类信息:
网页相关信息(通过信息获取部分获取);用户行为信息(通过log记录获取)
传统IR技术:(information retrieval)
本文探讨了搜索引擎如何利用网页信息和用户行为数据进行信息检索。提到了传统的IR技术,如向量空间模型和Tf*idf算法,以及Google的PageRank和IBM的HITS算法。还指出,由于用户行为的丰富信息,可以使用Direct技术来分析用户对检索结果的后续行为。Gray Cullis的分类强调了用户行为信息的重要性,包括查询词分布、翻页行为和点击URL的统计等。
搜索引擎维护的两类信息:
网页相关信息(通过信息获取部分获取);用户行为信息(通过log记录获取)
传统IR技术:(information retrieval)
1094
8121
1731

被折叠的 条评论
为什么被折叠?
