
1 网络信息采集实验
1.1 网络蜘蛛程序设计
1.1.1 实验目标
1.1.2 实验内容
1.1.3 背景知识
1.1.4 实验步骤
1.1.5 参考示例
1.1.6 实验分析
1.1.7 参考程序
1.2 网页清理
1.2.1 实验目标
1.2.2 实验内容
1.2.3 背景知识
1.2.4 实验步骤
1.2.5 参考示例
1.2.6 实验分析
1.3 Google 检索接口的调用
1.3.1 实验目标
1.3.2 实验内容
1.3.3 背景知识
1.3.4 实验步骤
1.3.5 参考示例
1.3.6 实验分析
1.3.7 参考程序
2 信息检索
2.1 倒排文档索引
2.1.1 实验目标
2.1.2 实验内容
2.1.3 背景知识
2.1.4 实验步骤
2.1.5 参考示例
2.1.6 实验分析
2.2 词干提取和停用词分析
2.2.1 实验目标
2.2.2 实验内容
2.2.3 背景知识
2.2.4 实验步骤
2.2.5 参考示例
2.2.6 实验分析
2.3 中文分词
2.3.1 实验目标
2.3.2 实验内容
2.3.3 背景知识
2.3.4 实验步骤
2.3.5 参考示例
2.3.6 实验分析
2.4 Lucene 索引分析
2.4.1 实验目标
2.4.2 实验内容
2.4.3 背景知识
2.4.4 实验步骤
2.4.5 参考示例
2.4.6 实验分析
3 信息检索模型实验
3.1 向量空间模型
3.1.1 实验目标
3.1.2 实验内容
3.1.3 背景知识
3.1.4 实验步骤
3.1.5 参考示例
3.1.6 实验分析
3.2 概率模型
3.2.1 实验目标
3.2.2 实验内容
3.2.3 背景知识
3.2.4 实验步骤
3.2.5 参考示例
3.2.6 实验分析
3.3 基于Lucene 的检索扩展
3.3.1 实验目标
3.3.2 实验内容
3.3.3 背景知识
3.3.4 实验步骤
3.3.5 参考示例
3.3.6 实验分析
3.4 PageRank 算法及实现
3.4.1 实验目标
3.4.2 实验内容
3.4.3 背景知识
3.4.4 实验步骤
3.4.5 参考示例
3.4.6 实验分析
4 检索评价实验
4.1 查全率和查准率的关系
4.1.1 实验目标
4.1.2 实验内容
4.1.3 背景知识
4.1.4 实验步骤
4.1.5 参考示例
4.1.6 实验分析
4.2 计算MAP和R-prec值
4.2.1 实验目标
4.2.2 实验内容
4.2.3 背景知识
4.2.4 实验步骤
4.2.5 参考示例
4.2.6 实验分析
4.3利用P@N 的 搜索引擎比较实验
4.3.1 实验目标
4.3.2 实验内容
4.3.3 背景知识
4.3.4 实验步骤
4.3.5 参考示例
4.3.6 实验分析
5 XML检索实验
5.1 XML查询与显示
5.1.1 实验目标
5.1.2 实验内容
5.1.3 背景知识
5.1.4 实验步骤
5.1.5 参考示例
5.1.6 实验分析
5.2 WHU-XML系统的使用与比较
5.2.1 实验目标
5.2.2 实验内容
5.2.3 背景知识
5.2.4 实验步骤
5.2.5 参考示例
5.2.6 实验分析
附1 Lucene简介
附2 环境安装与配置
主要参考文献