首页
会员中心
到顶部
到尾部
NET毕业设计

基于Lucene架构的搜索引擎

时间:2020/10/27 9:04:08  作者:  来源:  查看:0  评论:0
内容摘要:本课题的研究方法:    在本系统的开发过程中,首先分析了搜索引擎的相关功能,写出需求分析;其次,综合运用以前所学的相关知识(数据库,C#等),选择所熟悉的开发工具进行开发(本系统选择了Microsoft Visual ...
本课题的研究方法:
    在本系统的开发过程中,首先分析了搜索引擎的相关功能,写出需求分析;其次,综合运用以前所学的相关知识(数据库,C#等),选择所熟悉的开发工具进行开发(本系统选择了Microsoft Visual Studio .NET 2003作为开发平台,开发语言选择了C#;数据库采用Microsoft SQL Server 2000)。由于Lucene不是完整的搜索引擎程序,只为搜索引擎应用提供了工具包,在Asp.net平台中,可使用Lucene.net这个对Lucene兼容的库。使用Lucene.net协助完成搜索引擎相关的网页爬虫与抓取,为文档建立索引,关键词搜索的功能,通过Ajax优化系统,完成页面的局部刷新功能,给用户好的体验。

本毕业设计要实现的功能:
1.能够对Internet上的网页内容、标题、链接等信息按链式收集。
2.能够实现一定链接深度的网页收集,也就是在Internet上实现一定的URL级的数据收录。
3.对收集到的数据存入MSSQL Server 2000等关系型数据库中、或者存入文本文件中。
4.网站信息库中的信息会不断的变动,对收集到的数据需要定期的自动维护,做到定期的删除、从新收集。
5.对收集到的数据进行关键词的检索。
6.对检索出的数据要可定位性,即可以显示对数据的出处的链接。
7.实现中英文分词功能,能够按中文或者英文单词检索数据。
8.实现无刷新的显示搜索结果,对搜索用时的计算、显示,关键字高亮显示等。
9.逻辑搜索功能比如“中国”AND“北京”AND NOT(“海淀区”AND“中关村”)。


相关评论
广告联系QQ:45157718 点击这里给我发消息 电话:13516821613 杭州余杭东港路118号雷恩国际科技创新园  网站技术支持:黄菊华互联网工作室 浙ICP备06056032号