`
cloudtech
  • 浏览: 4604459 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
文章分类
社区版块
存档分类
最新评论

.net 开源搜索引擎,C#搜索引擎开源

 
阅读更多

.net 开源搜索引擎,C#搜索引擎开源,C#开源搜索引擎,.net搜索引擎开源


开源:完全自主研发搜索引擎1.0源代码及说明,单机400万网页全文索引,任意50词以内的检索不超过 20毫秒



搜索引擎1.0源代码、相关说明、下载地址如下:

1、Bwsyq.Search.Demo
进行检索,就是常说的搜索引擎网站。提供检索服务。
目前实现了:按关键词进行检索,实现了动态摘要、关键词高亮显示、自动分页、每页显示条目可自定义(默认每页显示10条检索结果)
未实现功能:相关搜索关键词条显示、按相关度进行排序、快照、网页标题、采集时间、网页URL、并行集群检索
其中:快照、网页标题、采集时间、网页URL 可根据实际情况自行实现
相关搜索关键词条显示、按相关度进行排序、并行集群检索 将在下一版提供
2、Bwsyq.Search.Index
进行索引,就是常说的全文索引。

3、DemoDoc 目录中的 3500个txt文档是用来做索引测试的文档。测试的使用请放置在:D:\index\DemoDoc 也可根据实际情况在代码中修改

4、index 目录中的.idx 文件是测试建立的索引文件。 测试的使用请放置在:D:\index\index 目录,也可根据事情情况修改配置文件

5、注意事项:
A、目前索引存储路径是 D:\index\index\ 可在配置文件中根据实际情况对配置文件“App.config、Web.config”进行修改
<KeyInfo Key="SEARCHIDX" Value="D:\index\index\"/>
B、索引所需词库存储路径是 D:\index\ App_Data 可在配置文件中根据实际情况对配置文件“App.config”进行修改
<KeyInfo Key="PhysicaPath" Value="D:\index\"/> 修改后将 App_Data文件夹及其中的文件全部拷贝到对应目录即可
C、检索所需词库存存储路径是 网站项目中的 App_Data 目录,无须修改
D、BwsyqIndex.dll 是核心库,采用C语言开发,可存放在system32目录,或项目运行的目录bin或release目录中。

6、目前提供的版本是2.0版,有如下性能指标:
A、单机可索引400万网页、
B、普通PC: AMD 2.0、 7200转硬盘、2G内存每4分钟可索引1000页(已经做了html parse)的文本
C、经实际测试任意50词以内的检索,检索运算不超过 20毫秒
D、检索速度不会因为索引的多少而发生任何变化,索引速度也不会因为文档多少或文档大小而变慢
E、开发工具VS2008,测试环境 windos7 + CPU(AMD 2.0)、 5400转300G硬盘、2G内存
注:本版本单机索引限制在 400万网页,超过将不在执行索引。

7、本版本截止开发周期业余时间不到 3个周末和3个周日,期间还感冒了一周,所以有很多不完善的地方,请大家多指正。
我会尽快根据大家提供的建议进行改善并提供改进后的新版本。

8、本软件完全属于本人自主创作,完全没有任何借鉴和第三方代码,您可以放心的用于学习和商业用途。

下载地址1:http://ishare.iask.sina.com.cn/f/17697171.html
下载地址2:http://www.everbox.com/f/xkdvEM3eyrwYXp9yG4d2b7aawZ
下载地址3:http://www.everbox.com/f/xO8NFbNyW5frP5SXSlaTzNdDIf
下载地址4:http://www.everbox.com/f/XcC7HMzMD7PXRKkNZKEVLfLcEK
下载地址5:http://www.everbox.com/f/WXFsqChwLTbLmX2P6gQuQy1z51
下载地址6:http://www.everbox.com/f/Bi9izWoxroLcn9mBs3N2S4PBeG
下载地址7:http://www.everbox.com/f/Tf3XzMdLVXDcX233qirYPTkMvr

版权所有:未经许可不得转载,有任何疑问请与我本人联系 QQ 99923309 Mail:bwsyq@bwsyq.com更多详情>>


我做测试的时候,单机检索3000万网页,任意(50词)以内的搜索不超过50毫秒,担心大家说我吹牛,所以先开放一个400万网页的索引搜索代码,给大家观摩观摩!
希望各位专家批评指正,多提宝贵意见,谢谢!

软件工程概述 - 企业架构 - IT企业做大做强之根本 - 之我见

实践检验得出的真理:asp.net 项目在 linux mono上编译需要修改的只有 3个地方

给大家漏一手本人亲自精心撰写的通用ajax框架,完全兼容 IE FireFox各个版本!(附完整源码及完整范例)

开发了一个中文分词服务器(C语言开发+词库+源代码),最大特色可以让javascript来调用!

用纯C语言写了一个HtmlParse(网页分析器)外带采集功能,大小只有200K(免费+开源+操作示意图)


开源:完全自主研发搜索引擎1.0源代码及说明,单机400万网页,任意50词以内的检索不超过 20毫秒

开源:基于百万商业圈.NET开发框架开发的并行带分词的采集器

百万商业圈 .NET 开发框架2.0及开发框架API说明书(BWFW)(含并行计算及中英文分词功能)

分享一点代码(小型C web开发框架),用C语言实现的一个WEB 文件上传(含全部源代码)一

天心天字辈ERP全部PDK源代码到了我手上的后果 - 超越天心之WEB天云

大家看看我的BS的甘特图排程做的如何? 无刷新Ajax甘特图 展示生产排程结果 演示

分享到:
评论

相关推荐

    迅龙中文Web搜索引擎(.NET)-开源的搜索引擎程序C#编写

    一个开源的搜索引擎程序C#编写的。里面有详细的说明文档,功能详尽,而且推荐个下载开源源码的网站,相信对学习C#和.NET的朋友有很大帮助

    asp.net 垂直搜索引擎

    1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,系统定时更新索引文件; 3.该代码简洁,完全开源5.支持上亿级数据的全文查询,时间在毫秒级,通常在30毫秒以下; 4.新闻系统与搜索引擎测试...

    垂直搜索引擎完全开源版 c#开发基于Lucene.net 带效果预览图片

    垂直搜索引擎完全开源版 c#开发基于Lucene.net 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,...

    站内搜索引擎源代码 asp.net

    提供了一个用asp.net创建的站内搜索引擎源代码,可以根据自己的需要进行修改,功能强大

    免费站内搜索引擎 基于C#与 lucene.net开发的 SQLServer版

    产品开发目前基于C# Lucene.Net 软件包括两个个部分: 1、jwSearchEngine索引器: 索引器是用来把数据库内的数据索引成索引文件来使用的,注意目前的1.0版本仅仅支持 SqlServer数据库 2、网站程序 网站直接...

    淘特站内搜索引擎(C#版) v2.1 源码

    淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及...

    ShootSearch (基于dotlucene的c#开源搜索引擎)

    ShootSearch是一个c#编写的基于dotlucene的开源搜索引擎.其目标是能够检索http,ftp,本地,本地网络邻居四类资源. 已经完成http部分. 测试DEMO: 新浪&搜狐首页开始所有www开头的主机,13分钟54.5 MB 985个文件 60...

    开源的搜索引擎[转]

    网博垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与...

    asp.net精美商城开源程序源码

    为了迎合搜索引擎,系统采用了真实静态化技术,可以自定义主页,栏目页, 商品页和文章页的标题和关键字等。 3.会员注册、找回密码、身份验证、会员资料修改、产品管理、产品批量置顶、批量推荐,批量删除、订单...

    迅龙中文Web搜索引擎0.7( C# .NET)核心代码

    迅龙中文搜索 0.7 nSearch版 核心代码 C# 源代码下载 《《完整源代码下载http://gforge.osdn.net.cn/projects/xunlong/》》 以发展中国的开源软件事业为己任 促进中文搜索技术的交流与合作! 宁夏大学 张冬 ...

    Masuit.LuceneEFCore.SearchEngine:基于EntityFrameworkCore和Lucene.NET实现的全文检索搜索引擎

    基于EntityFrameworkCore和Lucene.NET实现的全文检索搜索引擎 基于EntityFrameworkCore和Lucene.NET实现的全文检索搜索引擎,可轻松实现高性能的全文检索。可以轻松应用于任何基于EntityFrameworkCore的实体框架...

    asp.net知识库

    asp.net的网址重定向方法的比较:面向搜索引擎友好 也谈 ASP.NET 1.1 中 QueryString 的安全获取写法 ASP.NET运行模式:PageHandlerFactory 利用搜索引擎引用来高亮页面关键字 网站首页的自动语言切换 应用系统的多...

    meilisearch-dotnet:用于MeiliSearch API的.NET包装器

    MeiliSearch是一个开源搜索引擎。 目录 :open_book:文献资料 请参阅我们的或我们的。 :wrench:安装 使用: dotnet add package MeiliSearch 或使用: Install-Package MeiliSearch 运行MeiliSearch 有许多简单...

    PlugNT CMS 3.5最新版(100%开源)

    PlugNT CMS,一款免费开源ASP.NET内容管理系统,PlugNT系统组成部分之一,系统采用ASP.NET(C#) + jQuery技术,是一个功能强大、操作人性化、搜索引擎优化、高效性、安全性、扩展性强的Web系统,产品主要优点有以下几...

    UrlRewriter Java v2.0 RC1

    UrlRewriter.NET是一个非常棒的搜索引擎优化(Search Engine Optimization,简称SEO)工具。使用它,您可以创建包含指定关键字的Url,从而提高您网站在搜索引擎的排名。 使用UrlRewriter.NET您可以做到: 为实际的...

    asp.net三层架构生成器(含教程)中文版

    C# 三层架构生成器,适用与VS2005/2008/2010等。 功能简介: 一键自动生成三层架构的代码。 强大的全模板代码生成引擎,可根据模板生成各种语言代码。 自动生成整个项目和批量...便捷工具:C#到VB.NET代码转换器。

    Cube CMS-开源

    以ASP.NET .NET 2.0 C#编写的内容管理系统(CMS),以Microsoft MS SQL Server 2005为后端。 此CMS还使用FreeTextBox作为RAD编辑器和AspxLab Web控件。 它还使用DotLucene.Net作为搜索引擎。

    BISM"菁搜"FTP搜索引擎WEB前台源码

    Visual C# 2005 asp.net 2.0 (开源信息和相关帮助信息)http://blog.csdn.net/BismSoftware 有相关问题可以联系我们: BISM软件工作组 E-MAIL:Bismsotware@163.com 余文锋 E-MAIL:wenfeng610@yahoo.com.cn 陈鸿雏...

    PlugNT CMS 内容管理系统 v4.6 编译版

    源码介绍:数据库为 Access / SQL Server 2005 PlugNT CMS,一款免费开源ASP.NET内容管理系统,PlugNT系统组成部分之一,系统采用ASP.NET(C#) jQuery技术,是一个功能强大、操作人性化、搜索引擎优化、高效性、安全...

    X3BLOG AJAX国产大型开源多用户博客系统 1.1.0.beta1源码版

    国内搜索引擎最强大的多用户博客系统 国内唯一支持所有浏览器的多用户博客系统 国内唯一应用AJAX+XML+XSL三种技术于一体的博客系统 X3-BLOG 是基于XML+XSLT+AJAX技术构建的开源多用户博客门户系统,服务器端采用...

Global site tag (gtag.js) - Google Analytics