NCrawler 是一个Web Crawler 工具,它可以让开发人员很轻松的发展出具有Web Crawler 能力的应用程式,并且具有可以延展的能力,让开发人员可以扩充它的功能,以支援其他类型的资源(例如PDF /Word/Excel 等档案或其他资料来源)。 NCrawler 使用多执行绪(Multi-threading)模式针对网路资源进行探索,并且会依照给定的步骤来处理抓取到的资源,然后依给定的资源来活动(像是写入资料库或是撷取部份资料等等)。
目前 NCrawler 支援的搜寻类型有:
HTML 网页(需要 HtmlAgilityPack.dll)。
PDF 档案(需要 iTextSharp PDF Library)。
而 NCrawler 支援的中介储存区有:
记忆体(使用NCrawler.Crawler 进行时)。
资料库(使用NCrawler.DbServices.Crawler 进行时)。
隔离储存区(使用NCrawler.IsolatedStorageServices.Crawler 进行时)。
NCrawler 的中介储存区储存了包含网址以及探索伫列等资料,以供应NCrawler 引擎撷取网址以进行作业之用。并且保留历史资料以备查询。
NCrawler 具有强大的URL 探索能力,以及多执行绪的处理能力,因此笔者使用它撰写一支简单的无效连结侦测程式(只要不是HTTP 200 的回应都算无效),可以使用Windows 排程来定时执行,并回报无效连结的侦测结果,列出无效连结的清单报表等。无效连结侦测程式由InvalidLinkDetector 类别作为核心功能提供者,里面包装了NCrawler 以及记录用的XML Document 物件






















大小: 8KB

大小: 304.3M
终端仿真器 SecureCRTv7.1.1.264 最新版
串口调试小助手1.3 免费版
WinHex 十六进制编辑器v20.2 SR-5 绿色中文注册版
小旋风ASP服务器安装版
16进制转换工具V1.0 中文绿色版
Adobe AIRV33.1.1.932 官方最新版
github离线安装包64位版V2.9.11官方最新版(github desktop)
MSDN Library Visual Studio 6.0(VC、VB、VF、VJ)中文版win32开发人员必备
版本控制软件(SourceTree)v3.4.6 官方最新版
Memory Analyzer (MAT)V1.01 免费绿色版
Delphi Distillerv1.85绿色版
IBM内存检测工具(IBM Thread and Monitor Dump Analyzer for Java)V4.3.3 绿色版
一键安装JSP环境安装版
slave4j(基于eclipse插件的java代码生成器)V1.0.0 正式版
Auto DebugProfessional 5.6.5.18 中文绿色版
Understand For C++V1.4.319英文安装版