当前位置: 首页 > 应用软件 > 常用工具 >
SysNucleus WebHarvy网页采集大师

SysNucleus WebHarvy网页采集大师

  • 大小: 130.4M
  • 平台: Win7
  • 版本: v7.2.0.217 免费版
  • 类型: 常用工具
  • 语言: 中文
  • 时间: 2025-02-27 03:05:39
立即下载

内容简介

webharvy页面提取数据软件能够实现快速获取网页数据的专业抓取工具。通过将网页导入就能快速提取所需内容。该软件还支持将数据进行存储,当有采集网页数据的需要时,这个专业抓取助手就能够轻松满足你的使用需要。

webharvy电脑版介绍

WebHarvy是一款强大的网页数据采集工具,可以帮助用户从各种网站中抓取所需的数据,并将其保存为结构化的格式。

webharvy官方版

webharvy最新版安装教程

1.下载安装包后双击运行WebHarvySetup.msi

2.阅读并勾选协议后点击Install

webharvy客户端

3.等待安装

webharvy最新版

4.安装完成后软件将会自动启动

webharvy最新版

软件功能

1、智能模式检测

WebHarvy 自动识别网页中出现的数据模式。要从网页中抓取项目列表或表格(名称、地址、电子邮件、价格等),不需要额外的配置。如果数据重复,WebHarvy 会自动抓取它。

2、JavaScript 支持

在抓取数据之前,在浏览器中运行您自己的 JavaScript 代码。这可用于与页面元素交互、修改 DOM 或调用目标页面中已实现的 JavaScript 函数。

3、保护隐私

为了匿名抓取数据并防止网络抓取软件被网络服务器阻止,您可以选择通过代理服务器或 VPN 访问目标网站。可以使用单个代理服务器或代理服务器列表。

4、保存到文件或数据库

抓取的数据可以以多种格式保存。当前版本的 WebHarvy 网页抓取软件允许您将抓取的数据保存为 Excel、XML、CSV、JSON 或 TSV 文件。您还可以将数据导出到 SQL 数据库。

5、简单的网页抓取

通过 WebHarvy 的点击界面,网页抓取变得非常简单。无需编写代码或脚本来抓取数据。您将使用 WebHarvy 的内置浏览器加载和导航网站,并且可以通过单击鼠标选择要抓取的数据。

6、处理分页

网站通常会在多个页面中显示产品列表或搜索结果等数据。WebHarvy 可以自动从多个页面爬行和抓取数据。只需指出“下一页的链接”,WebHarvy 就会自动从所有页面中抓取数据。

7、自动执行浏览器任务

WebHarvy 可以轻松配置为执行诸如单击链接、 选择列表/下拉选项、在字段中输入文本、 滚动页面、 打开弹出窗口等任务。

8、提交关键词

通过自动向搜索表单提交输入关键字列表来抓取数据。可以将任意数量的输入关键字提交到多个输入文本字段来执行搜索。可以从输入关键字的所有组合的搜索结果中抓取数据。

9、类别抓取

WebHarvy 允许您从指向网站内类似页面/列表的链接列表中抓取数据。这允许您使用单一配置来抓取网站内的类别和子类别。

10、图像抓取

可以下载图像或抓取图像 URL。WebHarvy 可以自动抓取电子商务网站产品详细信息页面中显示的多张图像。

11、常用表达

正则表达式 (RegEx) 可以应用于网页的文本或 HTML 源来抓取匹配部分。这种强大的技术为您在抓取数据时提供了更大的灵活性和控制力。

webharvy如何使用?

一、安装装webharvy

1.先在本站安装下载并安装webharvy

二、打开WebHarvy并配置任务

1.打开WebHarvy软件后,点击“新任务”按钮创建一个新的任务。

2.在弹出的窗口中输入要采集的网页URL,并点击“开始配置”按钮

3.在打开的网页中选择需要采集的数据,并用鼠标框选出来。选中后,WebHarvy会自动识别出该数据所在的HTML元素,并在界面上显示出来

4.配置好所有需要采集的数据后,点击“下一页”按钮进入下一页并重复以上操作。

三、设置输出格式

在完成所有采集任务后,需要设置输出格式。WebHarvy支持多种输出格式,包括Excel、CSV、JSON等。用户可以根据自己的需求选择合适的输出格式。

四、运行任务

完成上述操作后点击“运行”按钮开始执行任务。WebHarvy会自动访问每一页,并采集所需的数据。采集完成后,用户可以将数据导出到本地文件,或者直接将其保存到数据库中。

使用说明

1、从云运行

WebHarvy 可以在 Amazon AWS EC2 Windows 实例中运行

2、需要 Windows

WebHarvy 需要 Windows 操作系统才能运行。如果您想在 Mac 上运行 WebHarvy,您应该通过 BootCamp 安装 Windows 或通过 Parallels 运行 WebHarvy。目前不支持 OS X / macOS。

3、基于 Chrome 构建

最新版本的 WebHarvy 是使用 Google 的开源 Chrome 浏览器项目构建的,这使得它更加安全、稳定和更快。

软件截图

  • SysNucleus WebHarvy网页采集大师 v7.2.0.217 免费版 0