这篇文章主要介绍了WebHarvy这款网页数据抓取软件的功能和特点。它是一款简单易用的工具,可以帮助用户轻松提取网页中的文本、图片或产品列表等内容。软件界面简洁直观,操作方便,支持从多个网站页面同时捕获内容,并能自动识别数据模式,省去了复杂的配置步骤。
WebHarvy还提供了多种导出格式,包括XML、CSV、JSON等,甚至可以将数据导入到SQL数据库中。它的功能非常强大,比如支持基于关键字的提取、使用正则表达式提取特定内容,以及通过代理服务器或VPN进行匿名抓取。软件内置浏览器还能运行JavaScript,并允许用户单独捕获HTML源代码的特定部分。
新增的功能还包括修复了一些启动问题,增加了键盘滚动和Java脚本加载下一页的功能,让操作更加灵活方便。总的来说,WebHarvy是一个非常实用的工具,适合需要快速从网页获取数据的用户使用,尤其是那些不想编写任何代码的人。我觉得这款软件真的挺方便的,特别是它的自动识别模式功能,省了很多麻烦!如果你有类似的需求,可以试试看。
WebHarvy(网页数据抓取软件)是一款网页数据抓取工具,在这里,不仅可以帮助你轻松访问所需网站,以便选择需要的图像、文本或产品列表等内容进行捕获提取,而且可以同时从多个网站页面捕获内容,除此之外,这款软件界面简洁美观清晰明了,操作使用简单方便快捷易上手,让你可以轻松把控,输入网址便能打开,默认使用内部浏览器,随时随地即可快速实现网页数据抓取,心动不如行动,欢迎各位感兴趣的小伙伴前来下载体验!

软件介绍
WebHarvy是一款网页数据抓取工具,软件可以提取网页里的文本及图片,输入网址即可打开,默认使用内部浏览器,支持扩展分析,可以自动获取类似链接的列表,软件界面直观操作简单。

软件功能
智能识别模式
WebHarvy自动识别网页中出现的数据模式。所以,如果你需要从一个网页刮项目(姓名,地址,电子邮件,价格等)的列表,你不需要做任何额外的配置。如果数据重复,WebHarvy会自动刮。
导出捕获的数据
可以保存从各种格式的网页中提取的数据。 WebHarvy网站刮板的当前版本允许你导出的刮数据作为XML,CSV,JSON或TSV文件。您还可以刮下数据导出到一个SQL数据库。

从多个页面提取
通常网页显示数据,如在多个页面中的产品目录。 WebHarvy可以自动抓取并从多个网页中提取数据。只是指出了“链接到下一页'和WebHarvy网站刮板将自动刮从所有页面的数据。
直观化的操作界面
WebHarvy是一个可视化的网页提取工具。其实完全没有必要编写任何脚本或代码用来提取数据。使用webharvy的内置浏览器浏览网页。您可以选择用鼠标点击来提取数据。它是那么容易!

基于关键字的提取
基于关键字的提取可让您捕捉从搜索结果页面输入关键字的列表数据。您创建的配置将被自动重复所有给定输入关键字,而挖掘的数据。可以指定任意数量的输入关键字
提取分类
WebHarvy网站刮板允许您从一个链接列表,从而导致一个网站内的相似页面抽取数据。这使您可以使用一个单一的配置刮网站内的类别或小节。

使用正则表达式提取
WebHarvy可以应用正则表达式(正则表达式)在文本或网页的HTML源代码,并提取去匹配的部分。这种强大的技术为您提供了更多的灵活性,同时拼抢的数据。

软件特色
WebHarvy是一个视觉网络刮板。绝对不需要编写任何脚本或代码来抓取数据。您将使用WebHarvy的内置浏览器浏览网页。您可以选择要点击的数据。这很容易!
WebHarvy自动识别网页中发生的数据模式。因此,如果您需要从网页上刮取项目列表(名称,地址,电子邮件,价格等),则无需执行任何其他配置。如果数据重复,WebHarvy会自动删除它。

您可以以多种格式保存从网页中提取的数据。WebHarvy Web Scraper的当前版本允许您将抓取的数据导出为Excel,XML,CSV,JSON或TSV文件。您也可以将抓取的数据导出到SQL数据库。
通常,网页在多个页面上显示产品列表等数据。WebHarvy可以自动抓取并从多个页面提取数据。只需指出“链接到下一页”,WebHarvy Web Scraper就会自动从所有页面中抓取数据。

软件优势
该程序可使用自定义的正则表达式从多个页面捕获数据,还允许通过代理服务器或V P N服务进行匿名抓取。另外,内置浏览工具可运行Java脚本,而且还能单独捕获HTML源代码的特定部分。

更新内容
修复了页面启动的时候可能导致禁用连接
可以对页面模式配置专属的连接方式
可以自动搜索HTML上可以配置的资源
增加了键盘向下滚动下一页的功能
增加了通过Java脚本加载下一页。
添加了URL配置的功能
可以将关键字输入一个列表上2搜索




























共有 0条评论