塞马尔特专家建议–如何抓取网站

ScrapBook是一个著名的Firefox扩展,具有增强的页面保存,笔记,书签和剪贴簿功能。使用ScrapBook,您可以轻松地将网页保存在本地计算机系统上。但是,您无法访问从另一台计算机设备或智能手机下载的文件。 ScrapBook扩展名可以与其他同步服务结合使用,这些服务可以同步ScrapBook存储数据的文件夹。

Firefox扩展的开发:

Danny Linn在Murota实验室开发了ScrapBook,并在Extend Firefox Competition中赢得了多个奖项。它的一些最新版本是ScrapBook Plus,ScrapBook Lite,ScrapBook X和ScrapBook Plus 2,它们具有交互功能。

使用ScrapBook下载整个网站:

您是否要下载整个或部分网站以供离线使用? ScrapBook是唯一帮助将不同网页保存到硬盘的Firefox扩展。它轻巧,快速,并且可以完美地缓存站点的本地副本。另外,ScrapBook支持多种语言,并已通过不同的CSS样式和图形进行了测试。此扩展名可用于组织数据和编辑收集的网页。其HTML /文本编辑功能类似于Opera的Notes。

安装Firefox扩展:

如果您正在运行最新版本的Firefox(v33),则必须调整其设置才能正确使用ScrapBook。默认情况下,其图标不会显示在任何地方,因此您必须右键单击网页,然后将按钮手动添加到工具栏。在下一步中,您需要单击“自定义”按钮,并且ScrapBook图标将在左侧可见。

使用ScrapBook下载网站:

可见ScrapBook图标后,您现在可以使用它来下载整个网站。首先,您必须右键单击该网站,然后选择“另存为”或“另存为”按钮。 ScrapBook将开始将样式,文本和图像下载到硬盘上。

WinHTTrack – ScrapBook的替代品

如果您不使用Mozilla Firefox,但仍想将整个网站下载到您的计算机上,则可以选择WinHTTrack。该程序使我们可以将网站下载到本地计算机,并适当地安排下载的文档。 WinHTTrack也可以更新现有文件并恢复中断的下载。它可以通过不同的过滤器和选项进行配置,并具有用户友好的界面。

WinHTTrack使用特定的Web搜寻器来下载站点。由于机器人排除协议,网站的某些部分可能无法正确下载。因此,您将不得不禁用该程序并重新启动窗口。 WinHTTrack遵循使用基本HTML和JavaScript代码生成的链接。它无法处理复杂的链接,也无法正确下载动态网站。

结论:

WinHTTrack和ScrapBook都有各自的优点和缺点。 WinHTTrack与几乎所有的Web浏览器兼容,而ScrapBook仅与Mozilla Firefox兼容。但是,两个扩展都需要大量空间。因此,您应确保硬盘上有足够的可用空间。