无人值守免费自动采集器(网站自动更新工具)是一款绿色的中小网站自动更新利器!声明:本软件适合需要长期更新内容的非临时性网站使用,不需要你对现有论坛或网站做任何修改。
功能特色:
独特的无人值守 ET从设计之初即以提高软件自动化程度为突破口,以达到无人值守,24小时自动工作的目的,经过测试,ET可以长期自动运行,即使以年为时间单位。 超高稳定性 软件要达到无人值守的目的,则要求能长期稳定运行,ET在这方面进行了大量优化,以保证软件能稳定、持续的工作,绝无某些采集软件会发生自身崩溃甚至引发网站崩溃的问题。 最低资源占用 ET独立于网站,不消耗宝贵的服务器WEB处理资源,可以在服务器工作,也可以在站长工作机工作。 严密的数据与网络安全 ET使用网站本身的数据发布接口或程序代码处理、发布信息内容,不直接操作网站数据库,避免了任何因ET造成数据安全问题的可能性。采集信息时,ET则使用标准HTTP端口,不会造成网络安全漏洞。 强大而灵活的功能 除了一般采集工具所具有的功能外,ET 通过对图片水印、防盗链、分页采集、回复采集、登录采集、自定项、UTF-8、UBB、模拟发布……的支持,使用户能灵活的实现各种采发需求。 【特色】设定好方案,即可24小时自动工作,不再需要人工干涉 【特色】与网站分离,通过独立制作的接口,可以支持任何网站或数据库 【特色】灵活强大的采集规则不仅仅是采集文章,可采集任何类型信息 【特色】小巧、低耗和良好的稳定性非常适合运行于服务器 【特色】所有规则都可以导入导出,灵活的资源重用 【特色】采用FTP上传文件,稳定、安全 【特色】下载上传支持断点续传 【特色】高速伪原创 【采集】可选择倒序、顺序、随机采集文章 【采集】支持自动列表网址 【采集】支持对数据分布在多层页面的网站进行采集 【采集】自由设定采集数据项,并可单独过滤整理每个数据项 【采集】支持分页内容采集 【采集】支持任意格式、类型的文件(包括图片、视频)下载 【采集】可突破防盗链文件 【采集】支持动态文件网址分析 【采集】支持对需登录访问的网页的采集 【支持】可设定关键词采集 【支持】可设定防止采集的敏感词 【支持】可设置图片水印 【发布】支持发布带回复的文章,可广泛用于论坛、博客等项目 【发布】与采集数据分离的发布参数项,可自由对应采集数据或预设数值,极大增强发布规则的重用性 【发布】支持随机选用发布账号 【发布】支持任意发布项语言翻译 【发布】支持编码转换、支持UBB代码 【发布】文件上传可选择好自动建立年月日子目录 【发布】模拟发布支持对无法安装接口的网站进行发布操作 【支持】方案可定时工作 【支持】防止网络运营商劫持HTTP功能 【支持】可手动进行单项采集发布 【支持】详尽的工作流程监视、信息反馈,让您迅速了解工作状态
使用说明:
一、选择工作方案
工作方案包含了从来源获取原始信息、信息加工处理、最终发布到目标网站一系列工作的全部设定指令,是ET进行自动采集工作的指挥官,当制定好我们需要的方案后(方案制订见 用户手册 – 设置篇),即可在主窗口选择工作方案,开始采集工作。
1、认识方案区;
主窗口左侧上方的树形目录区即为方案区,点击鼠标右键,弹出操作菜单,见图示1:
2、勾选方案;
点击方案名前的选择框,选中将要执行的方案,可以多选,见图示2:
如果所选方案缺少关键性配置,将显示提示,并将取消选中,见图示3:
ET工作时,将首先从当前的焦点方案开始执行,即蓝色反亮显示的方案,见图示4中的‘网站-discuz 6.0(带回复)’:
选中的多个方案,将循环执行。
在主窗口右侧上方的文章列表区,将显示勾选的焦点方案的待处理文章。
在方案名称上点右键,弹出菜单见图示:
点编辑方案,会进入该方案编辑窗口;
双击方案名称,也可以直接进入该方案编辑窗口。
二、自动工作
选择好将要执行的工作方案后,点击主窗口左侧下方的‘自动’按钮,即可开始全自动工作,用户从此时起可以扔掉鼠标键盘、抛开繁累的网站更新,与朋友结伴出游,网站内容自有ET为您默默收集更新,见
要停止自动工作,请点击‘停止’按钮;
三、手动工作
在进行方案调试时,通常会使用手动方式进行采集操作。
1、采集目录;
点击主窗口左侧下方的‘采集目录’按钮,ET将对当前选中的焦点方案执行目录采集动作,若无焦点方案则按顺序执行,见图示6:
采集到的目录信息则显示在主窗口右侧上方的文章列表区,见图示7:
注意:当方案的采集规则有修改时,会自动清空未发布文章,包括发送失败的文章,以避免用户继续使用错误的文章条目来采集。
2、处理文章;
当文章列表区中有待处理文章时,点击主窗口左侧下方的‘处理文章’按钮,将按顺序对文章列表区的第一项待处理文章执行采集动作,见图示8:
文章处理过程中,在主窗口右侧下方的信息区,将显示工作记录,见图示9:
处理结束后,文章列表区的对应条目将显示处理的状态,见图示10:
3、另一种手动处理文章方式;
在文章列表区,双击某项文章条目,将对该篇文章执行采集动作,无论这篇文章是否已经被处理。
四、认识文章列表区
主窗口右侧上方的表格区域,即是文章列表区,这里显示所执行方案的待处理文章,见图示7。
1、文章列表区各列说明;
文章采集标题:这是通过采集规则-列表分析规则获取的文章标题,如果该采集规则未再设置标题数据项的分析规则,那么ET将使用此处的文章采集标题作为发布标题,文章采集标题可更改,点击标题后的省略号按钮 可进入编辑状态。
状态-发送:当该项值为YES时,表示该篇文章已成功发布;
状态-敏感:当该项值为YES时,表示该篇文章正文包含敏感关键词;
状态-错误:0表示无错误,其他错误代码含义请参考相关主题;
状态-处理:打勾的文章条目表示已经执行过,您可以通过点击取消勾选,使它被再次执行;
2、转换显示编码;
在文章列表区上点右键,将弹出编码菜单,见图示11:
3、双击执行文章采集;
在上一部分已经讲过,可以在文章列表区,双击某篇文章条目,以执行对它的采集;
4、浏览按钮;
点击文章条目的浏览按钮,可以访问该篇文章网址,用于确认网址是否正确、查看网页源码等,见图示12:
五、认识信息栏
信息栏用于跟踪执行过程、反馈各种信息,是了解ET工作情况、解决采集所遇问题的重要工具,见图示9。
1、工作记录:
该栏记录ET的每一步工作过程及状态,包括目录采集和文章处理两大部分,我们通过工作记录可以了解该次采集执行是否正确完成,或是出现了什么问题;当出现问题时,可以根据提示、结合信息栏的其他反馈内容,用户可以迅速准确地找到故障原因并予解决。
2、采集源码:
此栏显示执行过程中所采集的文章列表页、文章页面、文章分页等的网页源码,利用此栏源码,可以方便的进行规则测试、提供规则定制依据。
源素材 » 无人值守免费自动采集器3.5.7