您的位置: 中国建站之家 » 常用软件 » 精品工具 » 火车采集器V2009炎黄网络合作版
  • 火车采集器V2009炎黄网络合作版
软件大小:26.4 MB软件类别: 常用软件 - 精品工具
语言:简体中文运行环境:2000/XP/2003/Vista
软件评级:更新时间:2009-6-11 16:55:21
软件授权:免费版插件情况:
解压密码:www.jz123.cn演示地址:www.jz123.cn


★★①安装说明★★

  火车采集器V2009SP2版要求:您的电脑必须安装.net framework2.0或2.0以上框架
     附windows .net framework 2.0下载地址:http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe

★★②升级说明★★

  若要从V2009SP1版直接升级,请下载升级包,不然则直接下载完整包


★★③版权声明★★

  火车采集器系列由 Locoy.Com 合肥乐维信息技术有限公司开发,享有自主知识产权,国家版权局登记号(2009SR017475)。
    本合作版使用权及发行权归安徽炎黄网络科技有限公司所有。
  您使用火车采集器则默认为接受 《火车采集器使用许可协议》(见F1-程序帮助文档,使用许可协议)


★★④更新列表★★

 火车采集器V2009炎黄网络合作版(2009-06-12):

 除包含V2009SP2正式版的所有功能外,还集成了原商业版才享受的Sqlite数据库本地保存采集数据,因为支持事务特性及卓越的性能,在采集速度相比原Access有很大的提高
 本次合作版还更新增加了对Vista sp2 正式版 及 Windows7 RC 版本支持,使得在此类高端操作系统上也能使用上火车采集器。


2009SP2版更新列表:  2009-04-28

1、改进了PHP接口的功能,php接口接收和返回整个标签内容数组集合,支持各个标签间相互调用及处理
2、标签内增加不得重复的设置,可以对过滤掉重复的标签内容了!(不只是简单的网址重复过滤)
3、对采集过程中出现错误的记录有错误处理机制了。以前网络出现错误时一样会标记为采集成功。
4、去掉了免费版内2%的随机广告.
5、添加了标签结果不符合要求的处理方法,全局设置内增加可选是否删除或标记为已采的选项
6、修复了附件下载时中文乱码及多次跳转无法得到正确文件名的bug
7、ubb发表添加了表格支持
8、web发布时自动加载需要的标签
9、修改了智能提取标签时提取了缩略图的bug
10、模块编辑器支持update语句.
11、优化了中文分词模块
12、优化了ftp上传模块,将不再出现文件已经实际下载却提示未找到任务可以上传文件的情况
13、修正了入库配置里端口的设置显示问题.
14、解决了因sql语句大小写问题导致入库不成功的bug.
15、修正了explorer意外结束后程序托盘图标无法显示的问题.
16、循环采集时内容合并的间隔符号,不能是半角空格的bug
17、修复了部分版本中任务列表框在三个步骤全不选后任务自动消失的bug.
18、修复了自动运行中部分情况下不能自动停止及采完网址不继续采内容的bug.
19、修复了导入带有从文件导入网址的任务规则时文本文件没有同步导出的bug.
20、修复了web上传文件时[本地文件循环:标签]中标签的设置不起作用及所有的类型均是text/plain的bug.


2009SP1修复V2009版BUG列表:  2009-03-20

1.模块编辑器里里的使用随机用户名界面显示错误
2.时间转化标签在发布时转化为空不能正确转化为时间戳的bug.
3.停止和暂停按钮的提示信息相反的bug.
4.免费版本的下载路径.(已开放随机目录给免费吧版本)
5.过滤内容为空的规则里图片照样下载的bug.
6.添加web发布配置那里,空白的地方一点就出错
7.把数据采集到本地保存为 csv文件的时候,所有的数据全部排列成一行.
8.对标记为过滤的记录,改为直接删除记录.
9.在任务编辑状态下,隐藏主界面后丢失正在编辑的任务的bug.
10.添加标签时,如果先在“定义固定格式的数据”打上了标签名“关键字” 点保存。这时标签名就是“SY_关键字的bug.
11.模块里不能添加http:// 
12.测试时的网址https不能测试.
13.对手动添加的网址重复检测.
14.列表页缩略图及自定义标签预览,在最大化时不能靠边.
15.标签编辑框里在有的系统上鼠标移出后会消失的bug.
16.ftp支持没有遵守标准ftp协议的服务器了.
17.修复了部分非微软输入法中文有时不能输入的bug.
18.修复下载中有空格时下载不成功的bug.

修改或增加:
1.程序可以多开,但用户应该注意在不同目录内开启多个程序实例.
2.本地编辑中,对于数据量很少的字段,可以直接在列表中编辑,回车提交信息.
3.在规则页面选择“使用接口”时,后面添加了一个编辑接口文件的小按钮
4.隐藏任务功能.有一个全局开关,当不选采网址,采内容,发内容时且该任务运行过一次后,如开,则该任务会隐藏.
5.在提取关键字后,最后一个链接符去掉. 
6.在单条发布时添加一个完成提示,在本地编辑时更新为已发布.

2009版功能更新 2009-02-23


加入了列表页标签采集,可以在采集网址的时候采集任意多的标签(类似以前的缩略图系统标签工作模式)
支持gzip,deflate网页压缩采集,可大幅度提高网页下载速度(3到10倍).
重写下载模块,可以断点下载,断点分块多线程下载,大文件不再是问题.支持论坛附件,多次跳转等Http,FTP协议形式的文件下载
支持上传附件.可以通过发布帖子文章的时候利用文件表单接口上传附件(文件)到网站,更方便.
加入了发布时间随机时间段的功能,使发布时间更人性化
重写本地数据编辑功能,加载更快,处理更方便
加入了在本地数据编辑时对单个标签进行同义词敏感词替换处理及执行历史SQL等功能
支持.net外部编程插件,可以做更为复杂的工作.例如下载视频.
支持更多http头.对于http 1.0的也可以下载了.
加入了加入批量网址时可按a-z添加的功能
支持对多个标签进行分词.准确性更好.
可以随机发布和随机文件保存目录.
支持网址部分post随机值.那些aspx类型的网站网址获取不再难.
规则模块高亮显示功能.对于一些关键字和标签进行高亮显示.编辑更方便.
测试规则时及数据编辑时可以进行单条和多条的WEB发布到网站测试
更新了用户界面,主界面使用仿VS2005可停靠窗口模式
加入了本地数据库编辑时可以默认选择使用设置模式还是代码模式显示的功能
任务可以批量复制,导入,导出等
可以一键导入模块中所有的标签,多标签的规则不再痛苦.
加入了一键获取本机User-Agent的功能
重写了获取源代码,Http模拟提交工具,增强了其功能
新加入[系统时间转化:]标签,可对当前时间按任意格式进行转化
添加了采集数据资源locoy://协议,用户可以直接点击这样的连接下载导入规则
新加入对大数据量采集,不用将数据采集在本地而直接Web或数据库发布的功能
加了Http请求系统设置,对非常特殊的网页可通过设置这些特殊Http请求头进行采集
其他增加的一些小细节等等请打开软件继续发掘......


修正BUG

支持.net2.0及.net3.5等框架环境下使用
修复了2008版采集时没有发送来源请求头的问题
修正了在Sqlite数据库下 下载缩略图非常慢的问题
修正了php外部编程接口在当用户windows目录下已经安装过php.ini的情况下执行出错的问题
修正了在发布时不能启用蜘蛛User-Agent的bug
对规则检测更加严格,可以避免因规则出错而导致的采集问题.
对规则编辑部分调整了显示区大小,编辑任务更方便.
测试时就可以测试文件下载,规则对不对,一目了然.
任务运行区状态显示更为友好.
修正了规则列表区上下移动位置进行排序的功能
更新了中文分词,修正了对人名识别和英文关键词的支持
修正了2008版在有文件下载时无法注销任务界面显示的bug
修复了2008版时间转化标签处对无法处理带斜杠的格式处理的bug
修正了2008版商业用户备用登陆服务器2,3工作不正常的错误
修复了暂停和停止显示错误的问题
修复了被窗体遮盖,进度条刷新显示错误的问题
修复了使用文件导入网址时界面假死的问题
修正了批量添加网址时在多倍数并倒序生成错误网址列表的问题
修复了2008版中flashget://类的地址同时是附件形式的下载不到文件的问题
修复了其他及2009标准版测试版中的一些bug


2008版本更新: 2008-08-08

新增功能

1、加入了对Sqlite数据库的支持,本地数据采用Sqlite保存,相比Access性能得到巨大提高
2、加入了外部编程接口,用户可以火车采集器内使用自己编写的php接口文件处理标签数据
3、加入了可视化编辑器及高亮文本编辑框,对本地数据的后期编辑更加快速和直观
4、加入了内置FTP上传文件的功能,特别在自动更新时保证下载的文件同步更新到服务器
5、加入了对采集内容简体转繁体,繁体转简体及火星文之间的转换的功能
6、加入了对单个标签可设置必须包含不得包含,采集结果是否允许为空的设置,使采集结果更加精确
7、加入了对单个标签是否补全相对网址的功能
8、加入了对单个标签设置是否在分页中匹配的功能,至此可以完美采集论坛的所有楼层及分页回复
9、加入了对需要POST数据才能采集的列表类的网站的支持,实例中已能完美采集51job.com
10、加入了采集时可选是否检测重复网址的功能,增加采集的速度
11、加入了发布时可选随机发布的功能,实现文章的乱序排列
12、加入了分词测试工具、翻译测试工具
13、加入了自动识别网页编码和自己加载本地登录信息的功能,使设置更加简单,可实现采集多编码的多页网页

修改功能

1、重写的自动更新模块,新增自动更新调度管理器,可计算各任务下次启动时间,管理更加直观
2、重写的任务运行管理器,不再采集定时刷新的方式管理任务队列
3、更新了中文分词模块,加入了对词性和词频的分析,使提取的关键字更加准确,并可以挂接用户词库
4、修改了多页设置内在默认页采集得到地址不再使用正则规则,而使用[参数]标签组合结果的简单方法设置
5、WEB发布模块发布地址和引用地址内加入了随机登录值标签的支持
6、修正了时间转换标签已存在的bug,支持更多种时间格式的转换
7、修复了数据库入库超过两次后出现索引超出范围。必须为非负值并小于集合大小的错误


★★⑤版本区别★★

火车采集器2009SP1正式版免费提供给广大朋友使用.同时我们也发布支持更多SEO功能和技术支持的个人、标准和企业版三种高级版本,各位朋友可按需选用.

查看各版本功能,收费及服务区别,请访问页面 http://www.locoy.com/product/buy.html

★★⑥联系我们★★

售前客服QQ:   9868300,9779166,511566576,86020004
软件购买咨询:support@locoy.com
合作与建议:  admin@locoy.com
公司地址:    合肥市巢湖路91号滨水华城1栋706室
联系电话:     0551-2864156
官方网站:    http://www.locoy.com

火车采集器V2009炎黄网络合作版

中国建站意见反馈留言板  电话:021-5430-5621 广告业务:QQ:9576619
关于我们 | 隐私版权 | 广告服务 | 联系我们 | 网站地图 | 粤ICP证05092265号
Copyright © 2004-2008jz123.cn. All Rights Reserved .