跳到主要内容

4 篇博文 含有标签「msray-search」

msray-search

查看所有标签

msray-search v1.1.0发布!

· 阅读需 5 分钟
admin
msray project team

系统核心重构,不再依赖浏览器插件!全方位突破,兜底级智能算法与搜索方案。已经实现所有引擎无需代理(包括谷歌)!

1: 关于新版引擎升级说明预览

  1. 必应搜索 - 持续采集、无需代理、可多窗口并发执行;
  2. 百度搜索 - 持续采集、无需代理、可多窗口并发执行;
  3. 搜狗搜索 - 持续采集、无需代理;
  4. 谷歌搜索 - 持续采集、无需代理;
  5. 百度移动端搜索 - 持续采集、无需代理;

注意,建议保持每个引擎同时只执行一个任务。如果并发窗口多,则无法最大化保障不出安全验证!

如果仅勾选一个搜索引擎,则建议系统参数配置中,并发值为1,一个并发稳如狗; 如果勾选多个搜索引擎,则建议系统参数配置中,并发值为勾选的搜索引擎的个数;

关于测试: 必应搜索,并发值为20,已测试连续稳定采集6小时+; 搜狗搜索,并发值为1,已测试连续稳定采集6小时+; 百度搜索,并发值为1,已测试连续稳定采集6小时+;(偶尔出验证但会在下次搜索自动处理恢复,并且出验证的任务会自动重试); 百度移动端搜索,并发值为1,已测试连续采集6小时+;(偶尔出验证但会在下次搜索自动处理恢复,并且出验证的任务会自动重试); 谷歌搜索,并发值为1,已测试连续采集2小时+(建议只采集第一页,翻页可能触发安全验证,会在下次任务搜索自动处理恢复);

2: 其他说明

  1. 新增内置浏览器模块,高效稳定快捷。不再必须依赖安装浏览器插件执行任务;
  2. 浏览器模式支持双模式(标准与高级);标准模式效率高但可能出验证;高级模式可最大化避免触发安全验证,可持续采集;
  3. 支持搜索引擎多选,如果多选,则同一个关键词会分别使用每个引擎去搜索!
  4. 相关词自动扩展功能优化,支持自动去重复,避免有时候出现相同搜索词;
  5. 支持搜索失败重试,不管是因为网络问题还是安全验证导致的失败,都会百分百重试,直到成功为止;
  6. 支持无限采集,勾选自动搜索相关词选项即可。
  7. 可根据引擎,分别自定义每次搜索(包括翻页)的间隔时间,自动取范围内随机值,最大化避免触发安全验证;
  8. 支持实时查看等待搜索的任务队列列表(仅显示前100条);
  9. 支持暂停任务以及一键清空任务(如果暂停后需要继续执行,则再次点击即可);
  10. 支持实时修改执行任务并发数(系统参数配置),无需重启;
  11. 支持实时修改显示模式(系统参数配置),可隐藏浏览器,也可以显示浏览器窗口,看见自动化流程;
  12. 支持自定义任务最大队列长度(系统参数配置),默认为500万。
  13. 支持自定义网络代理(系统参数配置),也支持测试,实时生效;
  14. 支持自定义WEBHOOK(系统参数配置),每次采集后,都会异步推送采集数据的结果到自定义的WEBHOOK地址。

下载地址:

香港线路节点: http://res.msray.net/release/msray-search/1.1.0.zip

大陆线路节点: http://www.uemit.cn/release/msray-search/1.1.0.zip

msray-search v1.0.2发布!

· 阅读需 2 分钟
admin
msray project team
  1. 插件引擎核心逻辑升级;

  2. 新增必应(bing)引擎;

  3. 优化谷歌引擎;

  4. 优化百度引擎,修复重复页码问题;

  5. 优化百度引擎,同时支持采集网页搜索结果与新闻资讯搜索结果!

  6. 支持失败自动重试!

  7. 相关词存储:支持采集与存储搜索引擎结果页面的相关搜索词(所有相关词数据会以json格式存储在data/keyword.txt中);

  8. 无限采集:支持自定义开启选项:自动把搜索页面上的相关词加入搜索任务队列;

  9. 浏览器标签页自动关闭:每个任务采集完成后,支持自动关闭对应标签页面;

  10. 任务管理:支持暂停任务,查看任务队列,清除任务;

  11. 执行记录页面:新增筛选,支持按引擎、采集状态、关键词进行筛选;

下载地址:

香港线路: http://res.msray.net/release/msray-search/1.0.2.zip     (含客户端+浏览器插件)
大陆线路: http://www.uemit.cn/release/msray-search/1.0.2.zip (含客户端+浏览器插件)

msray-search v1.0.1 发布!

· 阅读需 1 分钟
admin
msray project team
  • 导出新增支持"网站名称";
  • 优化百度引擎抓取逻辑;
  • 修复谷歌引擎BUG;
  • 优化配套插件参数;
  • 主界面数据显示优化,支持实时显示不重复域名数与网址数;
  • 降级golang sdk,以便于兼容老版本windows操作系统;

下载地址:

香港线路节点: http://res.msray.net/release/msray-search/1.0.1.zip (含软件+浏览器插件)
大陆线路节点: http://www.uemit.cn/release/msray-search/1.0.1.zip (含软件+浏览器插件)

msray-search v1.0.0 发布!

· 阅读需 2 分钟
admin
msray project team

msray-searchmsray系列软件之一。主要功能为便捷式的提取搜索引擎格式化结果信息,支持可视化。让数据分析与采集变得更简单。

软件由客户端(msray-search)与浏览器插件(msray-tracker)组成。 运行软件后,浏览器插件会自动获取客户端软件中下达的任务。

msray-plus不同的是,msray-search仅具有搜索引擎模块功能,同时无需隧道代理,采集结果更精准,搜索结果可在软件中实时查看。 msray-plus适合大批量关键词快速采集,而msray-search适合低速精准采集;

  • 1:使用golang开发,运行效率高,并且无需安装其他三方依赖;
  • 2:支持多个搜索引擎;
  • 3: 无需隧道代理;只要浏览器上能正常访问,就能正常收集结果,支持手工过验证;
  • 4:支持可视化采集,可观察到软件采集的流程。也可以缩小浏览器,不影响电脑其他操作;
  • 5:在存储搜索结果的同时,也支持存储不重复域名以及网址;
  • 6:支持自定义搜索引擎参数;
  • 7:支持自定义导出,可选CSV或TXT格式;
  • 8:支持采集标题、描述、URL、排名、所属页码、区分搜索引擎广告与正常搜索结果;支持采集网站中文名称等;