采集教程共6篇
结构化数据标记 有机率会来蜘蛛-SEO模板

结构化数据标记 有机率会来蜘蛛

各位站长,有没有发现引蜘蛛越来越难了,这里分享一点实用小技巧, 以wellcms为例,其他cms对照修改。 header.inc 中添加: <!--结构化数据标记!--> <script type=application/ld+json...
滕艾哲的头像-SEO模板黄金会员滕艾哲5天前
335
火车头采集器C#小技巧 提取h2、h3标签添加到内容头部作为文章导航-SEO模板

火车头采集器C#小技巧 提取h2、h3标签添加到内容头部作为文章导航

查找所有的 <h2> 或 <h3> 标签,并为它们统一、连续地添加带编号的 span 锚点。 先给对应的 C# 代码: //将内容中所有的h2或h3标签,添加span并顺序编号,成为li内容导航的锚点...
滕艾哲的头像-SEO模板黄金会员滕艾哲1个月前
3811
火车头采集器通过脚本轻松实现双标题内容去重-SEO模板

火车头采集器通过脚本轻松实现双标题内容去重

当我们用火车头采集器采集标题时,如果要实现双标题,比如原标题+百度下拉词或其他词,这种组合的标题有可能会有重复的部分, 比如标题:适合五一出游的地方 适合五一出游的地方推荐 那么如何实...
滕艾哲的头像-SEO模板黄金会员滕艾哲2个月前
6613
火车头采集器 高铁采集器 2025年计划任务不能保存-SEO模板

火车头采集器 高铁采集器 2025年计划任务不能保存

2025年了,火车头采集器也会出现千年虫的bug,这不,计划任务不能保存了。 每日或每周的定时可以正常保存,每间隔多久的就不能保存,提示 End time be start time。 别慌,后面有个Cron表达式可...
滕艾哲的头像-SEO模板黄金会员滕艾哲6个月前
5410
火车头采集器内容中的段落重排和去重方案-SEO模板

火车头采集器内容中的段落重排和去重方案

对火车头采集的内容进行段落重排+去重,伪原创,直接给C#代码: using ; using ..; using .Text.; using ; class { const = 0.9; Run( , ) { // 使用正则表达式匹配出所有的 p 标签 Regex regex...
滕艾哲的头像-SEO模板黄金会员滕艾哲6个月前
4710
火车头高铁采集器采集加密的影视下载链接-SEO模板

火车头高铁采集器采集加密的影视下载链接

今天分享一个用高铁采集器采集加密的影视下载链接的思路和经历。 要获取的内容位于一个Json页面,该页面的url是动态的,而且有个d值是加密的,比如:www.is96.com/movie/684c0100bbef8f211ea40a...
滕艾哲的头像-SEO模板黄金会员滕艾哲6个月前
10312