排序
结构化数据标记 有机率会来蜘蛛
各位站长,有没有发现引蜘蛛越来越难了,这里分享一点实用小技巧, 以wellcms为例,其他cms对照修改。 header.inc 中添加: <!--结构化数据标记!--> <script type=application/ld+json...
火车头采集器C#小技巧 提取h2、h3标签添加到内容头部作为文章导航
查找所有的 <h2> 或 <h3> 标签,并为它们统一、连续地添加带编号的 span 锚点。 先给对应的 C# 代码: //将内容中所有的h2或h3标签,添加span并顺序编号,成为li内容导航的锚点...
火车头采集器通过脚本轻松实现双标题内容去重
当我们用火车头采集器采集标题时,如果要实现双标题,比如原标题+百度下拉词或其他词,这种组合的标题有可能会有重复的部分, 比如标题:适合五一出游的地方 适合五一出游的地方推荐 那么如何实...
火车头采集器 高铁采集器 2025年计划任务不能保存
2025年了,火车头采集器也会出现千年虫的bug,这不,计划任务不能保存了。 每日或每周的定时可以正常保存,每间隔多久的就不能保存,提示 End time be start time。 别慌,后面有个Cron表达式可...
火车头采集器内容中的段落重排和去重方案
对火车头采集的内容进行段落重排+去重,伪原创,直接给C#代码: using ; using ..; using .Text.; using ; class { const = 0.9; Run( , ) { // 使用正则表达式匹配出所有的 p 标签 Regex regex...
火车头高铁采集器采集加密的影视下载链接
今天分享一个用高铁采集器采集加密的影视下载链接的思路和经历。 要获取的内容位于一个Json页面,该页面的url是动态的,而且有个d值是加密的,比如:www.is96.com/movie/684c0100bbef8f211ea40a...




