DEDECMS文章采集规则语法补充

(一)文字过滤与替换的方法


1.去除超链接,这种最常用。


{dede:trim replace=”}<a([^>]*)>{/dede:trim}

{dede:trim replace=”}</a>{/dede:trim}

如果填成这样,那就把链接的文本也一起去掉了


{dede:trim replace=”}<a([^>]*)>(.*)</a>{/dede:trim}


2.过滤JS调用广告,比如GG的广告,就加个这样的:


{dede:trim replace=”}<script([^>]*)>(.*)</script>{/dede:trim}


3.过滤div标签。


这个很重要,如果没过滤干净则可能使发布出来的文章版面错位, 目前大多数遇到采集后错位的原因在此。


{dede:trim replace=”}<div([^.]*)>{/dede:trim}

{dede:trim replace=”}</div>{/dede:trim}


有的时候也需要这样子过滤:


{dede:trim replace=”}<div 选择器>(.*)</div>{/dede:trim}


4.其它的过滤规则可以照以上规律进行推出。

5.过滤摘要和关键字使用,经常要用到。


{dede:trim replace=”}{/dede:trim}


6.简单替换。

{dede:trim replace=’替换后的词语’}要替换的词语{/dede:trim}

7.去掉src


{dede:trim replace=""}src="([^"]*)"{/dede:trim}



(二)内容页指定作者、来源


 指定value值即可实现:


{dede:item field='writer' value='qoogle.cn' isunit='' isdown=''}

{dede:match}{/dede:match}


{dede:function}{/dede:function}

{/dede:item}


{dede:item field='source' value='秋歌博客' isunit='' isdown=''}

{dede:match}{/dede:match}


{dede:function}{/dede:function}

{/dede:item}



(三)内容页分页采集


在“内容分页导航所在的区域匹配规则:”,填写规则,如 <ul class="pages>[内容]</ul>,然后选择“全部列出的分页列表”。


遭遇情景:如果选择“上下页形式或不完整的分页列表”,列表页的所有文章内容全部一起写入


如果文章对您有帮助|有启发|有共鸣|有“爽了”,请随意打赏。您的支持是我的动力和价值的体现。

----------我不是街头卖艺者,但我渴望被打赏,博客要生存下去不容易。
----------我不是酒店服务生,但我渴望被打赏,博主也有妻儿子女一家子人。
----------我不是乞丐叫花子,但我渴望被打赏,渴望被打赏的价值认同感。
----------我不是建筑搬运工,但我渴望被打赏,我是蜜蜂我阅读/挑选/整合/转载/传播。
----------我不是作家或教授,但我渴望被打赏,咱中国人也能主动为知识/为受益而付费。

感谢土豪的打赏!


一码支持:微信/支付宝

打赏qoogle的二维码


分享,也是您对我的热力支持。谢谢!

内容版权声明:除转载分类下的文章来源网络(直转或整合而成),其它皆为本站原创文章。

转载注明出处:http://qoogle.cn/?id=52

发表评论(不用注册哟!)

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。