昨天剛知道帝國還可以使用正則來過濾,高興B了!
放一個帝國的萬能過濾碼,再根據(jù)自已的需要添加就行了!可以過濾大部分代碼了,如果需要再細化,則在這個的基礎上添加上去就可,
目前這樣,
可以防止采集后模反跑格, 防止內(nèi)容內(nèi)有別的網(wǎng)站的連接, 防止GG廣告,防止?jié)撊胧巾撁? 防止表單,防止表格等等,
使用方法:直接復制后,放到采集的內(nèi)容過濾框框內(nèi)既可!
自已慢慢摸索吧!
<a([^>]*)>,<A([^>]*)>,</a>,</A>,<DIV([^>]*)>,</DIV>,<div([^>]*)>,</div>,<DIV>,<div>,<script[!--ad--]</script>,<form[!--ad--]</form>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>,<OBJECT[!--ad--]</OBJECT>,<object[!--ad--]</object>,<table([^>]*)>,<table>,</table>,<tr([^>]*)>,<tr>,</tr>,<td([^>]*)>,<td>,</td>,<font([^>]*)>,<font>,</font>,<tbody>,<tbody([^>]*)>,</tbody>,<style[!--ad--]</style>,<span([^>]*)>,</span>
|
|
|
|