采集常用技巧 |
1、過濾文章內容的鏈接: |
廣告過濾正則設置:“<a [!--ad--]>,</a>” |
2、同上得出,過濾font之類的標簽: |
廣告過濾正則:“<font[!--ad--]>,</font>”,其他依此類推。 |
3、同一鏈接的頁面如何重復采集: |
到“管理采集節點”那清空節點即可重復采集已入庫的頁面。 |
4、采集內容分頁正則說明: |
如果是全部列表式,則只需看第一頁的頁面HTML代碼。 |
|
常見問題 |
1、提示信息:Warning: preg_replace() [function.preg-replace]: Compilation failed: range out of order in character class at offset 83 in 答:你的采集正則變量名寫錯導致,請檢查你的正則變量。 |
|
|
|
|