国产999精品久久久久久-国产欧美综合一区二区三区-国产精品无码专区-亚洲色精品aⅴ一区区三区

位置:采集 > 管理節(jié)點 > 修改節(jié)點
基本信息
節(jié)點名稱: (如:體育,娛樂等)
父節(jié)點:
采集頁面地址:
(一行為一個列表)


采集頁面為直接內(nèi)容頁
采集頁面地址方式二:
(此方式,系統(tǒng)自動生成頁面地址)
地址: (分頁變量用 替換)
頁碼從 之間,間隔倍數(shù) 倒序 補零
(如:http://oldmartcafe.com/index.php?page=[page])
內(nèi)容頁地址前綴:
(如地址前面沒域名的話,系統(tǒng)會加上此前綴)
圖片/FLASH地址前綴(內(nèi)容): (圖片地址為相對地址時使用)
入庫欄目: (如本節(jié)點不是采集節(jié)點,請不選)
入庫專題:
開始時間: (格式:2007-11-01)
結(jié)束時間: (格式:2007-11-01)
備注:
選項
默認相關(guān)關(guān)鍵字: 截取標題前 個字

采集記錄數(shù):

采集前 條記錄("0"為不限,系統(tǒng)會從頭采到頁面尾)
遠程保存圖片到本地(內(nèi)容): (入庫時才會保存, 加水印)
遠程保存FLASH到本地(內(nèi)容): (入庫時才會保存)
標題圖片設(shè)置: 取第 張圖片為標題圖片( 生成縮略圖:寬度 ×高度 )
每組列表采集個數(shù): 每組采集 個列表頁(防止采集超時)
每組信息采集個數(shù): 每組采集 個信息頁(防止采集超時)
每組入庫數(shù): 每組入 條記錄(防止入庫超時)
每組采集時間間隔 (0為連續(xù)采集)
附加選項
頁面編碼轉(zhuǎn)換
正常編碼 UTF8->GB2312 BIG5->GB2312 UNICODE->GB2312
是否重復(fù)采集同一鏈接 重復(fù)采集(不選為不重復(fù)采集)

是否隱藏已導(dǎo)入的信息

采集后自動入庫 是, 直接審核(不推薦選擇,因為可能入庫超時)
  入庫后自動刪除已導(dǎo)入的信息記錄
整體頁面過濾正則
格式:廣告開始[!--pad--]廣告結(jié)束
IFRAME TABLE FORM
OBJECT TR TBODY
SCRIPT TD  
STYLE A  
DIV FONT  
SPAN IMG  
(多個請用","格開)  
整體頁面替換 替換成
(原字符多個請用","格開,如果是新字符是多個,可以用","格開,系統(tǒng)會對應(yīng)替換)
過濾選項
采集關(guān)鍵字(包含關(guān)鍵字才會采): (只針對標題。如不限制,請留空。多個請用","格開)
替換:
(針對標題與內(nèi)容)
替換成
(原字符多個請用","格開,如果是新字符是多個,可以用","格開,系統(tǒng)會對應(yīng)替換)
過濾廣告正則:
格式:廣告開始[!--ad--]廣告結(jié)束
(針對內(nèi)容)
IFRAME TABLE FORM
OBJECT TR TBODY
SCRIPT TD  
STYLE A  
DIV FONT  
SPAN IMG  
(多個請用","格開)  
內(nèi)容為空不采集 (newstext字段)
過濾相似: 不采集標題相似超過 字的信息[與入庫信息比較](如不限制請?zhí)?quot;0")
  不采集標題完全相同的信息(與入庫信息比較)
截取內(nèi)容簡介:

截取信息內(nèi)容 個字(在沒有設(shè)置“內(nèi)容簡介”正則,系統(tǒng)采取的措施)

采集內(nèi)容正則(不采集項,請留空)
列表頁  
信息鏈接區(qū)域正則:
(如不限,請為空)
截取的地方加上
如:<tr><td>鏈接區(qū)域</td></tr>
正則就是:
<tr><td>[!--smallurl--]</td></tr>
信息頁鏈接正則:
截取的地方加上
如:<a href="信息鏈接">標題</a>
正則就是:
<a href="[!--newsurl--]">*</a>

標題圖片正則:
(如圖片在內(nèi)容頁,請留空)

圖片地址前綴: 保存本地
(如填這里,將為此字段值)
內(nèi)容頁(文件過大的請不要選擇保存本地)
標題正則:
()
(如填寫這里,將為字段的值)
副標題正則:
()
(如填寫這里,將為字段的值)
發(fā)布時間正則:
()
(如填寫這里,將為字段的值)
標題圖片正則:
( )
附件前綴 遠程保存
(如填寫這里,這就是字段的值)
內(nèi)容簡介正則:
()
(如填寫這里,將為字段的值)
作者正則:
()
(如填寫這里,將為字段的值)
信息來源正則:
()
(如填寫這里,將為字段的值)
新聞?wù)恼齽t:
()
(如填寫這里,將為字段的值)
內(nèi)容頁分頁采集設(shè)置:(如沒有分頁請留空,只對newstext有效)
入庫是否保留原分頁: 保留分頁 不保留分頁
分頁形式: 上下頁導(dǎo)航式 全部列出式
"全部列出"式正則設(shè)置:
分頁區(qū)域正則([!--smallpageallzz--]) 分頁鏈接正則([!--pageallzz--])
"上下頁導(dǎo)航"式正則設(shè)置:
分頁區(qū)域正則([!--smallpagezz--]) 分頁鏈接正則([!--pagezz--])
 

注意事項:
1.*:表示不限制內(nèi)容。行與行之間的間隔最好用*格開
2.增加節(jié)點后,最好先“預(yù)覽”。
3.對于特殊字符請在前面加上“\\”,當(dāng)然直接將特殊字符改為“*”最合適了。特殊字符如下:
),(,{,},[,],\,?
4.同一信息鏈接系統(tǒng)不會重復(fù)采集。