国产999精品久久久久久-国产欧美综合一区二区三区-国产精品无码专区-亚洲色精品aⅴ一区区三区

 
售前咨詢QQ:QQ412395521
業務合作QQ:QQ627174919
位置:首頁 > 知新 > 帝國CMS > 采集使用

帝國CMS采集正則介紹與寫法

時間:2011-06-14 09:53:29
帝國CMS的采集正則
1、作用:通過設置采集正則以便使系統識別你要采集的內容。
2、帝國CMS的采集正則是什么樣的,下面我們用實例講解:
(1)、假如我們要采集頁面的內容頁為如下頁面:
圖1:HTML頁面

圖2:查看頁面源代碼為如下:
(2)、由上圖的源代碼內容我們可以得出帝國CMS的采集正則:
新聞標題正則:
    <td>標題:<strong>[!--title--]</strong></td>
新聞內容正則:
    <td>內容:<font color="#FF0000">[!--newstext--]</font></td>

上面中的“[!--title--]”與“[!--newstext--]”分別為“標題”字段與“內容”字段的正則變量。用于指定我們要采集的內容位置。
(3)、由上面我們得出了,帝國CMS采集正則是把正則變量替換要采集內容后的代碼內容。格式:
識別代碼頭部[!--變量名--]識別代碼尾部
注意事項:上面的“識別代碼頭部”一定是要唯一的標記。
3、帝國CMS正則還有表示任意內容的字符:“*”
如果“識別代碼頭部”中有內容是變化的,那么我們可以用*代替它。如頁面源代碼為如下,我們要采集下面的鏈接地址:
<a title="任意可變內容" href="鏈接地址">標題</a>
通過使用“*”任意內容表示字符,我們可以用下面的正則忽略可變內容,獲得鏈接地址:
<a title="*" href="[!--newsurl--]">
附加說明:[!--newsurl--]為頁面鏈接地址的正則變量。
4、其他說明:

(1)、正則要找出唯一性的開頭字符。有時候空格都會成為識別的依據。

(2)、對于特殊字符請在前面加上“\\”,當然直接將特殊字符改為“*”最合適了。特殊字符如下:
“ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。
旗下其它產品:【帝國備份王】    【EBMA系統】    【帝國下載系統
Powered by EmpireCMS
版權所有 ©2002-2024 EmpireSoft Inc.