国产999精品久久久久久-国产欧美综合一区二区三区-国产精品无码专区-亚洲色精品aⅴ一区区三区

首頁

下載

特性

版本

模板

案例

支持

教程

購買

售前咨詢QQ：

412395521

業務合作QQ：

627174919

帝國CMS采集正則介紹與寫法

時間：2011-06-14 09:53:29

帝國CMS的采集正則

1、作用：通過設置采集正則以便使系統識別你要采集的內容。

2、帝國CMS的采集正則是什么樣的，下面我們用實例講解：

(1)、假如我們要采集頁面的內容頁為如下頁面：

圖1：HTML頁面

圖2：查看頁面源代碼為如下：

(2)、由上圖的源代碼內容我們可以得出帝國CMS的采集正則：

新聞標題正則：

<td>標題：<strong>[!--title--]</strong></td>

新聞內容正則：

<td>內容：<font color="#FF0000">[!--newstext--]</font></td>

上面中的“[!--title--]”與“[!--newstext--]”分別為“標題”字段與“內容”字段的正則變量。用于指定我們要采集的內容位置。

(3)、由上面我們得出了，帝國CMS采集正則是把正則變量替換要采集內容后的代碼內容。格式：

識別代碼頭部[!--變量名--]識別代碼尾部

注意事項：上面的“識別代碼頭部”一定是要唯一的標記。

3、帝國CMS正則還有表示任意內容的字符：“*”

如果“識別代碼頭部”中有內容是變化的，那么我們可以用*代替它。如頁面源代碼為如下，我們要采集下面的鏈接地址：

通過使用“*”任意內容表示字符，我們可以用下面的正則忽略可變內容，獲得鏈接地址：

附加說明：[!--newsurl--]為頁面鏈接地址的正則變量。

4、其他說明：

(1)、正則要找出唯一性的開頭字符。有時候空格都會成為識別的依據。

(2)、對于特殊字符請在前面加上“\\”，當然直接將特殊字符改為“*”最合適了。特殊字符如下：
“ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。

旗下其它產品：【帝國備份王】【EBMA系統】【帝國下載系統】

關于帝國 \| 聯系我們 \| 法律聲明 \| 隱私條款 \| 許可協議	Powered by EmpireCMS
版權所有 ©2002-2024 EmpireSoft Inc.