php使用自帶dom擴展進行元素匹配的原理解析

 更新時間:2020-06-14 00:02:48   作者:佚名   我要評論(0)

DOMDocument
php提供了非常好用的解析html和xml文檔的擴展庫DOM,使用這個庫可以非常高效的進行html和xml文檔的解析,它的原理就是通過尋找首尾匹配對來進行文檔的解

DOMDocument

php提供了非常好用的解析html和xml文檔的擴展庫DOM,使用這個庫可以非常高效的進行html和xml文檔的解析,它的原理就是通過尋找首尾匹配對來進行文檔的解析。

從上面的分析可以看出,如果首位不匹配,可能就會導致一些錯誤的出現,因此,這個時候我們需要設置

libxml_use_internal_errors(true);

來進行錯誤的屏蔽,讓它可以解析整個文檔。

解析html基本用法

$dom = new \DOMDocument;
$content = htmlspecialchars_decode($content);
libxml_use_internal_errors(true);
$content = mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8');
$dom->loadHTML($content);

$content是要解析的html字符串,其中我們對它進行了轉義,因為可能含有實體集,然后我們有進行了編碼的轉換,因為可能文檔不是utf-8格式的,會導致日文,法文等文字亂碼。

獲取元素

$a = $dom->getElementsByTagName('a');
$p = $dom->getElementsByTagName('p');

遍歷元素

$elements = $dom->getElementsByTagName('a');
foreach ($elements as $element) {
  $element->textContent = '替換成其它的文字';
}

通過上面的循環,可以將全部a標簽的文字替換掉。

元素嵌套

有些時候,html會嵌套很多層,比如

<div>
<p>
<a href="xxx" rel="external nofollow" >我是文字</a>
</p>
<p>
內容替換
</p>
</div>

如果我們想要對p標簽文字進行替換的化,并且不想要替換含有子元素的內容,就是這里的a標簽不想替換,下面的語句不能夠解決我們的問題:

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if($element->hasChildNodes()){
    $element->textContent = 'p標簽內容替換';
  }
}

上面的代會將a標簽的內容也替換掉,這不是我們想要的結果,因為hasChildNodes()這個函數表示的含有內容,無論它是標簽還是文字,它都是返回true的,除非它是空標簽,例如

它才會返回false.

所以我們需要自己封裝一個函數進行檢查是否含有嵌套標簽。

function hasChild($element, $tags)
{
  foreach($tags as $v){
  $elements = $element->getElementsByTagName($v);

  if($elements->length){
  return true;
  }

  }
  return false;
}
$tags = array('title','h1','h2','h3','h4','h5','a','p','dd','img');  

$elements = $dom->getElementsByTagName('p');
foreach ($elements as $element) {
  if(hasChild($element, $tags)){
    $element->textContent = 'p標簽內容替換';
  }
}

通過我們自己封裝的函數,就可以判斷出$dom的node節點是否含有子標簽。

總結

到此這篇關于php使用自帶dom擴展進行元素匹配的文章就介紹到這了,更多相關php元素匹配內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:

  • php使用simple_html_dom解析HTML示例
  • DOM基礎及php讀取xml內容操作的方法
  • PHP使用DOMDocument類生成HTML實例(包含常見標簽元素)
  • PHP用正則匹配form表單中所有元素的類型和屬性值實例代碼

相關文章

  • php使用自帶dom擴展進行元素匹配的原理解析

    php使用自帶dom擴展進行元素匹配的原理解析

    DOMDocument php提供了非常好用的解析html和xml文檔的擴展庫DOM,使用這個庫可以非常高效的進行html和xml文檔的解析,它的原理就是通過尋找首尾匹配對來進行文檔的解
    2020-06-14
  • PHP實現圖片防盜鏈破解操作示例【解決圖片防盜鏈問題/反向代理】

    PHP實現圖片防盜鏈破解操作示例【解決圖片防盜鏈問題/反向代理】

    本文實例講述了PHP實現圖片防盜鏈破解操作。分享給大家供大家參考,具體如下: 很多小伙伴的博客,網站都是用圖床來實現的,那么現在很多穩定的圖床接口都被做了防盜
    2020-06-14
  • PHP論壇實現積分系統的思路代碼詳解

    PHP論壇實現積分系統的思路代碼詳解

    首先在用戶表定義一個積分字段; 然后創建一個等級表,主要字段有等級名,上限積分和下限積分; 再根據用戶的行為進行積分累加; 最后根據判斷用戶積分在哪個等級范
    2020-06-14
  • PHP Web表單生成器案例分析

    PHP Web表單生成器案例分析

    本文實例講述了PHP Web表單生成器。分享給大家供大家參考,具體如下: 1.實例: 2. 需求分析 在項目的實際開發中,經常需要設計各種各樣表單。直接編寫HTML表單雖然
    2020-06-14
  • 一文看懂PHP進程管理器php-fpm

    一文看懂PHP進程管理器php-fpm

    php-fpm是什么 php-fpm是PHP的一個進程管理器。php下面的眾多work進程皆有php-fpm進程管理器管理。 php-fpm的工作原理 php-fpm全名是PHP FastCGI進程管理器。php
    2020-06-14
  • PHP與Web頁面交互操作實例分析

    PHP與Web頁面交互操作實例分析

    本文實例講述了PHP與Web頁面交互操作。分享給大家供大家參考,具體如下: Web交互 1.Web表單交互 當表單的method屬性提交方式為POST時,瀏覽器發送POST請求 當
    2020-06-14
  • 簡單的php購物車代碼

    簡單的php購物車代碼

    本文介紹一個php實現的購物車代碼,功能實現完整,具有一定的參考價值 這里我們為你提供個簡單的php購物車代碼,從增加購物產品與發生購買了,在商城開發中,這個功能是
    2020-06-14
  • PHP常用字符串函數用法實例總結

    PHP常用字符串函數用法實例總結

    本文實例總結了PHP常用字符串函數用法。分享給大家供大家參考,具體如下: 字符串函數 explore 使用一個字符串分割另一個字符串 結果為數組 <&#63;php $str = 'a,
    2020-06-14
  • PHP函數用法詳解【初始化、嵌套、內置函數等】

    PHP函數用法詳解【初始化、嵌套、內置函數等】

    本文實例講述了PHP函數用法。分享給大家供大家參考,具體如下: 初始函數 函數:封裝一段用于完成特定功能的代碼。 通俗理解函數:可以完成魔鬼工作的
    2020-06-14
  • PHP正則表達式函數preg_replace用法實例分析

    PHP正則表達式函數preg_replace用法實例分析

    本文實例講述了PHP正則表達式函數preg_replace用法。分享給大家供大家參考,具體如下: preg_replace 執行一個正則表達式的搜索和替換 語法:preg_replace (patter
    2020-06-14

最新評論

买宝宝用品赚钱吗 北京赛车投注app 基金配资条件 11选5开奖结果走势图 正规的证券交易平台 宁夏11选五彩票平台 排列三稳赚计划 宁夏11远五开奖查询 股票指数期货上海远东出版社 一分彩计划人工计划 手机股票软件 山西快乐十分软件下载 内蒙古快三跨度和值走势图 内蒙古十一选五五的诀窍 东方6 1五加一多少钱 北京十一选五前三直开奖结果走势图 广西体彩十一选五开奖号