php获取富文本中p标签内容信息

发布时间 2023-06-28 17:22:30作者: SunleavesHe
function extractTextFromHTML($html) {
    // 创建一个DOMDocument对象
    $dom = new DOMDocument();

    // 设置字符编码为UTF-8
    $dom->encoding = 'UTF-8';

    // 忽略HTML中的错误和警告
    libxml_use_internal_errors(true);

    // 加载HTML内容
    $dom->loadHTML('<?xml encoding="UTF-8">' . $html, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);

    // 选择所有的<p>标签
    $paragraphs = $dom->getElementsByTagName('p');

    $text = [];

    // 遍历每个<p>标签,提取文本内容
    foreach ($paragraphs as $paragraph) {
        $text[] = $paragraph->textContent;
    }

    // 清除错误和警告
    libxml_clear_errors();

    // 返回提取的文本
    return $text;
}