|-原 php解析html类库simple_html_dom(详细介绍)
下载地址:https://github.com/samacs/simple_html_dom
解析器不仅仅只是帮助我们验证html文档;更能解析不符合W3C标准的html文档。它使用了类似jQuery的元素选择器,通过元素的id,class,tag等等来查找定位;同时还提供添...
下载地址:https://github.com/samacs/simple_html_dom
解析器不仅仅只是帮助我们验证html文档;更能解析不符合W3C标准的html文档。它使用了类似jQuery的元素选择器,通过元素的id,class,tag等等来查找定位;同时还提供添加、删除、修改文档树的功能。当然,这样一款强大的html Dom解析器也不是尽善尽美;在使用的过程中需要十分小心内存消耗的情况。不过,不要担心;本文中,笔者在最后会为各位介绍如何避免消耗过多的内存。
开始使用
上传类文件以后,有三种方式调用这个类:
从字符串中加载html文档
从文件中加载html文档
代码如下:
<?php
// 新建一个Dom实例
$html = new simple_html_dom();
// 从url中加载
$html->load_file('http://www.jb51.net');
// 从字符串中加载
$html->load('<html><body>从字符串中加载html文档演示</body></html>');
//从文件中加载
$html->load_file('path/file/test.html');
?>
如何避免解析器消耗过多内存
在本文的开篇中,笔者就提到了Simple HTML DOM解析器消耗内存过多的问题。如果php脚本占用内存太多,会导致网站停止响应等一系列严重的问题。解决的方法也很简单,在解析器加载html文档并使用完成后,记得清理掉这个对象就可以了。当然,也不要把问题看得太严重了。如果只是加载了2、3个文档,清理或不清理是没有多大区别的。当你加载了5个10个甚至更多的文档的时候,用完一个就清理一下内存绝对是对自己负责啦^_^,代码如下:...
浏览更多内容请先登录。
立即注册
更新于:2022-05-29 10:59:25
相关内容
php知识点学习整理
PHP preg_quote() 函数
PHP str_ireplace() 函数
查看php位置
php7.4 查看版本
PHP提示 cURL error 60: SSL certificate problem: unable to get loca...
php过滤表单输入的emoji表情
PHP 中英文混排截取字符串 (用php自带的函数,简单效果又好)
PHP的源代码BUG整理
php如何查看扩展是否开启
linux下安装php的Exif扩展笔记!(用LNMP一键安装脚本安装的php)
configure: error: Cannot find ldap.h 解决方法
一个PHP针对数字的加密解密类
php的Memcache addServer 后set失败
PHP8 报错Required parameter $r follows optional parameter
php执行shell不阻塞方法
CURL超时时间设置
php - php HTMLPurifier iframe和Youtube视频
PHP向js传数组
phpmyadmin问题整理
phpmyadmin解决Failed to set session cookie. Maybe you are using HTTP...
phpmyadmin 登录报错 mysqli_real_connect(): (HY000/2002):
PhpMyAdmin 配置文件现在需要一个短语密码的解决方法
PHP与APP
PHP是否可以应用于App开发
推荐内容