php抓取网页特定div区块及图片,从简单入手

1. 取得指定网页內的所有图片:

<?php

//取得指定位址的內容,並储存至text

$text=file_get_contents('http://yourweb/');

//取得第一個img标签,並储存至阵列match(regex语法与上述同义)

preg_match('/<img[^>]*>/Ui', $text, $match);

//打印match

print_r($match);

-----------------

2. 取得指定网页內的第一张图片:

<?php

//取得指定位址的內容,並储存至text

$text=file_get_contents('http://yourweb/');

//取得第一個img标签,並储存至阵列match(regex语法与上述同义)

preg_match('/<img[^>]*>/Ui', $text, $match);

//打印match

print_r($match);

------------------------------------

3. 取得指定网页內的特定div区块(藉由id判断):

<?php

//取得指定位址的內容,並储存至text

$text=file_get_contents('http://yourweb/');

//去除換行及空白字元(序列化內容才需使用)

$text=str_replace(array("\r","\n","\t","\s"), '', $text);

//取出div标签且id為PostContent的內容,並储存至阵列match

preg_match('/<div[^>]*[^>]*>(.*?) <\/div>/si',$text,$match);

//打印match[0]

print($match[0]);

-------------------------------------------

4. 上述2及3的结合:

<?php

//取得指定位址的內容,並储存至text

$text=file_get_contents('http://yourweb/');

//取出div标签且id為PostContent的內容,並储存至阵列match

preg_match('/<div[^>]*[^>]*>(.*?) <\/div>/si',$text,$match);

//取得第一個img标签,並储存至阵列match2

preg_match('/<img[^>]*>/Ui', $match[0], $match2);

//打印match2[0]

print_r($match2[0]);

转载请声明来源!