1,单页面多项采集和输出
//采集政府网各省份和入口地址:
$src_url="http://gjzwfw.www.gov.cn/col/col486/index.html";
// 规则
$rules=array(
'dcity'=> array('.clearFix p>a','text'), //con_main
'durl'=> array('.clearFix p>a','href'),
);
//p($rules);
$data = QueryList::Query($src_url,$rules)->data;
//p($data);
$rqty=0;
foreach ( $data as $val) {
$rqty=$rqty+1;
$dcity=$val['dcity']; //iconv("gbk","utf-8",$data[0]['title']);
$durl=$val['durl'];
echo $rqty.", ".$dcity.": ".$durl."
";
}
输入结果
1, 北京市: http://beijing.gjzwfw.gov.cn
2, 天津市: http://tj.gjzwfw.gov.cn
3, 河北省: http://hbzwfw.gjzwfw.gov.cn
Tag:
QueryList
PHP采集
爬虫