python scrapy解码方法和时间格式转换

2023-04-26 15:21•python•阅读 3179

import scrapy
from datetime import datetime

class BianSpider(scrapy.Spider):
    name = 'bian'
    # allowed_domains = ['www']
    start_urls = ['http://tech.163.com/special/00097UHL/tech_datalist.js?callback=data_callback']

    def parse(self, response):
        # print(response.body.decode('gbk'))
        import json
    ---《for i in json.loads(response.body.decode('gbk').strip('data_callback(').strip(')')):》---
            print(i['title'])
            print(i['label'])
            time_list = i['time']
       ---《print(datetime.strptime(time_list,'%m/%d/%Y %H:%M:%S'))》---
            print(','.join([ii['keyname'] for ii in i['keywords']]))
            desc_href = i['docurl']
            yield scrapy.Request(desc_href,self.show)

    def show(self,response):
        # print(response.xpath('//div[3]/div[2]/div[1]/div[1]//text()'))
        types = response.xpath("string(//div[@class='post_crumb'])").extract_first().strip()
        weizhi = ' '.join(response.xpath("//div[@class='post_crumb']//text()").extract()).strip()

        print(weizhi)
        print(response.xpath('//*[@>).extract())
        print(response.xpath('//*[@>').extract())

上一篇 »搜索引擎–基于Django/Scrapy/ElasticSearch的搜索引擎的实现
下一篇 »Java时间日期字符串格式转换大全

python scrapy解码方法和时间格式转换

相关推荐

javascript时间戳和日期字符串相互转换

【Flask项目】 python时间 获取当前时间 当月新增账户 获取当前一天和前一天

php日期转时间戳

LINUX-字符设置和文件格式转换

python3中编码和解码

python3 base64解码出现TypeError：Incorrect padding

python的datetime转换为unix时间戳

python3 scrapy 爬取腾讯招聘

【Flask项目】 python时间获取当前时间当月新增账户获取当前一天和前一天