港股市场截止2022年3月27号,宣布“延迟发布年报”的企业合计有15家之多,名单包括:新力控股、融信中国、融信服务、中国恒大、恒大物业、景业名邦、佳兆业、宝龙地产、宝龙商业、祥生控股、三盛控股、融创中国、世茂服务、世茂集团、阳光100中国
由于去年底开始全国多个房产项目停工、延期交付,同时各地新房销售环比下降较快,使得今年各地陆续推出新的调控政策,降低房贷利率、降低首付, 同时也有不少楼盘推出各种优惠,对于刚需买房者来说无疑都是利好。因为期房交付需要时间,建议大家在选择楼盘的时候,要关注房企的年报信息,避免出现烂尾的局面。可以通过爬虫程序采集房企的年报数据,综合分析楼盘信息。
以下示例是scrapy 设置代理随机IP访问,可以自行配置采集的目标网站:
1、在项目中新建middlewares.py文件(./项目名/middlewares.py)
#! -*- encoding:utf-8 -*-
import base64
import sys
import random
PY3 = sys.version_info[0] >= 3
def base64ify(bytes_or_str):
if PY3 and isinstance(bytes_or_str, str):
input_bytes = bytes_or_str.encode('utf8')
else:
input_bytes = bytes_or_str
output_bytes = base64.urlsafe_b64encode(input_bytes)
if PY3:
return output_bytes.decode('ascii')
else:
return output_bytes
class ProxyMiddleware(object):
def process_request(self, request, spider):
# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "username"
proxyPass = "password"
request.meta['proxy'] = "http://{0}:{1}".format(proxyHost,proxyPort)
# 添加验证头
encoded_user_pass = base64ify(proxyUser + ":" + proxyPass)
request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass
# 设置IP切换头(根据需求)
tunnel = random.randint(1,10000)
request.headers['Proxy-Tunnel'] = str(tunnel)
2、修改项目配置文件 (./项目名/settings.py)
DOWNLOADER_MIDDLEWARES = {
'项目名.middlewares.ProxyMiddleware': 100,
}
下一篇
已是最新文章