Python模拟登录微博并爬取表情包-巨人网络通讯

主页 > 知识库 > Python模拟登录微博并爬取表情包

Python模拟登录微博并爬取表情包

一、开发工具

**Python****版本：**3.6.4

相关模块：

DecryptLogin模块；

argparse模块；

requests模块；

prettytable模块；

tqdm模块；

lxml模块；

fake_useragent模块；

以及一些Python自带的模块。

二、环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

三、原理简介

本来这个爬虫是想作为讲python异步爬虫的一个例子的，昨天代码写完测试了一下，结果是我微博账号和ip都直接被封了(并发数设的500）。

然后我去谷歌搜了一下别人写的异步爬虫教程，测试用的都是些没啥反爬措施的小网站。

于是今天改了下代码，就先整个普普通通的微博小爬虫算了。

言归正传，和之前的微博爬虫类似，我们还是先利用DecryptLogin进行微博账户的模拟登录：

'''模拟登录'''
@staticmethod
def login(username, password):
  lg = login.Login()
  _, session = lg.weibo(username, password, 'mobile')
  return session

然后让使用者输入目标微博用户的id：

user_id = input('请输入目标用户ID(例如: 2168613091) ——> ')

微博用户id在这可以看到：

根据用户输入的微博用户id，我们访问如下两个链接：

url = f'https://weibo.cn/{user_id}'
url = f'https://weibo.cn/{user_id}/info'

然后利用xpath提取用户的基本信息：

打印这些信息，让使用者确认自己输入的微博用户id是否无误：

tb = prettytable.PrettyTable()
tb.field_names = ['用户名', '关注数量', '被关注数量', '微博数量', '微博页数']
tb.add_row([nickname, num_followings, num_followers, num_wbs, num_wb_pages])
print('获取的用户信息如下:')
print(tb)
is_download = input('是否爬取该微博用户发的所有图片?(y/n, 默认: y) ——> ')

如果无误，就开始爬取该用户发的所有微博里的图片：

'''下载所有图片'''
def __downloadImages(self, userinfos, savedir):
  # 一些必要的信息
  num_wbs = userinfos.get('num_wbs')
  user_id = userinfos.get('user_id')
  num_wb_pages = userinfos.get('num_wb_pages')
  # 提取图片链接并下载图片
  page_block_size = random.randint(1, 5)
  page_block_count = 0
  for page in tqdm(range(1, num_wb_pages+1)):
    # --提取图片链接
    response = self.session.get(f'https://weibo.cn/{user_id}?page={page}', headers=self.headers)
    image_urls = self.__extractImageUrls(response)
    # --下载图片
    for url in image_urls:
      try:
        res = requests.get(url, headers={'user-agent': self.ua.random}, stream=True)
        with open(os.path.join(savedir, url.split('/')[-1]), 'wb') as fp:
          for chunk in res.iter_content(chunk_size=32):
            fp.write(chunk)
        print('[INFO]: Download an image from: ', url)
      except:
        pass
    # --避免给服务器带来过大压力and避免被封, 每爬几页程序就休息一下
    page_block_count += 1
    if page_block_count % page_block_size == 0:
      time.sleep(random.randint(6, 12))
      page_block_size = random.randint(1, 5)
      page_block_count = 0

这里避免爬虫被BAN的措施主要有以下几点：

每爬n页数据就暂停x秒，其中n是随机生成的，且n一直在变化，x也是随机生成的，且x也一直在变化；
下载图片时，使用随机的ua，并且不使用登录后的session来请求图片链接来下载该图片。

从返回的微博页内容里提取图片链接时，需要注意：

对转发微博的微博id和原创微博的微博id提取方式不同；
只有单张图片的微博和有多张图片的微博提取图片链接的方式是不同的；
有时候图片链接提取会出错，http变成了ttp，所以需要对提取的图片链接进行后处理，然后再去请求这些链接来下载图片。

大体的思路就是这样，因为其实没啥难点，就是用xpath来提取我们需要的信息就行了，所以就这么粗略地介绍一下吧。T_T

运行方式：

python weiboEmoji.py --username 用户名 --password 密码

到此这篇关于Python模拟登录微博并爬取表情包的文章就介绍到这了,更多相关Python爬取微博表情包内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python基于百度AI实现抓取表情包
Python实现微信表情包炸群功能
Python基础进阶之海量表情包多线程爬虫功能的实现
Python自动生产表情包
python实战之制作表情包游戏

标签：酒泉江苏宁夏定西云南金融催收商丘龙岩

巨人网络通讯声明：本文标题《Python模拟登录微博并爬取表情包》，本文关键词 Python,模拟,登录,微博,并,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《Python模拟登录微博并爬取表情包》相关的同类信息！

Python模拟登录微博并爬取表情包

一、开发工具 **Python****版本：**3.6.4 相关模块： DecryptLogin模块； argparse模块； requests模块； prettytable模块； tqdm模块； lxml模块； fake_useragent模块；以及一些Python自带的模块。二、环境...

10-18

高德地图厂名修改，高德地图如何修改厂名？

高德地图默认定位修改？手机上有一个宽箭头样式的点击可更改或者开启自动定位打开地图自己定位高德地图如何修改位...

11-26

400电话属于哪家公司400电话安装的地方现在不断增加

为什么企业要安装400电话,很多的人都不清楚,但是为了形象,很多的企业还是安装了400电话,可能大家也都听说过这种电话,如果...

01-12

品牌和商标：行销符合法律的地方

术语“商标”，“品牌”和“商标名称”通常可互换使用，尽管它们在不同的上下文中描述了不同的事物。特别是当被公司不...

10-23

巨人科技是通讯行业的飞速发展

现在我国的很多企业都在广泛的使用了400电话，这也是因为400电话已经成了各企事业单位正规专业与否的一个体现了。拥有了...

05-15

金华专业电销机器人供应商,电话线路怎么办理-漫谈

金华专业电销机器人供应商,电话线路怎么办理及时调整操作策略，保证了联络中心的高效运行。结论：全频道呼叫中心不仅...

12-16

武汉长江防封电销卡

武汉电销卡办理中，电话咨询 13121219151 为什么要用防封电销卡对于企业来说，销售市场如同战场，谁能将营销销售做到完...

12-04

宁波联通群呼系统哪里专业-热点

宁波联通群呼系统哪里专业用工本钱问题不必再为职工操练处理不到位而担忧。能够用非常短的时刻拾掇客户电话做分类，做...

01-16

三个关键途径让你提高呼叫中心质量

服务质量一直是呼叫中心领域讨论的热点话题。近日，国外一家著名市场研究公司做了一份关于呼叫中心服务质量的调查。...

10-22

电销卡经常封号怎么办？（电销高频封号,电销如何防止封电话卡）

电销卡这个称呼的由来，是因为一些电话卡被广泛的用于电话销售工作当中，所以才有了这个称呼，那么为什么这种电话卡会...

10-05

杭州手机自动外呼系统（自动外呼电话）

本篇文章给大家谈谈杭州手机自动外呼系统，以及自动外呼电话对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。...

11-06

电话机器人一芯智能电话机器人

外呼模板【一芯智能电话机器人】您可以实时监视拨打的任务，并在发现异常时随时停止拨打并调整拨打的任务。【一芯智...

10-31

小勇机器人价格效果怎么样

3、创建拨打任务【小勇机器人价格】智能电销机器人【小勇机器人价格】外呼任务【小勇机器人价格】在创建任务的同时...

10-31

苹果MAC OS系统怎么设置分辨率调节字体大小

目前，大部分使用的都是windows操作系统，当然也有部分人喜欢用其他的系统。最近，一些mac用户问我，mac os系统的字体要怎...

10-20

杭州语音外呼系统软件（智能语音外呼系统哪个好）

本篇文章给大家谈谈杭州语音外呼系统软件，以及智能语音外呼系统哪个好对应的知识点，希望对各位有所帮助，不要忘了收...

05-17

电话机器人实拍图高清全屏（电话机器人实拍图高清全屏）

本文目录一览：1、智能电话机器人用的怎么样2、用智能AI电话机器人效果好吗?3、智能电话机器人哪个好?智能电话机器人用...

07-15

南京外呼系统怎么安装（外呼系统好用吗）

今日给各位共享南京外呼体系怎样装置的常识，其间也会对外呼体系好用吗进行解说，假如能可巧处理你现在面对的问题，别...

05-17

合肥房产群呼电话线路什么价格,销售管理CRM公司-[安全可靠]

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务难以启动； 2）销售人员号码被标注，...

12-17

山西电话电销机器人功能（电销系统电话机器人）

本文目录一览： 1、电销机器人有什么功用2、电销机器人有什么用？3、电话机器人功用有哪些呢？4、请电销机器人有什么功...

04-22

电销线路机器人怎么做（电销机器人有效果吗）

本篇文章给咱们谈谈电销线路机器人怎样做，以及电销机器人有作用吗对应的知识点，期望对各位有所协助，不要忘了保藏本...

11-07

电销机器人有市场吗（电销机器人有市场吗知乎

本文目录一览：1、现在有哪些行业在用电话机器人了？我做催收的合适用吗2、机器人的销售前景怎么样？3、现在电话机器...

11-29

宁夏医疗智能外呼系统商家的简单介绍

本文目录一览： 1、哪家的外呼系统好用？ 2、外呼系统哪家公司做得好？？？ 3、外呼系统哪家好？ 4、智能电话外呼系统哪...

11-25

怎么申请400开头的电话，怎么申请400开头的电话美团外卖

怎么申请400开头的电话，怎么申请400开头的电话美团外卖400电话代理商为你解答。先选号心仪号码,也可以到网站平台选号。...

07-20

乌鲁木齐市好用电销专用卡便宜

取消漫游费对虚商并无多大影响虚商用户权益受损可到工信部投诉有媒体称，今年两工作报告明确提出2017年全部取消好用电...

02-07

万州适合电销的电话卡（万州适合电销的电话卡在哪里办）

本文目录一览：1、有什么适合做电销的手机卡2、做销售应该用什么样的电话卡?3、电话销售用什么卡好,一天三四百分钟有什...

07-10

济南自动AI电话机器人一企嗨呼叫系统,AI机器人在哪可以办理-欢迎洽谈

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务难以启动； 2）销售人员号码被标注，...

12-17

如何去除win7强制关机提示框

关机时如果某程序无法关闭，Win 7会询问你是否强制关机，你可以通过修改组策略的方法让Win 7立即关机，不弹出这类询问窗...

10-20

ai电话机器人很火吗（ai智能机器电话）

本文目录一览：1、有听说过电话机器人吗,感觉怎么样?用过的说有听说过电话机器人吗,感觉怎么样?用过的说现在智能ai电话...

07-14

南京400电话办理步骤

【南京400电话办理步骤】400电话是全国通用的虚拟号码，需要绑定手机或者座机才可使用，全国各地的企业都在办理400电话，...

04-21

泰州电销防封系统官网

泰州电销防封系统官网 ,泰州电销防封系统官网安装,泰州电销防封系统官网下载电销防封系统，专为电销企业定制的封号解...

12-04

Win10笔记本电量图标不见了怎么办？Win10笔记本电量图标不见了的解决方法

有用户反应自己的Win10笔记本电量图标不见了，遇到这种问题我们可以先从系统设置上入手，下面小编就给大家带来Win10笔记...

10-20

百度地图标注-I’m Here 依赖信任

如果说地图导航标注是仅次于通讯、随身影音以外，手机的第三重要功用的话，CHIP信任你肯定不会辩驳这个说法。简直每部...

04-13

国际服务外包大会下月在南京举行

新京报讯（记者刘溪若）第六届中国国际服务外包大会将于6月26日至28日在南京举行。昨日，江苏省商务厅副厅长姜昕在北京...

10-22

济南财税ai机器人什么价格-价格透明

济南财税ai机器人什么价格具有无线接入中心功能，服务范围广阔的IP中心功能,为业务服务的中心功能，并且成为以庞大的数...

05-17

重庆北纬蜂巢电销卡（北纬蜂巢电销卡人工客服电话）

本文目录一览：1、北纬丰巢电话卡怎么注销?2、北纬蜂巢电话卡服务密码是多少3、北纬蜂巢电话卡在哪里买4、北纬蜂巢卡注...

07-10

400电话办理需要什么手续（400电话办理流程是什么）

400电话办理需要什么手续（400电话办理流程是什么）办理400电话是企业发展中的必要选择，能够提升客户满意度和品牌形象...

08-14

北京云南电话机器人系统怎么用

时代在发展，科技在进步，无论你的企业在行业中处于什么样的地位，无论你的企业在市场上占多大的份额，无论你的企业在...

10-31

安微数字化电销管理系统（安徽省数字化车间）

今日给各位共享安微数字化电销办理体系的常识，其间也会对安徽省数字化车间进行解说，如果能可巧处理你现在面临的问题...

05-18

中山外呼系统免费（电话外呼系统设备）

本文目录一览： 1、外呼系统怎么办理？2、外呼系统安装需要哪些费用？3、电销外呼系统多少钱一个月？4、市面上外呼系统...

11-27

匠心筑梦 | 二季度“远传工匠精神奖”新鲜出炉

2018年第二季度远传工匠精神奖新鲜出炉啦！从候选人到一对一访谈，再通过15位管理者和资深产品经理的严谨评选，整整历时...

10-19

可持续更新 Win10 Mobile正式版10586.218支持机型有哪些？

10-20

智能电话机器人怎么卖（智能电话机器人怎么卖的）

本篇文章给咱们谈谈智能电话机器人怎样卖，以及智能电话机器人怎样卖的对应的知识点，期望对各位有所协助，不要忘了保...

05-17

山东手机电销卡如何避免封号

山东手机电销卡如何避免封号电销卡是什么卡？总的来说，电销专用卡是一种由民营运营商发行的手机卡，市场上有很多品...

12-16

长春电销电话机器人排名（电话机器人电销系统）

今日给各位共享长春电销电话机器人排名的常识，其间也会对电话机器人电销体系进行解说，假如能可巧处理你现在面对的问...

05-17

400电话的费用是多少400电话的安装费用是多少?

企业在申请办理时，会选择不同类型的号码，费用也不一样。一般来说，400电话号码寓意好的，价格也比较贵，而普通的40...

01-13

郑州房产电话销售系统多少钱一张,外呼线路办理商家-放心省心

郑州房产电话销售系统多少钱一张,外呼线路办理商家通话完成后，你能够及时添加意向客户的微信，给客户发送企业"微"和相...

12-16

打400电话收费价格，拨打400电话收费

打400电话收费价格，拨打400电话收费400电话代理商为你解答。你好朋友拨打400电话是按照市话费收取的,国庆节快乐。以下...

07-20

办电销卡月租多少钱（电销卡多少钱一个月）

本文目录一览：1、电销卡在哪里办理多少钱2、电信卡月费多少钱?3、电销外呼系统多少钱一个月?4、电费自助缴费终端哪家好...

07-10

上海电信呼叫中心软件办理公司,电话营销线路-看这里!

上海电信呼叫中心软件办理公司,电话营销线路由某公司建立一个大型的呼叫中心，再租赁给其他公司使用，包括租赁号码线...

12-16

衡水400电话选号平台400电话号码选号方法技巧都有哪些？

400号已经成为企业对外宣传的必需品。 400电话号码选择平台可以帮助想要申请400号码的公司选择他们最喜欢的400号码。河北...

01-13

人民日报电话机器人（人民日报电话热线电话）

本文目录一览：1、电销机器人是诈骗吗?2、315之后,骚扰电话没有消停的意思,还经常接到智能机器人打的电话...3、机器人打电...

06-20

Python模拟登录微博并爬取表情包

10-18

本页收集关于Python模拟登录微博并爬取表情包的相关信息资讯供网民参考！

推荐文章

上一篇：allure结合python生成测试报告教程

下一篇：如何利用AJAX获取Django后端数据详解

一起分享吧