Python"大"数据分析,《庆余年》为啥这么火?

2021-11-06

点击上方“AI有道”,选择“星标”公众号

重磅干货,第一时间送达


今年末尾上映的古装剧《庆余年》可谓是赚足了眼球,号称投资了7个亿,集齐陈道明吴刚袁泉等一票老戏骨,实力演员张若昀李沁主演,又有新顶流肖战做配,在播出后没多久便圈粉无数



在微博上对该话题的讨论和阅读数量已经达到了几十亿(当然会存在水军的成分),播一集就能上微博热搜。在打分苛刻的豆瓣上面,截至目前为止,共有15万人参与了打分,评分也维持在了7.9分左右摇摆,各大视频网站也想趁这波热潮想要从观众手中赚上一笔,特地推出了一个“超前点播“,惹得网友和众多媒体吐槽声不断,



而前几天的整部剧全集被泄露又是掀起了一波高潮,一些主流的视频网站和版权方也因此损失惨重。当然我们整个社会需要加强打击盗版这种违法行为,不过“超前点播”这种吃相并不好看的行为倒并不值得提倡!


Anyway,今天小编呢从豆瓣上面爬取了关于庆余年的相关信息,通过“大数据”(其实并不大,或者还有点小)来帮大家分析一下,为什么观众喜欢看这部剧,喜欢看这部剧的观众又是谁以及看了之后又是怎么评价的。


01
数据的获取

首先是关于数据的获取,要想获取豆瓣上面的数据,首先需要登录自己的豆瓣账户和密码,并且获取cookie,然后跳转到《庆余年》相关的页面,就是这个样子,

然后我们利用request库发送请求,便能够获得我们想要的数据,相当简单。小编此次爬取了观看过、正在观看的观众的相关信息以及评论的具体内容。


    登录豆瓣页面并获取cookie

爬取评论内容


02
数据的分析和挖掘

爬完数据之后,接下来便是简单的数据清理和分析,以及数据可视化。用Python做数据可视化的工具有很多,目前比较轻量级好用的库是pyecharts,在这里,小编就不做赘述。我们看一下pyecharts来对已经获取的数据做的可视化结果。


1
总体评分

《庆余年》在豆瓣当中的总体评分维持在7.9分左后,并不算低,并且有15万人参与了评分。从评分的分布来看,大多数评分给了4星,占总数的48.7%,其次是5星,占总数的36.5%,剩下便是3星及以下的评分,一共占到了总数的14.8%,已经是一个相当低的比例了。

2
城市以及省份的差异

首先是直方图来粗略的展示前十大追剧热度最高的城市,如下图所示


但是直方图的呈现并不总是那么的直观和易于理解,所以小编也采用地图的形式向大家展示主要看剧的观众分布在哪几个区域,

可以看得出来,在长三角和珠三角这两片区域聚集了大量热爱该部剧的粉丝。


3
评论分析

在整理和分析了评论内容之后,小编首先是对包含剧中人物的评论做了归类,并通过直方图来呈现,



从直方图中我们可以看到,范闲和庆帝是被提到的次数最多的两位人物,接下去便是林婉儿和长公主(毕竟人家皮肤这么好,看着一点都像40多岁的女性?)。既然张若昀在剧中的人气这么高,小编便对针对范闲的评论做了进一步的探索,并用wordcloud库绘制词云图。从词云的分析情况来看,“剧情”,“搞笑”,“演技”,“原著”等字眼格外的醒目。


的确,这部剧不仅仅是剧情有趣,每一个演员演技还相当在线,该部剧不仅有张若昀、李沁、肖战等青年演员,还有一大批演技精湛的老戏骨参演,其中7名是国家一级演员,(“一级演员”是文艺界设立的专业技术职称,是国家对演员的最高职称享受国务院特殊津贴。能获得国家一级演员的称号是莫大的荣誉)。


剧情精彩不拖沓,主演专业不尴尬,人物设定完美,剧中台词又不时会诞生各种金句和表情包,于情于理《庆余年》确实很难不火。


而《庆余年》的第二季也很快会开始拍摄,这下喜欢该剧的观众和粉丝可以期待一下了!




推荐阅读

(点击标题可跳转阅读)


重磅!

林轩田机器学习完整视频和博主笔记来啦!


扫描下方二维码,添加 AI有道小助手微信,可申请入群,并获得林轩田机器学习完整视频 + 博主红色石头的精炼笔记(一定要备注:入群 + 地点 + 学校/公司。例如:入群+上海+复旦。 


长按扫码,申请入群

(添加人数较多,请耐心等待)


 

最新 AI 干货,我在看 

相关文章

Python这么火,要学吗?听听华为的工程师怎么说

2021-11-06
有人就有江湖,编程的江湖亦是如此.迅速崛起的Python,免不了要被拿来和其他语言比较.最近在华为工程师们也有讨论到Python的...

Python是个什么鬼?为何火遍国内外...

2021-11-06
Python又这么溜,这活生生的例子不就在我眼前吗?后来他给我甩了个链接,才发现是之前刷爆朋友圈的网红课——风变编程.广告词...

为什么“Python编程超级魔卡”这么火?

2021-11-06
Python语言在最近两个月的TIOBE排行榜里,与Java竞争激烈,不相上下,如果今年Python也能获得“年度编程语言”,就会成为连续...

15600+星的 Python Fire为什么这么火,用完你就知道了

2021-11-06
为什么这个项目这么火爆呢?俩字:『好用』......Github地址:https://github.com/google/python-fire获取方式:从 pypi 获取 `pip install ...

Python虽然很火,为啥找工作这么难

2021-11-06
在Python看起来还没今天那么火之前,它在技术圈其实就广为人知,特别适用于做 MVP(最小可行性)产品,运用在创业初期的产品...

Python是个什么鬼?为何火遍留德华人圈

2021-11-06
来源/全球化智库&智联招聘那么,我们留学生究竟靠什么拉高自己... Python进入小学课堂,各大高校也相继开设人工智能专业;腾讯、...

5天破10亿的哪吒,为啥这么火,Python来分析

2021-11-06
往期推荐49个Python学习资源:从初学者到高级玩家都有了Python正在慢慢失去魅力?Python这么慢,为啥大公司还在用?Python 开...

用Python爬取了《扫黑风暴》数据,并将其可视化分析后,终于知道它为什么这么火了~

2021-11-06
|用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影趣味:弹球游戏 | 九宫格 | 漂亮的花 | 两百行...

【实话实说】为啥Python都火到汽车圈了?

2021-11-06
短短时间阅读量突破3000后台索要资料包更是让小编回复到手软一个编程软件为什么会在汽车圈这么火?好奇的小编随机采访了几个圈...

执行效率太低又怎样? Python 照样火过 Java、C/ C++

2021-11-06
相较而言,Python 具有执行速度不够快、GIL 锁限制并发、版本间不能很好的兼容等缺陷.那么为什么近年来 Python 能够突破重围、...

随机推荐