破解X眼电影字体动态加密|凹凸玩数据

Aidan075 等级 609 1 0
标签: httpsPython

我们在上一篇文章 《破解大众点评的字体加密中提到了,大众点评只是静态字体加密,这次我们抱着学习的态度以猫眼电影为例讲讲如何破解字体动态加密。

没有了解过字体加密的小伙伴可以先看看上一篇,本文与上一篇重复的部分就不细讲了。

我们打开猫眼电影票房榜单的首页

https://maoyan.com/board/1

很明显,猫眼电影的榜单进行了字体加密。

破解X眼电影字体动态加密|凹凸玩数据

让我们回忆一下破解大众点评的步骤:

1、下载网站font字体包

2、将font字体包中导入FontEditor 观察得到乱码与数字的关系

3、前缀替换,并将字体名字和它们所对应的乱码构成一个字典

4、根据字典将加密的数字替换

然而,右键刷新页面,字体文件一直在变:

破解X眼电影字体动态加密|凹凸玩数据

为了探究一下,我们随便下载3个字体文件,对比看看能不能发现其中的规律。

分别重命名为A.woff,B.woff,C.woff,将他们依次导入FontEditor中打开

破解X眼电影字体动态加密|凹凸玩数据

其中A字体的1对应的是【uniECC8】

B字体的1对应的是【uniE5FD】

C字体的1对应的是【uniEE6C】

并无规律。

我们再将.woff文件转换成.xml文件,看看字体结构有没有相似之处:

#.woff文件转换成.xml文件  
from fontTools.ttLib import TTFont  
font = TTFont('./.woff')  
font.saveXML('A.xml')

每一个编码都对应一个TTGlyph对象,而许多行的XY坐标点最终绘制成数字。

破解X眼电影字体动态加密|凹凸玩数据

破解X眼电影字体动态加密|凹凸玩数据

破解X眼电影字体动态加密|凹凸玩数据

很多网上的教程到这里就结束了,因为按理说这三个字体的统一数字对应的XY坐标应是一样的。

这说明猫眼最近又新挖了一个坑,继续填坑。

看看上面的三个图,其实他们的XY坐标差异并不大。

所以我们允许在一定范围内的差异就算一样就好啦。

由于有负数,通过abs函数取绝对值

#对比两个坐标的差异  
def compare(AA, BB):  
    for i in range(5):  
        if abs(AA[i][0] - BB[i][0]) < 80 and abs(AA[i][1] - BB[i][1]) < 80:  
            pass  
        else:  
            return False  
    return True  
#True则可视为是同一个字  

这样我们就以某字体基准,无论现在实时的字体是哪一个,只要下载下来,再与该字体进行坐标差异对比,相似的就是同一数字。

在网上找了一张思路图,方便大家理解:

破解X眼电影字体动态加密|凹凸玩数据

我们下面尝试一下:

1、将新下载的字体文件与base_font对比,找到对应关系

2、前缀替换,并将字体名字和它们所对应的乱码构成一个字典

3、根据字典将加密的数字替换

# 字体解密   
def modify_html(newFont, html):  
    basefont = TTFont('./base_font.woff')  
    unilist = newFont['cmap'].tables[0].ttFont.getGlyphOrder()  
    numlist = []  
    base_num = ['6', '3', '7', '1', '5', '9', '0', '4', '2', '8']  
    base_unicode = ['uniF0DA', 'uniE907', 'uniED01', 'uniEAE1', 'uniF206',  
                   'uniE455', 'uniF401', 'uniE19C', 'uniEB76', 'uniF855']  
    for i in range(1, len(unilist)):  
        newGlyph = newFont['glyf'][unilist[i]].coordinates  
        for j in range(len(base_unicode)):  
            baseGlyph = basefont['glyf'][base_unicode[j]].coordinates  
            if compare(newGlyph,baseGlyph):  
                numlist.append(base_num[j])  
                break  
    rowList = []  
    for i in unilist[2:]:  
        i = i.replace('uni', '&#x').lower() + ";"  
        rowList.append(i)  

    dictory = dict(zip(rowList, numlist))  
    for key in dictory:  
        if key in html:  
            html = html.replace(key, str(dictory[key]))  
 return html  
# 返回解密后的html  

4、利用正则表达式获取数据

# 正则  
def parse_page(html):  
    pattern = re.compile('<dd>.*?board-index-.*?>(.*?)</i>.*?data-src="(.*?)".*?'  
                         + 'title="(.*?)".*?class="star">(.*?)</p>.*?releasetime">(.*?)</p>.*?'  
                         + 'realtime".*?stonefont">(.*?)</span>.*?'  
                         + 'total-boxoffice".*?stonefont">(.*?)</span>.*?</dd>', re.S)  

    items = re.findall(pattern, html)  
    data = pd.DataFrame(items,columns=['index','image','title','star','releasetime','realtime','total-boxoffice'])  
    data['star']=data['star'].str[3:]  
    data['releasetime']=data['releasetime'].str[5:]  
    print(data)  
    return data  

运行一下。

破解X眼电影字体动态加密|凹凸玩数据

get。

本文相关爬虫代码,仅供学习交流:https://t.zsxq.com/RVn6qBU

获取了猫眼电影榜单能做什么呢?扫描下方二维码关注,数据分析部分咱们下回再讲。


本文转转自微信公众号凹凸数据原创https://mp.weixin.qq.com/s/UOWFU5q1SKcW0epywlurIg,可扫描二维码进行关注: 破解X眼电影字体动态加密|凹凸玩数据 如有侵权,请联系删除。

收藏
评论区

相关推荐

破解X眼电影字体动态加密|凹凸玩数据
我们在上一篇文章 《破解大众点评的字体加密(http://mp.weixin.qq.com/s?__bizMzg5NDE3Nzc5Mw&mid2247483857&idx1&sn73f471f9dec5c0948bacb9ef72046e83&chksmc022c6bff7554fa9010a94a856432e306d0e9bf57fa9
Python简易扑克牌发牌
coding:utf8import randomimport time扑克牌54张间隔2秒发牌poker x for x in range(1, 55)poker x for x in range(1, 55)player pokers 每个花色的组合玩家4人for p in range(1, 5): playerp 4个
破解X眼电影字体动态加密|凹凸玩数据
我们在上一篇文章 中提到了,大众点评只是静态字体加密,这次我们抱着学习的态度以猫眼电影为例讲讲如何破解字体动态加密。没有了解过字体加密的小伙伴可以先看看上一篇,本文与上一篇重复的部分就不细讲了。我们打开猫眼电影票房榜单的首页https://maoyan.com/board/1很明显,猫眼电影的榜单进行了字体加密。 让我们回忆一下破解大众点评的步骤:1、下载
玩转python爬虫
&ensp;&ensp;&ensp;  近几年来,python的热度一直特别火!大学期间,也进行了一番深入学习,毕业后也曾试图把python作为自己的职业方向,虽然没有如愿成为一名python工程师,但掌握了python,也让我现如今的工作开展和职业发展更加得心应手。这篇文章主要与大家分享一下自己在python爬虫方面的收获与见解。 &ensp;&ensp;
扑克牌发牌
间隔2秒发牌且有大小王! coding:utf8import randomimport time 扑克牌54张poker [x for x in range(1, 55)]player pokers 每个花色的组合 玩家4人 列表for p in range(1, 5): player[p] [] 4个花色types ['♠', '♥'
手把手教你如何在Ubuntu下安装Miniconda
前言这次我们来安排一下如何在ubuntu上安装Miniconda。这里说一下为什么不是Anaconda,因为它太占内存了,足足有5G左右,我的云服务器才40G硬盘,实在是玩不起呐。但是Anaconda和Miniconda的用法完全一摸一样,使用上不要担心,完全就是一个多装了很多包,一个少装了很多包。 解释一下为什么用conda来创建python环境现在基于
Ubuntu16.04下安装opencv3.4.2
1.安装官方给的opencv依赖包 * GCC 4.4.x or later * CMake 2.6 or higher * Git * GTK+2.x or higher, including headers (libgtk2.0-dev) # 控制opencv GUI * pkg-config * Python 2.6 or l
64 岁 Python 之父退休失败,正式加入微软搞开源!
![](https://imgconvert.csdnimg.cn/aHR0cHM6Ly9tbWJpei5xcGljLmNuL21tYml6X2dpZi9wdHA4UDE4NHhqeWQ5YWZjN1h5V3cxTFUzNnRoQ3lOckg2eWJLWWNQRjZJNDdKTjJrMzRHRXh3VmdSMVdqeHFFS1A5cVpYRmYyTUJpYW
Mac 升级Python 2.7 到 Python 3.7
MAC上默认内置安装了Python 2.7,但是Python 2.7到2020年就会停止维护了,并且有时候会出现依赖库的不兼容问题,那么怎么安装Python 3.X,并且将Python 3.X的版本设置为默认版本呢? ### 安装Python 3.7 有两种安装方式。 第一种是直接下载python3安装包安装: 1、下载地址如下:[https://w
Python 3 教程
Python 3 教程 =========== ![python3](https://www.runoob.com/wp-content/uploads/2014/05/python3.png) Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,
Python version 3.5 does not support variable...
背景 == 目前处于FastAPI学习初期,使用环境是: * Win7 64 bits SP1 * PyCharm 2016.3 * Python 3.8.4 * FastAPI 0.60.1 问题截图 ==== ![Python version 3.5 does not support variable...](https://s4
Python 全栈开发
**如果你已经玩转了 Python 编程语言语法,肯定想用这些知识,开发一款应用程序,它可以是在网上,可以炫耀或出售,那就需要全栈式开发 Python。具体如何创建,部署和运行生产 Python Web 应用程序,参考 [Full Stack Python](https://www.oschina.net/action/GoToLink?url=https%
Python全栈快餐教程(1)
Python全栈快餐教程(1) - 用Flask处理HTTP请求 ================================ 初识Flask ------- Flask是最流行的Python web框架之一。 我们来写个最小的web应用,只有一个路由先跑进来玩玩吧。 from flask import Flask #
SpringBoot2.x配置Https
准备工作 ==== 需要自签,或者权威机构颁发的证书一张 springboot配置Https访问 =================== #ssl #https访问的端口 server.port=8085 #证书,可以存放在resoucrs目录下 server.ssl.key-store=classpath:to
SpringBoot2.x配置Https
准备工作 ==== 需要自签,或者权威机构颁发的证书一张 springboot配置Https访问 =================== #ssl #https访问的端口 server.port=8085 #证书,可以存放在resoucrs目录下 server.ssl.key-store=classpath:to