pythonの鉴黄之路(二)——图片转base64码

家电修理 2023-07-16 19:17www.caominkang.com电器维修

上篇博客的YCbCr鉴黄有些过于浮夸

http://blog.csdn./sm9sun/article/details/53319959

于是经过慎重决定,我们打算采取调用外部成熟的接口来完成鉴黄,这里就涉及数据传输的问题,不可能传图片啦~

为了便于网络通信,我们采取将图片转为base64码再进行后续的工作~

先介绍一下base64码


base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。base64编码可用于在HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了base64来将一个较长的唯一标识符(一般为128-bit的UUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用base64编码具有不可读性,即所编码的数据不会被人用肉眼所直接看到。

转码过程例子
38=46
内存1个字符占8位
转前 s 1 3
先转成ascii对应 115 49 51
2进制 01110011 00110001 00110011
6个一组(4组) 011100110011000100110011
然后才有后面的 011100 110011 000100 110011
然后计算机是8位8位的存数 6不够,自动就补两个高位0了
所有有了 高位补0
科学计算器输入 00011100 00110011 00000100 00110011
得到 28 51 4 51
查对下照表 c z E z
  先以“迅雷下载”为例 很多下载类网站都提供“迅雷下载”的链接,其地址通常是加密的迅雷专用下载地址。
其实迅雷的“专用地址”也是用base64"加密"的,其过程如下
一、在地址的前后分别添加AA和ZZ
二、对新的字符串进行base64编码
另 Flashget的与迅雷类似,只不过在第一步时加的“料”不同罢了,Flashget在地址前后加的“料”是[FLASHGET]
而QQ旋风的干脆不加料,直接就对地址进行base64编码了


python自带的base64模块内置了此部分功能


import sysimport osimport base64f=open(sys.argv[1],'rb')ls_f=base64.b64encode(f.read())f.close()file_object = open('base64.txt', '')file_object.rite(ls_f)file_object.close( )print ls_f







Copyright © 2016-2025 www.caominkang.com 曹敏电脑维修网 版权所有 Power by