当前位置:网站首页>Base64编码原理
Base64编码原理
2022-08-03 03:02:00 【共黄昏】
Base64编码原理
文章目录
一、Base64的由来
电子邮件刚问世的时候,只能传输英文,但后来随着用户的增加,中文、日文等文字的用户也有需求,但这些字符并不能被服务器或网关有效处理,为解决这一问题,最好的方案是在不改变传输协议的基础上,做一种扩展方案来支持非ASCII内容传输,把非 ASCII 字符用ASCII来表示,Base64编码应运而生。随之,Base64在URL、Cookie、网页传输少量二进制文件中也有相应的使用。
二、什么是Base64?
Base64 是一种编码方式
,最早出现在电子邮件传输协议中。Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。Base64编码是从二进制到字符的过程,可用于在HTTP环境下传递较长的标识信息。采用Base64编码具有不可读性,需要解码后才能阅读。
三、Base64编码原理
Base64 将8比特位为一个单元的字节数据拆分为以6个比特位为一个单元的二进制片段,不足6个比特位的在后面补0,在转为字符后补0的位置以=
表示,2个0替换一个=
号。每6个比特位单元对应Base64索引表中的一个字符,这样最终构成一个 超过编码前字节数据33% 的字符串。
Base64索引图如下图所示:
ASCII表如下图所示:
举个栗子:
将ABC
三个字符进行base64编码,编码过程如下:
文 本: A B C
ASCII码: 65 66 67
8bit位: 01000001 01000010 01000011
<-----------------------将8bit位化为6bit位----------------------->
6bit位: 010000 010100 001001 000011
Base64索引: 16 20 9 3
Base64编码: Q U J D
8bit位:010000010100001001000011
6bit位:010000010100001001000011
3*8=24 24/6=4
8bit位刚好能化为6bit位,不要补0.
注意:
ASCII码到 8bit位之间,是将ASCII转化位8位的二进制。6bit位到Base64索引之间,是将6位的二进制转化为十进制。
将abcd
四个字符进行base64编码,编码过程如下:
文 本: a b c d
ASCII码: 97 98 99 100
8bit位: 01100001 01100010 01100011 01100100
<----------------------将8bit位化为6bit位---------------------->
6bit位: 011000 010110 001001 100011 011001 000000
Base64索引: 24 22 9 35 25 0
Base64编码: Y W J j Z A==
8bit位:01100001011000100110001101100100
6bit位:011000010110001001100011011001000000
4*8=32 32/6=5*6 + 2
8bit位化为6bit位时,还差4位才能补齐最后的6位,因此在末尾补了4个0,当6bit位根据Base64索引表化为字符后需要在末尾补两个'==',一个'='代表补了两个0。
四、通过Python实现Base64编码
方案一:通过编码过程自己写Base64编码
b64_dict = {
0: 'A', 17: 'R', 34: 'i', 51: 'z',
1: 'B', 18: 'S', 35: 'j', 52: '0',
2: 'C', 19: 'T', 36: 'k', 53: '1',
3: 'D', 20: 'U', 37: 'l', 54: '2',
4: 'E', 21: 'V', 38: 'm', 55: '3',
5: 'F', 22: 'W', 39: 'n', 56: '4',
6: 'G', 23: 'X', 40: 'o', 57: '5',
7: 'H', 24: 'Y', 41: 'p', 58: '6',
8: 'I', 25: 'Z', 42: 'q', 59: '7',
9: 'J', 26: 'a', 43: 'r', 60: '8',
10: 'K', 27: 'b', 44: 's', 61: '9',
11: 'L', 28: 'c', 45: 't', 62: '+',
12: 'M', 29: 'd', 46: 'u', 63: '/',
13: 'N', 30: 'e', 47: 'v',
14: 'O', 31: 'f', 48: 'w',
15: 'P', 32: 'g', 49: 'x',
16: 'Q', 33: 'h', 50: 'y'}
def b64_encode(str):
# 第一步:字符串转二进制,8bit位
list64 = ''
for c in str:
print(ord(c))
s = bin(ord(c))[2:]
if len(s)%8 != 0:
for i in range(8 - len(s)%8):
s = '0' + s
list64 = list64 + s
# 第二步:8bit位划分为6bit位,不足六位的补0
if len(list64) % 6 == 0:
for i in range(0, len(list64), 6):
n6 = '0b' + list64[i:i + 6:1]
num_0 = 0
else:
n = 6 - (len(list64) - (len(list64) // 6) * 6)
for i in range(n):
list64 = list64 + '0'
num_0 = i + 1
# 第三步:将6bit位化为十进制(Base64索引),放进myb64nums列表里
myb64nums = []
for i in range(0, len(list64), 6):
n6 = list64[i:i + 6:1]
myb64num = int(n6, 2)
myb64nums.append(myb64num)
print(myb64nums)
# 第四步:通过Base64索引查询字符,并放进字符串中。
b64_str=""
for myb64num in myb64nums:
b64_str=b64_str+b64_dict[myb64num]
# 第五步:检测8bit化为6bit位时末尾是否补了0,如果补了则在字符后面补'='
if num_0 != 0:
for i in range(0, num_0 // 2):
b64_str=b64_str+'='
return b64_str
print(b64_encode('abcd'))
方案二:调用base64库实现base64编码
import base64
# base64加密
b64_en = base64.b64encode('abcd'.encode())
print(b64_en)
#base64解密
b64_de = base64.b64decode('YWJjZA=='.encode())
print(b64_de)
边栏推荐
- 什么样的存储服务,才能成为企业数字化创新“加速器”?
- [Arduino] Reborn Arduino Monk (2)----Arduino Language
- Auto.js Pro 计算脚本运行时间
- ClickHouse - Getting Started
- 金仓数据库 Pro*C 迁移指南(3. KingbaseES Pr*oc 对 Oracle Pro*c 的兼容)
- AttributeError: module ‘xxx‘ has no attribute
- [Static type and dynamic type compile check and run check in Objective-C]
- leetcode:153. 寻找旋转排序数组中的最小值
- Topic Modeling of Short Texts: A Pseudo-Document View
- 【GO记录】从零开始GO语言——用GO语言做一个示波器(二)基于arduino的简易示波器
猜你喜欢
随机推荐
爆肝22个ES6知识点
IDEA如何创建父子工程
谷粒商城一些疑问总结
软件测试技术之如何编写测试用例(2)
Jincang Database Pro*C Migration Guide (3. KingbaseES Pr*oc Compatibility with Oracle Pro*c)
MySQL-如何分库分表?一看就懂
为什么要使用 playwright 做浏览器自动化测试?
Wei Dongshan Digital Photo Frame Project Learning (5) Transplantation of libjpeg-turbo
PSSecurityException
ClickHouse—高级
C语言——结构体(声明、内存对齐、自引用)、位段、联合体、枚举常量合集
对话框管理器第四章:对话框消息循环
钻石基础知识介绍
leetcode:149. 直线上最多的点数
Task Scheduler 计划定时任务,修改时报错: One or more of the specified arguments are not valid
VS中使用BugTrap定位程序崩溃点
Guys, I don't understand a bit: why the documentation of oracle-cdc writes that the connector can be done exactly-o
WordPress博客问答小插件
机器学习【KNN案例、API、总结】
leetcode:163 缺失的区间