加密解密算法之RSA

文章内容如有错误或排版问题，请提交反馈，非常感谢！

在了解RSA之前，需要先要对对称加密和非对称加密有个初步的了解。对称加密就是加密和解密使用同一个密钥。对称加密快而且方便，但是有个缺点，密钥容易被偷或被破解。非对称算法把密钥分成两个，一个自己持有叫私钥，另一个发给对方，还可以公开，叫公钥，用公钥加密的数据只能用私钥解开。

前面介绍的RC4、DES、AES都属于对称加密，而今天要学习的RSA则属于非对称加密的一种。

非对称加密的发展历史

1976年以前，所有的加密方法都是同一种模式：甲方选择某一种加密规则，对信息进行加密，乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称”密钥”），这被称为”对称加密算法”（Symmetric-key algorithm）。这种加密模式有一个最大弱点：甲方必须把加密规则告诉乙方，否则无法解密。保存和传递密钥，就成了最头疼的问题。

1976年，两位美国计算机学家 Whitfield Diffie 和 Martin Hellman，提出了一种崭新构思，可以在不直接传递密钥的情况下，完成解密。这被称为”Diffie-Hellman密钥交换算法”。这个算法启发了其他科学家。人们认识到，加密和解密可以使用不同的规则，只要这两种规则之间存在某种对应关系即可，这样就避免了直接传递密钥。这种新的加密模式被称为”非对称加密算法”。

乙方生成两把密钥（公钥和私钥）。公钥是公开的，任何人都可以获得，私钥则是保密的。
甲方获取乙方的公钥，然后用它对信息加密。
乙方得到加密后的信息，用私钥解密。

如果公钥加密的信息只有私钥解得开，那么只要私钥不泄漏，通信就是安全的。

1977年，三位数学家 Rivest、Shamir 和 Adleman 设计了一种算法，可以实现非对称加密。这种算法用他们三个人的名字命名，叫做RSA算法。从那时直到现在，RSA算法一直是最广为使用的”非对称加密算法”。毫不夸张地说，只要有计算机网络的地方，就有RSA算法。这种算法非常可靠，密钥越长，它就越难破解。根据已经披露的文献，目前被破解的最长RSA密钥是768个二进制位。也就是说，长度超过768位的密钥，还无法破解（至少没人公开宣布）。因此可以认为，1024位的RSA密钥基本安全，2048位的密钥极其安全。

RSA的数学原理

非对称加密算法核心原理其实就是设计一个数学难题，使得用公钥和明文推导密文很容易，但根据公钥、明文和密文推导私钥极其难。

互质关系

如果两个正整数，除了1以外，没有其他公因子，我们就称这两个数是互质关系（coprime）。比如，15和32没有公因子，所以它们是互质关系。这说明，不是质数也可以构成互质关系。关于互质关系，不难得到以下结论：

任意两个质数构成互质关系，比如13和61。
一个数是质数，另一个数只要不是前者的倍数，两者就构成互质关系，比如3和10。
如果两个数之中，较大的那个数是质数，则两者构成互质关系，比如97和57。
1和任意一个自然数是都是互质关系，比如1和99。
p是大于1的整数，则p和p-1构成互质关系，比如57和56。
p是大于1的奇数，则p和p-2构成互质关系，比如17和15。

欧拉函数

任意给定正整数n，请问在小于等于n的正整数之中，有多少个与n构成互质关系？（比如，在1到8之中，有多少个数与8构成互质关系？）计算这个值的方法就叫做欧拉函数，以φ(n)表示。在1到8之中，与8形成互质关系的是1、3、5、7，所以φ(n)=4。

φ(n)的计算方法并不复杂，但是为了得到最后那个公式，需要一步步讨论。

第一种情况：如果n=1，则φ(1)=1。因为1与任何数（包括自身）都构成互质关系。
第二种情况：如果n是质数，则φ(n)=n-1。因为质数与小于它的每一个数，都构成互质关系。比如5与1、2、3、4都构成互质关系。
第三种情况：如果n是质数的某一个次方，即n=p^k(p为质数，k为大于等于1的整数)，则$\phi(p^k)=p^k-p^{(k-1)}$，比如φ(8)=φ(2^3)=2^3-2^2=8-4=4。这是因为只有当一个数不包含质数p，才可能与n互质。而包含质数p的数一共有p^(k-1)个，即1×p、2×p、3×p、…、p^(k-1)×p，把它们去除，剩下的就是与n互质的数。上面的式子还可以写成下面的形式：$\phi(p^k)=p^k-p^{(k-1)}=p^k(1-\frac{1}{p})$，可以看出，上面的第二种情况是k=1时的特例。
第四种情况：如果n可以分解成两个互质的整数之积，n=p1×p2，则φ(n)=φ(p1p2)=φ(p1)φ(p2)，即积的欧拉函数等于各个因子的欧拉函数之积。比如，φ(56)=φ(8×7)=φ(8)×φ(7)=4×6=24。这一条的证明要用到中国剩余定理，这里就不展开了，只简单说一下思路：如果a与p1互质(a<p1)，b与p2互质(b<p2)，c与p1p2互质(c<p1p2)，则c与数对(a,b)是一一对应关系。由于a的值有φ(p1)种可能，b的值有φ(p2)种可能，则数对(a,b)有φ(p1)φ(p2)种可能，而c的值有φ(p1p2)种可能，所以φ(p1p2)就等于φ(p1)φ(p2)。
第五种情况：因为任意一个大于1的正整数，都可以写成一系列质数的积。$n=p_1^{k1}p_2^{k2}…p_r^{kr}$，根据第4条的结论，得到$\phi(n)=\phi(p_1^{k1})\phi(p_2^{k2})…\phi(p_r^{kr})$，再根据第3条的结论，得到$\phi(n)=p_1^{k1}p_2^{k2}…p_r^{kr}(1-\frac{1}{p_1})(1-\frac{1}{p_2})…(1-\frac{1}{p_r})$，也就等于$\phi(n)=n(1-\frac{1}{p_1})(1-\frac{1}{p_2})…(1-\frac{1}{p_r}))$，这就是欧拉函数的通用计算公式。比如，1323的欧拉函数，计算过程如下：$\phi(1323)=\phi(3^3*7^2)=1323(1-\frac{1}{3})(1-\frac{1}{7})=756$。

欧拉定理

欧拉函数的用处，在于欧拉定理。”欧拉定理”指的是：如果两个正整数a和n互质，则n的欧拉函数φ(n)可以让下面的等式成立：$a^{\phi(n)}\equiv1\pmod{n}$，也就是说，a的φ(n)次方被n除的余数为1。或者说，a的φ(n)次方减去1，可以被n整除。比如，3和7互质，而7的欧拉函数φ(7)等于6，所以3的6次方（729）减去1，可以被7整除（728/7=104）。欧拉定理的证明比较复杂，这里就省略了。我们只要记住它的结论就行了。欧拉定理可以大大简化某些运算。比如，7和10互质，根据欧拉定理，$7^{\phi(10)}\equiv1\pmod{10}$，已知φ(10)等于4，所以马上得到7的4倍数次方的个位数肯定是1。$7^{4k}\equiv1\pmod{10}$，因此，7的任意次方的个位数（例如7的222次方），心算就可以算出来。欧拉定理有一个特殊情况。假设正整数a与质数p互质，因为质数p的φ(p)等于p-1，则欧拉定理可以写成$a^{p-1}\equiv1\pmod{p}$，这就是著名的费马小定理。它是欧拉定理的特例。欧拉定理是RSA算法的核心。理解了这个定理，就可以理解RSA。

模反元素

还剩下最后一个概念：如果两个正整数 a 和 n 互质，那么一定可以找到整数 b，使得 ab-1 被 n 整除，或者说 ab 被 n 除的余数是 1。$ab\equiv1\pmod{n}$，这时，b 就叫做 a 的模反元素。比如，3 和 11 互质，那么 3 的模反元素就是 4，因为 (3×4)-1 可以被 11 整除。显然，模反元素不止一个，4 加减 11 的整数倍都是 3 的模反元素 {…, -18, -7, 4, 15, 26, …}，即如果 b 是 a 的模反元素，则 b+kn 都是 a 的模反元素。欧拉定理可以用来证明模反元素必然存在。$a^\phi(n)=a*a^{\phi(n)-1}\equiv1\pmod{n}$，可以看到，a 的 φ(n)-1 次方，就是 a 的模反元素。

算法原理

RSA 算法基于一个事实：将两个大素数相乘十分容易，但是想要对其乘积进行因式分解却极其困难，因此可以将乘积公开作为加密密钥。根据欧拉定理可知：只需 e*d mod φ(n)=1，即可满足上式，如果我们选取素数 p,q，那么：n=p*q 容易计算，φ(n)=(p-1)*(q-1) 容易计算，很容易选取一个正整数 e，e 和 φ(n) 互质。当 e 和 φ(n) 互质时：由欧拉定理可很容易算出一个模反元素 d，满足 e*d mod φ(n)=1。

RSA 算法三个参数：n、e1、e2，n=p*q（p、q 为 2 个大质数）n 的二进制所占用的位数即秘钥的长度。e1 与 e2 是一对相关的值，e1 可以任意取，但要求 e1 与 (p-1)(q-1) 互质；要求 (e2 e1) mod ((p-1)(q-1))=1。(n,e1),(n,e2) 就是密钥对，其中 (n,e1) 为公钥，(n,e2) 为私钥。

RSA 的加密流程

非称加密算法的流程图：

在此可以看到，非对称加密是通过两个密钥（公钥-私钥）来实现对数据的加密和解密的。公钥用于加密，私钥用于解密。对于非对称的加密和解密为什么可以使用不同的密钥来进行，这些都是数学上的问题了。不同的非对称加密算法也会应用到不同的数学知识。上面也对 RSA 中使用的数学问题做了一个小小的介绍。现在就来看看 RSA 算法是怎么来对数据进行加密的吧，如下是一幅 RSA 加密算法流程及加密过程图。

Cryptography and Network Security 形象的描述了 RSA 流程：

+-------------------------------------------------------------------------------+ | Key Generation | | | | Select p, q p and q both prime, p != q | | Calculate n = p*q | | Calculate φ(n) = (p-1)*(q-1) | | Select integer e e is relatively primt to φ(n) | | Calculate d (d*e) mod n = 1 | | Public key PU = {e, n} | | Private key PR = {d, n} | +-------------------------------------------------------------------------------+ +-------------------------------------------------------------------------------+ | Encryption | | | | Plaintext M M< n | | Ciphertext C C = M^e mod n | +-------------------------------------------------------------------------------+ +-------------------------------------------------------------------------------+ | Decryption | | | | Ciphertext C | | Plaintext M M = C^d mod n | +-------------------------------------------------------------------------------+

RSA 的应用

RSA 作为非对称加密技术的代表，加解密的速度其实相当慢，只能对小块的数据进行加解密。但是其非对称的特点，满足公钥可以随处分发，只有公钥能解密私钥加密的数据，只有私钥能解密公钥加密的数据。所以很适合用来进行密钥分发和身份验证，这两个应用场景刚好相反。

用于对称秘钥分发的场景，其他人用公钥加密对称的秘钥，那么只有授权人才持有私钥，因此才能解密获得对应的秘钥，解决了 AES 密钥分发的难题；

对于身份验证的场景，授权人用私钥加密一段指令，其他人用公钥解密对应的数据，验证对应的指令与之前约定的某些特征一致，如果一致，那么可以确认这个指令就是授权人发出的。

Python 理应 PyCrypto 实现 RSA

RSA 公钥和私钥的生成

RSA 的密文是对代码明文的数字的 E 次方求 mod N 的结果。也就是将明文和自己做 E 次乘法，然后再将其结果除以 N 求余数，余数就是密文。RSA 是一个简洁的加密算法。E 和 N 的组合就是公钥（public key）。对于 RSA 的解密，即密文的数字的 D 次方求 mod N 即可，即密文和自己做 D 次乘法，再对结果除以 N 求余数即可得到明文。D 和 N 的组合就是私钥（private key）。算法的加密和解密还是很简单的，可是公钥和私钥的生成算法却不是随意的。使用 Pycrypto 生成秘钥对很简单，我们分别为 Master 和 Ghost 各生成一对属于自己的秘钥对。

from Crypto import Random from Crypto.PublicKey import RSA # 伪随机数生成器 random_generator = Random.new().read # rsa 算法生成实例 rsa = RSA.generate(1024, random_generator) # master 的秘钥对的生成 private_pem = rsa.exportKey() with open('master-private.pem', 'wb') as f: f.write(private_pem) public_pem = rsa.publickey().exportKey() with open('master-public.pem', 'wb') as f: f.write(public_pem) # ghost 的秘钥对的生成 private_pem = rsa.exportKey() with open('ghost-private.pem', 'wb') as f: f.write(private_pem) public_pem = rsa.publickey().exportKey() with open('ghost-public.pem', 'wb') as f: f.write(public_pem)

当我们执行后，会在当前目录生成公钥和私钥，所生成的私钥和公钥大概是这样的：

-----BEGIN RSA PRIVATE KEY----- MIICXgIBAAKBgQDOZ4ObgkZaH3ZexNj9WwAnXD4nDPBxPdyCSSehXvaM9ytSHpdP RefVtRysq1J866DgzXA+mUUHXEzRfvRQHqZrCenqgsb2FGnCA7SkbLOp5c92ZLPi DaET0/rZ7gkUCLZj1cRxXF8ZLyXgN7T8x7sAXyLa+tK0rt16UgOQuQbqjQIDAQAB AoGBAJED/15Z+E3HfyX0TbQrpH8C+xP6rlARs4TCGxrwmm7OFdy7a3mh1tG6Tqwu LmVgM4beL/d7Phl+yuYBuWs1LZwRkxDztLkVySxLQwL5VTDuV3NHT2/uHSIsaxHM r7xlDjyzeATSTAdxdRLDwZsVmboqf5Mbn0fzMJiFt3YL41mhAkEA3xPCwuLvCupc hJ3QIBc55rirYw9CGS4NAuH2PSgbev2i/RvdA5hBC/IS2bN8NGxniFLXRO+/f7E1 usVp5ZIlSQJBAOzd0yiny0RDWEizpDup+V1O+Jp+e8CJjaH+UWod0+pzISpiHPza KRAc3ezYe6uo7wDYjnb8kvOUhsilpfQ2TyUCQQCdN2QPzbgCzWEe5coEk9nuzT+c tOg0rsvkuDO+rkGP0KnKEJUXL3rIXHcEjwZ+O9hLr3af0wf3ioD/fJpBfVphAkEA kZBE2yA674l/cLZNQIlVgL0uVCtUu98MljfnKpKID/WOtTA0ZkNfptJGo+3qGnUn 49oxuve/C0gEiLwbv3e8rQJAN3EOF0pridWcKw5l06pG8nxzXJEWzfus0FX7qfdy RGGaehQAV4nqic/i88MivONjUb4+cSQbY8/Qq9xolxv++A== -----END RSA PRIVATE KEY-----

-----BEGIN PUBLIC KEY----- MIGfMA0GCSqGSIb3DQEBAQUAA4GNADCBiQKBgQDOZ4ObgkZaH3ZexNj9WwAnXD4n DPBxPdyCSSehXvaM9ytSHpdPRefVtRysq1J866DgzXA+mUUHXEzRfvRQHqZrCenq gsb2FGnCA7SkbLOp5c92ZLPiDaET0/rZ7gkUCLZj1cRxXF8ZLyXgN7T8x7sAXyLa +tK0rt16UgOQuQbqjQIDAQAB -----END PUBLIC KEY-----

当然每次运行的结果都不一定，公钥是公开的，任何人都可以看到，但是私钥一定要保存好，否则一旦泄露，意味着你的信息也不安全了。

加密与解密

通常通信的时候，发送者使用接受者的公钥加密，接受者使用接受者私钥解密。简而言之，Master给Ghost通信，需要加密内容，那么Ghost会生成一个秘钥对，Ghost的公钥ghost-public.pem和私钥ghost-private.pem。Ghost把公钥公开给发送者，任何人都可以用来加密，然后Master使用ghost-public.pem进行加密，然后把内容发给Ghost，Ghost再使用ghost-private.pem进行解密。

from Crypto.PublicKey import RSA from Crypto.Cipher import PKCS1_OAEP import base64 def encrypt(text): with open('ghost-public.pem') as f: rsa_key = RSA.importKey(f.read()) cipher = PKCS1_OAEP.new(rsa_key) encrypt_text = base64.b64encode(cipher.encrypt(text.encode("utf-8"))) return encrypt_text.decode("utf-8") def decrypt(encrypt_text): with open('ghost-private.pem') as f: rsa_key = RSA.importKey(f.read()) cipher = PKCS1_OAEP.new(rsa_key) text = cipher.decrypt(base64.b64decode(encrypt_text)) return text.decode("utf-8") if __name__ == "__main__": text = 'hello ghost, this is a pliantext' encrypt_text = encrypt(text) print(encrypt_text) decrypt_text = decrypt(encrypt_text) print(decrypt_text)

注意：

在使用RSA加密时，推荐使用PKCS1_OAE，PKCS1_V1_5可用于兼容老代码，但已不推荐使用。

RSA可以加密的单段数据长度受key的长度所限制，大量数据需分段加密。

根据RFC3447描述，若使用PKCS1_OAEP加密，单段数据最大长度mLen<=k-2hLen-2，若采用PKCS1_V1_5加密，则能够加密的明文最大mLen<=k-11。我们来计算下采用PKCS1_OAEP时，能加密的字符串的最大长度多少。

mLen<=k-2hLen-2中：

mLen：需要加密的字符串的长度

k：RSA key的位数（2048或1024）

hLen：使用的hash算法所输出的字节数，若未指定，则默认为SHA1，hLen=40。

所以当key长度为1024时，支持的最大长度为1024/8-2*20-2=86，当key长度为2048时，支持的最大长度为2048/8-2*20-2=214签名与验签

当然，对于窃听者，有时候也可以对伪造Master给Ghost发送内容。为此出现了数字签名。也就是Master给Ghost发送消息的时候，先对消息进行签名，表明自己的身份，并且这个签名无法伪造。具体过程即Master使用自己的私钥对内容签名，然后Ghost使用Master的公钥进行验签。

from Crypto.Signature import PKCS1_PSS from Crypto.Hash import SHA from Crypto.PublicKey import RSA import base64 def get_signature(message): with open('master-private.pem') as f: rsa_key = RSA.importKey(f.read()) digest = SHA.new() digest.update(message.encode("utf-8")) signer = PKCS1_PSS.new(rsa_key) signature = base64.b64encode(signer.sign(digest)) return signature.decode("utf-8") def verify_signature(message, signature): with open('master-public.pem') as f: rsa_key = RSA.importKey(f.read()) verifier = PKCS1_PSS.new(rsa_key) digest = SHA.new() digest.update(message.encode("utf-8")) is_verify = verifier.verify(digest, base64.b64decode(signature)) return is_verify if __name__ == "__main__": message = 'To be signed' signature = get_signature(message) print(signature) print(verify_signature(message, signature))

其中签名算法有PKCS1_PSS和PKCS1_v1_5

参考链接：https://www.dlitz.net/software/pycrypto/api/current/

总结

破解加密的难度除了跟加密方法有关，还跟密钥长度以及加密模式有很大的关系，就拿AES来说，有AES128和AES256（代表密钥长度），显然AES256的安全性能比AES128更高，而AES又要四种模式：ECB、CBC、CFB、OFB（代表加密模式）。RSA1024是属于非对称加密，是基于大整数因式分解难度，也就是两个质数相乘很容易，但是找一个大数的质因子非常困难。量子计算机时代，RSA有一定的破绽，因为利用shro's algorithm，量子计算机穷举计算质因子速度可以提高N个数量级，能够在有限的时间内破解RSA密钥，具体可以参考：超链接。

AES作为对称加密技术，加密速度很快。现在高端一点的CPU都带有AES-NI指令，可以极快的完成加密和解密。AES256目前没有明显的漏洞，唯一的问题就是如何安全的分发密钥。现在大部分的加密解密都是同时应用RSA和AES，发挥各自的优势，使用RSA进行密钥分发、协商，使用AES进行业务数据的加解密。

相关文章:

主题模型LDA(Latent Dirichlet Allocation)初探

HTML head & meta标签详解

Hive UDF的开发简介

游戏排名算法：Elo、Glicko、TrueSkill

加密解密算法之RC4

加密解密算法之RSA

非对称加密的发展历史

RSA的数学原理

RSA 的应用

Python 理应 PyCrypto 实现 RSA

总结

K-Means改进算法X-Means/G-Means

层次聚类方法ROCK

机器学习聚类算法之K-Medians

发表回复取消回复

加密解密算法之RSA

非对称加密的发展历史

RSA的数学原理

RSA 的应用

Python 理应 PyCrypto 实现 RSA

总结

K-Means改进算法X-Means/G-Means

层次聚类方法ROCK

机器学习聚类算法之K-Medians

发表回复 取消回复

发表回复取消回复