RSA加密算法全解析：从数学原理到Python实现与安全实践

原创于 2026-06-27 12:46:42 发布 · 322 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#RSA算法 #非对称加密 #Python实现

1. 项目概述：从“黑盒”到“白盒”的RSA探索之旅

在信息安全领域，RSA非对称加密算法就像一座基石，支撑着现代互联网通信的信任体系。从你登录网站时看到的HTTPS小锁，到用SSH密钥免密登录服务器，再到数字签名验证软件包的完整性，背后几乎都有RSA的身影。然而，对于很多开发者来说，RSA常常是一个“黑盒”——我们知道调用某个库函数 RSA.encrypt() 就能加密， RSA.sign() 就能签名，但内部究竟如何运转，为何如此设计，遇到“密钥格式错误”、“不支持RSA密钥交换”这类报错时又该如何排查，往往一头雾水。这次，我决定彻底拆解这个“黑盒”，从数学原理到代码实现，从密钥生成到攻击防御，进行一次完整的“白盒化”学习与实践。目标很明确：不仅要会用，更要懂为什么这么用，以及怎么用得安全。

2. RSA核心原理的数学拆解：为何“正向容易逆向难”？

理解RSA，必须从它的数学心脏开始。它巧妙地将大数分解的困难性转化为了加密安全性的基石。

2.1 密钥生成的数学舞台：欧拉函数与模逆元

RSA的安全性建立在一个核心的“单向门”假设上：给定两个大质数p和q，计算它们的乘积n=p*q非常容易；但反过来，给定一个巨大的合数n，要找出它的质因数p和q，在计算上却极其困难。这就是大整数分解难题。

密钥生成的第一步，就是搭建这个舞台：

选择两个大质数p和q ：这是所有安全的基础。在实际应用中，p和q通常都是1024位或2048位的随机大质数，确保n的位数达到2048或4096位，以抵御当前的计算能力。
计算模数n ： n = p * q 。n的长度就是RSA密钥的长度，它将被公开。
计算欧拉函数φ(n) ： φ(n) = (p-1) * (q-1) 。欧拉函数φ(n)表示在小于n的正整数中，与n互质的数的个数。对于两个质数乘积的情况，计算非常简单。 注意：φ(n)是绝对的核心秘密，必须和p、q一起被严格保护，绝不能泄露。
选择公钥指数e ：选择一个整数e，满足 1 < e < φ(n) ，且e与φ(n)互质（即最大公约数gcd(e, φ(n)) = 1）。通常为了计算效率，会选择一个固定的小质数，比如 65537 (0x10001) 。这个数字在二进制下只有两个1，使得模幂运算非常快，且因其足够大，安全性也有保障。e是公钥的一部分，会被公开。
计算私钥指数d ：计算e对于φ(n)的模逆元d。即寻找一个整数d，满足 (e * d) mod φ(n) = 1 。这个d就是私钥的核心部分。计算d需要使用扩展欧几里得算法。

注意：这里有一个极其关键的认知点。很多人误以为私钥就是(p, q, d)的组合。实际上，在标准的RSA私钥存储格式（如PKCS#1）中，为了提升运算效率（特别是使用中国剩余定理CRT进行解密时），私钥通常包含更多信息： (n, e, d, p, q, dmp1, dmq1, iqmp) 。其中 dmp1 = d mod (p-1) , dmq1 = d mod (q-1) , iqmp = q^(-1) mod p 。当你遇到“私钥格式不正确”的错误时，很可能就是因为提供的私钥文件缺少了这些CRT参数，或者编码格式不对。

2.2 加密与解密的模幂运算：单向门的开关

公钥 (n, e) 和私钥 (n, d) 准备好后，加解密过程本质上就是模幂运算。

加密（用公钥） ：对于明文消息m（需要先将其转换为一个小于n的整数），计算密文c： c ≡ m^e (mod n) 。
解密（用私钥） ：对于密文c，计算明文m： m ≡ c^d (mod n) 。

其正确性由欧拉定理保证：因为 e*d ≡ 1 (mod φ(n)) ，所以存在整数k使得 e*d = 1 + k*φ(n) 。那么 c^d ≡ (m^e)^d ≡ m^(e*d) ≡ m^(1 + k*φ(n)) ≡ m * (m^φ(n))^k (mod n) 。根据欧拉定理，当m与n互质时， m^φ(n) ≡ 1 (mod n) ，因此上式等于 m (mod n) 。即使m与n不互质，通过中国剩余定理也能证明加解密依然成立。

这个过程的美妙之处在于， 正向运算（加密）只需要公钥(n, e)，而逆向运算（解密）必须要有私钥d 。由于从(n, e)推导出d需要知道φ(n)，而计算φ(n)又等价于分解n，只要n足够大且随机，这个逆向过程在有限时间内就是不可行的。

2.3 签名与验签：身份的“数字印章”

RSA的另一大用途是数字签名，其过程可以看作是加密的逆应用。

签名（用私钥） ：对消息的哈希值H(m)进行“解密”运算： s ≡ H(m)^d (mod n) 。这里生成的s就是签名。
验签（用公钥） ：对签名s进行“加密”运算，得到 s^e (mod n) ，然后与发送方提供的消息哈希值H(m)进行比较。如果相等，则证明签名有效，因为只有持有私钥d的人才能生成这样的s。

实操心得 ：永远不要直接用RSA对原始消息进行签名，一定要先哈希。原因有二：1. 安全性。直接签名可能遭受各种攻击（如盲签名攻击）。2. 效率。RSA运算很慢，而哈希运算很快，对固定长度的哈希值签名，效率更高且标准化。常见的组合是 RSA-SHA256 。

3. 从理论到实践：手搓一个简易RSA加密工具

理解了原理，最好的巩固方式就是动手实现一个简化版的RSA。这里我们用Python来演示核心过程，请注意，这仅用于教育目的，生产环境请务必使用成熟的密码学库（如 cryptography 、 PyCryptodome ）。

3.1 密钥生成的核心代码实现

我们将实现一个生成小型RSA密钥对的函数，重点在于展示扩展欧几里得算法。

import random
from math import gcd

def extended_gcd(a, b):
    """扩展欧几里得算法，返回 (gcd, x, y) 使得 a*x + b*y = gcd(a, b)"""
    if b == 0:
        return a, 1, 0
    else:
        g, x1, y1 = extended_gcd(b, a % b)
        x = y1
        y = x1 - (a // b) * y1
        return g, x, y

def modinv(e, phi):
    """计算 e 模 phi 的乘法逆元 d"""
    g, x, _ = extended_gcd(e, phi)
    if g != 1:
        raise Exception('e 和 φ(n) 不互质，逆元不存在')
    else:
        return x % phi

def generate_rsa_keypair(bit_length=128):
    """生成简化版RSA密钥对（bit_length较小，仅用于演示）"""
    # 1. 生成两个质数（这里使用简单方法，实际应用应使用密码学安全的随机质数生成）
    # 警告：此方法不安全！仅用于演示。
    def is_prime(num):
        if num < 2:
            return False
        for i in range(2, int(num**0.5)+1):
            if num % i == 0:
                return False
        return True

    p = q = 1
    while not is_prime(p):
        p = random.getrandbits(bit_length//2)
    while not is_prime(q) or q == p:
        q = random.getrandbits(bit_length//2)

    # 2. 计算 n 和 φ(n)
    n = p * q
    phi = (p-1) * (q-1)

    # 3. 选择公钥指数 e
    e = 65537
    while gcd(e, phi) != 1:
        # 极低概率事件，如果发生，重新选e（或重新生成p,q）
        e = random.randrange(3, phi, 2)

    # 4. 计算私钥指数 d
    d = modinv(e, phi)

    # 公钥 (n, e), 私钥 (n, d)
    public_key = (n, e)
    private_key = (n, d)
    # 实际私钥还应包含p, q等用于CRT加速的参数，此处省略
    return public_key, private_key, p, q

# 示例：生成一个微型密钥对
public_key, private_key, p, q = generate_rsa_keypair(32)
print(f"公钥 (n, e): {public_key}")
print(f"私钥 (n, d): {private_key}")
print(f"秘密质数 p, q: {p}, {q}")

3.2 加密与解密的实现及注意事项

接下来实现最核心的模幂运算。直接计算 m^e mod n 在指数很大时会溢出且极慢，必须使用快速模幂算法（平方-乘算法）。

def mod_pow(base, exponent, modulus):
    """快速模幂运算：计算 (base^exponent) % modulus 的高效算法"""
    result = 1
    base = base % modulus
    while exponent > 0:
        # 如果当前指数位为1，则将当前的base乘入结果
        if exponent & 1:
            result = (result * base) % modulus
        # 将base平方，并右移指数一位
        base = (base * base) % modulus
        exponent >>= 1
    return result

def rsa_encrypt(message_int, public_key):
    """RSA加密：明文整数 -> 密文整数"""
    n, e = public_key
    if message_int < 0 or message_int >= n:
        raise ValueError("明文整数必须满足 0 <= m < n")
    cipher_int = mod_pow(message_int, e, n)
    return cipher_int

def rsa_decrypt(cipher_int, private_key):
    """RSA解密：密文整数 -> 明文整数"""
    n, d = private_key
    message_int = mod_pow(cipher_int, d, n)
    return message_int

# 示例：加密一个小的数字
public_key, private_key, _, _ = generate_rsa_keypair(64) # 使用稍大的密钥
message = 42
print(f"原始消息: {message}")

cipher = rsa_encrypt(message, public_key)
print(f"加密后的密文: {cipher}")

decrypted = rsa_decrypt(cipher, private_key)
print(f"解密后的消息: {decrypted}")
print(f"加解密是否成功: {message == decrypted}")

重要提示 ：以上代码是极度简化的教学模型。 绝对不要 将其用于任何真实的数据加密，因为它存在严重的安全缺陷：

质数生成不安全 ：使用了非密码学安全的随机数和低效的质数检测方法。
没有填充方案 ：直接对整数进行加密，这被称为“教科书式RSA”或“裸RSA”，极易受到多种攻击（如通过加密相同明文推测内容）。
密钥管理缺失 ：没有处理密钥的序列化、存储、格式（如PEM）。
仅支持整数 ：没有处理文本或字节到整数的编码（如OAEP填充中的PSA编码）。

4. 工业级实践：使用标准库进行安全的RSA操作

在实际开发中，我们永远应该使用经过严格审计的密码学库。下面以Python的 cryptography 库为例，展示正确做法。

4.1 密钥生成与序列化

from cryptography.hazmat.primitives.asymmetric import rsa
from cryptography.hazmat.primitives import serialization

# 1. 生成安全的RSA私钥（默认2048位）
private_key = rsa.generate_private_key(
    public_exponent=65537,
    key_size=2048,
)

# 提取公钥
public_key = private_key.public_key()

# 2. 序列化私钥为PEM格式（PKCS#8，加密存储）
private_pem = private_key.private_bytes(
    encoding=serialization.Encoding.PEM,
    format=serialization.PrivateFormat.PKCS8,
    encryption_algorithm=serialization.BestAvailableEncryption(b'mypassword') # 使用密码保护
)
print("加密的私钥PEM:")
print(private_pem.decode())

# 3. 序列化公钥为PEM格式（SPKI）
public_pem = public_key.public_bytes(
    encoding=serialization.Encoding.PEM,
    format=serialization.PublicFormat.SubjectPublicKeyInfo
)
print("\n公钥PEM:")
print(public_pem.decode())

# 4. 从PEM文件加载密钥
from cryptography.hazmat.primitives.serialization import load_pem_private_key, load_pem_public_key

# 加载加密的私钥（需要密码）
loaded_private_key = load_pem_private_key(
    private_pem,
    password=b'mypassword',
)

# 加载公钥
loaded_public_key = load_pem_public_key(public_pem)

4.2 加密解密与OAEP填充

cryptography 库强制使用OAEP（最优非对称加密填充）等安全填充方案，杜绝了“裸RSA”。

from cryptography.hazmat.primitives.asymmetric import padding
from cryptography.hazmat.primitives import hashes

# 待加密的原始数据（必须是字节）
message = b"This is a secret message that needs to be encrypted."

# 1. 使用公钥加密（OAEP with SHA-256）
ciphertext = public_key.encrypt(
    message,
    padding.OAEP(
        mgf=padding.MGF1(algorithm=hashes.SHA256()),
        algorithm=hashes.SHA256(),
        label=None # 通常为None
    )
)
print(f"密文长度: {len(ciphertext)} bytes") # 对于2048位密钥，密文固定为256字节

# 2. 使用私钥解密
decrypted_message = private_key.decrypt(
    ciphertext,
    padding.OAEP(
        mgf=padding.MGF1(algorithm=hashes.SHA256()),
        algorithm=hashes.SHA256(),
        label=None
    )
)
print(f"解密后的消息: {decrypted_message.decode()}")

4.3 签名与验签

from cryptography.hazmat.primitives.asymmetric import padding as sig_padding

# 待签名的消息
data = b"Important contract data."

# 1. 使用私钥签名（PSS padding is recommended）
signature = private_key.sign(
    data,
    sig_padding.PSS(
        mgf=sig_padding.MGF1(hashes.SHA256()),
        salt_length=sig_padding.PSS.MAX_LENGTH
    ),
    hashes.SHA256()
)
print(f"签名长度: {len(signature)} bytes")

# 2. 使用公钥验签
try:
    public_key.verify(
        signature,
        data,
        sig_padding.PSS(
            mgf=sig_padding.MGF1(hashes.SHA256()),
            salt_length=sig_padding.PSS.MAX_LENGTH
        ),
        hashes.SHA256()
    )
    print("验签成功！签名有效。")
except Exception as e:
    print(f"验签失败！签名无效或数据被篡改。错误: {e}")

5. 深入场景：SSH密钥、HTTPS与常见报错排查

理解了基础操作，我们就能更好地理解RSA在真实场景中的应用和遇到的问题。

5.1 SSH密钥交换： `ssh-keygen -t rsa` 的背后

当你执行 ssh-keygen -t rsa -C "your_email@example.com" 时，系统就是在本地生成一对RSA密钥。 -t rsa 指定算法， -C 是注释。生成的 id_rsa （私钥）和 id_rsa.pub （公钥）就是遵循特定格式的RSA密钥对。

为什么现在常建议使用 ed25519 而非 RSA ？ 这与网络热词“禁用 RSA key exchange”相关。传统的SSH RSA密钥交换协议存在一些弱点（如需要依赖服务器存储的主机密钥）。而基于椭圆曲线的 ed25519 算法，在相同安全强度下密钥更短、速度更快、且被认为更能抵抗某些类型的侧信道攻击。因此，在新版OpenSSH中，默认可能会禁用较老的、纯RSA的密钥交换方式，转而支持将RSA用于签名（如 ecdh-sha2-nistp256 配合 rsa-sha2-512 ），或直接使用 ed25519 。如果你遇到连接失败并提示“不支持RSA密钥交换”，通常需要在SSH客户端或服务端配置中启用相关算法（如 KexAlgorithms +rsa-sha2-512 ），但更长期的解决方案是迁移到 ed25519 密钥。

5.2 HTTPS中的RSA：握手与证书

在HTTPS握手（TLS/SSL）中，RSA曾长期被用于两种目的：

密钥交换 ：客户端生成一个预主密钥，用服务器的RSA公钥加密后发送。服务器用私钥解密得到该密钥，双方再据此生成会话密钥。这就是“RSA密钥交换”。
身份认证 ：服务器证书中的公钥通常是RSA公钥，客户端用它来验证服务器用对应私钥所做的签名。

然而，纯粹的RSA密钥交换有一个缺点：它不具备 前向保密性 。如果服务器的私钥在未来被泄露，过去所有截获的加密通信都能被解密。因此，现代TLS（如1.3）已经 完全禁用 了RSA密钥交换，转而使用基于迪菲-赫尔曼（DHE）或椭圆曲线迪菲-赫尔曼（ECDHE）的密钥交换，这些算法能实现前向保密。RSA在TLS 1.3中仅保留用于证书签名验证。这就是为什么你会看到类似“ ecdhe_rsa ”的密码套件名——它表示使用ECDHE进行密钥交换，使用RSA进行身份认证。

5.3 常见错误与实战排查指南

结合网络热词，我们梳理几个高频问题：

1. “RSA签名遭遇异常，请检查私钥格式是否正确。不正确的长度”

原因：这通常意味着你提供的私钥数据与算法期望的格式或长度不匹配。
排查：
- 检查密钥文件 ：确认文件是完整的PEM格式（以 -----BEGIN PRIVATE KEY----- 开头）或PKCS#8格式。用文本编辑器打开看看是否有损坏或多余字符。
- 检查密码 ：如果私钥是加密的，确保提供的密码正确。
- 检查算法匹配 ：确保你试图用RSA私钥去验证一个RSA签名，而不是ECDSA等其他算法。
- 使用命令行工具验证 ：可以用 openssl rsa -in your_key.pem -check -noout 来检查RSA私钥的完整性。

2. “目标主机支持RSA密钥交换【原理扫描】”

解读：这是安全扫描工具（如Nessus, OpenVAS）的常见发现。它不是一个错误，而是一个 安全提示 。它告诉你目标服务器在SSH或TLS服务中，仍然支持被认为不够安全或已过时的纯RSA密钥交换算法。
行动：对于安全要求高的环境，应按照安全基线要求，在服务器配置中禁用不安全的密钥交换算法。例如，在SSH的 sshd_config 中，可以配置 KexAlgorithms 来排除 diffie-hellman-group1-sha1 等弱算法，优先使用 curve25519-sha256 或 ecdh-sha2-nistp521 。

3. “buuctf rsa rrrrsa”

背景：这是CTF（夺旗赛）中常见的RSA题目类型名称。CTF中的RSA题目往往故意设置“不安全”的参数，考察选手对RSA各种攻击手段的理解。
关联学习 ：这类题目是绝佳的实战练习场。它们可能涉及：
- 小公钥指数攻击（e很小，如e=3） ：如果加密时未填充，可以直接开e次方根恢复明文。
- 共模攻击 ：同一明文用不同的公钥(n1, e)和(n2, e)加密，且n1和n2互质，可以恢复明文。
- 因数分解攻击 ：当n较小（如512位）或质数p、q生成不随机（过于接近）时，可以通过工具（如yafu、factordb）快速分解n。
- 维纳攻击 ：当私钥d较小时，可以通过连分数逼近法在多项式时间内破解。
- 选择密文攻击 ：利用服务器对错误密文的反应（如返回解密失败或成功）来推测信息。通过解这些题目，能极大地加深对RSA脆弱环节的认识。

6. RSA的安全边界与最佳实践总结

经过这一轮从原理到实战的拆解，我们应该对RSA建立起一个立体而清醒的认知。

RSA的安全边界完全依赖于大整数分解的难度 。目前，2048位的RSA密钥被认为是安全的，但学术界普遍认为，随着量子计算机的发展，Shor算法能在理论上多项式时间内破解RSA，因此后量子密码学（PQC）是未来的方向。NIST已开始标准化PQC算法。

在当下，安全使用RSA必须遵循以下铁律：

使用足够长的密钥 ：2024年的今天， 绝对不要使用低于2048位的密钥 。对于需要长期保密的数据，应考虑使用3072或4096位。1024位密钥已被证明可在一定成本下被破解。
永远使用安全的填充方案 ：加密必须用OAEP，签名推荐用PSS。绝对杜绝“教科书式RSA”。
使用密码学安全的随机数生成器 ：密钥生成、填充中的随机盐等，都必须使用操作系统或硬件提供的密码学安全随机源（如 /dev/urandom , CryptGenRandom , SecureRandom ）。
保护私钥如同保护生命 ：私钥必须加密存储，设置强密码。访问私钥的代码和环境必须安全。定期轮换密钥。
理解协议中的角色 ：在现代协议（如TLS 1.3）中，RSA可能已不再用于密钥交换，仅用于签名。配置服务时，应遵循最新安全建议，禁用不安全的算法套件。
考虑替代方案 ：对于新系统，可以考虑使用基于椭圆曲线的算法，如 ed25519 （签名）和 X25519 （密钥交换）。它们更高效、密钥更短，且通常被认为具有更好的安全属性。

最后，回到我们手搓代码的经历，它最大的价值不是造出了一个可用的轮子，而是让你在调用 encrypt 和 sign 这些高级API时，能清晰地看到脚下坚实的数学地基和周围可能存在的陷阱。当“私钥格式错误”的异常抛出时，你想到的不再是盲目搜索，而是PKCS#1和PKCS#8格式的区别；当看到“禁用RSA密钥交换”的警告时，你理解这背后是前向保密的安全理念在演进。这才是深入学习的意义——从“会用”走向“懂行”，在纷繁复杂的现象背后，抓住那条不变的、由数学和工程共同构筑的安全防线。