Redis和MySQL如何保证数据一致性

Redis 和 MySQL 保证数据一致性是一个在分布式系统设计中常见的挑战。由于 Redis 通常作为缓存（Cache）使用，而 MySQL 作为持久化数据库（Database），两者之间的数据同步需要精心设计。

没有一个银弹方案可以适用于所有场景，关键取决于你的业务对一致性级别（强一致性还是最终一致性）和性能的要求。

不一致通常发生在写操作过程中。当数据在 MySQL 中被修改后，如果 Redis 中的旧缓存没有被及时处理，后续的读请求就会读到脏数据。

以下是几种主流的解决方案，从简单到复杂。

这是最常用、最基础的策略。其核心原则是：程序只直接管理缓存的数据和有效期，不主动更新缓存，而是在读取时懒加载数据。

写流程 (Write)：
1. 先更新（或删除）MySQL 中的数据。
2. 然后，删除（Invalidate） Redis 中对应的缓存。
- 注意：是删除缓存，而不是更新它。这是一个关键点，目的是让下次读请求时再重新加载数据，避免在写过程中并发读导致缓存与数据库不一致。
读流程 (Read)：
1. 首先，从 Redis 中尝试读取数据。
2. 如果命中缓存（Cache Hit），直接返回数据。
3. 如果未命中缓存（Cache Miss），则从 MySQL 中读取数据。
4. 将从 MySQL 读取到的数据写入 Redis（方便下次读取），然后返回数据。

优点：

缺点：

如何优化不一致窗口？

在这个模式中，程序将 Redis 视为主要的数据源，所有的写操作都先经过缓存。

写流程 (Write)：
1. 先更新 Redis 中的缓存（如果数据不存在则创建）。
2. 再由 Redis 的自定义模块或应用程序同步地（Synchronously）将数据写入 MySQL。
- 注意：这个过程是阻塞的，必须等两边都写完才算成功。
读流程 (Read)：
1. 直接读取 Redis。如果 Redis 有数据（应该一直有，因为写操作会更新它），直接返回。

优点：

缺点：

这是大型互联网公司最常用的一种最终一致性方案，可靠性非常高。其核心是利用 MySQL 的 binlog (二进制日志) 作为数据变更的源头。

工作原理：
1. 应用程序只读写 MySQL。Redis 缓存的管理完全交给一个数据同步服务（如 Canal、Debezium）。
2. 这个同步服务伪装成 MySQL 的从库（Slave），订阅并解析 MySQL 的 binlog。
3. 当 MySQL 中有数据更新时，binlog 会记录这些变更。
4. 同步服务解析 binlog，识别出哪些表的数据发生了变更。
5. 同步服务调用接口或发送消息（到 MQ），删除 Redis 中对应的缓存键。

优点：

缺点：

策略	一致性级别	优点	缺点	适用场景
缓存失效 (Cache-Aside)	最终一致性	实现简单，缓存命中率高	存在不一致时间窗口	绝大多数业务场景，读多写少
写穿透 (Write-Through)	强一致性	数据一致性高，读性能好	实现复杂，写性能差	写操作较少，但要求强一致性的场景
异步同步 (Binlog)	最终一致性	应用解耦，可靠性高，性能好	系统复杂，有同步延迟	大型系统，对一致性要求不是实时强一致

操作顺序：在 Cache-Aside 中，一定是先更新数据库，再删除缓存。如果顺序反过来，在删除缓存后、更新数据库前，另一个读请求可能把旧的数据库值又加载到缓存了，导致不一致的时间窗口更长。
删除缓存失败：删除 Redis 缓存的操作可能会失败。一定要有重试机制。可以将删除命令放入消息队列（如 Kafka, RocketMQ），不断重试直到成功。这是保证最终一致性的关键。
缓存过期时间：给 Redis 中的每一个键都设置一个合理的过期时间（TTL）。这是最后的兜底方案。即使之前的删除操作全部失败，缓存最终也会因过期而消失，下次读取时就能拿到数据库的最新数据。这被称为 计划性过期。
复杂数据处理：对于需要复杂计算后写入缓存的数据（如聚合统计），不适合采用写穿透模式，更适合在 binlog 解析后由专门的服务计算好再写入 Redis。

对于大多数业务场景，推荐采用以下组合拳：

主方案：缓存失效模式 (Cache-Aside)。
增强可靠性：将删除缓存的操作放入消息队列进行异步重试，防止单次删除失败。
兜底方案：为缓存数据设置一个合理的过期时间 (TTL)。
进阶选择：当系统发展到一定规模，对一致性和性能要求更高时，可以考虑引入 Canal 等工具通过解析 binlog 来失效缓存，将应用与缓存彻底解耦。

没有完美的方案，只有最适合你当前业务和系统架构的方案。