新浪微博redis优化历程

格式：pdf
大小：14.69 MB
文档页数：36

下载文档原格式

/ 36

Redis缓存预热：系统启动期的优化技术

Redis缓存预热：系统启动期的优化技术Redis 缓存预热是一种优化技术，用于在系统启动时提前将所需的数据加载到缓存中，以减少对数据库的直接访问，提高系统的性能和响应速度。

以下是 Redis 缓存预热的详细解释：1.为什么需要缓存预热？在系统启动时，缓存通常是空的。

如果大量请求直接访问缓存，而缓存中没有所需的数据，那么这些请求将不得不直接查询数据库。

这会导致数据库压力增大，影响系统的性能和稳定性。

因此，通过缓存预热，我们可以提前将常用的数据加载到缓存中，避免在系统启动初期产生大量的数据库访问请求。

2.如何进行缓存预热？缓存预热通常在系统启动时或预定的时间点进行。

具体步骤如下：（1）确定需要预热的数据：首先需要确定哪些数据需要在系统启动前加载到缓存中。

这些数据通常是经常被访问的热点数据。

（2）加载数据到缓存：可以使用程序或脚本将数据从数据库或其他数据源加载到Redis 缓存中。

加载数据的过程可以在系统启动时或在预定的时间点执行。

（3）监控缓存状态：在缓存预热完成后，需要监控缓存的状态，确保数据已经被正确地加载到缓存中，并且能够满足系统的需求。

3.缓存预热的优点和注意事项：（1）优点：可以提高系统的性能和响应速度；减少对数据库的直接访问，降低数据库的压力；可以预先加载必要的热点数据，避免在系统运行时再进行数据加载。

（2）注意事项：需要合理地选择预热的数据，避免加载过多的无用数据；预热过程可能需要消耗一定的时间和资源，需要根据实际情况进行权衡；需要定期更新缓存数据，以确保数据的实时性和准确性。

总之，Redis 缓存预热是一种有效的优化技术，可以提高系统的性能和响应速度，减少对数据库的直接访问。

在实际应用中，需要根据实际情况进行合理的配置和使用。

(Redis缓存)Redis内存优化与性能调优

(Redis缓存)Redis内存优化与性能调优Redis内存优化与性能调优Redis是一款开源的高性能键值对存储数据库，被广泛应用于缓存、队列和数据场景中。

然而，随着数据量的增加，Redis的内存占用可能成为性能瓶颈。

因此，进行Redis内存优化与性能调优是非常必要的。

本文将从几个方面介绍如何进行Redis内存优化与性能调优。

一、使用适当的数据结构Redis提供了多种数据结构如字符串、列表、哈希、集合和有序集合等。

不同的数据结构对内存的占用有所不同。

在使用时，要根据业务需求选择最适合的数据结构。

比如，字符串和哈希适用于存储小而简单的数据，列表适用于存储多个有序的元素。

二、优化过期键过期策略过期键是指存储在Redis中已经过期的键。

对于过多的过期键，会占用宝贵的内存空间。

建议在使用过程中，合理设置过期时间，定期进行过期键清理操作。

可以通过Redis的过期算法进行配置优化，如使用主动删除策略或惰性删除策略。

三、使用内存碎片整理Redis的内存碎片是指大量的内存空间被细小的碎片所占据，无法有效利用。

内存碎片会导致Redis的内存占用率较高，影响性能。

可以使用Redis提供的"MEMORY DOCTOR"命令对内存碎片进行整理，提高内存的利用率。

四、限制内存使用Redis提供了maxmemory参数，可按需限制Redis实例的内存使用量。

当内存达到上限时，可以使用相应的淘汰策略进行数据清理。

常用的淘汰策略包括LRU（最近最少使用）和LFU（最近最少频率）等。

根据业务需求和数据访问模式，选择合适的淘汰策略进行配置。

五、使用持久化方式Redis提供了RDB（Redis Database）持久化和AOF（Append Only File）持久化两种方式。

RDB持久化是通过将内存中的数据定期快照到磁盘上，而AOF持久化则是将每个操作命令追加到磁盘文件中。

通过选择合适的持久化方式，可以在保证数据安全的同时，降低内存占用。

Redis数据库在微博系统中的实践

【）微博架构中的角色对象一
如ＭｎｏＢ等来保存持久的信息值。除非客户ｏｇＤ端需要数据，我们再进行查询和返回信息。（）微博中消息对象二１．发布的消息和回复的评论
发布的消息具有自己的唯一标识，消息内容，发布人和创建时间等基本内容。回复的评论也具有自己的唯一标识，消息内容，以及回复人和创建时间等基本内容。】除了以上两种，消息还可以进行转发，也就是消息嵌套消息，但是可以把转发的内容放入到
一
、
选择适合微博系统的数据库
二、Ｒｄｓｅｉ的键值的格式定义
Ｒｄｓｅｉ的数据在内存中始终是以ｋｙ值作为ｅ
微博系统其实是一个类似群聊的庞大在线聊天室，由于每时每刻都有大量的实时消息产生，
并且需要即时反馈给各个用户，所以需要保持更快的速度来读写数据。传统的关系型数据库在数据量超过规模的时候，由于其自身的关系型系统逻辑相对复杂，也就导致了读写速度的下降。
第１４卷
第３期
厦门城市职业学院学报
ＪｕｎｌｏａｎＣｔｃｔｎｌＣｏｅｅｏｒａｆＸｉｍｅｉＶｏａｉａｌｇｙｏｌ
Ｖ０．４Ｎ．１１ｏ３
Ｓｐ．０１ｅ２２
２１０２年９月
Ｒｄｓ据库在微博系统中的实践ｅｉ数
２粉丝．
条新的消息中，不用进行递归嵌套，只需要显综上所述，需要设计３个。

Redis基本原理优化和应用示例

Redis基本原理优化和应用示例Redis采用键值对的数据结构，数据存储在内存中，因此读写性能非常高。

其底层采用单线程模型，所有的操作都在一个线程中执行，避免了线程切换带来的开销。

同时，Redis使用了事件驱动的I/O模型，通过多路复用技术来实现高并发。

Redis的数据结构主要包括字符串（String）、列表（List）、哈希（Hash）、集合（Set）、有序集合（Sorted Set）等。

除了基本的读写操作，Redis还支持对数据进行批量操作、事务、发布订阅等高级功能。

1. 内存优化：由于Redis的数据存储在内存中，因此内存的使用是一个重要的优化点。

可以通过压缩数据、使用合适的数据结构、设置合理的过期时间等方式来减少内存的占用。

2. 持久化优化：Redis提供了两种持久化机制，即RDB（Redis Database）和AOF（Append Only File）。

RDB是将内存中的数据周期性地保存到磁盘上，而AOF是将所有的写操作追加到文件中。

在选择持久化方式时，需要根据业务需求权衡性能和数据安全性。

3. 高可用性优化：Redis提供了主从复制和哨兵机制来实现高可用性。

主从复制可以将主节点的数据同步到从节点上，从而实现读写分离和故障转移。

而哨兵机制则用于监控节点的状态，并在主节点故障时选择一个合适的从节点作为新的主节点。

4.预防缓存穿透：缓存穿透是指缓存中没有所请求的数据，导致请求一直落到后端存储系统上，可能引起后端存储系统的压力过大。

可以通过在缓存中加入空对象或者使用布隆过滤器来预防缓存穿透。

1. 缓存：Redis最常见的应用场景就是作为缓存使用，将热点数据存储在内存中，从而提高读写性能。

通过使用Redis的过期时间设置和LRU算法，可以实现缓存的自动失效和自动逐出。

2. 排行榜：由于Redis在有序集合（Sorted Set）结构上的支持，可以很方便地实现排行榜功能。

将用户的得分作为有序集合的分数，用户的ID作为成员，即可实现按照得分排序的排行榜。

Redis缓存的性能优化与调优技巧

Redis缓存的性能优化与调优技巧Redis是一种高性能、基于内存的Key-Value存储系统，被广泛应用于缓存、队列、消息中间件等场景。

为了确保应用的性能和可靠性，合理地优化和调优Redis缓存是非常重要的。

本文将介绍一些Redis缓存的性能优化与调优技巧，旨在提高系统的吞吐量和响应速度。

一、减少网络开销由于Redis通常是作为独立的服务器运行，应用需要通过网络连接Redis来读写数据。

为了减少网络开销，可以采取以下措施：1. 使用连接池：通过维护一个连接池，应用程序可以重复使用已建立的Redis连接，避免频繁地创建和关闭连接，从而减少网络开销。

2. 批量操作：通过将多个命令合并成一个批量操作，可以减少网络往返的次数，提高系统性能。

二、选择合适的数据结构Redis提供了多种数据结构，如字符串、列表、哈希、集合和有序集合。

选择合适的数据结构可以提高系统的性能和效率：1. 字符串：适用于存储单个数值或者较小的数据块。

2. 列表：适用于按照先后顺序存储一系列数据，可以实现消息队列的功能。

3. 哈希：适用于存储对象的字段和值，可以快速读写单个字段。

4. 集合：适用于存储无序并且唯一的元素集合。

5. 有序集合：适用于存储有序的元素集合，并可以根据指定条件快速地获取部分元素。

三、优化内存使用由于Redis是基于内存的存储系统，内存的使用情况直接影响系统的性能和可扩展性。

以下是一些优化内存使用的技巧：1. 合理设置过期时间：对于不需要长期存储的数据，可以设置适当的过期时间，让Redis自动删除过期的数据。

2. 使用压缩列表：压缩列表是一种紧凑存储多个元素的数据结构，在某些场景下可以减少内存的占用。

3. 分批导入数据：当需要导入大量数据到Redis中时，可以将数据分批导入，避免一次性导入导致内存溢出。

四、合理配置持久化机制Redis提供了多种持久化机制，如RDB快照和AOF日志。

通过合理配置持久化机制可以提高系统的数据可靠性和恢复能力：1. 调整RDB快照策略：RDB快照是将Redis数据保存到硬盘上的一种持久化方式。

Redis数据库的性能优化技巧

Redis数据库的性能优化技巧Redis是一款流行的内存数据库，具有高性能和灵活性等特点。

但是，在使用Redis期间，我们可能会遇到性能问题。

为解决这些问题，我们需要一些性能优化的技巧。

本文将介绍一些常用的Redis性能优化技巧，以帮助您提高Redis数据库的性能。

1. 使用持久化方式Redis支持两种持久化方式：RDB和AOF。

在RDB持久化方式中，Redis将时间点快照保存在磁盘上；在AOF持久化方式中，Redis保存每个写操作的日志，并在Redis重启时将它们重新执行。

虽然这两种持久化方式各有利弊，但我们通常建议使用AOF，因为它可以确保即使Redis崩溃，也可以在重新启动时恢复最新的状态。

2. 使用合适的数据结构Redis支持多种数据结构，如字符串、哈希表、列表、集合和有序集合等。

在使用Redis时，我们应该选择最适合我们应用程序需求的数据类型和命令。

例如，如果我们需要使用键-值对，那么字符串可能是最好的选择；而如果我们需要使用类似于SQL的查询，那么哈希表可能是更好的选择。

使用正确的数据结构可以使Redis查询更快，而使用不正确的数据结构则会浪费宝贵的内存和CPU时间。

3. 将热点键存储在内存中Redis的内存是有限的，因此我们需要根据我们的需求使用Redis的内存。

如果我们有一些非常频繁地访问的键，我们应该将它们存储在内存中。

我们可以使用Redis的LRU算法（最近最少使用）来确保最常用的键始终保留在内存中，而不是被从内存中移除。

4. 分布式Redis具有分布式特性，这意味着我们可以将数据存储在多个Redis节点中。

这样，我们可以将负载分摊到多个节点上，从而提高Redis的性能。

在使用Redis分布式时，我们应该选择最适合我们应用程序需求的分片和复制策略。

例如，如果我们需要高读取性能，我们可以选择将数据复制到多个节点，而不是分片。

5. 使用管道Redis的管道是Redis提供的一种高性能命令执行方式。

Redis缓存的数据压缩与存储优化技术探索

Redis缓存的数据压缩与存储优化技术探索在现代软件开发中，缓存是一项广泛应用的技术，旨在提高应用程序的性能和响应速度。

Redis是一种常用的缓存解决方案，它具有高性能、灵活性和可靠性的特点。

然而，随着数据量的增长，缓存的存储成本也成为了一个问题。

为了解决这个问题，我们需要探索Redis缓存的数据压缩与存储优化技术。

一、压缩算法的选择在Redis中，数据压缩是通过使用压缩算法来减少存储空间的。

常见的压缩算法有Gzip、Snappy、LZ4等。

选择合适的压缩算法需要综合考虑压缩比率、压缩速度以及解压速度等因素。

在一些场景中，如果数据的压缩和解压速度很重要，可以选用Snappy或LZ4等快速压缩算法。

而在另一些场景中，如果存储空间非常宝贵，可以选择压缩比例更高的算法，如Gzip。

需要根据具体的应用场景和需求来选择合适的压缩算法。

二、压缩级别的调整除了选择合适的压缩算法，我们还可以通过调整压缩级别来平衡压缩比和压缩速度。

一般来说，压缩级别越高，压缩比例就越高，但同时也会增加压缩和解压的时间成本。

在Redis中，常见的压缩级别有1到9。

可以根据实际需求，通过测试和评估来选择合适的压缩级别。

如果对存储空间要求较高，可以选择较高的压缩级别；如果对性能要求较高，可以选择较低的压缩级别。

三、数据类型的选择在Redis中，不同的数据类型对于数据压缩的效果有所差异。

例如，字符串类型的数据通常可以获得较好的压缩效果，而哈希类型和有序集合类型的数据则很难获得较好的压缩效果。

因此，在设计数据模型时，可以根据数据类型的特点来选择合适的压缩方案。

对于可压缩的数据类型，可以采用较为激进的压缩策略；而对于不易压缩的数据类型，则可以考虑采用较为保守的压缩策略或者直接不进行压缩。

四、数据热度的考虑在Redis中，数据的热度对于数据压缩的效果也有较大的影响。

热数据通常是指经常被访问的数据，而冷数据则是指很少被访问的数据。

对于热数据，采用较低的压缩级别可以平衡性能和存储空间；而对于冷数据，可以选择更高的压缩级别来节省存储空间。

Redis缓存优化分布式推荐系统的实时推荐

Redis缓存优化分布式推荐系统的实时推荐随着互联网的快速发展，越来越多的应用场景需要实现实时推荐功能。

在这些场景中，分布式推荐系统被广泛应用，以满足大量用户的实时推荐需求。

然而，在实时推荐系统中，数据的处理速度往往成为瓶颈，影响着用户的体验。

为了提高实时推荐系统的性能，Redis缓存技术被引入并优化。

一、Redis缓存技术介绍Redis是一个开源的内存数据库，其具有高性能、高并发、支持多种数据结构等特点，非常适用于缓存场景。

在分布式推荐系统中，Redis可以用作缓存层，将频繁读取的数据存储在内存中，提高数据的读取速度。

二、Redis缓存优化分布式推荐系统的原理在分布式推荐系统中，实时推荐往往依赖于快速读取和处理大量的用户数据。

通过引入Redis缓存，可以将经常使用的数据存储在内存中，减少数据库的查询压力，并提高数据的读取速度。

同时，Redis还支持数据的持久化，可以将数据写入磁盘，保证数据的可靠性。

三、Redis缓存优化实时推荐系统的实践1. 数据预热：在系统启动的时候，可以将热门的数据预先加载到Redis缓存中，减少用户首次读取数据的等待时间。

2. 缓存更新策略：针对分布式推荐系统中频繁更新的数据，可以采用定时更新或异步更新的方式，避免频繁更新Redis缓存，提高系统的性能。

3. 缓存淘汰策略：为了防止Redis缓存占用过多内存，可以采用LRU（最近最少使用）或LFU（最不经常使用）等淘汰策略，定期清理不常用的数据。

4. 命中率监控：监控Redis缓存的命中率，通过统计命中率可以评估缓存的效果，并调整缓存策略。

5. 分布式部署：为了提高系统的可用性和负载均衡能力，可以将Redis缓存进行分布式部署，在多台机器上同时存储缓存数据，提高读取速度和系统的稳定性。

四、Redis缓存优化分布式推荐系统的效果通过引入Redis缓存技术，可以显著提高分布式推荐系统的读取性能。

在实际应用中，许多公司已经使用Redis缓存来优化推荐系统，并取得了较好的效果。

Redis缓存管理优化技巧

Redis缓存管理优化技巧缓存是提高系统性能和响应速度的重要手段之一。

而Redis作为一种高性能的缓存数据库，被广泛应用于各类应用程序中。

本文将介绍一些Redis缓存管理的优化技巧，以帮助开发者更好地利用Redis提升系统性能。

一、合理设置缓存过期时间在使用Redis缓存时，我们需要合理设置缓存的过期时间。

如果过期时间设置得太短，会导致频繁的缓存失效和重新加载，增加系统的负担；而过期时间设置得太长，则可能导致缓存数据过期而不被更新，从而引发数据不一致的问题。

针对不同的业务场景，我们可以根据数据的更新频率和重要性来设置不同的过期时间。

对于频繁更新的数据，可以设置较短的过期时间，以保证数据的实时性；而对于不经常更新的数据，可以设置较长的过期时间，以减少缓存的失效和重新加载次数。

二、使用合适的数据结构Redis提供了多种数据结构，如字符串、哈希表、列表、集合和有序集合等。

在选择数据结构时，需要根据具体的业务需求来进行选择，以提高数据的存取效率。

例如，对于一些需要频繁更新的数据，可以使用哈希表来存储，以便快速地更新和查询特定字段的值；对于需要按照某个顺序进行排序的数据，可以使用有序集合来存储，以便快速地获取排名靠前或靠后的数据。

三、使用Pipeline批量操作在进行大量的读写操作时，使用Pipeline可以显著提高Redis的性能。

Pipeline可以将多个命令打包成一个请求发送给Redis服务器，减少了网络通信的开销和客户端和服务器之间的往返时间。

通过使用Pipeline，可以将多个读取操作或写入操作打包在一起，一次性发送给Redis服务器，从而减少了通信的次数，提高了系统的吞吐量和响应速度。

四、使用位图进行布隆过滤器布隆过滤器是一种高效的数据结构，用于判断一个元素是否存在于一个集合中。

在某些场景下，我们需要判断某个元素是否存在于缓存中，而不需要实际获取该元素的值。

这时，可以使用Redis的位图数据结构来实现布隆过滤器。

TUP第二期新浪杨卫华：谈微博Cache设计

杨为华：我们就是时间排序，最简单的方法，我们没有找到更好的算法之前。
提问：不是根据一些热点？
杨为华：我们也考虑过那个方向，但是我们认为挑战性非常大，你认为好的方法用户不一定认可，这个挑战很大。你用算法做一些东西，但是用户认为不重要的东西，如果用户没有展示，用户可能也会有其他看法。为什么用复合模式，我们也不知道为什么叫复合模式，我们根据实时运行情况，发现哪里有瓶颈我们会想到更好的方法解决。这个瓶颈，能不能给在线用户加一个什么东西，减少系统压力，不影响原来的价值，主要处于每个性能模块的角度考虑的。
最早我们新浪曾经有一个DB产品，刚开始做通过我们社区介绍，慢慢让大家知道DB在一些方面用起来更适合大家的地方，后来比如说我们去年发展一种分布式的，现在随着社区大家互相介绍，如果有人单独讲一个DB会觉得很不好意思。微博最早我们只能看国外的，慢慢有不少公司做这个，刚开始我们介绍一些基本技术，比如说微博的东西可以用推和拉做，等到以后经过我们把这个话题讲到以后，有人再讲微博技术光讲推和拉觉得不好意思，要进行一些更深入的话题，慢慢我们就在这个过程当中。今天讲一下cache的设计，我讲过一次微薄扩展设计，那是一个基本话题，刚才也讲了一个架构讲得比上次更深刻，光讲一个推是不够的，我今天演讲主要从是cache进一步补充一下，一部分是Feed架构简介，第二是cache的设计。
cache规划方面一些问题，将不同业务，不同长度KEY存储到不同的MEMcache，不同的业务有不同的更高效的内存利用。
mutex，什么情况会出现这个问题，比如说一个很热的内容，cache里面没有了，因为memcache不是很可靠的东西，你放在里面可能会消失，经常出现这样的情况：一个很热的cache没有了，因为我们系统有很多并发很热数据没有了，非常多的并发如果我们没有一个很好的策略，比如说几十个，几百个加一个内容这会是一个悲剧。我们给每个KEY加载MUTEX，这个并发连接取数据库，然后把mutex删除成规，这个时候我只需要一个连接，数据库加载到BD里面有可以了。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

业务场景-数据
• 一些数据
6 IDC 3700+ instances 24T+内存 500+servers 千亿条记录 7千亿cmds/day
1.2万亿read/day
2千亿write/day
Redis存储前时代
Redis前时代
• 新的关系计算需求实现困难
– 大量关系计算：从MC取全量+本地计算->超时
解决方案
• 初期方案
– 增大mc容量到40G，Graph db 增至一主六从 – 监控并及时清理僵死线程 – 关系计算性能问题暂时无解
• 最终方案
– 引入Redis做storage (graph/counter) – 关系计算在redis实现 O(1) – 促进更多复杂需求 – Graph db恢复一主三从
• 重启耗时，10-20分钟服务异常
解决方案
• 容量规划
– 提前预估容量，上线前预拆足够的数据分片 – 选择合适的数据类型，慎用zset – 业务独立存储，拒绝混放
解决方案
• 提高可用性
– 所有Redis全部增加Slave – Master挂载slave不超过2个，采用M-S-S方式挂载 – 多IDC 单Master，复制同步
• 下线低配server，寻找廉价新机房
小结
• 量变->质变，极端业务定制 • 大规模集群 T级 3+idc 成本
– 单个请求成本 – 总拥有成本
Redis存储高速稳定期
Redis存储高速稳定期
• Graph 定位cache 定制longset
• 热数据mc • 全量落地mysql • 数据量不大：Graph mc 10G，计数器 mc 2G • 开发速度
问题出现
• 2010年，Graph mc 30G+，峰值 10wTPS • Mysql成为瓶颈
– 线程阻塞，访问卡顿 – List类型业务不适合mysql
• Counter
– 定制cdb，通过table分段存储计数 – 一个KV存多个计数
2013000001 800|360|1000|10000
解决方案
• Counter存储结构
– cdb=schema+tables – 计数double-hash寻址，消除冗余robj存储结构 – 冲突过多aux_dict – 数值过大extend_dict • 多管齐下，节省数百台机器
ª 数据路由 ª 负载均衡 ª 数据在线迁移 ª 服务治理（生命周期故障转移etc.）
– 运维标准化、自动化（扩/缩容etc.）
服务化
服务化
• 服务化 à
– 业务服务化 motan ✓ – 资源服务化 à
小结
小结
• 小规模 50G 1-2个集群
– 人肉运维
• 中规模 100G+，3+集群
– 可运维性->重要 – 开源组件->熟悉架构实现
Redis存储爆发期
Redis存储爆发期
• 完全增量复制 • 在线热升级 • SLAVE均衡访问 • 大量子业务切入 • 单业务数百G稳定
新浪微博redis优化历程
陈波 @ﬁshermen
大纲
• 业务场景 • Redis存储架构演进 • 一些经验 • Q&A
业务场景-业务
• Redis在新浪微r)
关系 (graph)
• 占用机器增加迅猛，成本合理性需要考虑 • 部分机房机架饱和
解决方案
• Graph
– 定位：storageàcache – 定制：hashàLongset
2013000001.rep 800 2013000001.cmt 360 2013000001.like 1000 2013000001.read 10000
– 最多6个版本 – BUG重复修复，运维困难
问题分析
• 崩溃：读写会用pageCache，导致redis进 swap而崩溃 • 其他服务报警：复制全量推送导致网络阻塞 • 负载不均：client通过域名访问，域名解析返回随机ip，结果连接不均衡，最终导致负载不均衡
• 凌晨低峰升级，访问 IPà域名
– 不完美，但基本可work
问题升级
• 2011年底，Graph 100G+ 灵异事件
– 凌晨3点低峰期，redis无征兆崩溃 – 批量升级、扩容拆分，引发其他业务异常报警
• 多个slave严重负载不均，请求数最大差1-2个数量级，峰值响应从不足1ms->3ms • 在线版本增多
– 内存降为 1/10 – 性能接近
• Counter 定制cdb
– 内存降为 1/5 - – 性能增3-5倍
Redis存储高速稳定期
• 继续定制
– Counter 落地SSD，容量提升20倍，8个月à10年 – Vector – Others…
小结
• 项目初期
– 30G- 日PV5kw- – 技术选型熟悉度 – 拼的是开发速度
• 产品需求与新技术相互促进
Redis存储初期
Redis初期
• Redis 2.0 • Graph存hash，40G 10w TPS，4 Server • Counter:20G 2w TPS，2 Server
• 避免过早优化，小步快跑 • 架构没有最好，只有更适合
一些经验
• 结合发展阶段选择最合适的技术和架构，避免过早优化 • 拥抱需求，需求、技术相互促进 • 解决问题的root cause
Q&A
警 – 存储效率低 <30%
2013000001.rep 800 2013000001.cmt 360 2013000001.like 1000 2013000001.read 10000
问题出现
问题出现
• 2013年，Graph海量规模
– 数据T级，MS 十T级 – 数百台server，而且还在快速增加 – Graph用Hash结构，存储效率不高

问题出现
• Counter 业务增加，增长迅猛 – 日增：计数亿条内存5G+ – 总数据百G级， MS T级 – Feed请求计数近百倍读放大，高峰超时报
问题解决
• 紧急方案
– 超过物理内存3/5à迁移端口 – 错峰升级/扩容对网络仍然有一定冲击 – 开发ClientBalancer组件，保持域名下IP连接均衡，负载均衡
• 进一步优化方案：
– 及时清理pagecache，减少对正常业务影响 – Aof去掉rewrite，改用rotate – 类似mysql，独立IO线程对rdb、aof转发复制（社区版psync, repl-backlog-size, repl-backlog-ttl） – 支持热升级，避免重启，提高可运维性 – Others…
问题出现
• 2011年，初期使用经验不足
– 数据分片过少，扩容困难 – 部分数据类型使用不当，内存超预期 – 多业务混放，拆分不便
• 可用性不够
– 小业务初期没有slave，server故障à服务异常 – 大业务挂载3-4个slave，高峰期write超时，请求失败
问题出现
• 2014，SLA 目标6个9
– 数千关联Server 6+IDC 跨地域分布 – 海量数据 24T+ – 峰值 5000w+ TPS，响应毫秒级 – 硬件/网络故障时有发生，如何实现？
问题解决
• 资源服务化 à
– Conﬁgserver用于服务的发布与订阅 – CacheService 用于集群管理