一、什么是 NoSQL

  NoSQL(Not Only SQL)泛指非关系型数据库,NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,特别是大数据应用难题。(关系型数据库:表格,行,列)

1、NoSQL 的分类

  • KV键值对:Redis、Memecache;
  • 文档型数据库(bson、json 格式):MongoDB 是一个基于分布式文件存储的数据库,它是介于关系型数据库和非关系型中间的产品;
  • 列存储数据库:HBase(分布式文件系统);
  • 图关系数据库:Neo4J。

| 分类 | Examples举例 | 典型应用场景 | 数据模型 | 优点 | 缺点 |
| - | - | - | - | - | - |
| 键值(key-value) | Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB | 内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等等 | Key 指向 Value 的键值对,通常用hash table来实现 | 查找速度快 | 数据无结构化,通常只被当作字符串或者二进制数据 |
| 列存储数据库 | Cassandra, HBase, Riak | 分布式的文件系统 | 以列簇式存储,将同一列数据存在一起 | 查找速度快,可扩展性强,更容易进行分布式扩展 | 功能相对局限 |
| 文档型数据库 | CouchDB, MongoDb | Web应用(与Key-Value类似,Value是结构化的,不同的是数据库能够了解Value的内容) | Key-Value对应的键值对,Value为结构化数据 | 数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构 | 查询性能不高,而且缺乏统一的查询语法 |
| 图形(Graph)数据库 | Neo4J, InfoGrid, Infinite Graph | 社交网络,推荐系统等。专注于构建关系图谱 | 图结构 | 利用图结构相关算法。比如最短路径寻址,N度关系查找等 | 很多时候需要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群方案 |

二、什么是 Redis

  Redis 是基于内存操作,CPU 不是 Redis 性能瓶颈,Redis 的瓶颈是根据机器的内存和网络带宽。Redis 为什么单线程还怎么快?

  • 误区 1:高性能的服务器一定是多线程的。
  • 误区 2:多线程一定比单线程效率高。

  Redis 是将所有的数据全部放在内存中,所以说使用单线程去操作效率就是最高的,多线程会导致CPU 上下文会切换。对于内存系统来说,如果没有上下文切换效率将会是最高,多次读写都是在一个 CPU 上的。(Linux 中下载 Redis)

1、库的切换

  Redis 默认有 16 个数据库,配置文件:databases 16。默认使用第 0 个。可以使用 select进行切换数据库。

127.0.0.1:6379> select 1 # 切换数据库
OK
127.0.0.1:6379[1]> dbsize # 已使用的大小
(integer) 0

2、值的基本操作

  值的添加和查看。

127.0.0.1:6379[1]> set name 1 # 设置一个 key value
OK
127.0.0.1:6379> keys * # 或许当前库的所有 key
1) "name"
127.0.0.1:6379[1]> get name # 获取指定 key 的值
"1"

  判断值是否存在。

127.0.0.1:6379> exists name
(integer) 1
127.0.0.1:6379> exists name1
(integer) 0

  设置值的过期时间。

127.0.0.1:6379> expire name 10 # 获取时间为 10 m
(integer) 1
127.0.0.1:6379> ttl name # 查看值的过期时间
(integer) 7
127.0.0.1:6379> ttl name
(integer) -2

  将 key 移动到其他库里。

move name 1

  查看 key 的类型。

127.0.0.1:6379[1]> type name
string

  清空值

127.0.0.1:6379[1]> flushdb # 清空当前数据库
OK
127.0.0.1:6379[1]> get name
(nil)
127.0.0.1:6379[1]> flushall # 清空全部数据库的内存
OK

三、Redis 的五大数据类型

1、String

  String 使用的场景:value 除了可以是字符串还可以是数字。

  • 计数器;
  • 统计多单位的数量;
  • 粉丝数;
  • 对象缓存存储。

  追加字符串,如果 key 不存在,则相当于 set key。

127.0.0.1:6379[1]> append name 2
(integer) 2
127.0.0.1:6379[1]> get name
"12"

  字符串的长度。

127.0.0.1:6379[1]> strlen name
(integer) 2

  自增和自减,如果值不是数字,则会报错。

127.0.0.1:6379[1]> incr name # 自增
(integer) 13
127.0.0.1:6379[1]> decr name # 自减
(integer) 12
127.0.0.1:6379[1]> incr name1
(error) ERR value is not an integer or out of range

  加法和减法。

127.0.0.1:6379[1]> incrby name 10 # 加法
(integer) 22
127.0.0.1:6379[1]> decrby name 5 # 减法
(integer) 17

  获取指定范围的字符串。

127.0.0.1:6379[1]> set name "yixing"
OK
127.0.0.1:6379[1]> get name
"yixing"
127.0.0.1:6379[1]> getrange name 0 3 # 截取 [0,3] 字符串
"yixi"
127.0.0.1:6379[1]> getrange name 0 -1 # 获取全部的字符串,和 get key 一样
"yixing"

  字符串的替换。

127.0.0.1:6379[1]> set name yixing
OK
127.0.0.1:6379[1]> setrange name 0 xx # 替换指定位置开始的字符串
(integer) 6
127.0.0.1:6379[1]> get name
"xxxing"

  setex 设置过期时间,setnx 不存在再设置(分布式锁)。

127.0.0.1:6379[1]> setex name 30 "zyx" # 设置 name 的值为 zyx,30 秒后过期
OK
127.0.0.1:6379[1]> ttl name
(integer) 25
127.0.0.1:6379[1]> setnx password 23 # 如果 password 不存在,则创建
(integer) 1
127.0.0.1:6379[1]> setnx age 23 # 存在,则创建失败
(integer) 0

  批量添加和查看值。

127.0.0.1:6379[1]> mset k1 v1 k2 v2 k3 v3 # 同时设置多个值
OK
127.0.0.1:6379[1]> keys *
1) "k1"
2) "k2"
3) "k3"
127.0.0.1:6379[1]> mget k1 k2 k3 # 同时获取多个值
1) "v1"
2) "v2"
3) "v3"
127.0.0.1:6379[1]> msetnx k4 v4 k3 v3 # msetnx 也是同时设置多个值,但是是原子性操作,要不都成功,要不都失败
(integer) 0
127.0.0.1:6379[1]> keys *
1) "k1"
2) "k2"
3) "k3"
127.0.0.1:6379[1]> msetnx k4 v4 k5 v5
(integer) 1
127.0.0.1:6379[1]> keys *
1) "k1"
2) "k5"
3) "k3"
4) "k4"
5) "k2"

  存储对象。

# 设置一个 user:1 对象,值用 json 字符串存储
127.0.0.1:6379[1]> set user:1 {name:zhangsan,age:3}
OK
# 使用 user:{id}:{filed} 来存储值
127.0.0.1:6379[1]> mset user:1:name zhangsan user:1:age 2
OK

  getset 先 get 后 set。

127.0.0.1:6379[1]> getset k0 6 # 如果值不存在,则返回 nil
(nil)
127.0.0.1:6379[1]> get k0
"6"
127.0.0.1:6379[1]> getset k1 7 # 如果存在值,获取原来的值,并设置新的值
"v1"
127.0.0.1:6379[1]> get k1
"7"

2、List

  在 Redis 里,可以把 List 用成(lpush、lpop):栈、队列、阻塞队列。

  • 它实际上是一个链表,before Node after,left 和 right 都可以插入值;
  • 如果 key 不存在,则创建新的链表;如果 key 存在,新增值;
  • 如果移除了所有值,空链表将不存在;
  • 在两边插入或改动值,效率最高。

  添加值和查看值。

127.0.0.1:6379> lpush list one # 将一个或多个值,插入到列表头部(左)
(integer) 1
127.0.0.1:6379> lpush list two three
(integer) 3
127.0.0.1:6379> lrange list 0 -1 # 获取 list 指定范围值
1) "three"
2) "two"
3) "one"
127.0.0.1:6379> lrange list 0 1
1) "three"
2) "two"
127.0.0.1:6379> rpush list right # 将一个或多个值,插入到列尾(右)
(integer) 4
127.0.0.1:6379> lrange list 0 -1
1) "three"
2) "two"
3) "one"
4) "right"

  移除值。

127.0.0.1:6379> lpop list # 移除左边的值
"three"
127.0.0.1:6379> rpop list # 移除右边的值
"right"

  根据下标获取值。

127.0.0.1:6379> lrange list 0 1
1) "two"
2) "one"
127.0.0.1:6379> lindex list 0
"two"

  获取链表的长度。

127.0.0.1:6379> llen list
(integer) 2

  移除指定个数的指定值。

127.0.0.1:6379> lrange list 0 -1
1) "one"
2) "one"
3) "two"
4) "one"
127.0.0.1:6379> lrem list 2 one
(integer) 2
127.0.0.1:6379> lrange list 0 -1
1) "two"
2) "one"

  对 list 进行截断。

127.0.0.1:6379> lrange list 0 -1
1) "3"
2) "2"
3) "1"
4) "2"
5) "1"
127.0.0.1:6379> ltrim list 2 3 # list 值发生改变,只剩 [2, 3] 的元素
OK
127.0.0.1:6379> lrange list 0 -1
1) "1"
2) "2"

  移除列表的最后一个元素,并将它移动到另一个列表中(不存在则创建)。

127.0.0.1:6379> lrange list 0 -1
1) "5"
2) "4"
3) "3"
127.0.0.1:6379> lrange mylist 0 -1
(empty list or set)
127.0.0.1:6379> rpoplpush list mylist # 将 list 中最后一个值,移动到 mylist 的头部
"3"
127.0.0.1:6379> lrange list 0 -1
1) "5"
2) "4"
127.0.0.1:6379> lrange mylist 0 -1
1) "3"

  linsert 将某个具体的 value 插入到列中某个元素的前面或后面。

127.0.0.1:6379> lrange list 0 -1
1) "0"
2) "1"
3) "2"
4) "3"
5) "4"
6) "5"
127.0.0.1:6379> linsert list before "2" 1.5 # 将 1.5 插入到 2 的前面
(integer) 7
127.0.0.1:6379> linsert list after 2 2.5 # 将 2.5 插入到 2 的后面
(integer) 8
127.0.0.1:6379> lrange list 0 -1
1) "0"
2) "1"
3) "1.5"
4) "2"
5) "2.5"
6) "3"
7) "4"
8) "5"

3、Set

  添加、查看、判断值,set 集合中的值不能重复。

127.0.0.1:6379> sadd set 1 1 2 # 向 set 中添加值,值不能重复
(integer) 2
127.0.0.1:6379> smembers set # 查看指定 set 的所有值
1) "1"
2) "2"
127.0.0.1:6379> sismember set 1 # 判断指定值是否存在
(integer) 1
127.0.0.1:6379> sismember set 3
(integer) 0

  获取 set 集合中元素的个数。

127.0.0.1:6379> scard set
(integer) 2

  移除 set 集合中的指定元素。

127.0.0.1:6379> smembers set
1) "1"
2) "2"
127.0.0.1:6379> srem set 1
(integer) 1
127.0.0.1:6379> smembers set
1) "2"

  从 set 集合中随机抽出指定个数的元素。

127.0.0.1:6379> smembers set
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"
127.0.0.1:6379> srandmember set
"3"
127.0.0.1:6379> srandmember set 2
1) "2"
2) "4"

  随机删除指定个数的元素。

127.0.0.1:6379> smembers set
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"
127.0.0.1:6379> spop set
"1"
127.0.0.1:6379> spop set 2
1) "6"
2) "2"
127.0.0.1:6379> smembers set
1) "3"
2) "4"
3) "5"

  将一个指定的值,移动到另一个 set 集合。

127.0.0.1:6379> smove set myset 3

  交、并、差集(B 站,共同关注)。

127.0.0.1:6379> smembers set1
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
127.0.0.1:6379> smembers set2
1) "4"
2) "5"
3) "6"
4) "7"
5) "8"
127.0.0.1:6379> sdiff set1 set2 # 差集
1) "1"
2) "2"
3) "3"
127.0.0.1:6379> sinter set1 set2 # 交集
1) "4"
2) "5"
127.0.0.1:6379> sunion set1 set2 # 并集
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"
7) "7"
8) "8"

4、Hash

  Hash 变更的数据 user、name、age,尤其是用户信息之类的,经常变动的信息。hash 更适合于对象的存储,String 更加适合字符串存储。

  对 map 的增删查。

127.0.0.1:6379> hset map name "yixing" # 值为多个 key-value (key 不能重复)
(integer) 1
127.0.0.1:6379> hget map name # 获取一个 key 的值
"yixing"
127.0.0.1:6379> hset map age 12 password "123" # 添加多个 key-value
(integer) 2
127.0.0.1:6379> hmget map name age # 获取多个 key 的值
1) "yixing"
2) "12"
127.0.0.1:6379> hgetall map # 获取全部数据
1) "name"
2) "yixing"
3) "age"
4) "12"
5) "password"
6) "123"
127.0.0.1:6379> hdel map password # 删除 hash 指定 key,对应的 value 也消失
(integer) 1
127.0.0.1:6379> hgetall map
1) "name"
2) "yixing"
3) "age"
4) "12"

  获取 hash 表 key 的数量。

127.0.0.1:6379> hgetall map
1) "name"
2) "yixing"
3) "age"
4) "12"
127.0.0.1:6379> hlen map
(integer) 2

  判断 hash 中指定 key 是否存在。

127.0.0.1:6379> hexists map name
(integer) 1

  获取所有的 key 或所有 的 value。

127.0.0.1:6379> hkeys map
1) "name"
2) "age"
127.0.0.1:6379> hvals map
1) "yixing"
2) "12"

  对指定 key 的 value 进行加/减法运算。

127.0.0.1:6379> hincrby map age 1 # 对值进行数值操作
(integer) 13
127.0.0.1:6379> hincrby map age -1
(integer) 12

  向 map 中添加 key-value,如果 key 已存在,则添加失败,

127.0.0.1:6379> hsetnx map password 123 # 如果不存在则可以添加
(integer) 1
127.0.0.1:6379> hsetnx map password 1234 # 如果存在则不能设置
(integer) 0

5、Zset

  Zset 是一个有序集合,它在 set 的基础上,增加了一个值,set k1 v1,zset k1 score1 v1。

  • set 排序,存储班级成绩表,工资表排序;
  • 普通消息 1,重要消息 2,带权重进行判断;
  • 排行榜应用实现,取 Top N 测试。

  添加和查看值。

127.0.0.1:6379> zadd zset 1 one
(integer) 1
127.0.0.1:6379> zadd zset 2 two 3 three
(integer) 2
127.0.0.1:6379> zrange zset 0 -1
1) "one"
2) "two"
3) "three"

  排序如何实现。

127.0.0.1:6379> zadd user 2500 xiaohong # 添加三个用户
(integer) 1
127.0.0.1:6379> zadd user 5000 zhangsan
(integer) 1
127.0.0.1:6379> zadd user 500 yixing
(integer) 1
127.0.0.1:6379> zrangebyscore user -inf +inf # 显示全部的用户 从小到大
1) "yixing"
2) "xiaohong"
3) "zhangsan"
127.0.0.1:6379> zrange user 0 -1 # 从小到大排序
1) "yixing"
2) "xiaohong"
3) "zhangsan"
127.0.0.1:6379> zrevrange user 0 -1 # 从大到小排序
1) "zhangsan"
2) "xiaohong"
3) "yixing"
127.0.0.1:6379> zrangebyscore user -inf +inf withscores # 显示全部的用户并且附带工资
1) "yixing"
2) "500"
3) "xiaohong"
4) "2500"
5) "zhangsan"
6) "5000"
127.0.0.1:6379> zrangebyscore user -inf 2500 withscores # 显示工资小于 2500 的用户,并升序排序
1) "yixing"
2) "500"
3) "xiaohong"
4) "2500"

  移除集合中的指定元素。

127.0.0.1:6379> zrevrange user 0 -1
1) "zhangsan"
2) "xiaohong"
3) "yixing"
127.0.0.1:6379> zrem user xiaohong
(integer) 1
127.0.0.1:6379> zrevrange user 0 -1
1) "zhangsan"
2) "yixing"

  获取集合中的元素个数。

127.0.0.1:6379> zcard user
(integer) 2

  获取指定区间的成员数量。

127.0.0.1:6379> zrangebyscore user -inf +inf withscores 
1) "yixing"
2) "500"
3) "xiaohong"
4) "2500"
5) "zhangsan"
6) "5000"
127.0.0.1:6379> zcount user 0 3000
(integer) 2

四、三种特殊数据类型

1、geospatiald 地理位置

  利用 geo 这个功能可以推算地理位置的信息,两地之间的距离。可以实现:朋友的定位,附近的人,打车距离的计算。(经纬度查询网站)

添加地理信息。两级无法直接添加,我们一般会下载城市数据,直接通过 java 程序一次性导入。

127.0.0.1:6379> geoadd china:city 116.40 39.90 beijing
(integer) 1
127.0.0.1:6379> geoadd china:city 121.47 31.23 shanghai
(integer) 1
127.0.0.1:6379> geoadd china:city 106.50 29.53 chongqi 114.05 22.52 shenzhen
(integer) 2
127.0.0.1:6379> geoadd china:city 120.16 30.24 hangzhou 108.96 34.26 xian
(integer) 2

  获取当前定位,一定是一个坐标值。

127.0.0.1:6379> geopos china:city beijing chongqi # 获取指定城市的经纬度
1) 1) "116.39999896287918091"
   2) "39.90000009167092543"
2) 1) "106.49999767541885376"
   2) "29.52999957900659211"

  两地之间的距离,单位:米(m)、千米(km)、英里(mi)、英尺(ft)。

127.0.0.1:6379> geodist china:city beijing shanghai km # 查看上海到北京的直线距离
"1067.3788"

  以经纬度为中心,找出某一半径内的元素。比如:附近的人。

127.0.0.1:6379> georadius china:city 110 30 1000 km # 以100,30这个经纬度为中心,寻找方圆 1000km 内的城市
1) "chongqi"
2) "xian"
3) "shenzhen"
4) "hangzhou"
127.0.0.1:6379> georadius china:city 110 30 500 km
1) "chongqi"
2) "xian"
127.0.0.1:6379> georadius china:city 110 30 500 km withdist # 显示到中间距离的位置
1) 1) "chongqi"
   2) "341.9374"
2) 1) "xian"
   2) "483.8340"
127.0.0.1:6379> georadius china:city 110 30 500 km withcoord # 显示其它人的位置信息
1) 1) "chongqi"
   2) 1) "106.49999767541885376"
      2) "29.52999957900659211"
2) 1) "xian"
   2) 1) "108.96000176668167114"
      2) "34.25999964418929977"
127.0.0.1:6379> georadius china:city 110 30 500 km withdist withcoord count 1 # 筛选出指定个数的结果
1) 1) "chongqi"
   2) "341.9374"
   3) 1) "106.49999767541885376"
      2) "29.52999957900659211"
127.0.0.1:6379> georadius china:city 110 30 500 km withdist withcoord count 2
1) 1) "chongqi"
   2) "341.9374"
   3) 1) "106.49999767541885376"
      2) "29.52999957900659211"
2) 1) "xian"
   2) "483.8340"
   3) 1) "108.96000176668167114"
      2) "34.25999964418929977"

  找出位于指定元素范围的其他元素。

127.0.0.1:6379> georadiusbymember china:city beijing 1000 km
1) "beijing"
2) "xian"

  返回一个或多个位置元素的 Geohash 表示,将二维的经纬度转换为一维的字符串,如果两个字符串越接近,那么则距离越近。

127.0.0.1:6379> geohash china:city beijing chongqi
1) "wx4fbxxfke0"
2) "wm5xzrybty0"

  geo 底层的实现原理其实就是 Zset,可以使用 Zset 命令来操作 geo。

127.0.0.1:6379> zrange china:city 0 -1
1) "chongqi"
2) "xian"
3) "shenzhen"
4) "hangzhou"
5) "shanghai"
6) "beijing"

2、Hyperloglog 基数统计

  Hyperloglog 是基数统计的算法。优点:占用的内存是固定,2^64 不同的元素的技术,只需要用 12KB 内存。Hyperloglog 有 0.81% 的错误率,如果允许容错,那么一定可以使用 Hyperloglog。如果不允许容错,就是用 set 或者其他。

  网站的 UV(一个人访问一个网站多次,但是还是算作一个人):传统的方式,set 保存用户的 id,然后就可以统计 set 中的元素数量作为标准判断。这个方式如果保存大量的用户 id,就会比较麻烦。统计 UV 任务时,可以将错误率忽略不计。

# 测试使用
127.0.0.1:6379> pfadd mykey a b c d e f g h i j # 创建第一组元素 mykey
(integer) 1
127.0.0.1:6379> pfcount mykey # 统计 mykey 元素的基数数量
(integer) 10
127.0.0.1:6379> pfadd mykey1 i j z x c v b n m 
(integer) 1
127.0.0.1:6379> pfcount mykey1
(integer) 9
127.0.0.1:6379> pfmerge mykey2 mykey mykey1 # 求 mykey 和 mykey1 的并集
OK
127.0.0.1:6379> pfcount mykey3
(integer) 0
127.0.0.1:6379> pfcount mykey2 # 查看并集的数量
(integer) 15

3、Bitmaps 位存储

  统计用户信息:活跃情况、登录情况、打卡情况,两种状态的都可以使用 Bitmaps。Bitmaps 位图是操作二进制位来进行记录,只有 0 和 1 两个状态。

  使用 Bitmaps 来记录,周一到周日的打卡。

127.0.0.1:6379> setbit sign 0 1 # 周一
(integer) 0
127.0.0.1:6379> setbit sign 1 0
(integer) 0
127.0.0.1:6379> setbit sign 2 0
(integer) 0
127.0.0.1:6379> setbit sign 3 1
(integer) 0
127.0.0.1:6379> setbit sign 4 1
(integer) 0
127.0.0.1:6379> setbit sign 5 0
(integer) 0
127.0.0.1:6379> setbit sign 6 0
(integer) 0

  查看某一天是否有打卡。

127.0.0.1:6379> getbit sign 3
(integer) 1
127.0.0.1:6379> getbit sign 6
(integer) 0

  统计操作,统计打卡的天数。

127.0.0.1:6379> bitcount sign # 统计为 1 的个数
(integer) 3

标题:Redis 的五大数据类型和三种特殊数据类型
作者:Yi-Xing
地址:http://47.94.239.232:10014/articles/2021/03/01/1614567506651.html
博客中若有不恰当的地方,请您一定要告诉我。前路崎岖,望我们可以互相帮助,并肩前行!