1. LRU与LFU简介
LRU (Least recently used,最近最少使用 ) 和 LFU (Least frequently used,最不经常使用)是两种经典的cache管理算法。其主要差别在于其核心思想:
- LRU:如果数据最近被访问过,那么将来被访问的几率也更高
- LFU:如果数据在最近一段时间内访问次数越少,那么将来被访问的几率也越低
LRU和LFU具备的操作主要是:get
and put
.
get(key)
- 返回key对应的值,如果key不存在,则返回-1put(key, value)
- 如果key存在则将其对应的值设置为value,如果key不存在,则插入新的节点。如果cache已经满了,则需要以某种准则(满足某种函数f(x))去除cache中已存在的节点。
这一数据结构的核心在于当存储空间满了要插入新的节点时,以何种规则(即所谓的f(x))丢弃相应的节点。在设计LRU和LFU时的主要差别也在于此。
2. LRU的设计与实现
为了快速找到最早更新的节点,可选的数据结构有:queue,heap,linked list。由于题目又要求快速访问指定节点,并且在访问之后要更新它的时间顺序,queue和heap不太适用。因此考虑使用linked list,这里我们选用double linked list,简化节点的删除操作,实现O(1)的删除效率。并用hash table以便实现O(logn)时间随机访问节点。
首先是双链表的节点定义:
1
2
3
4
5
6
7
struct Node{
Node *pre;
Node *next;
int key;
int val;
Node(int k,int v):key(k),val(v),pre(NULL),next(NULL){}
};
使用map将key与相应的节点对应起来,实现以O(logn)时间随机访问linked list中的相应节点,并进行删除更新等相关操作。另外在构造函数中还需指定capacity的大小:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
class LRUCache {
public:
LRUCache(int capacity) {
capacity_ = capacity;
head = NULL;
tail = NULL;
keyToNode.clear();
}
private:
int capacity_;
Node *head;//头节点
Node *tail;//尾节点
unordered_map<int,Node*> keyToNode;//key与节点Node的map
};
下面设计辅助函数。由于我们将节点按照使用的时间顺序插入double linked list当中,所以头节点是最少最近使用的节点,而尾节点是最近使用的节点。因此首先设计三个函数:删除头节点:removeHead()以及插入新节点:insertToEnd(int k, int v),以及更新已存在节点在双链表中的顺序:moveToEnd(int key)。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
void insertToEnd(int k, int v){
//if full or already exist, return
if(isFull()||keyToNode.count(k)!=0) return;
Node *nd = new Node(k,v);
keyToNode[k] = nd;
//if head = tail = NULL
if(!head){
head = tail = nd;
}
else{
tail->next = nd;
nd->pre = tail;
tail = tail->next;
}
}
void removeHead(){
//if head not exist
if(!head) return;
keyToNode.erase(head->key);
Node *tmp = head;
if(head == tail)//if only one node
{
head = tail = NULL;
}
else{
head = head->next;
head->pre = NULL;
}
delete tmp;
}
void moveToEnd(int key){
//if key not exist or already in the end
if(keyToNode.count(key) == 0|| keyToNode[key] == tail) return;
Node *nd = keyToNode[key];
if(nd == head)//if at the front
{
head = head->next;
head->pre = NULL;
}
else{
nd->pre->next = nd->next;
nd->next->pre = nd->pre;
}
tail->next = nd;
nd->pre = tail;
nd->next = NULL;
tail = tail->next;
}
get(int key)
函数的设计比较简单,直接查找map中key值是否存在,如果不存在返回-1,反之,更新节点位置到链表尾端并返回其值即可。
1
2
3
4
5
6
int get(int key) {
if(keyToNode.count(key) == 0) return -1;
//如果存在,将节点更新到链表尾端
moveToEnd(key);
return keyToNode[key]->val;
}
put(int key, int value)
分为以下情况:1.如果节点存在,只需要更新节点的值并更新节点在链表中的位置(moveToEnd)即可。这里我们使用get函数判断节点是否存在,则可以省略moveToEnd操作。2.如果节点不存在,则插入节点前需要判断是否溢出,如果溢出,则先将头节点删除再在尾节点插入新节点即可。
1
2
3
4
5
6
7
8
9
10
11
void put(int key, int value) {
//if already exist, update value
if(get(key)!=-1){
keyToNode[key]->val = value;
return;
}
//if not exist, insert
if(isFull()) removeHead();
insertToEnd(key,value);
}
3. LFU的设计与实现
与LRU纯粹比较数据使用时间与当前时间的远近不同,LFU的核心思想如果数据在最近一段时间内访问次数越少,那么将来被访问的几率也越低。因此在设计LFU时,我们需要引进变量:频率frequency,并且需要根据频率值来决定节点的删除操作。这里需要注意的是:当几个节点的频率都相同时,采用LRU的思想,优先删除的是最近最少使用的节点。
根据以上的分析,首先我们需要在节点上增加一个变量freq记录节点的频率。其次,除了LRU中key与Node的map之外,对于每一个频率值,我们还需要一个list 来记录在这一频率值下的节点。因此我们增加一个频率与list的map:freqMap。另外,为了迅速找到并删除节点,我们在Node结构中增加iterator,记录frequency list的头部。
节点的定义和LFU的结构如下:
1
2
3
4
5
6
7
struct Node{
int val;
int freq;
list<int>::iterator it;
Node():freq(1){}
Node(int value):val(value),freq(1){}
};
1
2
3
4
5
6
7
8
9
10
11
12
class LFUCache {
public:
LFUCache(int capacity) {
this->capacity = capacity;
}
private:
int capacity;
int minFreq;
unordered_map<int,Node*> cacheMap;
unordered_map<int,list<int>> freqMap;
};
get(int key)
函数的设计与LRU中get函数类似。需要注意的是这里更新节点不再是将节点移到到链表尾部,而是更新节点的freq,将原节点从以前的freq list中移除,添加到新的freq list前端,最后更新节点的iterator。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
int get(int key) {
//if not exist
if(cacheMap.find(key) == cacheMap.end()) return -1;
Node* node = cacheMap[key];
//update freq
freqMap[node->freq].erase(node->it);
node->freq += 1;
freqMap[node->freq].push_front(key);
node->it = freqMap[node->freq].begin();
if(freqMap[minFreq].size()==0)
minFreq = node->freq;
return node->val;
}
put(int key, int value)
的设计同样需要注意对freq list的处理。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
void put(int key, int value) {
if(capacity <= 0) return;
if(get(key) == -1)
{
if(cacheMap.size()==capacity)
{
//remove
int popkey = freqMap[minFreq].back();
cacheMap.erase(popkey);
freqMap[minFreq].pop_back();
}
//insert new node
Node* node = new Node(value);
minFreq = 1;
freqMap[1].push_front(key);
node->it = freqMap[1].begin();
cacheMap[key] = node;
}
else
{
cacheMap[key]->val = value;
}
}