好好了解一下Cookie(强烈推荐)

2019年12月06日 阅读数:64
这篇文章主要向大家介绍好好了解一下Cookie(强烈推荐),主要内容包括基础应用、实用技巧、原理机制等方面,希望对大家有所帮助。
Cookie是由服务器端生成,发送给User-Agent,浏览器会将Cookie的key/value保存到某个目录下的文本文件内,下次请求同一网站时就发送该Cookie给服务器,对cookie知识感兴趣的朋友一块儿学习吧

Cookie的诞生html

因为HTTP协议是无状态的,而服务器端的业务必须是要有状态的。Cookie诞生的最初目的是为了存储web中的状态信息,以方便服务器端使用。好比判断用户是不是第一次访问网站。目前最新的规范是RFC 6265,它是一个由浏览器服务器共同协做实现的规范。
前端

Cookie的处理分为:web

服务器像客户端发送cookie
浏览器

浏览器将cookie保存
缓存

以后每次http请求浏览器都会将cookie发送给服务器端
安全

服务器端的发送与解析服务器

发送cookie
cookie

服务器端像客户端发送Cookie是经过HTTP响应报文实现的,在Set-Cookie中设置须要像客户端发送的cookie,cookie格式以下:dom

Set-Cookie: "name=value;domain=.domain.com;path=/;expires=Sat, 11 Jun 2016 11:29:42 GMT;HttpOnly;secure"
其中name=value是必选项,其它都是可选项。Cookie的主要构成以下:函数

name:一个惟一肯定的cookie名称。一般来说cookie的名称是不区分大小写的。

value:存储在cookie中的字符串值。最好为cookie的name和value进行url编码

domain:cookie对于哪一个域是有效的。全部向该域发送的请求中都会包含这个cookie信息。这个值能够包含子域(如:

yq.aliyun.com),也能够不包含它(如:.aliyun.com,则对于aliyun.com的全部子域都有效).

path: 表示这个cookie影响到的路径,浏览器跟会根据这项配置,像指定域中匹配的路径发送cookie。

expires:失效时间,表示cookie什么时候应该被删除的时间戳(也就是,什么时候应该中止向服务器发送这个cookie)。若是不设置这个时间戳,浏览器会在页面关闭时即将删除全部cookie;不过也能够本身设置删除时间。这个值是GMT时间格式,若是客户端和服务器端时间不一致,使用expires就会存在误差。

max-age: 与expires做用相同,用来告诉浏览器此cookie多久过时(单位是秒),而不是一个固定的时间点。正常状况下,max-age的优先级高于expires。

HttpOnly: 告知浏览器不容许经过脚本document.cookie去更改这个值,一样这个值在document.cookie中也不可见。但在http请求张仍然会携带这个cookie。注意这个值虽然在脚本中不可获取,但仍然在浏览器安装目录中以文件形式存在。这项设置一般在服务器端设置。

secure: 安全标志,指定后,只有在使用SSL连接时候才能发送到服务器,若是是http连接则不会传递该信息。就算设置了secure 属性也并不表明他人不能看到你机器本地保存的 cookie 信息,因此不要把重要信息放cookie就对了服务器端设置

cookie示例以下:

?
1
2
3
4
5
6
7
8
9
var http = require( 'http' );
var fs = require( 'fs' );
http.createServer( function (req, res) {
   res.setHeader( 'status' , '200 OK' );
   res.setHeader( 'Set-Cookie' , 'isVisit=true;domain=.yourdomain.com;path=/;max-age=1000' );
   res.write( 'Hello World' );
   res.end();
}).listen(8888);
console.log( 'running localhost:8888' )

5BY_CCV_Q_VJ1__2_TV1
O6PXV8YEU5EJ0G____Q20E5

直接设置Set-Cookie过于原始,咱们能够对cookie的设置过程作以下封装:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
var serilize = function (name, val, options) {
   if (!name) {
     throw new Error( "coolie must have name" );
   }
   var enc = encodeURIComponent;
   var parts = [];
   
   val = (val !== null && val !== undefined) ? val.toString() : "" ;
   options = options || {};
   parts.push(enc(name) + "=" + enc(val));
   // domain中必须包含两个点号
   if (options.domain) {
     parts.push( "domain=" + options.domain);
   }
   if (options.path) {
     parts.push( "path=" + options.path);
   }
   // 若是不设置expires和max-age浏览器会在页面关闭时清空cookie
   if (options.expires) {
     parts.push( "expires=" + options.expires.toGMTString());
   }
   if (options.maxAge && typeof options.maxAge === "number" ) {
     parts.push( "max-age=" + options.maxAge);
   }
   if (options.httpOnly) {
     parts.push( "HTTPOnly" );
   }
   if (options.secure) {
     parts.push( "secure" );
   }
   
   return parts.join( ";" );
}

须要注意的是,若是给cookie设置一个过去的时间,浏览器会当即删除该cookie;此外domain项必须有两个点,所以不能设置为localhost:

?
1
something that wasn 't made clear to me here and totally confused me for a while was that domain names must contain at least two dots (.),hence ' localhost' is invalid and the browser will refuse to set the cookie!

服务器端解析cookie

cookie能够设置不一样的域与路径,因此对于同一个name value,在不一样域不一样路径下是能够重复的,浏览器会按照与当前请求url或页面地址最佳匹配的顺序来排定前后顺序

X_W6SLE3H_AUV181U6D_Q_H

因此当前端传递到服务器端的cookie有多个重复name value时,咱们只须要最匹配的那个,也就是第一个。服务器端解析代码以下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
var parse = function (cstr) {
   if (!cstr) {
     return null ;
   }
   
   var dec = decodeURIComponent;
   var cookies = {};
   var parts = cstr.split(/\s*;\s*/g);
   parts.forEach( function (p){
     var pos = p.indexOf( '=' );
     // name 与value存入cookie以前,必须通过编码
     var name = pos > -1 ? dec(p.substr(0, pos)) : p;
     var val = pos > -1 ? dec(p.substr(pos + 1)) : null ;
     //只须要拿到最匹配的那个
     if (!cookies.hasOwnProperty(name)) {
       cookies[name] = val;
     } /* else if (!cookies[name] instanceof Array) {
       cookies[name] = [cookies[name]].push(val);
     } else {
       cookies[name].push(val);
     }*/
   });
   
   return cookies;
}

客户端的存取

浏览器将后台传递过来的cookie进行管理,而且容许开发者在JavaScript中使用document.cookie来存取cookie。可是这个接口使用起来很是蹩脚。它会由于使用它的方式不一样而表现出不一样的行为。

当用来获取属性值时,document.cookie返回当前页面可用的(根据cookie的域、路径、失效时间和安全设置)全部的字符串,字符串的格式以下:

?
1
"name1=value1;name2=value2;name3=value3" ;

当用来设置值的时候,document.cookie属性可设置为一个新的cookie字符串。这个字符串会被解释并添加到现有的cookie集合中。如:

?
1
document.cookie = "_fa=aaaffffasdsf;domain=.dojotoolkit.org;path=/"

设置document.cookie并不会覆盖cookie,除非设置的name value domain path都与一个已存在cookie重复。

因为cookie的读写很是不方便,咱们能够本身封装一些函数来处理cookie,主要是针对cookie的添加、修改、删除。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
var cookieUtils = {
     get: function (name){
      var cookieName=encodeURIComponent(name) + "=" ;
      //只取得最匹配的name,value
      var cookieStart = document.cookie.indexOf(cookieName);
      var cookieValue = null ;
      
      if (cookieStart > -1) {
       // 从cookieStart算起
       var cookieEnd = document.cookie.indexOf( ';' , cookieStart);
       //从=后面开始
       if (cookieEnd > -1) {
        cookieValue = decodeURIComponent(document.cookie.substring(cookieStart + cookieName.length, cookieEnd));
       } else {
        cookieValue = decodeURIComponent(document.cookie.substring(cookieStart + cookieName.length, document.cookie.length));
       }
      }
      
      return cookieValue;
     },
     
     set: function (name, val, options) {
       if (!name) {
         throw new Error( "coolie must have name" );
       }
       var enc = encodeURIComponent;
       var parts = [];
       
       val = (val !== null && val !== undefined) ? val.toString() : "" ;
       options = options || {};
       parts.push(enc(name) + "=" + enc(val));
       // domain中必须包含两个点号
       if (options.domain) {
         parts.push( "domain=" + options.domain);
       }
       if (options.path) {
         parts.push( "path=" + options.path);
       }
       // 若是不设置expires和max-age浏览器会在页面关闭时清空cookie
       if (options.expires) {
         parts.push( "expires=" + options.expires.toGMTString());
       }
       if (options.maxAge && typeof options.maxAge === "number" ) {
         parts.push( "max-age=" + options.maxAge);
       }
       if (options.httpOnly) {
         parts.push( "HTTPOnly" );
       }
       if (options.secure) {
         parts.push( "secure" );
       }
       
       document.cookie = parts.join( ";" );
     },
     delete : function (name, options) {
      options.expires = new Date(0); // 设置为过去日期
      this .set(name, null , options);
     }
    }

缓存优势

一般所说的Web缓存指的是能够自动保存常见http请求副本的http设备。对于前端开发者来讲,浏览器充当了重要角色。除此外常见的还有各类各样的代理服务器也能够作缓存。当Web请求到达缓存时,缓存从本地副本中提取这个副本内容而不须要通过服务器。这带来了如下优势:

缓存减小了冗余的数据传输,节省流量

缓存缓解了带宽瓶颈问题。不须要更多的带宽就能更快加载页面

缓存缓解了瞬间拥塞,下降了对原始服务器的要求。

缓存下降了距离延时, 由于从较远的地方加载页面会更慢一些。

缓存种类

缓存能够是单个用户专用的,也能够是多个用户共享的。专用缓存被称为私有缓存,共享的缓存被称为公有缓存。

私有缓存

私有缓存只针对专有用户,因此不须要很大空间,廉价。Web浏览器中有内建的私有缓存——大多数浏览器都会将经常使用资源缓存在你的我的电脑的磁盘和内存中。如Chrome浏览器的缓存存放位置就在:C:\Users\Your_Account\AppData\Local\Google\Chrome\User Data\Default中的Cache文件夹和Media Cache文件夹。

公有缓存

公有缓存是特殊的共享代理服务器,被称为缓存代理服务器或代理缓存(反向代理的一种用途)。公有缓存会接受来自多个用户的访问,因此经过它可以更好的减小冗余流量。
下图中每一个客户端都会重复的向服务器访问一个资源(此时还不在私有缓存中),这样它会屡次访问服务器,增长服务器压力。而使用共享的公有缓存时,缓存只须要从服务器取一次,之后不用再通过服务器,可以显著减轻服务器压力。

I_GG_YP_TT_5CQ3LPLKDK6

事实上在实际应用中一般采用层次化的公有缓存,基本思想是在靠近客户端的地方使用小型廉价缓存,而更高层次中,则逐步采用更大、功能更强的缓存在装载多用户共享的资源。

缓存处理流程

_R_X_GAK_B3S_D_Q4HQG

而对于前端开发者来讲,咱们主要跟浏览器中的缓存打交道,因此上图流程简化为:

_TGWF9OK_EXO2IOB5GMR_CY

下面这张图展现了某一网站,对不一样资源的请求结果,其中能够看到有的资源直接从缓存中读取,有的资源跟服务器进行了再验证,有的资源从新从服务器端获取。

_I_0_Y_VNT3_HVCOAV_20W

注意,咱们讨论的全部关于缓存资源的问题,都仅仅针对GET请求。而对于POST, DELETE, PUT这类行为性操做一般不作任何缓存

新鲜度限值

HTTP经过缓存将服务器资源的副本保留一段时间,这段时间称为新鲜度限值。这在一段时间内请求相同资源不会再经过服务器。HTTP协议中Cache-Control和 Expires能够用来设置新鲜度的限值,前者是HTTP1.1中新增的响应头,后者是HTTP1.0中的响应头。两者所作的事时都是相同的,但因为Cache-Control使用的是相对时间,而Expires可能存在客户端与服务器端时间不同的问题,因此咱们更倾向于选择Cache-Control。

Cache-Control

下面咱们来看看Cache-Control均可以设置哪些属性值:

max-age(单位为s)指定设置缓存最大的有效时间,定义的是时间长短。当浏览器向服务器发送请求后,在max-age这段时间里浏览器就不会再向服务器发送请求了。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
<html>
  <head>
   <meta http-equiv= "Content-Type" content= "text/html; charset=utf-8" >
   <meta name= "viewport" content= "width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />
   <meta http-equiv= "X-UA-Compatible" content= "IE=EDGE" />
   <title>Web Cache</title>
   <link rel= "shortcut icon" href= "./shortcut.png" >
   <script>
   </script>
  </head>
  <body class= "claro" >
  <img src= "./cache.png" >
  </body>
</html>
var http = require( 'http' );
var fs = require( 'fs' );
http.createServer( function (req, res) {
   if (req.url === '/' || req.url === '' || req.url === '/index.html' ) {
     fs.readFile( './index.html' , function (err, file) {
       console.log(req.url)
       //对主文档设置缓存,无效果
       res.setHeader( 'Cache-Control' , "no-cache, max-age=" + 5);
       res.setHeader( 'Content-Type' , 'text/html' );
       res.writeHead( '200' , "OK" );
       res.end(file);
     });
   }
   if (req.url === '/cache.png' ) {
     fs.readFile( './cache.png' , function (err, file) {
       res.setHeader( 'Cache-Control' , "max-age=" + 5); //缓存五秒
       res.setHeader( 'Content-Type' , 'images/png' );
       res.writeHead( '200' , "Not Modified" );
       res.end(file);
     });
   }
   
}).listen(8888)

当在5秒内第二次访问页面时,浏览器会直接从缓存中取得资源

O_KPE_I_OPPVT0NW2E_8IL

public 指定响应能够在代理缓存中被缓存,因而能够被多用户共享。若是没有明确指定private,则默认为public。

private 响应只能在私有缓存中被缓存,不能放在代理缓存上。对一些用户信息敏感的资源,一般须要设置为private。

no-cache 表示必须先与服务器确认资源是否被更改过(依靠If-None-Match和Etag),而后再决定是否使用本地缓存。

若是上文中关于cache.png的处理改为下面这样,则每次访问页面,浏览器都须要先去服务器端验证资源有没有被更改。

AH_NV6A_NCY2HU_QN0J_SJ

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
fs.readFile( './cache.png' , function (err, file) {
     console.log(req.headers);
     console.log(req.url)
     if (!req.headers[ 'if-none-match' ]) {
       res.setHeader( 'Cache-Control' , "no-cache, max-age=" + 5);
       res.setHeader( 'Content-Type' , 'images/png' );
       res.setHeader( 'Etag' , "ffff" );
       res.writeHead( '200' , "Not Modified" );
       res.end(file);
     } else {
       if (req.headers[ 'if-none-match' ] === 'ffff' ) {
         res.writeHead( '304' , "Not Modified" );
         res.end();
       } else {
         res.setHeader( 'Cache-Control' , "max-age=" + 5);
         res.setHeader( 'Content-Type' , 'images/png' );
         res.setHeader( 'Etag' , "ffff" );
         res.writeHead( '200' , "Not Modified" );
         res.end(file);
       }
     }
   });

no-store 绝对禁止缓存任何资源,也就是说每次用户请求资源时,都会向服务器发送一个请求,每次都会下载完整的资源。一般用于机密性资源。

关于Cache-Control的使用,见下面这张图(来自大额)

181841016351634

客户端的新鲜度限值

Cache-Control不只仅能够在响应头中设置,还能够在请求头中设置。浏览器经过请求头中设置Cache-Control能够决定是否从缓存中读取资源。这也是为何有时候点击浏览器刷新按钮和在地址栏回车,在NetWork模块中看到彻底不一样的结果

U_AON_N_XO_AX_P_U0B

Expires

不推荐使用Expires,它指定的是具体的过时日期而不是秒数。由于不少服务器跟客户端存在时钟不一致的状况,因此最好仍是使用Cache-Control.

服务器再验证

浏览器或代理缓存中缓存的资源过时了,并不意味着它和原始服务器上的资源有实际的差别,仅仅意味着到了要进行核对的时间了。这种状况被称为服务器再验证。

若是资源发生变化,则须要取得新的资源,并在缓存中替换旧资源。

若是资源没有发生变化,缓存只须要获取新的响应头,和一个新的过时时间,对缓存中的资源过时时间进行更新便可。

HTTP1.1推荐使用的验证方式是If-None-Match/Etag,在HTTP1.0中则使用If-Modified-Since/Last-Modified。

Etag与If-None-Match

根据实体内容生成一段hash字符串,标识资源的状态,由服务端产生。浏览器会将这串字符串传回服务器,验证资源是否已经修改,若是没有修改,过程以下(图片来自浅谈Web缓存):

60HQ8__TL_6I_P_0Q15O7
__X_T_T_GHESYFLERGV52_9

上文的demo中咱们见到过服务器端如何验证Etag:

FXKDYMGEYA4_M__CHTVENT2

因为Etag有服务器构造,因此在集群环境中必定要保证Etag的惟一性

If-Modified-Since与Last-Modified

这两个是HTTP1.0中用来验证资源是否过时的请求/响应头,这两个头部都是日期,验证过程与Etag相似,这里不详细介绍。使用这两个头部来验证资源是否更新时,存在如下问题:

有些文档资源周期性的被重写,但实际内容没有改变。此时文件元数据中会显示文件最近的修改日期与If-Modified-Since不相同,致使没必要要的响应。

有些文档资源被修改了,但修改内容并不重要,不须要全部的缓存都更新(好比代码注释)

关于缓存的更新问题,请你们看看这里张云龙的回答,本文就不详细展开了。

本文demo代码以下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
<!DOCTYPE HTML>
<html>
  <head>
   <meta http-equiv= "Content-Type" content= "text/html; charset=utf-8" >
   <meta name= "viewport" content= "width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />
   <meta http-equiv= "X-UA-Compatible" content= "IE=EDGE" />
   <title>Web Cache</title>
   <link rel= "shortcut icon" href= "./shortcut.png" >
   <script>
   </script>
  </head>
  <body class= "claro" >
  <img src= "./cache.png" >
  </body>
</html>
var http = require( 'http' );
var fs = require( 'fs' );
http.createServer( function (req, res) {
   if (req.url === '/' || req.url === '' || req.url === '/index.html' ) {
     fs.readFile( './index.html' , function (err, file) {
       console.log(req.url)
       //对主文档设置缓存,无效果
       res.setHeader( 'Cache-Control' , "no-cache, max-age=" + 5);
       res.setHeader( 'Content-Type' , 'text/html' );
       res.writeHead( '200' , "OK" );
       res.end(file);
     });
   }
   if (req.url === '/shortcut.png' ) {
     fs.readFile( './shortcut.png' , function (err, file) {
       console.log(req.url)
       res.setHeader( 'Content-Type' , 'images/png' );
       res.writeHead( '200' , "OK" );
       res.end(file);
     })
   }
   if (req.url === '/cache.png' ) {
     fs.readFile( './cache.png' , function (err, file) {
       console.log(req.headers);
       console.log(req.url)
       if (!req.headers[ 'if-none-match' ]) {
         res.setHeader( 'Cache-Control' , "max-age=" + 5);
         res.setHeader( 'Content-Type' , 'images/png' );
         res.setHeader( 'Etag' , "ffff" );
         res.writeHead( '200' , "Not Modified" );
         res.end(file);
       } else {
         if (req.headers[ 'if-none-match' ] === 'ffff' ) {
           res.writeHead( '304' , "Not Modified" );
           res.end();
         } else {
           res.setHeader( 'Cache-Control' , "max-age=" + 5);
           res.setHeader( 'Content-Type' , 'images/png' );
           res.setHeader( 'Etag' , "ffff" );
           res.writeHead( '200' , "Not Modified" );
           res.end(file);
         }
       }
     });
   }
}).listen(8888)

好了,本文关于cookie的介绍到此结束了,但愿你们可以喜欢。

上一篇: Navicat快捷键
下一篇: Cookie