Content-Length和Transfer-Encoding详解
citgpt 2024-10-24 16:21 18 浏览 0 评论
什么是Content-Length?
Content-Length是HTTP消息长度,用十进制数字表示的八位字节的数字,是Headers中常见的一个字段。Content-Length应该是精确的,否则就会导致异常 ( HTTP1.0中这个字段可有可无)。
Content-Length字段指出报文中实体主体的字节大小。这个大小是包含了所有内容编码的。比如, 对文本文件进行了gzip压缩的话,Content-Length首部指的就是压缩后的大小而不是原始大小。
Content-Length是如何工作的
Content-Length使用十进制的数字表示了消息的长度,服务端/客户端通过它来得知后续要读取消息的长度。
如果这个长度不正确, 会发生如下情况:
Content-Length > 实际长度
如果Content-Length比实际的长度大,服务端/客户端读取到消息结尾后,会等待下一个字节,自然会无响应直到超时。
同样地,在响应消息中Content-Length
超过实际长度也是一样的效果:
Content-Length < 实际长度
如果这个长度小于实际长度,首次请求的消息会被截取,比如参数为param=piaoruiqing,Content-Length为10,那么这次请求的消息会被截取为: param=piao,如图所示:
但,仅仅是如此吗,当然不,我们再来看看第二次请求会发生什么让人意外的事情,如图:
连续的两次请求,第一次消息被截断,而第二次没有发生预期的截断,而是服务端抛出了异常: Request method 'ruiqingPOST' not supported。刺不刺激?
那 ruiqingPOST是个什么神仙方法??? 此时,凭着多年开发(DEBUG)经验练就的敏感度,我们大致可以猜出,上一次请求被截取剩下的消息,在这次请求出现了。掏出wireshark来验证一下,如图:
导致这种情况的原因就是开启了Connection:keep-alive,如果使用Connection:close,所产生的现象就是每一次的请求都被截断,但不会产生解析混乱(如将上一次剩下的消息拼接到后续的请求消息中)。
不确定Content-Length的值怎么办?
Content-Length首部指示出报文中实体主体的字节大小。但如在请求处理完成前无法获取消息长度,我们就无法明确指定Content-Length,此时应该使用Transfer-Encoding: chunked
什么是Transfer-Encoding: chunked
数据以一系列分块的形式进行发送。Content-Length 头部在这种情况下不会被设置发送。在每一个分块的开头需要添加当前分块的长度,以十六进制的形式表示,后面紧跟着 \r\n,之后是分块本身,后面也是\r\n。终止块是一个常规的分块,不同之处在于其长度为0。
Transfer-Encoding: chunked是如何工作的
接下来我们用一个下载文件的例子,来探讨Transfer-Encoding: chunked是如何工作的。服务端代码如下:
使用postman发起请求,wireshark抓包查看,如图:
在wireshark中可以很清晰地看到chunked的数据,其结构大致是:返回的消息被分为多个数据块,每个数据块有两部分,长度 + 数据,这两部分都以CRLF(即\r\n)结尾。而终止块是一个特殊的数据块,其长度为0,如图:
如此,即完成了分块编码。其主要应用于如下场景,即要传输大量的数据,但是在请求在没有被处理完之前响应的长度是无法获得的。例如,当需要用从数据库中查询获得的数据生成一个大的HTML表格、需要传输大量的图片等。
PS:
Content-Length如果需要存在且生效,那么他的值必须是正确的,否则会发生异常。(大于实际值会超时,小于实际值会截断并可能导致后续的数据解析混乱)
如果报文中包含Transfer-Encoding: chunked首部, 那么Content-Length将被忽略。
相关推荐
- js中arguments详解
-
一、简介了解arguments这个对象之前先来认识一下javascript的一些功能:其实Javascript并没有重载函数的功能,但是Arguments对象能够模拟重载。Javascrip中每个函数...
- firewall-cmd 常用命令
-
目录firewalldzone说明firewallzone内容说明firewall-cmd常用参数firewall-cmd常用命令常用命令 回到顶部firewalldzone...
- epel-release 是什么
-
EPEL-release(ExtraPackagesforEnterpriseLinux)是一个软件仓库,它为企业级Linux发行版(如CentOS、RHEL等)提供额外的软件包。以下是关于E...
- FullGC详解 什么是 JVM 的 GC
-
前言:背景:一、什么是JVM的GC?JVM(JavaVirtualMachine)。JVM是Java程序的虚拟机,是一种实现Java语言的解...
-
2024-10-26 08:50 citgpt
- 跨域(CrossOrigin)
-
1.介绍 1)跨域问题:跨域问题是在网络中,当一个网络的运行脚本(通常时JavaScript)试图访问另一个网络的资源时,如果这两个网络的端口、协议和域名不一致时就会出现跨域问题。 通俗讲...
- 微服务架构和分布式架构的区别
-
1、含义不同微服务架构:微服务架构风格是一种将一个单一应用程序开发为一组小型服务的方法,每个服务运行在自己的进程中,服务间通信采用轻量级通信机制(通常用HTTP资源API)。这些服务围绕业务能力构建并...
- 深入理解与应用CSS clip-path 属性
-
clip-pathclip-path是什么clip-path 是一个CSS属性,允许开发者创建一个剪切区域,从而决定元素的哪些部分可见,哪些部分会被隐...
-
2024-10-25 11:51 citgpt
- Request.ServerVariables 大全
-
Request.ServerVariables("Url")返回服务器地址Request.ServerVariables("Path_Info")客户端提供的路...
- python操作Kafka
-
目录一、python操作kafka1.python使用kafka生产者2.python使用kafka消费者3.使用docker中的kafka二、python操作kafka细...
- Runtime.getRuntime().exec详解
-
Runtime.getRuntime().exec详解概述Runtime.getRuntime().exec用于调用外部可执行程序或系统命令,并重定向外部程序的标准输入、标准输出和标准错误到缓冲池。...
- promise.all详解 promise.all是干什么的
-
promise.all详解promise.all中所有的请求成功了,走.then(),在.then()中能得到一个数组,数组中是每个请求resolve抛出的结果...
-
2024-10-24 16:21 citgpt
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracleclient (56)
- springbatch (59)
- oracle恢复数据 (56)
- 简单工厂模式 (68)
- 函数指针 (72)
- fill_parent (135)
- java配置环境变量 (140)
- linux文件系统 (56)
- 计算机操作系统教程 (60)
- 静态ip (63)
- notifyicon (55)
- 线程同步 (58)
- xcode 4 5 (60)
- 调试器 (60)
- c0000005 (63)
- html代码大全 (61)
- header utf 8 (61)
- 多线程多进程 (65)
- require_once (60)
- 百度网盘下载速度慢破解方法 (72)
- 谷歌浏览器免费入口 (72)
- npm list (64)
- 网站打开速度检测 (59)
- 网站建设流程图 (58)
- this关键字 (67)