淘宝618超级争霸入口 淘宝618争霸赛在哪里
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
淘宝详情页切片优化 淘宝详情页如何创建html
淘宝详情页切片每张要多大,淘宝详情页切片怎么切,淘宝详情页切片保存什么格式,淘宝详情页切图方法对于复杂页面,为了将用户关注的内容尽可能快渲染出来,至少有两种方式:
一、Facebook 的 BigPipe 方式。先输出页面整体布局,然后逐步输出脚本块,一边输出一边执行,将内容渲染回页面布局中。这样可以让服务端的运算、网络传输和浏览器端的渲染变成并行。BigPipe 最主要解决的问题是服务端的运算时间,当服务端的运算时间大于 300 ~ 500ms 时才能体现出优势。当服务端响应非常快(小于 100ms),BigPipe 退化为下面要讲的 【【淘密令】】.
二、淘宝商品详情页的 【【淘密令】】 方式。淘宝的商品详情页,服务端平均响应时间为 52ms, 采用 BigPipe chunked 输出意义不大。这次优化主要在浏览器端。页面下载完毕后,要经过 Tokenization ― Tree Construction ― Rendering. 要让首屏尽快出来,得给浏览器减轻渲染首屏的工作量。可以从两方面入手:
- 减少 DOM 节点数。节点数越少,意味着 Tokenization、Rendering 等操作耗费的时间越少。(对于典型的淘宝商品详情页,经测试发现,每增加一个 DOM 节点,会导致首屏渲染时间延迟约 0.5ms)
- 减少脚本执行时间。脚本执行和 UI Update 共享一个 thread, 脚本耗的时间越少,UI Update 就能越发提前。
对于 BigPipe 来说,初始输出的只有页面布局,DOM 节点数不多。首屏的 DOM 节点数主要取决于首屏脚本块中,字符串化的 html 代码:
big_pipe.onPageletArrive({ "【【微信】】": { } })
这种方式下,页面中的 DOM 节点是逐步增加的。尚未渲染的 DOM 节点,不会影响 TTI 区域。
对于 【【淘密令】】 来说,减少 DOM 节点数的方式有:
- 和 Facebook 的 BigPipe 一样,调整页面代码为 页面布局 + 脚本块。BigPipe 是服务器 chunked 输出 html 内容,【【淘密令】】 是服务器一次性输出,其他都是一样的。
- 尽量少调整页面代码,但通过某种方式,将首屏不需要的 html 代码先存放起来。渲染好首屏后,再将存储好的 html 代码逐步渲染出来。
最容易想到的一种方式是学习 Facebook 好榜样,用 js 字符串来存放:
<【【微信】】;【【微信】】="<p>some data</p>...";</【【微信】】;
这种方式对于 【【淘密令】】 来说,并不是很好:
把代码规范做好,把校验工作做好,再加上预处理和缓存,js 字符串的方式也是非常不错的。但对于淘宝详情页来说,目前用 js 字符串的方式需要做的改动比较多,增加的服务器消耗不少,不是很合适。
我们这次优化的目标是:
- 大幅度减少首屏渲染时间。
- 尽量不改变原有开发习惯。
- 用尽量少的代码做尽量多的优化。
为了便于获取注释内容,添加一层包裹:
<div id="【【微信】】"><!-- html code--></div>
这样,获取代码很简单:
【【微信】】=document.getElementById('【【微信】】').childNodes[0].nodeValue;
缺点是:
当 html code 很大时,替换的效率不高。依赖特殊标记的替换理论上也不完美。
还有什么存放方式呢?
HTML 元素分为五大类:
- 【【微信】】. 像 hr, br, base 这种。
- Raw text elements. 有两个:【【微信】】 和 style.
- RCDATA elements. 也有两个:textarea 和 title.
- Foreign elements. 来自 MATHML 和 SVG 的元素。
- 【【微信】】. 除了以上四种类型之外的所有元素,比如 p, div, 【【微信】】 等。
显然,【【微信】】 和 Foreign elements 不适合用来存放 html 代码。
对于 【【微信】】, 里面的 < 字符会被当做 tag open 来解析,有一个方式是通过 display:none 来避免渲染:
<di【【微信】】="display:none">html code</div>
这样做,减少的只是可见的 DOM 节点数,DOM 总数依旧不变。Tokenization ― Tree Construction 等操作的耗时并没减少。
我们将重点放到 Raw text elements 和 RCDATA elements 上来。
先了解下 CDATA(Character Data) 的相关知识点。
在 XML 中,不包含子元素的元素的内容默认必须是 PCDATA(Parsed Character Data):
<data><p>some text</p></data>
“Parsed” 是指 < 和 & 字符要转换成 < 和 & 实体字符形式。如果不想写一大堆 &xx;, 可以直接标记为 CDATA:
<data><![CDATA[<p>some text</p>]]></data>
这是 XML 的习惯,很严格,但对用户并不友好。在 HTML 中,如果要兼容 XML, 得像如下一样:
<【【微信】】;//<![CDATA[var t="<p>";//]]></【【微信】】;
增加的 <![CDATA[ 很无聊。【【微信】】 中本就是 CDATA.
为了让用户更舒心,让代码更自然,HTML 将 【【微信】】 和 style 定义为 Raw text elements. 也就是说,这两个元素里面的内容是 raw text, 里面出现的 > 就表示 > 字符本身,不会被当作 tag open 来解析;> 也不会根据实体字符来转义,就表示 > 字串自身。这就是 CDATA.
Raw text elements 有一个限制:里面的内容不能有自身的ETAGO标记,也就是说,【【微信】】 里的内容不能含有 </【【微信】】(\s|\\|>), 否则就会导致 【【微信】】 提前结束:
<【【微信】】;[xss_clean]('<【【微信】】;alert("O HAI")</【【微信】】;');</【【微信】】;
上面的代码会出错,必须打破 </【【微信】】 组合:
<【【微信】】; // Using string 【【微信】】ion: [xss_clean]('<【【微信】】;alert("heh")<' + '/【【微信】】;'); // Lame. // Using a string literal escape: [xss_clean]('<【【微信】】;alert("huh")<\x3C【【微信】】;'); // Lame. // Simply escaping the solidus character with a re【【微信】】 (\): [xss_clean]('<【【微信】】;alert("O HAI")</【【微信】】;'); // Awesome!</【【微信】】;
style 也类似,不多说。
除了 Raw text elements, 还有 RCDATA elements. 我们来看看。
RCDATA(Replaceable Character Data) 表示里面可以有 &xx; 等实体字符,也可以包含 < 字符而不会被当作 tag open 来解析。比如:
<textarea><p><</p></textarea>
在 RCDATA 里,< 可替换为 < (Replaceable 的含义),拿到值(比如 textarea.value)后,是无从得知源码里是否有 < 等实体字符的。
回到正题。在 Raw text elements 里,可以用 【【微信】】 来存放数据:
<【【微信】】 type="text/html" id="【【微信】】-data"><p>some text</p></【【微信】】;
获取也很简单:
【【微信】】=document.getElementById('【【微信】】-data')[xss_clean];
这个方案比用注释来存放的方案更好,但依旧存在以下缺点:
- 服务端,要将 【【微信】】 里 html 中的 </【【微信】】 替换为某种特殊标记。
- 浏览器端,得到 htmlCode 后,要将上面的特殊标记替换回原值。
注意:特殊标记不能是 </【【微信】】, 因为有可能存在以下代码:
<【【微信】】 type="text/html" id="【【微信】】-data"><【【微信】】;【【微信】】='</【【微信】】;';</【【微信】】;</【【微信】】;
这样替换回原值时,会误伤 str 字符串。
textarea 中的内容会按照 RCDATA 规则来解析:
- 遇到 & 时,会尽可能得到实体字符。
- 遇到 </textarea(\s|\\|>) 时,会结束解析。
- 其他都直接作为 textarea 的内容。
<textarea id="area-data"><p>some text</p></textarea>
获取非常简单:
【【微信】】=document.getElementById('area-data').value;
缺点:
- 服务端,要将 html 中的 & 转义成 &
- 服务端,要打破 ETAGO, 将 </textarea 转义成 </textarea
优点很明显,在浏览器端,只需通过 textarea.value 取值即可,无需进行任何转义替换操作。并且理论上不会出现任何 bug.
经过上面的分析,结果已经很明显,用 RCDATA elements 来存放数据是最妥当的。title 元素明显不合适,因此最后的选择就剩下一个了:textarea. 并且从语义上讲,用 text area 来存放 html text 也说得过去^o^
可以根据实际情况,将页面划分成几大区域。非首屏区域,简单转义后,直接用 textarea 包裹起来。这样,DOM 数立刻就减少了。浏览器在拿到 html 代码时,首次 Tokenization ― Tree Construction 的速度就会大大加快。
完整的优化,还需要:
- 给浏览器合理的喘息(UI Update)时间,等首屏真正在显示器上绘制出来后,再进行下一步操作。
- 得到 textarea.value, 填充回 DOM 树时,得妥善处理内嵌的 【【微信】】 代码。
- 对内嵌 【【微信】】 代码中的 [xss_clean] 要妥善处理。
- 通过 textarea 回填,里面的非 defer 和 async 脚本会从同步变成异步。要妥善处理依赖关系,不破坏原有脚本逻辑。
- 对于优化项目来说,完备的测试和监控非常重要。
- 这次还做了 AssetsTransfer. 用户第一次访问时,会将首屏相关的脚本和样式内嵌,并做预加载。用户再次访问时,则改成外链方式,这样能充分利用浏览器缓存,并减少 html 传输量。
最后,给一张优化成果图:
这是一个典型的淘宝详情页的首屏时间趋势图。可看出,首屏时间从优化前的 3s 降低到了优化后的 1.5s 左右,快了一倍!
更深度的优化需要对页面内容(包括脚本)做进一步的细粒度模块化,区分出优先级,然后根据需求,灵活自由地控制各个模块的下载和执行等等
这篇博客写得比较杂,关于 【【淘密令】】 优化的更多细节,以后有机会再细说。欢迎反馈、拍砖。欢迎业界各位朋友尝试 【【淘密令】】 优化,希望国内的站点速度都越来越快!
CDATACDATA ConfusionHTML5 TokenizationThe end-tag open (ETAGO) delimitertokenization of htmlhtml 实体字符值
2011-09-23:在业界,【【微信】】 经常用来存放 template 数据:
<【【微信】】 type="text/template"><h1>{{title}}</h1><p>I am {{name}}...</p></【【微信】】;
绝大部分情况下,template 里不会出现 </【【微信】】 . 这样,服务端和浏览器端都无需做任何 replace, 是目前用来存放 template 的最佳实践。
2011-09-24:举例说明下 textarea 中为何要转义 &. 假设原代码为:
<p>< represents <</p><p></p></p>
如果直接放到 textarea 中,
<textarea><p>< represents <</p><p></p></p></textarea>
由于 textarea 是 RCDATA 元素,上面的代码等价于:
<textarea><p>< represents <</p><p></p></p></textarea>
获取 textarea.value,回填到 DOM 树的代码为:
out[xss_clean]=textarea.value;
这时页面中的显示效果明显和原来不一样了。如果将所有 & 都转化成 & 则可以保持原样。
注意:理论上,并不需要将所有 & 转化成 &, 只需要将与 HTML 语法冲突的字符串 < > & 中的 & 转化成 & 即可。但这样做,还得处理 x 等数值表示,比如 & 还有 & & 两种表现形式,这样替换起来更麻烦,不如将所有 & 替换成 & 来得快捷高效。