一、網(wǎng)頁(yè)大小這里的網(wǎng)頁(yè)大小是指網(wǎng)頁(yè)的字節(jié)大小,網(wǎng)頁(yè)的物理大小。
很多搜索引擎的搜索結(jié)果中會(huì)看到網(wǎng)頁(yè)大小。
我們知道,在內(nèi)容和功能確定的前提下,網(wǎng)頁(yè)字節(jié)數(shù)越小,打開(kāi)速度越快,對(duì)se爬行越有利,這個(gè)網(wǎng)頁(yè)大小具體指的是么呢?它指的是該網(wǎng)頁(yè)源代碼的字節(jié)大小,不包含額外的js,gif,flash,jpg等。
怎么得到網(wǎng)頁(yè)大小的值呢?
1、如果網(wǎng)頁(yè)在本地,直接查看在網(wǎng)頁(yè)屬性;
2、在網(wǎng)頁(yè)點(diǎn)右鍵-查看源代碼,將源代碼另存,查看大小;
3、利用firefox插件Extended Statusbar;
4、有人需要在程序中調(diào)用網(wǎng)頁(yè)字節(jié)大小,可用代碼:
搜索引擎抓取的只是網(wǎng)頁(yè)的部分源代碼,而圖片、Css等不會(huì)存儲(chǔ)到它的服務(wù)器,在搜索引擎抓取的過(guò)程中,利用類(lèi)似上面的代碼,得到一個(gè)網(wǎng)頁(yè)大小的參數(shù),一塊存入數(shù)據(jù)庫(kù),最終在搜索引擎結(jié)果頁(yè)面中輸出。
二、網(wǎng)頁(yè)流量很多主機(jī)都有流量限制,這里說(shuō)的流量就是指從服務(wù)器端下載的實(shí)際流量,即用戶(hù)瀏覽網(wǎng)頁(yè)產(chǎn)生的實(shí)際流量。
1、用戶(hù)第一次打開(kāi)網(wǎng)頁(yè)A時(shí),會(huì)將網(wǎng)頁(yè)A本身(網(wǎng)頁(yè)源代碼的字節(jié)大小)+Css+Js+網(wǎng)頁(yè)中的圖片+flash+其它全部下載到本機(jī)硬盤(pán)(瀏覽器緩存)中,這是的流量等于以上文件字節(jié)數(shù)的總和;
2、當(dāng)用戶(hù)再打開(kāi)網(wǎng)頁(yè)A之后,又打開(kāi)了網(wǎng)頁(yè)B,而網(wǎng)頁(yè)B中包含了部分和A相同的CSS,JS,圖片,同時(shí)又包含自身的一部分圖片,js等,這時(shí)瀏覽器不會(huì)下載這些相同的文件,所以這是打開(kāi)網(wǎng)頁(yè)B的流量=B源代碼+網(wǎng)頁(yè)B中新的圖片,cs,js等;
3、當(dāng)用戶(hù)再打開(kāi)網(wǎng)頁(yè)A、B后(沒(méi)有刪除緩存),用F5刷新了A,或B,瀏覽器只會(huì)重新下載A、B源代碼;
4、當(dāng)用戶(hù)用使用Ctrl+F5刷新A、B,或清除了緩存,重新下載A、B,同前兩步;F5為讀取緩存,Ctrl+F5為重新從服務(wù)器讀取。