[點晴永久免費OA][轉帖]瀏覽器工作原理
當前位置:點晴教程→點晴OA辦公管理信息系統
→『 經驗分享&問題答疑 』
有許多瀏覽器正在被使用,截至2022年,使用最多的是:谷歌瀏覽器、蘋果的Safari、微軟的Edge和火狐。 但是,它們實際上是如何工作的,從我們在地址欄中鍵入網絡地址開始,到我們試圖訪問的頁面顯示在屏幕上,會發生什么? 關于這個問題的答案,一個極其簡化的版本是:
很直接,對嗎?是的,但在這個看似超級簡單的過程中還涉及更多的內容。在這個系列中,我們將討論 1.導航導航是加載網頁的第一步。它指的是當用戶通過 DNS 查詢(解決網址問題)導航到一個網頁的第一步是找到該網頁的靜態資源位置(HTML、CSS、Javascript和其他類型的文件)。如果我們導航到 example.com ,HTML 頁面位于 IP 地址為 93.184.216.34 的服務器上(對我們來說,網站是域名,但對計算機來說,它們是 IP 地址)。如果我們以前從未訪問過這個網站,就必須進行域名系統(DNS)查詢。
因此,當我們請求進行 DNS 查詢時,我們實際做的是與這些服務器中的一個進行對話,要求找出與example.com 名稱相對應的IP地址。如果找到了一個對應的 IP,就會返回。如果發生了一些情況,查找不成功,我們會在瀏覽器中看到一些錯誤信息。 在這個最初的查詢之后,IP 地址可能會被緩存一段時間,所以下次訪問同一個網站會更快,因為不需要進行 DNS 查詢(記住,DNS 查詢只發生在我們第一次訪問一個網站時)。 TCP (Transmission Control Protocol) 握手一旦瀏覽器知道了網站的 IP 地址,它將嘗試通過 TCP 三次握手(也稱為 SYN-SYN-ACK,或者更準確的說是 SYN、SYN-ACK、ACK,因為 TCP 有三個消息傳輸,用于協商和啟動兩臺計算機之間的TCP 會話),與持有資源的服務器建立連接。
TCP 握手是一種機制,旨在讓兩個想要相互傳遞信息的實體(在我們的例子中是瀏覽器和服務器)在傳輸數據之前協商好連接的參數。 因此,如果瀏覽器和服務器是兩個人,他們之間的對話會是這樣的: 瀏覽器向服務器發送一個 SYNC 消息,要求進行同步(同步意味著連接)
然后,服務器將回復一個 SYNC-ACK 消息( SYNChronization 和 ACKnowledgement) 在最后一步,瀏覽器將回復一個 ACK 信息 現在,TCP連接(雙向連接)已經通過3次握手建立,TLS協商可以開始。 TLS協商對于通過 HTTPS 建立的安全連接,需要進行另一次握手。這種握手(TLS協商)決定了哪個密碼將被用于加密通信,驗證服務器,并在開始實際的數據傳輸之前建立一個安全的連接。
在這一步驟中,瀏覽器和服務器之間還交換了一些信息
現在可以開始從服務器請求和接收數據了 2.獲取數據在上一節中,我們談到了 HTTP 請求在我們與服務器建立安全連接后,瀏覽器將發送一個初始的 HTTP GET 請求。首先,瀏覽器將請求頁面的 HTML 文件。它將使用 HTTP 協議來做這件事。
請求方法 - POST, GET, PUT, PATCH, delete 等 URI - 是統一資源識別符的縮寫。URIs 用于識別互聯網上的抽象或物理資源,如網站或電子郵件地址等資源。一個 URI 最多可以有 5 個部分 scheme:用于說明使用的是什么協議 authority:用于識別域名 path:用于顯示資源的確切路徑 query:用于表示一個請求動作 fragment:用來指代資源的一部分 // URI parts scheme :// authority path ? query # fragment //URI example <https://example.com/users/user?name=Alice#address> https: // scheme name example.com // authority users/user // path name=Alice // query address // fragment HTTP 頭字段 - 是瀏覽器和服務器在每個 HTTP 請求和響應中發送和接收的字符串列表(它們通常對終端用戶是不可見的)。在請求的情況下,它們包含關于要獲取的資源或請求資源的瀏覽器的更多信息。 如果你想看看這些請求頭字段是什么樣子的,請進入 Chrome 瀏覽器并打開開發者工具(F12)。進入 Network 標簽,選擇 HTTP 響應一旦服務器收到請求,它將對其進行處理并回復一個 狀態代碼 - 例如:200、400、401、504網關超時等(我們的目標是 200 狀態代碼,因為它告訴我們一切正常,請求是成功的) 響應頭字段 - 保存關于響應的額外信息,如它的位置或提供它的服務器。 一個 HTML 文檔的例子可以是這樣的 <!doctype HTML> <html> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <meta http-equiv="X-UA-Compatible" content="ie=edge"> <title>我的頁面</title> <link rel="stylesheet" src="styles.css"/> <script src="mainscripts.js"></script> </head> <body> <h1 class="heading">這個是我的頁面</h1> <p>一個段落和一個 <a href="<https://example.com/about>">鏈接</a></p> <div> <img src="myImage.jpg" alt="image description"/> </div> <script src="sideEffectsscripts.js"></script> </body> </html> 對于我前面提到的同一個搜索,響應頭是這樣的 如果我們看一下HTML文檔,我們會發現它引用了不同的 CSS 和 Javascript 文件。這些文件不會被請求。在這個時候,只有 HTML 被請求并從服務器接收。 這個初始請求的響應包含收到的第一個字節的數據。第一個字節的時間(TTFB)是指從用戶提出請求(在地址欄中輸入網站名稱)到收到第一個 HTML 數據包(通常為14kb)的時間。 TCP 慢啟動和擁塞算法
3.HTML 解析到目前為止,我們討論了導航和數據獲取。 今天我們將討論解析,特別是 我們看到在向服務器發出初始請求后,瀏覽器如何收到包含我們嘗試訪問的網頁的 HTML 資源(第一塊數據)的響應。 現在瀏覽器的工作就是開始解析數據。
換句話說,解析意味著將我們編寫的代碼作為文本(HTML、CSS)并將其轉換為瀏覽器可以使用的內容。 解析將由瀏覽器引擎完成(不要與瀏覽器的 Javascript 引擎混淆)。 瀏覽器引擎是每個主要瀏覽器的核心組件,它的主要作用是結合結構 (HTML) 和樣式 (CSS),以便它可以在我們的屏幕上繪制網頁。 它還負責找出哪些代碼片段是交互式的。 我們不應將其視為一個單獨的軟件,而應將其視為更大軟件(在我們的例子中為瀏覽器)的一部分。 有許多瀏覽器引擎,但大多數瀏覽器使用這三個活躍且完整引擎之一: Gecko 它是由 Mozilla 為 Firefox 開發的。 過去,它曾為其他幾種瀏覽器提供支持,但目前,除了 Firefox,Tor 和 Waterfox 是唯一仍在使用 Gecko 的瀏覽器。 它是用 C++ 和 Javascript 編寫的,自 2016 年起,還用 Rust 編寫。 WebKit 它主要由 Apple 為 Safari 開發。 它還為 GNOME Web (Epiphany) 和 Otter 提供支持。 (令人驚訝的是,在 iOS 上,包括 Firefox 和 Chrome 在內的所有瀏覽器也由 WebKit 提供支持)。 它是用 C++ 編寫的。 Blink,Chromium 的一部分 它最初是 WebKit 的一個分支,主要由 Google 為 Chrome 開發。 它還為 Edge、Brave、Silk、Vivaldi、Opera 和大多數其他瀏覽器項目(一些通過 QtWebEngine)提供支持。 它是用 C++ 編寫的。 現在我們了解了誰將進行解析,讓我們看看在從服務器接收到第一個 HTML 文檔后到底發生了什么。 讓我們假設文檔如下所示: <!doctype HTML> <html> <head> <title>This is my page</title> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> </head> <body> <h1>This is my page</h1> <h3>This is a H3 header.</h3> <p>This is a paragraph.</p> <p>This is another paragraph,</p> </body> </html> 即使請求頁面的 HTML 大于初始的 14KB 數據包,瀏覽器也會開始解析并嘗試根據其擁有的數據呈現體驗。 HTML 解析涉及兩個步驟:詞法分析 和 樹構造(構建稱為 DOM 樹的東西)。 詞法分析
詞法分析過程結束時的結果是一系列 0 個或多個以下標簽:DOCTYPE、開始標簽 ( 構建 DOM創建第一個 token 后, DOM 樹描述了 HTML 文檔的內容。 實際上,DOM 比我們在該模式中看到的更復雜,但我保持簡單以便更好地理解(另外,我們將在以后的文章中更詳細地討論 DOM 及其重要性)。 此構建階段是 解析器從上到下逐行工作。 當解析器遇到非阻塞資源(例如圖像)時,瀏覽器會向服務器請求這些圖像并繼續解析。 另一方面,如果它遇到阻塞資源(CSS 樣式表、在 HTML 的 部分添加的 Javascrpt 文件或從 CDN 添加的字體),解析器將停止執行,直到所有這些阻塞資源都被下載。 這就是為什么,如果你正在使用 Javascript,建議在 HTML 文件的末尾添加 預加載器 & 使頁面更快Internet Explorer、WebKit 和 Mozilla 都在 2008 年實現了預加載器,作為處理阻塞資源的一種方式,尤其是腳本(我們之前說過,當遇到腳本標簽時,HTML 解析將停止,直到腳本被下載并執行)。 使用預加載器,當瀏覽器卡在腳本上時,第二個較輕的解析器會掃描 HTML 以查找需要檢索的資源(樣式表、腳本等)。 然后預加載器開始在后臺檢索這些資源,目的是在主 HTML 解析器到達它們時它們可能已經被下載(如果這些資源已經被緩存,則跳過此步驟)。 4.解析 CSS解析完 HTML 之后,就該解析 CSS(在外部 CSS 文件和樣式元素中找到)并構建 CSSOM 樹(CSS 對象模型)。 當瀏覽器遇到 CSS 樣式表時,無論是外部樣式表還是嵌入式樣式表,它都需要將文本解析為可用于設置布局樣式的內容。 瀏覽器將 CSS 變成的數據結構稱為 CSSOM。 DOM 和 CSSOM 遵循相似的概念,因為它們都是樹,但它們是 詞法分析和構建 CSSOM與 HTML 解析類似,CSS 解析從詞法分析開始。 CSS 解析器獲取字節并將它們轉換為字符,然后是標簽,然后是節點,最后它們被鏈接到 CSSOM 中。 瀏覽器會執行一些稱為 瀏覽器從適用于節點的最通用規則開始(例如:如果節點是 body 元素的子節點,則所有 body 樣式都由該節點繼承),然后通過應用更具體的規則遞歸地優化計算出的樣式。 這就是為什么我們說樣式規則是級聯的。 假設我們有下面的 HTML 和 CSS: body { font-size: 16px; color: white; } h1 { font-size: 32px; } section { color: tomato; } section .mainTitle { margin-left: 5px } div { font-size: 20px; } div p { font-size: 8px; color: yellow; } 這段代碼的 CSSOM 看起來像這樣: 請注意,在上面的模式中,嵌套元素既有 由于我們的 CSS 可以有多個來源,并且它們可以包含適用于同一節點的規則,因此瀏覽器必須決定最終應用哪個規則。 這就是 想象一下,您在機場尋找您的朋友 John。 如果你想通過喊他的名字找到他,你可以喊 “ John ”。 可能不止一個 John 會同時出現在機場,所以他們可能都會做出回應。 更好的方法是用他的全名打電話給你的朋友,這樣當你喊“John Doe”時,你就有更好的機會找到他,因為“ John Doe ”比“ John ”更具體。 同樣,假設我們有這個元素:
<a href="<https://dev.to/>">This is just a link!</a> </p> 以及這些 CSS 樣式: a { color: red; } p a { color: blue; } 您認為瀏覽器會應用哪條規則? 答案是第二條規則,因為 p 標簽中的所有 a 標簽選擇器比所有a 標簽選擇器都具有更高的優先級。 如果你想玩玩優先級,你可以使用這個 優先級計算器。 重點CSS 規則是從右到左閱讀的,這意味著如果我們有這樣的代碼: 5. 執行 Javascript在解析 CSS 并創建 CSSOM 的同時,還會下載其他資產,包括 Javascript 文件。 這要歸功于我們在之前文章中提到的預加載器。
所以,當我們從服務器獲取 Javascript 文件后,代碼被解釋、編譯、解析和執行。 計算機無法理解 Javascript 代碼,只有瀏覽器可以。 JS 代碼需要被翻譯成計算機可以使用的東西,這是 Javascript 瀏覽器引擎的工作(不要與瀏覽器引擎混淆)。 根據瀏覽器的不同,JS 引擎可以有不同的名稱和不同的工作方式。 Javascript 引擎javascript 引擎(有時也稱為 ECMAscript 引擎)是一種在瀏覽器中執行(運行)Javascript 代碼的軟件,而不僅僅是零部件(例如,V8 引擎是 Node.js 環境的核心組件)。 Javascript 引擎通常由 Web 瀏覽器供應商開發,每個主要瀏覽器都有一個。 我們說過,目前使用最多的瀏覽器是 Chrome、Safari、Edge 和 Firefox。 每個都使用不同的 Javascript 引擎,它們是: V8 V8 是 Google 的高性能 Javascript 引擎。 它是用 C++ 編寫的,用于 Chrome 和 Node.js 等。 它實現了 ECMAscript(一種 Javascript 標準,旨在確保網頁在不同 Web 瀏覽器之間的互操作性)和 WebAssembley。 它實現了 ECMA-262。 JavascriptCore JavascriptCore 是 WebKit 的內置 Javascript 引擎,它為 Safari 瀏覽器、郵件和 macOS 上使用的其他應用程序提供支持。 它目前按照 ECMA-262 規范實現 ECMAscript。 它也被稱為 SquirrelFish 或 SquirrelFish Extreme。 Chakra Chakra 是微軟為其 Microsoft Edge 網絡瀏覽器和其他 Windows 應用程序開發的 Javascript 引擎。 它實現了 ECMAscript 5.1,并且對 ECMAscript 6 有部分(不斷增加的)支持。它是用 C++ 編寫的。 SpiderMonkey SpiderMonkey 是 Mozilla 的 Javascript 和 WebAssembly 引擎。 它是用 C++、Javascript 和 Rust 編寫的,用于為 Firefox、Servo 和其他項目提供支持。 一開始,Javascript 引擎只是簡單的解釋器。 我們今天使用的現代瀏覽器能夠執行稱為即時 (JIT) 編譯的功能,這是編譯和解釋的混合體。 編譯 在編譯過程中,一個稱為 解釋 在解釋過程中,解釋器逐行檢查 Javascript 代碼并立即執行。 沒有進行編譯,因此沒有創建目標代碼(代碼的輸出由解釋器本身使用其內部機制創建)。 舊版本的 Javascript 使用這種類型的代碼執行。 即時編譯( JIT Compilation ) 即時編譯是給定語言的解釋器的一個特性,它試圖同時利用編譯和解釋。 是在純編譯期間,代碼是在執行之前被編譯,然而在 JIT 編譯中,代碼在執行時(在運行時)被編譯。 所以我們可以說源代碼是動態轉換為機器代碼的。 較新版本的 Javascript 使用這種類型的代碼執行。 JIT 編譯的一個很重要的方面就是將源代碼編譯成當前正在運行的機器的機器碼指令。 這意味著生成的機器代碼是針對正在運行的機器的 CPU 架構進行了優化。 簡而言之,這三個過程可以總結為:
今天, 請注意,我提到了舊版本和新版本的 Javascript。 不支持較新版本語言的瀏覽器將解釋代碼,而支持的瀏覽器將使用某些版本的 JIT 來執行代碼(V8、Chakra JavascriptCore 和 SpiderMonkey 引擎都使用 JIT)。 事實上,盡管 Javascript 是一種解釋型語言(它不需要編譯),但如今大多數瀏覽器都會使用 JIT 編譯來運行代碼,而不是純粹的解釋型語言。 Javascript 代碼是如何處理的當 Javascript 代碼進入 Javascript 引擎時,它首先被解析。 這意味著代碼被讀取,并且在這種情況下,代碼被轉換為稱為 假設我們有一個文件,其中包含一個只做一件事的程序,那就是定義一個變量: js復制代碼const age = 25; 這就是這行非常簡單的代碼看起來像抽象語法樹的方式(我正在使用@babel/parser-7.16.12): 如果你想將一些 Javascript 轉換為抽象語法樹,你可以使用這個工具。 編寫變量后得到的 AST 實際上要大得多,在屏幕截圖中隱藏了更多節點。 構建 AST 后,它會被翻譯成機器代碼并立即執行,因為現代 Javascript 使用即時編譯。 這段代碼的執行將由 Javascript 引擎完成,利用稱為“調用堆棧”的東西。
6.創建可訪問(無障礙)樹除了我們一直在討論的所有這些樹(DOM、CSSOM 和 AST)之外,瀏覽器還構建了一種稱為
一般而言,殘疾用戶可以并且確實在使用具有各種輔助技術的網頁。 他們使用屏幕閱讀器、放大鏡、眼動追蹤、語音命令等。 為了讓這些技術發揮作用,它們需要能夠訪問頁面的內容。 由于他們無法直接讀取 DOM,因此 ACT 開始發揮作用。 可訪問性樹是使用 DOM 構建的,稍后輔助設備將使用它來解析和解釋我們正在訪問的網頁的內容。 ACT 就像 DOM 的語義版本,每次 DOM 更新時它都會更新。 每個需要暴露給輔助技術的 DOM 元素都會在 ACT 中有一個對應節點。 在未構建 ACT 之前,屏幕閱讀器無法訪問內容。 要查看可訪問性樹的實際的樣子,您可以通過 Google Chrome 瀏覽器。 打開調試器 (F12) 并轉到“元素”選項卡。 從那里,你可以在右側選擇“輔助功能”窗格。
我去 Google 并檢查了搜索輸入,這是我在“計算”屬性下的“輔助功能”窗格中得到的: 使用語義 HTML 的重要性超出了本文的范圍,但作為開發人員,我們都應該記住,我們構建的網站應該可供所有希望使用它們的人使用。 如果您想閱讀有關該主題的更多信息,可以在此處找到一篇關于 Web 可訪問性的很好的介紹性文章。 據互聯網協會無障礙訪問特別興趣小組稱,目前全世界有超過 13 億人(約占世界人口的 15%)患有某種形式的殘疾。 7.渲染樹在解析階段構建的樹(DOM、CSSOM)被組合成一種叫做 DOM 和 CSSOM 是使用 HTML 和 CSS 文件創建的。 這兩個文件包含不同類型的信息,樹的結構也不同,那么渲染樹是如何創建的呢? 結合 DOM 和 CSSOM
以上步驟的結果將是一個包含所有可見節點、內容和樣式的 布局(回流)階段渲染樹包含有關顯示哪些節點及其計算樣式的信息,但不包含每個節點的尺寸或位置。 接下來需要做的是計算這些節點在設備視口(瀏覽器窗口內)內的確切位置及其大小。 這個階段稱為布局(在 Chrome、Opera、Safari 和 Internet Explorer 中)或重排(在 Firefox 中),但它們的意思相同。 瀏覽器在渲染樹的根部開始這個過程并遍歷它。 回流步驟不會只發生一次,而是每次我們更改 DOM 中影響頁面布局的某些內容時,即使是部分更改,都會觸發回流。 重新計算元素位置的情況示例如下:
讓我們來看一個非?;镜?HTML 示例,其中內嵌了一些 CSS: html復制代碼<!DOCTYPE html> <html> <head> <meta name="viewport" content="width=device-width,initial-scale=1" /> <title>Reflow</title> </head> <body> <div style="width: 100%; height: 50%"> <div style="width: 50%; height: 50%">This is the reflow stage!</div> </div> </body> </html> 上面的代碼只是說在視口內我們應該有兩個 div,其中第二個嵌套在第一個里面。 父 div 占據視口寬度的 100%和高度的 50%。第二個 div 占據父 div 的 50% 這看起來像這樣: 這個過程的輸出是一個 繪畫(重繪)階段在瀏覽器決定哪些節點需要可見并計算出它們在視口中的位置后,就可以在屏幕上繪制它們(渲染像素)了。 這個階段也被稱為 就像布局階段一樣,繪畫階段不會只發生一次,而是每次我們改變屏幕上元素的外觀時。 這些情況的例子是:
繪畫意味著瀏覽器需要將元素的每個視覺部分繪制到屏幕上,包括文本、顏色、邊框、陰影和替換元素(如按鈕和圖像),并且需要超快地完成。 為了確保重繪可以比初始繪制更快地完成,屏幕上的繪圖通常被分解成幾層。 如果發生這種情況,則需要進行合成。 分層和合成傳統意義上,網絡瀏覽器完全依賴 CPU 來呈現網頁內容。 但現在即使是最小的設備也有高性能的 GPU,所有大部分實現方案都圍繞著 GPU 來尋求更好的體驗。
通常,只有特定的任務會被重定向到 GPU,而這些任務可以由合成器線程單獨處理。 為了找出哪些元素需要在哪一層,主線程遍歷布局樹并創建層樹。 默認情況下,只有一層(這些層的實現方式因瀏覽器而異),但我們可以找到會觸發重繪的元素,并為每個元素創建一個單獨的層。 這樣,重繪不應應用于整個頁面,而且此過程將可以使用到 GPU 如果我們想向瀏覽器提示某些元素應該在一個單獨的層上,我們可以使用 謹記上面討論的兩種操作,回流和重繪,都是昂貴的,尤其是在像手機這樣處理能力低的設備上。 這就是為什么在處理 DOM 更改時我們應該嘗試優化它們(我將在我的 DOM 系列的未來一篇文章中詳細討論這一點)。 有些動作只會觸發重繪,有些動作會同時觸發回流和重繪。
鏈接:https://juejin.cn/post/7204806134935306301 該文章在 2023/5/25 18:17:19 編輯過 |
關鍵字查詢
相關文章
正在查詢... |