網(wǎng)絡運維|從網(wǎng)絡IO看高性能架構
2020-06-19 17:00 作者:艾銻無限 瀏覽量:
網(wǎng)絡維護是一種
日常維護,包括
網(wǎng)絡設備管理(如計算機,服務器)、操作
系統(tǒng)維護(系統(tǒng)打補丁,系統(tǒng)升級)、
網(wǎng)絡安全(病毒防范)等。+
北京艾銻無限科技發(fā)展有限公司為您免費提供給您大量真實有效的北京
網(wǎng)絡維護服務,北京
網(wǎng)絡維修信息查詢,同時您可以免費資訊北京
網(wǎng)絡維護,北京
網(wǎng)絡維護服務,北京
網(wǎng)絡維修信息。專業(yè)的北京
網(wǎng)絡維護信息就在
北京艾銻無限+
+
北京
網(wǎng)絡維護全北京朝陽豐臺北京周邊海淀、大興、昌平、門頭溝、通州、西城區(qū)、燕郊、石景山、崇文、房山、宣武、順義、平谷、延慶全北京
網(wǎng)絡維護信息
相信大家肯定聽過什么阻塞/非阻塞IO,同步/異步調用,我也嘗試過死記概念,結果大家應該都有體會,過一陣子就忘記了。知其然而不知其所以然~然并卵。
大家在選擇一門語言或者一個框架的時候肯定優(yōu)先看它的性能,也就是并發(fā)量,例如常用的測試手段,就是用該語言或者框架寫個http server服務器,對于http請求返回一個“hello,world!”,利用wrk進行壓測,看看每分鐘請求量最高能到多少,在4核8G的Ubuntu服務器上跑該http服務,利用wrk壓測,gin框架每分鐘能處理的請求量接近300W!這是相當優(yōu)秀的!
前一陣子在go meet up深圳討論語言性能的時候,有位老哥說同等業(yè)務與機器,PHP每秒請求量大概在300多,處理三萬并發(fā)量的服務程序, go需要一臺服務器,而PHP需要一百臺。我當時非常震驚,為什么語言之間的差別這么大,是什么原因造成這個巨大的差別呢?我問Boss Lee(meet up講師,一位技術大佬),他跟我說因為PHP是一個請求開一個進程處理,注意是進程而不是線程!
那為什么用進程處理請求會造成性能差別這么大,甚至到了一百臺服務器的差別呢?(一百臺服務器一年得上百萬吧~)
經(jīng)過我查閱資料,得出了是 網(wǎng)絡IO模型造成了性能根本上的差別 這一結論!
這里直接說結論:PHP是阻塞IO+多進程模型,大名鼎鼎的Netty(JAVA)框架是主從reactor+worker threads 模式。
為什么?因為CPU切換進程或線程所帶來的性能損耗是巨大的,主從reactor模式解決了IO分發(fā)的高效率問題!
這里先記住結論,后文看解析
2.三大網(wǎng)絡模型
2.1阻塞IO+多進程
服務器初始監(jiān)聽在lisnted_fd到接字上,此時一個客戶端發(fā)起連接請求,連接成功后產(chǎn)生連接套接字,此時父進程fork出一個子進程,子進程拿到連接套接字,并以此與客戶端通信。在這種網(wǎng)絡模型下,父進程關心的是監(jiān)聽套接字,子進程關心的是連接套接字。
這種網(wǎng)絡模型編程簡單,但是效率不高。
2.2阻塞IO+多線程
進程切換上下文代價是相當高的,有一種類似進程,但是切換開銷比進程小的東西,那就是線程。
為什么說線程切換比進程切換開銷要小呢?
因為線程由操作系統(tǒng)內核管理,在同一個進程中,所有的線程共享該進程的整個虛擬地址空間,包括代碼、數(shù)據(jù)、堆、共享庫等。
我們的代碼被CPU執(zhí)行需要一些數(shù)據(jù)支撐的,這就是所謂的上下文,包括但不限于程序計數(shù)器需要告訴CPU代碼執(zhí)行到哪里了,寄存器中存放了一些計算中間值,內從中存放了當前一些變量等。 從一個計算場景切換到另一個計算場景,這些值都需要重新載入,這就是上下文切換。
2.2非阻塞IO+IO多路復用
使用poll和epoll可以設計出基于套接字滿足高性能,高并發(fā)的事件驅動程序。
事件驅動模型,叫做 reactor模型,或者Even loop模型。 是不是很熟悉?這個模型的核心有兩點:
· 存在一個無限循環(huán)的事件分發(fā)線程,叫reactor線程,或者Even loop線程。這個分發(fā)線程背后的技術就是poll與epoll這類的IO多路復用技術。
· 所有的IO操作都可抽象為事件,每個事件必須有回調函數(shù)來處理。acceptor上有連接建立,已連接套接字的發(fā)送緩沖區(qū)可以寫,通信管道pipe上有數(shù)據(jù)可以讀,這些事件通過事件分發(fā),都能被檢測并調用回調函數(shù)處理。
· 單reactor模型 + worker threads該模型是將acceptor上連接建立事件,和已連接套接字的IO事件的分發(fā)由一個reactor線程去執(zhí)行,由工作線程去處理耗時操作,例如數(shù)據(jù)庫讀取,文件解析,計算等等。單reactor模型 + worker threads.png
· 主從reactor模型 + worker threads當所有acceptor的連接建立事件和已連接套接字的IO事件交由一個reactor線程處理,在并發(fā)量較高的情況下,這個reactor線程會 忙不過來 ,表現(xiàn)在客戶端連接建立成功率偏低。
那么主從模式的核心思想就在于,主reactor上只監(jiān)聽acceptor上成功建立的連接事件,并將其分發(fā)給從reactor線程,從reactor線程只需要負責已連接套接字上的IO事件。
總結:我們通過主reactor線程來分發(fā)成功建立的套接字,通過從reactor線程來分發(fā)已連接套接字上的IO事件,通過工作線程來處理耗時操作! 更進一步---通過用戶態(tài)自己建立的協(xié)程機制來調度業(yè)務處理程序,用戶態(tài)自己管理協(xié)程間切換,避免了CPU切換線程,又能為程序帶來更高的處理效率!
3. 五種網(wǎng)絡IO簡介
· 阻塞IO
· 非阻塞IO
· IO多路復用
· 異步IO
· 信號驅動IO
阻塞IO:
當應用程序調用阻塞IO完成某個操作時,應用程序會被掛起,感覺上應用程序像是被“阻塞”了一樣。實際上,內核所做的事情是將CPU時間切換給了其他有需要的進程,網(wǎng)絡應用程序在這種情況下就會得不到CPU時間做該做的事情。
非阻塞IO:
當應用程序調用非阻塞IO完成某個操作時,內核立即返回,不會把CPU時間讓出給其他進程,應用程序在返回后可以得到足夠的CPU時間做其他的事情。
IO多路復用:
我們可以把標準輸入、套接字都看作IO的一路,多路復用的意思,就是在任何一路IO有“事件”發(fā)生的情況下,通過應用程序去處理相應的IO事件,這樣我們的程序就“好像”在同一時刻處理多個IO事件。
異步IO:
當一個異步過程調用發(fā)出后,調用者不能立刻得到結果。實際處理這個調用的部件在完成后,通過狀態(tài)、通知和回調來通知調用者。
信號驅動IO:
應用進程使用 sigaction 系統(tǒng)調用,內核立即返回,應用進程可以繼續(xù)執(zhí)行。當數(shù)據(jù)報準備好讀取時,內核就為該進程產(chǎn)生一個SIGIO信號,我們隨后可以在信號處理函數(shù)中讀取數(shù)據(jù)報,也可以立即通知主循環(huán),讓他讀取數(shù)據(jù)。
4.網(wǎng)絡IO的本質
網(wǎng)絡IO的本質就是socket流的讀取,通常一次IO讀操作會涉及到兩個對象和兩個階段。
兩個對象:
· 用戶進程(線程)
· 內核對象
兩個階段:
· 等待數(shù)據(jù)流準備
· 從內核向進程復制數(shù)據(jù)
對于socket流而言:
· 第一步通常涉及等待網(wǎng)絡上的數(shù)據(jù)分組到達,然后被復制到內核的某個緩沖區(qū)。
· 第二步把數(shù)據(jù)從內核緩沖區(qū)復制到進程緩沖區(qū)。
5. 如何區(qū)分阻塞IO和非阻塞IO
阻塞IO發(fā)起的read請求,線程會被掛起,一直等到內核數(shù)據(jù)準備好,并把數(shù)據(jù)從內核區(qū)域拷貝到應用程序的緩沖區(qū)中,拷貝完成后,read請求調用才返回。
非阻塞IO的read請求在數(shù)據(jù)為準備的情況下立即返回,應用程序可以不斷查詢內核,直到數(shù)據(jù)準備好,內核將數(shù)據(jù)拷貝到應用程序緩沖區(qū)并完成這次read調用。
6. 如何區(qū)分同步和異步
同步調用與 異步調用 是對于獲取數(shù)據(jù)的過程而言的,前面的幾種最后獲取數(shù)據(jù)的read操作調用,都是同步的,即在read調用時,內核將數(shù)據(jù)從內核空間拷貝到應用程序空間,這個過程是在read函數(shù)中同步進行的。
當我們發(fā)起異步讀(aio_read)之后,就立即返回,內核自動將數(shù)據(jù)從內核空間拷貝到應用程序空間,這個拷貝過程是異步的,內核自動完成的,和前面的同步操作不一樣,應用程序并不需要主動發(fā)起拷貝動作。
以上文章由北京艾銻無限科技發(fā)展有限公司整理