確定性網絡:打造網絡里的超級高鐵

作者簡介:黃玉棟,北京郵電大學網絡與交換國家重點實驗室研二在讀,研究方向為未來網絡體系架構,確定性網絡,郵箱地址: hyduni@163.com.

確定性網絡是指能保證業務的確定性帶寬、時延、抖動、丟包率指標的網絡;確定性網絡技術是一種新型的服務質量(QoS)保障技術。本文面向小白科普入門,將盡量用通俗易懂的語言,深入淺出的分析確定性網絡的需求由來、技術實現和未來展望。

一、需求由來

業務形態和需求的改變是網絡技術變革的主要動力。

傳統電話網采用面向連接的電路交換技術,其在通信前建立連接,為通信雙方分配具有固定帶寬的通信電路,直到通信結束再釋放連接;比如早期單一的64Kbps話音業務,可以采用固定比特率進行傳輸,一根電話線連兩頭,想打多久打多久。電路交換具有實時、低速率、高質量的話音傳送的優勢,但缺點是帶寬利用率不高。

而后一方面互聯網繁榮,圖片、視頻、搜索等業務形態變得復雜,采用分組交換后網絡就像大馬路的交通,路上自行車、小汽車、公交車、大貨車啥車都有,上下班高峰期容易排隊和擁堵,時延和抖動等需求沒有保障;

另一方面車載網絡、航空航天、金融交易、電力傳輸和石油勘探等垂直領域,出現了大量的專用總線和實時以太網技術,其保證了流量的低時延低抖動傳輸,但礙于專線成本高,而各類實時以太網標準又互不兼容、且不與標準以太網兼容,所以技術封閉,沒法鋪到互聯網大馬路上。

因此,確定性網絡的需求主要來自兩方面:

  • 兼容以太網標準:在工業自動化、智能制造等傳統場景,需要用以太網統一替代幾十種現場總線和實時以太網標準,融合IT網絡和OT網絡,實現盡力而為流與工業時延敏感流的共網傳輸,降低成本。
  • 承載確定性業務:隨著機器與機器間通信流量激增,需要在自動駕駛、遠程手術、全息通信等新興場景,結合5G等技術,打造網絡里的超級高鐵,實現確定性業務的端到端傳輸。

二、技術實現

在講確定性網絡的技術挑戰前,首先要聊一下現有的互聯網和工業網絡是怎么做QoS服務質量保障的。

互聯網怎么做QoS?

互聯網主要有四種方法保證QoS: 擴容/輕載、流量整形、隊列調度和擁塞控制。

  • 擴容/輕載:擴容就是擴帶寬,兩車道不夠用就改四車道、八車道,讓網絡處于輕載的狀態。現在以太網已經能做到單端口400G,當然,比較費錢。
  • 流量整形:通過令牌桶、信用整形等技術,對特定端口或者流量進行限速。比如上游節點出端口帶寬8Gbps,下游節點空余帶寬只有2 Gbps,就要限制上游傳輸帶寬小于2Gbps,以免下游節點擁塞。好比兩車道不能八輛大卡車并排開。
  • 隊列調度:隊列調度就是在交換機的出端口對流量進行調度,好比紅綠燈。首先把包標記上不同的優先級,然后包進入對應的優先級隊列,最后采用不同的隊列調度算法對包進行處理。比如嚴格優先級算法(SP),會讓高優先級的流量有就一直轉發;比如加權循環調度算法(WRR),會給每個隊列一個權重,按權重的比例依次進行轉發,以免低優先級的流量長時間等待。
  • 擁塞控制:當流量過多,緩沖隊列都不夠用了,網絡出現擁塞丟包,就需要擁塞控制。可采用ECN、DCTCP等基于顯式擁塞標記或者Timely、Swift等基于RTT往返時延的方法探測擁塞,讓上游節點直至發送端降低發包速率。好比沿著擁塞地點讓交警往回控制其他車輛停止通行或者繞道而行。

互聯網做QoS有兩大核心問題:缺少有界時延抖動的保證,以及難以應對聚播和突發流量。

  • 缺少有界時延抖動保證:由于是統計復用出端口帶寬資源,缺少時延維度的QoS保障機制,盡力而為轉發總是會存在排隊等待和擁塞的情況,業務時延在50ms-1s的量級,并存在長尾時延。
  • 難以應對聚播和突發流量:由于發端流量的大小和發包時間不可控,網絡中存在多條流在下游節點匯聚(Incast,聚播)以及某時刻流量激增(Burst,突發)的現象,導致網絡擁塞丟包。

工業網絡怎么做QoS?

工業網絡對時延抖動的要求非常嚴格,往往要求端到端時延在幾毫秒甚至幾百微妙以內,以及微秒級甚至零抖動。比如離散自動化中的運動控制,要求端到端時延控制在1ms以內,抖動在1us以內,且具有99.9999%的可靠性。

要達到如此高精度的傳輸控制,以時間觸發以太網為例,主要需要時鐘同步和時隙規劃這兩種技術。更多時隙規劃的技術細節可參考文章(一文讀懂時延敏感網絡的調度整形機制

  • 時鐘同步:即全網時鐘同步,終端設備、交換機的時鐘都相同,網卡也要給包打上硬時間戳。目前有兩種時鐘同步方式,一種是主從模式,選出一個最精準的時鐘作為主時鐘,其他從時鐘都聽主時鐘的;一種是投票模式,比如一個域內有9臺設備,5臺現在時鐘是1:00,4臺是1:01,少數服從多數,就都調整為1:00。
  • 時隙規劃:時隙一般是指交換機出端口的時間維度的傳輸資源。比如某交換機出端口帶寬1Gbps,也就是1s可以傳1G個bit,假設一個包有1500Byte,也就是12000bit, 那它的傳輸就占用出端口某一段12us的時隙資源。而占用哪一段,由它的傳輸開始時間決定。由于工業流量大多是周期性發送的小于MTU的包,所以可以控制終端的發包開始時間,通過全局時隙規劃(時分復用),讓各個包只在提前算好的時刻被“觸發”發送,保證其在每跳的出端口傳輸時占用的時隙互不沖突,從而避免了聚播和突發的產生,實現“準時準確”傳輸。

確定性網絡怎么實現?

確定性網絡技術不是單一技術,而是一系列協議和機制的合集,通過網絡切片、顯性路由、資源預留、時鐘/頻率同步、周期映射、門控優先級隊列調度、幀搶占、流量過濾和整形、多發選收等技術分別保障確定性帶寬、低時延、低抖動、高可靠等QoS指標。

簡單的說,它既兼容了以太網這條大馬路,又借鑒了工業網絡里全網同步、時隙規劃、控制發包/邊緣的思想,就像網絡里的超級高鐵,首先定點發車,然后長距傳輸,專道不堵車,通過周期映射和周期規劃確定到站時間,并且每站定長停靠,最終保證端到端時延可預期。具體技術實現和挑戰留作下回分解。

三、未來展望

由于現網缺乏嚴格的有界時延抖動保障機制,建筑網絡高鐵是未來網絡發展的必然趨勢。舉個例子,若想在現網中獲得一條從北京到南京10ms時延的線路,首先測一下有3條路可以走,時延分別是50ms、100ms和200ms,達不到要求,再需要測沿路徑的鏈路帶寬使用情況、每跳的隊列長度和擁塞情況,然后通過一行行命令和ACL規則,去做優先級映射、限速整形、隊列調度、擁塞控制、重路由,這當中還可能存在規則錯配、影響其他業務QoS等問題,而當終于配置好滿足10ms時延后,又有可能突然出現莫名的流聚合和突發,時延陡然暴增至500ms,令網絡工程師通宵達旦、徹夜難眠。

而在不遠的將來,可以預見確定性網絡技術趨于成熟,只需要幾分鐘的配置時間,便可以擁有一條從北京到南京、穩定可靠的、端到端時延10ms的超級高鐵線路。


  • 本站原創文章僅代表作者觀點,不代表SDNLAB立場。所有原創內容版權均屬SDNLAB,歡迎大家轉發分享。但未經授權,嚴禁任何媒體(平面媒體、網絡媒體、自媒體等)以及微信公眾號復制、轉載、摘編或以其他方式進行使用,轉載須注明來自 SDNLAB并附上本文鏈接。 本站中所有編譯類文章僅用于學習和交流目的,編譯工作遵照 CC 協議,如果有侵犯到您權益的地方,請及時聯系我們。
  • 本文鏈接http://www.taian720.com/24441.html
分享到:
相關文章
條評論

登錄后才可以評論

清風松雨 發表于20-09-17
0