阿里云宗志剛:云網一體,新一代洛神云網絡平臺

12月19日,2020中國云網絡峰會于北京順利召開。阿里云智能資深技術專家宗志剛帶來了主題演講《云網一體,新一代洛神云網絡平臺》,分享了新一代的阿里云網絡技術。

阿里云洛神網絡平臺

阿里云的網絡平臺稱之為洛神,是網絡虛擬化的平臺,也是阿里云飛天操作系統的三大內核組件之一,另外兩個核心組件是計算虛擬化——神龍平臺、存儲虛擬化——盤古平臺。

阿里云的洛神平臺支撐著整個阿里云的網絡產品,總共分為三個部分:第一,云上網絡,代表著數據中心虛擬化;第二,大數據中心之間互聯的跨地域網絡。第三,線下IDC、門店、終端上云的混合云網絡。三大網絡包含著豐富的網絡產品。

阿里云洛神平臺由應用驅動,目前已經演進到2.0版本,最早的版本稱之為洛神1.0 Beta,能夠做到通過VPC實現租戶之間的隔離,地址空間的獨立規劃,并且開始構建云上虛擬化網元,例如VPN等。

隨著更多大型企業上云,應用場景促使云網絡技術進一步演進。大型/超大型企業的業務的特點有:第一,業務規模非常大,隨之帶來了的網絡規模也很龐大。第二,要求全球部署,能提供接入和連接能力。第三,一般大型的企業,特別是大型的互聯網企業,往往是云原生容器的首批的實踐者。

為了支持大型/超大型企業上云,阿里云洛神平臺演進到了2.0版本,2.0版本的特點包括三點:第一,規模非常大,性能非常高。第二,網絡擁有彈性開放能力。第三,提供連接全球化接入能力。

洛神2.0技術架構

1、支持超大規模云網絡

在超大型企業的網絡規模和配置下發性能的要求下,如果采用傳統網絡的對象模型和管控模型挑戰是非常大的。但是,阿里云洛神2.0平臺現在能做到支持近百萬的容器規模,現在阿里云上的超大型客戶的單VPC里可以支持60萬的ECS,如果把容器算上,就是支持了近百萬的容器規模。洛神2.0平臺如何實現支撐百萬級的網絡規模?

首先它進行了管控層次化的拆分,在中間增加了一層高速緩存DB,專門來處理海量網元的請求,因為其只處理請求消息,所以性能非常高。另外,阿里云還對網絡接口ENI模型進行了優化,通過ENI—trunking技術,做到了同時支持主ENI和子ENI,通過不同的VLAN來區分流量,接入到不同的容器里面,來提升容器的密度。到目前為止,最新一代的ECS可以支持4K的容器密度。

2、支持超高性能云網絡

巨大的網絡規模意味著對網絡轉發性能的超高要求。阿里云的最大用戶在“雙十一”凌晨的流量峰值達到了近百T,多個數據中心互聯的流量也達到了幾十T,如此大的網絡流量規模對網絡的轉發性能提出了非常高的要求。阿里云洛神平臺進行了軟硬件一體化架構的演進,通過將網絡的轉發卸載到硬件上,來提升轉發性能,網絡的性能有了十倍到百倍的提升,通過硬件的方式,網絡的時延也有了大幅提升,從微秒級降到納秒級別。

3、支持彈性開放云網絡

大型企業的業務非常豐富多樣,業務迭代也非常快,很多的業務對應到網絡實例有著非常高的彈性需求。為了實現高彈性的網絡能力,阿里云洛神2.0平臺將原來基于X86裸金屬架構的方式,變成基于底層ECS的方式,通過ECS可以實現秒級的彈性能力。同時對底層的VPC網絡進行優化,可以支持高可靠的ECMP技術。同時,它還能在高性能轉發的同時,實現租戶之間流量故障隔離。目前為止,所有阿里云網元類的網絡產品都已經基于最新一代的NFV平臺構建。

4、云網融合一體化

洛神2.0平臺提供連接全球,覆蓋全球一張網的能力。在基礎設施上,阿里云提供了覆蓋全球的基礎設施,有21個region,63個AZ,120+個POP點的規模。豐富的基礎設施可以方便用戶使用阿里云的產品和服務。

在云邊端這一側,洛神2.0平臺將網絡的連接能力從中心延伸到了邊緣。阿里云云盒使阿里云的機架可以部署到用戶的RTC里,資源可以給用戶獨享,算力更加接近用戶的業務,使用驗體驗可以和中心云VPC的使用體驗完全一致。

阿里云洛神平臺還制定了新的鏈路技術,使用自定義的TCP加密技術連接到云,避免了很多UDP報文被公網的路由器攔截、限速的問題,可以大大提升網絡吞吐能力。另外,它集成了FEC,可以有效的提高網絡吞吐能力,還支持不同硬件端、軟件端的加密協議。并且,在多接口、多運營商的場景下,還提供多鏈路負載分擔的技術,不同的業務可以使用不同的鏈路,真正實現業務接入的智能調度。

業務接入網之后,洛神平臺實現了源路由的網絡調度技術,源路由里報文使用是自定義的方式,中心的控制器會實時的采集和探測網元里丟包和時延的信息,當新的流量進入到這張網后,會根據最優的鏈路進行調度。經過很多應用場景的實驗,發現公網的訪問效果有時候比專線更優。

未來的網絡一定會走向智能化,阿里云的洛神平臺在這方面也有了一些實踐,異常定位工具vTrace就是一個案例。vTrace能定位網絡中的丟包和時延,它會對業務報文進行染色,染色的業務報文經過虛擬化網元時會被采集,然后上升到分析系統里做清洗,然后分析看丟包在什么地方或網絡時延有多大。

隨著5G、IOT的規模應用,萬物上云、萬物互聯會對云網絡技術提出一些新的要求。對于洛神云網絡平臺的未來,宗志剛表示,云網絡要支持海量的連接、確定性的時延,還有應用和云、邊、端之間的聯動,這些都是對技術的挑戰,也是洛神未來的思考方向。

最后,宗志剛分享了阿里云發布的云網絡技術圖書——《云網絡:數字經濟的連接》,該書結合了阿里云近10年的行業經驗,提出了阿里云對云網絡技術的演進和發展的一些思考,歡迎大家免費試讀。


  • 本站原創文章僅代表作者觀點,不代表SDNLAB立場。所有原創內容版權均屬SDNLAB,歡迎大家轉發分享。但未經授權,嚴禁任何媒體(平面媒體、網絡媒體、自媒體等)以及微信公眾號復制、轉載、摘編或以其他方式進行使用,轉載須注明來自 SDNLAB并附上本文鏈接。 本站中所有編譯類文章僅用于學習和交流目的,編譯工作遵照 CC 協議,如果有侵犯到您權益的地方,請及時聯系我們。
  • 本文鏈接http://www.taian720.com/24652.html
分享到:
相關文章
條評論

登錄后才可以評論

環球塔莎 發表于20-12-23
0