1. Enabling Memory-intensive Network Functions on Programmable Switches (Abstract) (Slides) (Video)
腦洞大開的一個Slide。嫌棄Programmable Switch上面ASIC SRAM空間太小,利用RDMA的方式連接8台支援RDMA NIC的Server,此種操作讓會用到很多記憶體操作的NF有機會Offload到Programmable Switch上。
結論 :
增加2.4~2.75 µs latency (in NAT case)
20 millions lookup per second
很小的throughput reduction ~0.55%
2. Scaling Distributed Machine Learning with In-Network Aggregation (Slides) (Video)
這大概又是另一個炫炮的應用。
在訓練ML Model時,會將同樣的資料分給很多個worker同時進行訓練,在訓練完一段時間(數百毫秒)後,不同worker間會互相交換 ~100MB的資料,將資料平均後再進行下一階段的訓練。由於不同worker之間每數百毫秒就需要傳送大量資料,對網路設備是個相對大的負擔,既然只是要將訓練完的資料作平均的話,是不是能將做平均這一個動作放在Programmable Switch上面完成,以加快ML model訓練的速度,畢竟訓練一個模型是以小時、天甚至週為單位。
由於交換器上面一來沒有浮點數的概念,故用整數分位數來代替,捨棄一點精準度,另外就是交換器上的ASIC晶片記憶體也沒到數百MB那麼大,故用streaming的方式來做平均。
結論 :
各種不同的訓練演算法,最少提升20%速度,最多提升300%速度。
3. Building a Product Using P4 (Slides) (Video)
ARISTA的Software Director分享的內容,如果對Programmable Switch的發展對Fix Function Switch產生的影響不了解的,可以看看他的結論,簡單摘要如下。
•P4 is a brilliant way to expose the flexibility of Tofino, or any other flexible pipeline.
•P4 benefits from having brilliant minds working on it, it is really good technically, as software engineer building switches I think it is the most exciting change in ASIC programming I have ever seen.
•Combined with Tofino, p4 enables Arista to produce a variety of new types of network devices.
•渡過前期Learning curve後,新功能的TTM加快了
•Can do more without involving the ASIC vendor
•In the data center space no, cost and time to market are still the key factors in selling data center switches. non-standard features are not required
•More NFV Offload
•多數客戶只在意產品品質,不在乎技術層面,少數客戶喜歡pipeline access
4. The Switching System Vendor Viewpoint: Opportunities and Challenges (Abstract) (Slides) (Video)
Cisco Data Center Switch 業務的CTO在Demo時分享了這個Slides,先講到支援P4可程式化交換器的優點。
•Accelerate Releases( •新功能/Bug fixes •Shorter time to market(2~3Y 變成 0.75~1.5Y))
•Unique Features Not Available in ASICs( •ML/Big Data加速 •Innovative Load Balancing •Deduplication algorithm in data broker •Multicast-to-unicast translation)
•Customer Requested Features(•MAP-T, SRv6, BIER, Multicast address translation )
•Reduced investment/commitment/cost required for the hardware implementation of a feature
說完了優點當然也會有缺點
•不把原本會動的東西弄壞,也不希望要另外做太複雜的回歸測試
•Vendor code and custom code may be confidential
•晶片資源依然有限
•資料層或控制層的相依性
5. Leveraging P4 for Fixed Function Switches (Abstract) (Slides) (Video)
Google又領先在多數人前面,這次談的主題是P4的自動化測試,Slide內容並不多,有興趣的話建議看Video。
這邊的目的是希望建造一個自動化測試的環境,而此環境需要有以下條件
•輸入的流量可以自動產生(Replay production flows, 自動產生隨機增加/刪除flow entries的request, 自動測試封包產生器)
•驗證單一交換器晶片,不是整個網路架構
•經過待測物的封包自動和P4 BMv2模擬器的結果做比對
參考資料 : p4.org