Upload
masafumi-oe
View
1.008
Download
1
Embed Size (px)
DESCRIPTION
現在の200万フルルート対応ルータ開発におけるむつかしさを解説し,各社のデザイン方針,生き残りをかけた現況を紹介します.
Citation preview
おことわり
詳細な調査に基づく発表としております.しかしながら,諸事情により,具体的な製造元などを細かくお伝えできない場面があることをご理解ください.
本資料は,公開用のため,確信は記載されていません.講演に参加された方のみぞ知る話です.
2014/6/11 Interop2014_C2-08 2
ルーターとスイッチングハードウェアの今を知る
何がむつかしいのかを知るために
2014/6/11 Interop2014_C2-08 3
ことばの確認ルータとスイッチングハブ(スイッチ)
•ルータとは?•Layer-3(L3)のIP層において,異なるネットワーク間の通信を中継する機器
•ルータの基本•ルーティング
•届いたIPパケットの「宛先」を「経路表(ルーティングテーブル)」を参照し,次の宛先,インターフェース等を把握
•経路表は,OSPFやBGPといったルーティングプロトコルでコントロールされる.
•フォワーディング
•次の宛先へIPパケットを送ること
2014/6/11 Interop2014_C2-08 4
ここでのルータとは・・・
• 10G・100GbEのような広帯域に対応し,キャリアにおいてインターネットの全経路(通称フルルート)を処理する能力を有する機器
• ルーティングプロトコルの信頼性が高い.
2014/6/11 Interop2014_C2-08 5
ことばの確認ルータとスイッチングハブ(スイッチ)
•Layer2(L2)スイッチとは?•データリンク層(Ethernet)において,適切なインターフェースへ通信を中継する
•L2スイッチの基本•スイッチング
•届いたEthernetフレームの「宛先MAC」を,FIB(フォワーディングインフォメーションベース)から適切な宛先インターフェースを把握
•フォワーディング•宛先へEthernetフレームを送ること
•L3スイッチ=ルータのようにルーティング(=スイッチング)とフォワーディングする.
• 基本機能は,ルータに同じ
2014/6/11 Interop2014_C2-08 6
ポイント
•L2でもL3でも
•ルータでもスイッチングハブでも,
「受信」「宛先を検索」「送信」
が基本です.
2014/6/11 Interop2014_C2-08 7
今の通信機器10GbE/40GbE L2/L3 スイッチ,ルータと呼ばれる製品の内部構成
ブロードコムBCM56840シリーズ
スイッチ機能制御部
スイッチ機能LSI
拡張I/F
電源
メーカーA
2014/6/11 Interop2014_C2-08 8
今の通信機器10GbE/40GbE L2/L3 スイッチ,ルータと呼ばれる製品の内部構成
スイッチ機能LSIBCM56840
10GbE x 24 40GbE x 2 (10GbE x 4 x 2)
スイッチ機能制御部
メーカーB
2014/6/11 Interop2014_C2-08 9
コアの部品は,同じ
•汎用LSIの活用が垣間見れる•Broadcom Trident I / BCM56841A3KFRBG US$ 500
Cisco Nexus 3000/ Arista 7050 / Force 10 S4810 / Juniper QFX3500 他などEthernet スイッチングLSIのベースに製品を仕上げる
=
2014/6/11 Interop2014_C2-08 10
(参考)LSI・ASIC・FPGA•LSI
•ターゲット・クロックを元に回路デザインをして作成,製造
•コスト高い,高性能を追及できる.CPU等
•汎用LSI一般に販売されている.既製品
•専用LSIメーカ専用品
•ASIC•既成のASIC上に,必要な機能を実装する.
•高性能を追及ができないが,LSIより安価に開発,量産効果
•FPGA•メモリーのお化け,いつでも自由に回路を書き換えられる.
•規模が大きくなるといろいろ課題も生じる.FPGAそのものが高価
•たくさん使うなら,ASICほうが安いとも.
2014/6/11 Interop2014_C2-08 11
機器の構成イメージ
コア機能
制御部(x86/PorwerPC)Linux / *BSD /
等OS
ソフトウェア制御
• ルーティングプロトコル
• ループ検出• スタッキング制御• CLI
(FPGA)(ASIC)(汎用LSI)
• 独自プロトコルなどの実装用• 独自のスイッチング実装
汎用LSIのSERDESなど一部機能のみを利用する場合もある
専用LSIや汎用LSIASICを利用
この点の実装で汎用LSIであっても製品間の違いがでてくる.
2014/6/11 Interop2014_C2-08 12
(参考)L2/L3 LSI機能ブロックデザイン( 10GbE x 64 ports )
Forwarding Engine
TCAM L3 Longest Prefix Match
L2MACTCAM
Buffer memory
SERDES
SERDES
ACL TCAM
SERDES: シリアル-パラレル変換
SERDES
SERDES
2014/6/11 Interop2014_C2-08 13
(参考)汎用LSIシャーシスイッチ・高機能化
•スケーラビリティ:多段構成を組める•ボックススイッチからシャーシスイッチまで可
•Broadcom Trident II StrataXGS BCM56850
•1.28T/960G/720Gbpsのシリーズ
•1.28Tbps : 32port 40GbE •HiGIG (Broadcom バックプレーン間接続用通信方式)とファブリックモジュール用BCM56750 によるモジュラー構造構成
•高機能サービス実装•FCoE / VxLAN 出典: Broadcom BCM56850 data sheet
2014/6/11 Interop2014_C2-08 15
ベンダーの開発動向
• スイッチ・ルータ用に独自LSIを設計・製作するベンダー
• 上位機種に採用,汎用LSIも併用• 下位機種は,汎用LSIを採用
• 高性能を手に入れ,マーケティングやビジネス上のリスクも負う
• スイッチ・ルータ用に独自ASICを製作するベンダー
• ベースとなるASICのチップ上に設計パターンを乗せるイメージ• ちょっと前までは,ASICで十分な性能でした.
• 汎用LSIの機能を利用,独自実装するより安い
• スイッチ・ルータ用に汎用LSIを活用するベンダー
• ホワイトボックススイッチの台頭
2014/6/11 Interop2014_C2-08 16
何がそんなに大変なの?ワイヤーレートとデバイスの限界
•ワイヤーレートでのルーティングを達成すること•パケットを受信
•ルーティングテーブル参照
•フォワーディング
•パケット送信次のフレームが来るまでに完了させないといけない.
•処理能力は,バンド幅(bps)ではなく,フレーム(パケット)数(fps・pps)を基準に考える.•バンド幅の拡大=1フレームの処理の猶予が少なくなる
I/Fバンド幅 ワイヤーレート時百万FPS
フレーム処理時間
1Gbps 1.488095 672μs
10Gbps 14.88095 67.2ns
40Gbps 59.5238 16.8ns2014/6/11 Interop2014_C2-08 17
帯域が拡大高速化は幅ではなく時間が効いてくる
!10Gbps = 約67nsの猶予
•DRAM•DDR/DDR2/DDR3と高速化!
•いやそれは,車線(アクセス幅)が広くなっている.
•車の速度,ビットを取り出せる時間はあまりかわらない.•遅延 49ns~+アクセスタイム
•まとまったデータを取り出すのは早いけど,初動が重い.
•SRAM•CPUのキャッシュなど,高価で電力も必要
•Sandy Bridge Core i3 3.3GHzの場合,L1:4Cycle(1.2ns) L2: 12Cycle(3.6ns) L3:27.85Cycle(8.355ns) / 1Cycle =0.3ns
•初動が速いけど,コスト(DRAMの4倍~),電力消費(DRAMの4倍)
2014/6/11 Interop2014_C2-08 18
処理の猶予とメモリデバイスの速度
• TCAM(TernaryCAM)• MACやIPを高速に一定時間で検索する
• 連想メモリ,保存ではなく「検索」のメモリー
• 0-1ーdの3ステートにより,Longest Match検索やワイルドカードで検索できる.
• SRAMの8倍以上の価格,SRAMの2倍以上の消費電力
• TCAMとSRAMを組み合わせる• どんな問い合わせでも一定時間(2クロック)で答えが出る.
• 実装上はすごく有利
• ACL,L2,L3の検索に活用
• 40Mbit品でIPv4が100万エントリ
• 51.2万経路 で18Mbit必要・IPv6なら12.8万経路
2014/6/11 Interop2014_C2-08 19
TCAM
経路検索
インデックス
SRAM
参照
経路確定
TCAMの乗せれば解決?
•いわゆる力技・正攻法•消費電力大,冷却設計,回路線長の限界
•いわゆる逃げ•100万経路(相当)対応,相当って?
•経路の特性を利用して,経路を圧縮,TCAMを圧縮
2014/6/11 Interop2014_C2-08 20
ここまでのまとめ
•ハードウェア視点から見ると,広帯域化は,L3・L2の宛先検索がボトルネックになる
L3フルルート(100万経路越え)
L2MACアドレステーブル(大量のMAC)
デカいテーブルは,デバイス技術の観点から
コスト・消費電力・設計が大変.
2014/6/11 Interop2014_C2-08 21
ディスカッション
2014/6/11 Interop2014_C2-08 22
テーマ
•生き残れるのはどこだ!
•スイッチング機器
•ルータ機器
2014/6/11 Interop2014_C2-08 23
生存競争
1)運用やプロトコルにより,開発制約を緩くする
2A)直球で勝負
ハード・ソフト開発の正常進化
2B)アイデアで勝負できる
実用性に耐えうる実装をアイデアで開発
3)別の道へ進む
2014/6/11 Interop2014_C2-08 24
生き様1)冒険して高性能達成ミッド・バックプレーンを廃止
•もちろん,ブレークスルーするベンダーもあります.
•例)ファブリックと各IOモジュールを直交接続化
• ミッドバックプレーンは,線路長が与える物理的な制約により,高速化・低遅延化がむつかしくなる.
•ASIC+汎用LSIで広帯域化・低遅延を実現
• ただし,モジュールスロットのバリエーションが組めない.
2014/6/11 Interop2014_C2-08 25
生き様2)経路を圧縮してTCAM削減
•もちろん,ブレークスルーするベンダーもあります.
•例)TCAMを増やすのではなく,ハッシュ化や,多段構成で検索するなどにより,フルルート相当を実現.
2014/6/11 Interop2014_C2-08 26
生き様概況・生き残れる?
•ルーター直球開発
•ルーター変化球
•フルルートルーターじゃないけど・
•用途の集約化で設計効率を高める
•汎用LSI活用
2014/6/11 Interop2014_C2-08 27
鍛え上げられる=完成度が高くなるシェアを落とす=完成度は??
•生き残るためにベンダーは,生存競争を正攻法やアイデアで生き抜く
2014/6/11 Interop2014_C2-08 28
変化球
• ハッシュなど経路の圧縮によるTCAM削減
• 必要十分に絞ったTCAM量
• カスタムLSI,汎用LSI,ASIC
正攻法
• カスタムLSI
• 十分なTCAM
ハードウエア屋の悩みを知ると,ダメなところが見えてくる
•デバイスの壁にぶち当たってるベンダーから話を聞くと,IPv6は罪作りなプロトコル•「ハードウェアにやさしい」なんて教えられましたが・・・
•ルーティングテーブルがデカくなる可能性がある
•デュアルスタック=TCAM2倍以上
•運用の「もしかして」に備えた「余裕」により設計がむつかしくなる•200万ルート,それとも100万ルート?
•ベンダーは黙々と頑張りますが,こんな状況にみなさんはどうお考えですか?
2014/6/11 Interop2014_C2-08 29
マルチから特定用途機器へ変化
•マルチこなす機器から特定用途向け視点を持った進化•データセンタ事業者・キャリア事業者の視点でどうとらえていますか?
•たとえば?•DCに必要な機能に絞ったホワイトボックススイッチ+オリジナルOS?
•(参考)ルーター&スイッチのトレンド•低遅延性
•L2/L3テーブルサイズ
•VxLAN・SDN
•OpenFlow
•PTP,パケットへのタイムスタンプ挿入
•スタッキング・ループ防止
•スイッチング帯域
多機能から費用対効果を考慮した用途別すみわけ
2014/6/11 Interop2014_C2-08 30