High Availability

Материал из Juniper Exam Wiki
Версия от 17:30, 13 октября 2016; Наталия Бобкова (обсуждение | вклад) (Новая страница: «= Без включенных фитч High Availibility = Когда есть 2 или более RE и падает master => PFE restarts and all hardware and…»)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к навигации Перейти к поиску

Без включенных фитч High Availibility

Когда есть 2 или более RE и падает master => PFE restarts and all hardware and interfaces are discovered by the new master RE.

New RE restart rpd, so that all adjacencies are aware of the topological changes.


Graceful restart (GR)

Позволяет маршрутизатору информировать своих соседей (helper router) о предстоящей перезагрузке или перезагрузки процесса rpd.

Перезагружающийся маршрутизатор (restarting router) запрашивает у соседей определенное время на перезагрузку, после которой они потом снова станут соседями.

О процессе перезагрузке будет знать не вся сеть, а только непосредственные соседи (соседство у различных протоколов вроде падать не будет).

Во время перерыва на control plane, трафик может передаваться через forwarding plane.

Применимо к протоколам: OSPF, ISIS, RIP, BGP, RSVP, LDP, MSDP, PIM.

Каждому RE можно задать ip управления (interface fxp0)

Требования:

- и restarting роутер и helper роутер должны поддерживать GR (на Junos для helper роутера ф-ия активна по умолчанию)

- роутер должен уметь передавать трафик через себя во время процесса перезагрузки (у Junos это по архитектуре есть)

Настройка

# show routing-options 
graceful-restart { <------------------------- включается глоально
        restart-duration 300; <--------------- max время, в теч которого маршрутизатор находится в GR
}
# show protocols bgp  
graceful-restart { <------------------------- можно задать для конкретного протокола
    restart-time 300;
    stale-routes-time 300; <---------------- max время, в теч которого хранятся старые маршруты
} 
group external {
    export bgp;
    neighbor 192.168.0.40 {
        peer-as 200;
        graceful-restart { <------------------- можно применить для более специфичного уровня иерархии
            disable;

Просмотр

Мониторинг только внутри протоколов:

# show protocols ospf   
traceoptions {
    file ospf_wtf;
    flag graceful-restart;
# show log ospf_wtf
# show bgp neighbor 192.168.0.40 [Options]

Graceful RE switchover

Когде включен GRES, RE синхронизируют конфигурации и обмениваются keepalive через internal link.

Если один из RE падает (не приходят keepalive 2 сек), то процесс передачи пакетов через PFE продолжается работать.

Graceful RE switchover сохранчет инфо об интерфейсах, о ядре, но не инфо, содержащуюся в control plane.

Новому RE придется заново устанавливать соседства и запускать rpd процесс.

Когда рухнет один из RE, PFE разрывает связь со старым RE и устанавливает с новым, с которым обмениваются сообщениями в дальнейшем.

PFE не ребутается и продолжает слать трафик, основываясь на существующей forwarding table.

Настройка

[edit chassis] hierarchy using the

set redundancy graceful-switchover

Для синхронизации конфигов

{master}[edit system] 
user@R1-re0# set commit synchronize


Просмотр

> show chassis routing-engine
> show system switchover

Принудительно сделать switchover

user@R1> request chassis routing-engine master ?
 acquire Attempt to become master Routing Engine
 release Request that other Routing Engine become master
 switch Toggle mastership between Routing Engines

Nonstop Active Routing (NSR)

Используется только с кол-вом RE > 1.

Также как и graceful RE switchover, NSR хранит информацию об интерфейсах и ядре, но плюс к этому - хранит информацию о маршрутизации на backup RE =>

=> не нуждается в helper router => используется на тех сетях, где роутерами не поддерживается GR => заменяет полностью GR

Для протоколов, которые не поддерживаются NSR, после процессе переключения на новый RE, процесс восстановления работы протоколов происходит по стандартному алгоритму.

Для работы NSR обязательно включить graceful RE switchover, синхронизировать конфиги.

После включения NSR, backup начинает собирать маршрутную информацию с master.

Просмотр

Для переключения из master в backup

{master}
user@R1-re0> request routing-engine login other-routing-engine
 
--- JUNOS 10.1R1.8 built 2010-02-12 18:31:54 UTC
{backup} 
user@R1-re1>

Мониторинг работы также осущ-ся в каждом протоколе отдельно (для traceoptions можно задать флаг: nsr-synchronization)


Bidirectional Forwarding Detection (BFD)

Быстрее, чем обычные протоколы определяет (+ статическая маршуртизация), что сервис упал (менее секунды). Хосты устанавливают сессию и обмениваются hello. Если перестали приходить hello, то BFD оповещает систему, что возникла проблема связности между хостами.

В настройках вы определяете минимальное значение для передачи и поучения helloна роутерах. Если значения не совпадают, то BFD использует наибольшее значение (adaptive-mode). Это поведение по умолчанию можно выключить: no-adaptation

Значение кол-ва пропущенных hello можно менять (multiplier)

Настройка

ospf {
    area 0.0.0.0 {
        interface fe-0/0/0.0 {
            bfd-liveness-detection {
                minimum-interval 300;
            }
        }


bgp {
    bfd-liveness-detection {
        minimum-receive-interval 300;
      }
    group external {
        export bgp;
        bfd-liveness-detection {
            transmit-interval {
                minimum-interval 300;
            }
        }

Просмотр

 show bfd session


Virtual Router Redundancy Protocol (VRRP)

Особенности роутеров:

Master - выполняет ф-ию ARP

Backup - их может быть несколько

Для обмена информацией между собой (о приоритете и состоянии мастера) роутеры запихивают обновления в ip-пакеты и шлют на ip 224.0.0.18 раз в 1 сек (по умолчанию).

Можно задать другой интервал для обмена обновлений (1-255). Или с помощью fast-interval (100–999 milliseconds). TTL = 255

Мак-адрес для virtual-router: 00-00-5E-00-01-VRID [virt router ID]

Приоритет по умолчанию: 100

Выигрывает: больший приоритет


Сотосяния:

Initialization - выборы мастера

Master - мастер отправляет всем сообщения о своем состоянии

Backup - backup роутер мониторит состояние master роутера

Transit - короткий момент, когда master сдох, а backup еще не стал master'ом.


Настройка

> show configuration interfaces ae5.398 
vlan-id 398;
family inet 
    address 77.94.165.185/29 {
        vrrp-group 1 { <---------------------------------------------- в рамках одного маршрутизатора не должно существовать несколько групп с одинаковым ID
            virtual-address 77.94.165.187; 
            priority 10; <----------------------------------------------- приоритет
            advertise-interval 10; <----------------------------------- интервал отправки сообщений внутри группы
            accept-data;   <------------------------------------------- позволяет отвечать на icmp-пакеты
            authentication-type md5; <------------------------------ md5, simple pass, none
            authentication-key "$9$"; ## SECRET-DATA
            no-preempt; <-------------------------------------------- backup не перехватывает роль master (In situations where the VIP address is not owned by any of the participating 
VRRP routers within a specific VRRP group)


vrrp-inheret-from - ????????


Просмотр

show vrrp summary 
Interface     State       Group   VR state       VR Mode    Type   Address 
ae5.398       up              1   backup          Active    lcl    77.94.165.185      
                                                           vip    77.94.165.187

Unified in-service software upgrade (ISSU)

Позволяет обновиться без перерыва на control plane и с минимальным перерывом на forwarding plane.

Обязательно должно быть 2 RE.

Должны быть включены: GRES, NSR.

На обоих RE должны быть одинаковые версии прошивки.