Un sistema és segur si acompleix:
Els sistemes d’alta disponibilitat són sistemes informàtics que han estat dissenyats seguint un conjunt de normes i tècniques per tal que el sistema pugui estar disponible sempre o, si més no, el màxim de temps possible.
Per tal que els sistemes informàtics tingui una elevada disponibilitat caldrà implantar solucions de programari i de maquinari.
En el procés de disseny cal determinar les necessitats d’alta disponibilitat que tindrà el nostre sistema i fins a quin nivell és necessari implantar aquest tipus de solucions. En funció del tipus de negoci, no cal que els sistemes estiguin disponibles les vint-quatre hores del dia i, per tant, es poden programar aturades per realitzar tasques de manteniment. I en cas que es produeixi una aturada inesperada, sovint no impediran l’activitat econòmica que es desenvolupa.
El temps d’inactivitat és el període de temps en què el nostre sistema no està operatiu i, per tant, no pot respondre a les peticions que realitzin els usuaris. En funció de les causes podem diferenciar dos tipus de temps d’inactivitat: planificat o no planificat.
El temps no planificat pot ocórrer per:
Un projecte d'implantació d'alta disponibilitat ha de tenir les següents fases:
L'alta disponibilitat s'ha d'acordar entre les parts implicades. Això es fa habitualment mitjançant un acord de nivell de servei (SLA en anglès: "Service Level Agreement"), un contracte escrit entre el proveïdor de servei i el seu client en què es documenta el nivell acordat per a la qualitat del servei.
Els termes acordats en un SLA inclouen:
((X - Y) / X) * 100, on X = temps objectiu i Y = temps d'inactivitat. Se sol parlar de "X nous": 3 nous (99,9%), 4 nous (99,99%), etc.Els sistemes altament disponibles poden seguir, principalment, les següents estratègies:
Les estratègies de disponibilitat es contraposen:
En l'alta disponibilitat, volem reduir els riscos associats als components crítics del sistema:
Quan cau un arbre al bosc i no hi ha ningú al voltant, fa soroll? La disponibilitat contínua es fa aquesta mateixa pregunta. Si la fallida es pot recuperar abans que l'usuari sàpiga que ha passat, és realment una fallida?
L'arquitectura habitual per aquests sistemes és activa/activa. És a dir: hi ha més d'un sistema disponible i actiu. Això obliga també a fer un disseny de les aplicacions que suporti aquesta arquitectura:
A continuació veurem algunes estratègies associades a la disponibilitat dels sistemes.
Cal identificar els components més crítics per a la continuïtat del sistema. Principalment, fonts d'alimentació, discos durs i memòria.
Els components tenen associada una dada proporcionada pel fabricant, l'MTBF: "Mean Time Between Failures". Aquesta dada ens proporciona informació de la probabilitat que un component tingui una fallada.
L'MTBF es pot utilitzar per dimensionar els components del sistema, i reduir la probabilitat d'una fallada. Per exemple: si dupliquem, la probabilitat de què els dos components fallin serà el producte (probabilitat màxima 1).
La tècnica consisteix a duplicar els servidors sencers. El tipus de redundància es pot classificar, en funció de la capacitat de resposta en cas de fallada, en:
Al nostre sistema, poden haver talls del subministrament elèctric, fallades dins de les nostres instal·lacions, o avaries d'algun dispositiu elèctric dels equips. Les possibles solucions serien:
La tecnologia RAID (Redundant Array of Independent Disks) permet combinar dos o més discos perquè siguin tractats pel sistema com una única unitat lògica. Hi ha diferents tipus de RAID, que ofereixen diferents tipus i nivells de tolerància a fallades.
El RAID pot realitzar-se de dues formes:
Les funcionalitats més habituals que implementen els diferents tipus de discos RAID són:
Exemple de paritat (disc 3 de paritat):Disc 1: 01101101Disc 2: 11010100Disc 3: 10111001 (XOR)Suposem que falla el disc 2. Llavors hem de fer el XOR de Disc 1 i Disc 3:Disc 1: 01101101Disc 3: 10111001Disc 2: 11010100 (reconstrucció)Recuperació XOR amb tres discs:inici paritat error (C) xorA B C x A B C x A B C x A B C x1 0 1 - 1 0 1 0 1 0 - 0 11 1 0 - 1 1 0 0 1 1 - 0 00 0 0 - 0 0 0 0 0 0 - 0 00 1 1 - 0 1 1 0 0 1 - 0 11 0 0 - 1 0 0 1 1 0 - 1 00 1 0 - 0 1 0 1 0 1 - 1 00 1 1 - 0 1 1 0 0 1 - 0 11 1 1 - 1 1 1 1 1 1 - 1 1A dins dels nivells de RAID més habituals tenim els nivells estàndar i els nivells anidats:
Un Centre de Processament de Dades (CPD) secundari està dissenyat per entrar en funcionament quan el centre principal deixa d'estar operatiu. Pel seu alt cost, només són recomanables per a grans empreses amb necessitats de disponibilitat total.
Els CPD secundaris han de localitzar-se a una distància mínima de 30-50 km per evitar que els dos CPD quedin implicats en el mateix desastre natural.
Les actualitzacions de dades entre els dos CPD poden ser:
Hi ha dos sistemes, principalment, que permeten disposar en tot moment de dades compartides a la xarxa:
A l'hora d'implantar un sistema de bases de dades, és important fer un bon disseny que permeti la seva escalabilitat posterior i un rendiment alt de les consultes.
Per millorar la seva disponibilitat, podem tenir un sistema amb una BBDD primària i una secundària que sigui una rèplica exacta. Això permetria que la secundària entri en funcionament davant una fallada de la primària. També és important que estiguin en servidors separats, per disminuir el risc si tenen una caiguda.
La còpia de la informació pot ser:
Per tal de garantir la connectivitat entre clientes i servidors, la majoria de servidors disposen de dues targetes de xarxa. A més, dues targetes permeten comunicar-se amb el doble d'amplada de banda.
Tots els dispositius de xarxa (encaminadors, commutadors, concentradors...) haurien d'estar redundats.
També els canals de comunicació haurien de replicar-se, per exemple, utilitzant arquitectures d'anell que permeti que la fallada d'un canal de comunicació entre dos nodes no faci fallar tot el sistema. Quan s'utilitza l'anell, el protocol STP (Spanning Tree) serveix per resoldre problemes de bucles infinits.
Les comunicacions entre seus i amb altres proveïdors o clients Internet requereixen també alta disponibilitat. Això s'aconsegueix tenint més d'un proveïdor d'accés a Internet. De retruc, tenim una amplada de banda millor.
El repartiment de càrrega millora la distribució de càrregues de treball a través de múltiples recursos informàtics, com ara màquines, un clúster de màquines, enllaços de xarxa, unitats de processament centralitzades o unitats de disc.
En si mateix no és una solució de disponibilitat, però pot evitar la saturació dels recursos en condicions normals. I en condicions de fallades permetria mantenir el servei, tot i amb un rendiment reduït.
L'escalabilitat és la capacitat d'un sistema per a gestionar càrregues de treball més grans, o per a ser fàcilment expandit en funció d'un increment en la demanda de recursos de xarxa, processament, bases de dades o arxius.
Es pot aconseguir de dues maneres:
Un clúster és un conjunt d’unitats funcionals amb característiques similars interconnectades per mitjà d’una xarxa d’alta velocitat i configurades perquè actuïn coordinadament, com una sola unitat.
Hi ha dos tipus:
El pla de contingència recull el conjunt de procediments alternatius que permetrien a l’empresa continuar treballant de manera normal en el cas que alguna de les seves funcionalitats es veiés afectada per un accident intern o extern.
Per elaborar-ne un, cal:
Les possibles solucions serien de tres tipus:
Els procediments d'actuació haurien de contenir:
Un pla de contingència s'ha de revisar periòdicament. Cada cop que es posa en funcionament, s'ha de fer una valoració per a identificar possibles millores.
Hi ha dos plans de contingència que totes les empreses haurien d'elaborar:
La virtualització consisteix a crear amb un programa específic una capa d’abstracció sobre una màquina física perquè els seus recursos puguin ser compartits i utilitzats per múltiples usuaris. Es poden virtualitzar servidors, sistemes d’emmagatzematge, connexions de xarxa, estacions de treball, aplicacions i sistemes operatius.
Tots els servidors tenen un monitor de les màquines virtuals (VMM: Virtual Machine Monitor), o hipervisor, que les gestiona.
Els objectius de la virtualització són:
Es poden tenir diferents servidors amb diferents sistemes operatius dins d'un únic servidor físic.
La virtualització d’escriptoris trenca amb la concepció que l’escriptori són tots els programes i les dades ubicats en una màquina física, i el defineix com el conjunt d’aplicacions i dades amb què un usuari treballa, independentment del dispositiu amb què accedeixi.
Avantatges:
Permet que les aplicacions estiguin allotjades a un servidor principal, o bé que es puguin descarregar i instal·lar al client quan calguin. D'aquesta forma, es pot controlar que tots els usuaris utilitzin la darrera versió.
La migració en calent (en anglès, live migration) consisteix a poder traslladar una màquina virtual des d’una màquina física a una altra sense que l’usuari se n’adoni. S’anomena migració en calent, ja que mentre s’està movent d’un lloc a un altre la màquina virtual continua estant operativa.
Aquest procés millora la gestió del rendiment, redueix el temps d'inactivitat i afavoreix l'escalabilitat de les aplicacions i serveis.
Implica la migració dels següents components: memòria, disc dur, connexions de xarxa i processador.
La virtualització és una de les tècniques més eficients i econòmiques per a garantir l'alta disponibilitat als sistemes d'informació.
Aquests són els principals avantatges:
La informàtica en núvol és la disponibilitat sota demanda de recursos del sistema informàtic, especialment emmagatzematge de dades i potència de càlcul, sense una gestió activa per part de l'usuari. Els serveis que es proporcionen es poden adaptar a les demandes del negoci, i (segons el servei) els clients no s'han de preocupar del maquinari, el manteniment o les actualitzacions.
Les empreses que proporcionen aquests serveis ho fan utilitzant infraestructures d'alta disponibilitat, i per tant el client no s'ha de preocupar d'aquest aspecte. També permet reduir costos, facilitar l'accessibilitat i tenir una flexibilitat a l'hora d'adaptar-se a les necessitats del negoci.
També hi ha incerteses associades al servei: quin nivell de servei es rebrà per part del proveïdor, la dependència de productes propietaris o la ubicació de la informació en relació a les normatives de protecció de dades.
Els serveis es poden classificar en:
Els principals són VMware, Microsoft i Citrix.
Tenim VMware, Virtual PC, QEMU, KVM, Linux-Vserver, Xen.
Tant Hewlett-Packard com Dell disposen productes específics per a virtualitzar.