Tolérance aux pannes : l'essor
Le monde de la tolérance aux pannes 24 x 7 est loin d'être surpeuplé. Les principales solutions banalisées qui s'offrent aux entreprise sont les systèmes NonStop Integrity de Compaq, les variantes des systèmes SPARC de Sun Microsystems et les systèmes Windows NT à base de composants Intel de Marathon Technologies. Les annonces récentes de Stratus Computer sont donc susceptibles de faire du bruit.
Stratus Computer a annoncé son entrée sur le marché des systèmes
d'entrée de gamme et intermédiaires à tolérance de panne sous Windows 2000 avec
trois nouveaux systèmes. Une annonce importante puisque Stratus réalise allègrement
son milliard de dollars de chiffre d'affaires et bénéficie d'une excellente
image sur le marché des serveurs haut de gamme depuis plus de 20 ans avec le
système d'exploitation VOS (Virtual Operating System) et des serveurs UNIX.
Dans le cadre de son développement de produits, Stratus entend suivre le plan
d'annonce des processeurs d'Intel - les premières machines seront basées sur
l'architecture Intel 32 bit (IA-32), puis sur les processeurs 64 bit IA-64 lorsque
ces derniers seront disponibles.
Les produits de Stratus comprennent notamment les ftServer 5200, ftServer 6500
et un serveur d'entrée de gamme sans dénomination. Le serveur ftServer 5200
(nom de code Melody) disposera de deux processeurs Pentium III Xeon à 550 MHz,
de 512 Ko de cache, d'un maximum de 2 GO de RAM, de 10 slots PCI, une configuration
DMR offrant une double redondance modulaire (autrement dit 2 cartes-mères) et
TMR (triple redondance - 3 cartes), et un stockage RAID 1 sur 48 disques. Le
serveur coûtera entre 30.000 et 35.000 dollars et devrait être disponible lorsque
vous lirez ces lignes. Le serveur ftServer 6500 (nom de code Liberty) disposera
de quatre processeurs Pentium III Xeon à 750 MHz, de 1 Mo de cache, d'un maximum
de 4 GO de RAM, de 10 slots PCI, une configuration DMR et TMR, et un stockage
RAID 1 sur 48 disques. Ce serveur coûtera entre 40.000 et 45.000 dollars et
devrait être disponible courant septembre 2000. Stratus n'a pas encore donné
de détails sur son serveur d'entrée de gamme (nom de code Tune). Cependant,
on sait que son prix devrait avoisiner les 15.000 à 20.000 dollars et que le
produit sera disponible au cours du dernier trimestre de 2000.
Les systèmes Windows 2000 de Stratus sont uniques à plusieurs égards. Stratus
double ou triple tous les composants de ces systèmes et utilise une horloge
pour synchroniser les différentes cartes-mères. Chaque système opère sous une
image système unique disposant de matériel de contrôle croisé propriétaire.
Du fait que les systèmes Stratus offrent une image système unique, ils ne nécessitent
qu'une seule licence de système d'exploitation. Stratus construit ces systèmes
à base de composants standards du marché mais y ajoute des dispositifs propriétaires
d'identification, des matériels d'entrées/sorties et des ASIC de contrôle croisé.
Dans les systèmes DMR, un algorithme propriétaire compare l'état du système
par rapport à un standard pour contrôler toute panne éventuelle. Dans les systèmes
TMR, l'algorithme est plus simple et sonde les cartes pour déterminer si une
des cartes est différente des deux autres.
Stratus a intégré de nombreux autres mécanismes de tolérance aux pannes dans
ses systèmes. Sur un système non tolérant aux pannes, lorsqu'une application
plante, l'OS sauvegarde l'état du système sur disque et redémarre le serveur.
Les machines Stratus stockent l'état du système en mémoire persistante de sorte
que lorsqu'un système plante, le redémarrage s'effectue depuis la mémoire du
système. L'ordinateur effectue une sauvegarde de la session après le boot afin
que l'administrateur puisse analyser les résultats.
Stratus peut garantir à ses clients des systèmes offrant des taux de disponibilité de 99,999 %, soit seulement 5 minutes d'indisponibilité par an
Comme la moitié des écrans bleus de Windows 2000 proviennent d'un
problème de driver de périphérique, Stratus a tenté de renforcer les drivers.
Stratus n'utilise que des spécifications très rigoureuses pour ses cartes et
drivers, exigeant notamment les codes sources des drivers. Par exemple, les
drivers doivent disposer de points de contrôle pour diagnostiquer l'état des
drivers et des cartes : numéro d'identification, numéro de révision et erreurs.
Stratus a également créé une barrière de protection matérielle qui isole le
driver et permet de n e mettre en échec que l'unité concernée et non le système
dans sa totalité. Lorsque le système détecte qu'un driver est en train d'enregistrer
des données pour se protéger d'un plantage, il intercepte l'appel, désactive
le périphérique et transfère l'activité sur un périphérique de substitution.
Pour éviter les 25 % d'écrans bleus qui découlent des problèmes de DLL, Stratus
a également créé un logiciel complémentaire de gestion des DLL.
Tout ordinateur Stratus est doté d'une connexion commutée par modem à un centre
d'assistance Stratus qui connaît l'identité de chaque composant matériel et
logiciel installé sur le système. Les systèmes comprennent également des solutions
de diagnostic (logicielles et matérielles), utilisées à distance par les centres
d'assistance Stratus de par le monde. Ainsi, Stratus peut garantir à ses clients
des systèmes offrant des taux de disponibilité de 99,999 %, soit seulement 5
minutes d'indisponibilité par an. Il faut vraiment une grosse erreur d'un opérateur
pour planter un système Stratus, et bon nombre de clients UNIX de Stratus ont
connu des années de service sans la moindre interruption. Stratus facture annuellement
la télésurveillance d'un système à 15 % de son prix d'acquisition et plus de
90 % des clients ont recours à ce service.
Lorsqu'un composant tombe en panne, un centre de support Stratus désactive automatiquement
le composant et envoie un composant de remplacement au client dans la nuit.
Selon Stratus, les clients ne s'aperçoivent généralement de la panne du composant
que lorsque le composant de remplacement est livré. En outre, les composants
configurés comportent une indication de statut par code de couleur (vert, jaune,
rouge). Ainsi, même un opérateur non formé peut aller au composant en panne,
l'extraire et insérer le composant de remplacement.
Selon David Flawn, Vice-Président de Stratus en charge du développement international,
les systèmes Stratus constituent une excellente alternative aux système Windows
2000 en clusters des autres fournisseurs car les clusters sont difficiles à
mettre en œuvre et à maintenir et qu'ils nécessitent des logiciels spécialement
écrits pour exploiter le clustering.
En entrant sur le marché Windows 2000 avec des prix relativement faibles pour
ses serveurs ftServer, Stratus va entrer en compétition avec des constructeurs
généralistes tels qu'IBM, Compaq, Hewlett-Packard et Dell. Steve Keily, le Président
et CEO de Stratus, parie sur une forte croissance des besoins en haute disponibilité
avec des implémentations telles que les ASP et les ISP, les grands déploiements
de Microsoft Exchange Server, SAP… Ces applications peuvent tirer parti de matériels
à tolérance de panne. De plus, de nombreux clients UNIX de Stratus pourraient
bien migrer certaines de leurs application UNIX sur des matériels Windows 2000
moins onéreux.
Les systèmes Stratus seront parmi les premiers à recevoir la certification Windows 2000 Datacenter Server
Les systèmes Stratus seront parmi les premiers à recevoir la certification
Windows 2000 Datacenter Server. Stratus espère vendre une grande quantité de
système ftServer dans les années à venir. Ce volume fera évoluer le modèle commercial
de l'entreprise et lui donnera une visibilité bien supérieure sur le marché.
Stratus commercialisera ces serveurs via un réseau de distribution et pourrait
bien chercher à les distribuer en OEM. Ce constructeur pourrait bien prendre
une place de choix sur le marché des serveurs Windows.