Eigenschaften von neuem HA-vServer

Goldlocke

New Member
Hallo liebes Forum,

ich spiele erstmals mit dem Gedanken, einen hochverfügbaren managed vServer mit automatischem Cluster-Failover für eine SaaS-Anwendung anzumieten. Also mindestens 2 physikalische Server, die z.B. via SAN auf einen gemeinsamen redundanten Speicher zugreifen. Das die Dinger nicht gerade günstig sind, habe ich bereits realisiert. Ich habe vorher überwiegend mit klassichem WebHosting Erfahrungen gesammelt. Aus diesem Grund sollte der Server auch managed sein, damit ich mich wie zuvor auch auf die Programmierung der Webseiten konzentrieren kann. Ich würde sehr gerne wissen, welche Bedingungen und Eigenschaften in diesem Bereich üblich oder aus technischen Gründen möglicherweise notwendig bzw. nicht möglich sind.

Die folgenden Fragen beziehen sich auf Funktionen und Merkmale, die ich während der letzten Jahre bei verschiedenen Providern nutzen konnte und nun mit (fehlenden) Angaben vergleiche, die mir bei meinen Recherchen so aufgefallen sind. Bitte versteht diese Liste nicht als überzogene Ansprüche meinerseits, sondern eher als Diskussionsgrundlage, was bei einem managed vServer möglicherweise anders ist:

Ist es üblich und/oder technisch problemlos machbar, dass ich...
...Schreib-Zugriff auf die php.ini habe(kann ja rein theoretisch außerhalb des webroot liegen)?
...selber CronJobs einrichten und ändern kann?
...SSH-Zugriff auf mein Webroot-Verzeichnis erhalte(keine root-Shell, sondern Zugriff zwecks entpacken oder erstellen von gezippten Ordnern via Shell sowie schnelles rekursives löschen von alten Ordnern mit zig Dateien während Entwicklungsphasen)
...externe Domains selbst einbinde oder einbinden lasse(das passiert nicht so oft, dass ich es zwingend selber machen müsste)
...

Da ich bei einem managed Server in der Regel keinen root-Zugriff erhalte, dürften diese Funktionen genau wie beim klassischen Webhosting über Verwaltungs-Obeflächen gesteuert werden (cPanel, Plesk, proprietäre Eigenentwicklung, etc.). Beim klassischen Webhosting konnte ich diese Dinge jedenfalls immer problemlos erschlagen. Aber wie sieht es diesbezüglich bei managed vServern aus? Wie üblich ist dort eine derartige Verwaltungs-Oberfläche und gibt es Gründe, warum diese weniger Funktionen bieten könnte als bei einem klassischem Webhosting? In meiner Vorstellung ist ein managed vServer quasi wie aufgebohrtes Webhosting, also mit dedizierten Ressourcen.

Die Verfügbarkeit ist ja auch ein heißes Thema. Von gar keinen Angaben über schwammige Formulierungen bis hin zu präzisen SLAs ist mir da so ziemlich alles über den Weg gelaufen.
Ich Interessiere mich bezüglich der SLAs primär für 2 Bereiche:

1) Unterscheidung zwischen "Verfügbarkeit" und "Netzwerk-Verfügbarkeit" und der Bewertung der prozentualen Angaben. Wie ist im Hinblickauf eine SaaS-Anwendung z.B. eine Verfügbarkeit von 99,95% sowie eine Netzwerk-Verfügbarkeit von 99,5% zu bewerten? Was 99,5% in Stunden bedeutet kann ich natürlich ausrechnen, es geht mir eher um die Diskrepanz zwischen den beiden Werten in Hinblick auf die gewünschte Hochverfügbarkeit.

2) MTTR bei einer Service-Bereitschaft von 24/7 und einer Reaktionszeit von 15 Minuten in Bezug auf ein Problem der Priorität 1, also einen signifikanten Verfügbarkeits-Ausfall. Wenn diese z.B. mit 4 Stunden angegeben ist, wie sind dann MTTR, Verfügbarkeit und Netzwerk-Verfügbarkeit im Ganzen zu verstehen? Wird die MTTR bei der Verfügbarkeit berücksichtigt, so dass man ab Meldung der Störungen pro Jahr im Bereich "Netzwerk-Verfügbarkeit" theoretisch 10,3 Störfälle á 4,25 Stunden hinnehmen muss + 1,2 Störfälle im Bereich "Verfügbarkeit"?

Und dann ist ja immer die große Frage was passiert, wenn diese Werte überschritten werden? Ich kenne das privat von der Telekom. Da hatte ich mir mal diese verbesserte Störungsbehebung aufschwatzen lassen, die aber im Endeffekt gar nichts gebracht hat, außer dass die Telekom mehr Geld von mir bekommen hat. Sich da anteilig die Monatsgebühr erstatten zu lassen ist lächerlich, da man sich bei so einem Ausfall schon längst um alternativen gekümmert hätte(z.B. 4G-Router).

Vielen Dank fürs Lesen...
Goldlocke
 
Ohne auf die einzelnen Punkte groß eingehen zu wollen: Aber alles, was Du schreibst, möchtest, forderst, ... - hängt grundsätzlich vom Vertrag zwischen Dir und dem Hoster ab. "Gehen" tut im Prinzip alles. Was der jeweilge Hoster freiwillig, gerne, "mit Bauchschmerzen" oder "unter gar keinen Umständen" zulässt - s.o.
 
ich spiele erstmals mit dem Gedanken, einen hochverfügbaren managed vServer mit automatischem Cluster-Failover für eine SaaS-Anwendung anzumieten. Also mindestens 2 physikalische Server, die z.B. via SAN auf einen gemeinsamen redundanten Speicher zugreifen. Das die Dinger nicht gerade günstig sind, habe ich bereits realisiert. Ich habe vorher überwiegend mit klassichem WebHosting Erfahrungen gesammelt. Aus diesem Grund sollte der Server auch managed sein, damit ich mich wie zuvor auch auf die Programmierung der Webseiten konzentrieren kann. Ich würde sehr gerne wissen, welche Bedingungen und Eigenschaften in diesem Bereich üblich oder aus technischen Gründen möglicherweise notwendig bzw. nicht möglich sind.

Ich werfe mal Ceph Cluster in den Raum. Bei 2-3 Nodes kann ein Ceph Cluster schon Sinn machen und die aktuelle Proxmox Version hat einen Support für Ceph Cluster. Wäre eventuell für die Skalierung und Performance in dem Fall genau das Richtige gerade wenn es um Hochverfügbarkeit geht. Unter https://www.thomas-krenn.com/de/wiki/Ceph findest du dazu mehr Details. Die Installation und Administration ist in so einem Fall relativ günstig, man sollte aber für eine optimale Performance mindestens mit einem 10 Gigabit Netzwerk an die Sache herangehen, ansonsten geht nicht mehr als 100 MB/s durch die Gigabit Leitung. Gerne können wir bei Interesse dazu auch ein Angebot ausarbeiten um einen Kostenrahmen abzustecken.

Ist es üblich und/oder technisch problemlos machbar, dass ich...
...Schreib-Zugriff auf die php.ini habe(kann ja rein theoretisch außerhalb des webroot liegen)?

Normalerweise ja, bei uns wäre auch ein Vollzugriff auf die Managed vServer Instanzen möglich.

...selber CronJobs einrichten und ändern kann?
...SSH-Zugriff auf mein Webroot-Verzeichnis erhalte(keine root-Shell, sondern Zugriff zwecks entpacken oder erstellen von gezippten Ordnern via Shell sowie schnelles rekursives löschen von alten Ordnern mit zig Dateien während Entwicklungsphasen)
...externe Domains selbst einbinde oder einbinden lasse(das passiert nicht so oft, dass ich es zwingend selber machen müsste)
...

Das sind eigentlich alles Aufgaben einer Verwaltungsoberfläche auf der virtuellen Maschine die im HA Verbund betrieben wird. I-MSCP oder Plesk können das ohne Weiteres abbilden, hat aber eigentlich nur am Rande etwas mit dem Management als Solches und dem HA Cluster zu tun.


Die Verfügbarkeit ist ja auch ein heißes Thema. Von gar keinen Angaben über schwammige Formulierungen bis hin zu präzisen SLAs ist mir da so ziemlich alles über den Weg gelaufen.
Ich Interessiere mich bezüglich der SLAs primär für 2 Bereiche:

Ja, SLA ist immer so eine Sache :)


1) Unterscheidung zwischen "Verfügbarkeit" und "Netzwerk-Verfügbarkeit" und der Bewertung der prozentualen Angaben. Wie ist im Hinblick auf eine SaaS-Anwendung z.B. eine Verfügbarkeit von 99,95% sowie eine Netzwerk-Verfügbarkeit von 99,5% zu bewerten? Was 99,5% in Stunden bedeutet kann ich natürlich ausrechnen, es geht mir eher um die Diskrepanz zwischen den beiden Werten in Hinblick auf die gewünschte Hochverfügbarkeit.

Netzwerk Verfügbarkeit bedeutet, die Verfügbarkeit des Internets bis zum Server. Quasi Verfügbarkeit des Netzwerkanschlusses bis Server. Dieser kann durch Switchausfälle oder Anbindungsstörungen beeinflusst werden.

Service Verfügbarkeit bedeutet, die tatsächliche Verfügbarkeit der Services auf dem Server selbst.

Auf die reine Netzwerkverfügbarkeit kann man normalerweise mehr geben als auf eine Serviceverfügbarkeit da die Fehlerquellen dort deutlich weniger sind als bei einem Service. Die Verfügbarkeit eines Services kann durch äußere Einflüsse wie z.B. DDoS Angriffe, Fehlkonfigurationen, fehlgeschlagene Updates, ... sehr leicht beeinflusst werden und ist daher nur schwer zu garantieren.


2) MTTR bei einer Service-Bereitschaft von 24/7 und einer Reaktionszeit von 15 Minuten in Bezug auf ein Problem der Priorität 1, also einen signifikanten Verfügbarkeits-Ausfall. Wenn diese z.B. mit 4 Stunden angegeben ist, wie sind dann MTTR, Verfügbarkeit und Netzwerk-Verfügbarkeit im Ganzen zu verstehen? Wird die MTTR bei der Verfügbarkeit berücksichtigt, so dass man ab Meldung der Störungen pro Jahr im Bereich "Netzwerk-Verfügbarkeit" theoretisch 10,3 Störfälle á 4,25 Stunden hinnehmen muss + 1,2 Störfälle im Bereich "Verfügbarkeit"?


Die Zahlen kommen mir irgendwie bekannt vor :) Klingt nach unserem Support Konzept. Man muss das etwas differenziert betrachten. Eine Festplatte in einem Server zu tauschen ist sicherlich nur eine Sache von 15-30 Minuten ab Ticketerstellung. Das wäre dann der Optimalfall wo der Fehler klar ist und schnell gefunden wird. Der nicht Optimalfall wäre - Server ist nicht erreichbar und das Fehlerbild nicht direkt erkennbar. In so einem Fall müssen die einzelnen Bauteile des Servers nacheinander getauscht werden und getestet werden, ob das richtige defekte Bauteil erwischt wurde. So ein Reparaturprozess dauert daher unter Umständen länger. Bei der Garantie der maximalen Endstörzeiten muss aber genau dieser Fall berücksichtigt werden mit der maximalen zu erwartenden Störzeit des Servers. Diese kann man natürlich senken, wenn man ein baugleiches Sparepart Gerät bucht und dann z.B. einfach nur die Festplatten umbauen muss. Das möchten die Kunden aber im Regelfall nicht bezahlen. Gerade bei Clustern ist das auch nicht so kritisch wenn ein Clustermember mal für eine Stunde ausfällt und wie gesagt geht man dabei vom Worse Case aus nicht vom Regelfall.


Grundsätzlich solltest du dir über eine Sache Gedanken machen. Verfügbarkeiten kann man viel garantieren, wenn aber daraus keine Vertragsstrafe resultiert kann man bei einer Verfügbarkeitsverletzung bestenfalls eine Rechnungsstundung gemessen am Gesamtbetrag und der Gesamtausfallzeit vornehmen oder von einem außerordentlichen Kündigungsrecht gebrauch machen. Große Schadenersatzforderungen sind hier grenzwertig zu betrachten, hier kommt es immer auch darauf an, was der Kunde pro Monat für die Dienstleistung zahlt und welcher Schaden tatsächlich entstanden ist. Meist bewegt man sich daher etwas auf dünnen Eis eine Schadenersatzforderung bei einem einfachen Verfügbarkeits-SLA geltend zu machen.

Du kannst natürlich auch einen Vertrag machen, mit einer garantierten Schadenersatzklausel, daher bei Verletzung des Verfügbarkeitsrahmens X pro weitere Minute Summe X €. Das geht, es wird aber schwierig dafür einen Hoster zu finden der sich dieses finanzielle Risiko antun möchte oder man findet einen Hoster der dann aber eine Risikopauschale X € pro Monat aufschlägt und ebenso eine maximale Schadenssumme definiert.
Solche Risiko SLA bekommt man eigentlich von keiner Versicherung versichert, daher muss der Hoster dafür selbst Rücklagen aufbauen denn der Schadenersatzfall kann bei einem größeren Ausfall durchaus eintreten. Es ist eben nur Technik die läuft und genauso wie ein Auto nicht ohne Wartung und Schaden betrieben werden kann, kann auch kein Server ohne Wartung und Schaden betrieben werden.


Ich empfehle dir daher dich nicht an SLA zu klammern. Natürlich sind hohe SLA immer nett, haben aber genaugenommen wenig Bewandtnis. Du solltest dich nach Kundenmeinungen und Referenzkunden erkundigen. Ein Hoster der im Störfall alle Hebel in Bewegung setzt um dein Problem zu lösen ist mehr Wert als jede theoretische SLA. Und diesen findest du nur, wenn du dich am Markt umschaust und dich über die Anbieter und deren Stärken- und Schwächen informierst.
 
Back
Top