Arkeia, eine kommerzielle, professionelle Backuplösung für Netzwerke

ArticleCategory: [Choose a category for your article]

Applications

AuthorImage:[Here we need a little image form you]

[Photo of the Author]

TranslationInfo:[Author and translation history]

original in en Georges Tarbouriech
en to de Harald Radke

AboutTheAuthor:[A small biography about the author]

Georges ist seit langer Zeit Unix Anwender (sowohl von kommerziellen, als auch freien Derivaten). Er verwendet Arkeia für die Datensicherung in einer recht heterogenen Netzwerkumgebung.

Abstract:[Here you write a little summary]

Arkeia 4.2.3-1 ist die neueste Version der professionellen Backuplösung von Knox Software http://www.arkeia.com. Neben dem kommerziellen Produkt gibt es noch eine für den persönlichen Gebrauch freie Version, die mit einigen Linux Distributionen mitkommt.
Der Leser mag vielleicht glauben, dass kommerzielle Software nichts im LinuxFocus zu suchen hätte.
Fakt ist, dass dieses kommerzielle Produkt auf den professionellen Anwender abzielt und Linux selbst immer mehr Zugang in diesem Bereich findet.

ArticleIllustration:[This is the title picture for your article]

[Illustration]

ArticleBody:[The article body]

Einleitung

Die Administration eines Netzwerkes ist eine vielschichtige Aufgabe. Eine davon ist die Datensicherung. Augenscheinlich nimmt die Datenmenge in Netzwerken täglich zu, vorallem, seitdem Festplatten mit großen Kapazitäten bereitstehen, umfangreiche Applikationen genutzt werden und immer mehr Benutzer hinzukommen.
Es war deshalb notwendig, die seit Jahren bestehenden Strategien zur Datensicherung weiterzuentwickeln.
Damals wurden Backups mittels eines Magnetbandlaufwerkes betrieben, welches an dem zu sichernden Server angeschlossen war. Für das Backup wurden UNIX-Kommandos wie dump, tar, cpio oder find (-cpio ist eine Option für find) verwendet.

Natürlich funktioniert diese Strategie auch heute noch, solange die Zahl von Servern, Clients und Anwendungen im Netzwerk nicht exponentiell steigt.
Andernfalls ist man gezwungen, sich nach einer besseren Alternative umzuschauen.
In diesem Fall heisst besser: schneller!

Unter dem Gesichtspunkt der Geschwindigkeit macht man sich dann auf die Suche nach der besten Methode zur Datensicherung.
Dies wird recht schwierig, laufen im Netzwerk viele verschiedene Betriebssysteme. Meist sollte die beste Methode billig, effizient und einfach zu implementieren sein! Bei genauerer Betrachtung stellt sich aber heraus, dass es immer auf einen Kompromiß hinausläuft und dass die Bedürfnisse und Ansprüche individuell verschieden sind.
Deshalb sollte man sich zuerst Gedanken über die Anforderungen machen, unter Berücksichtigung der Software und der Hardware.

Es gibt eine umfangreiche Palette an Produkten, von denen aber die meisten properitäre Software verwenden...und sie sind zumeist recht teuer (was noch eine Untertreibung ist).
Man sollte auch nicht die Hardware vergessen: zumindest eine Reihe von Bandlaufwerken oder Wechslern wird benötigt.
Nicht zuletzt muss entschieden werden, welcher Rechner als Backup Server verwendet werden soll.
Dieser muss große Festplattenkapazitäten, sowie umfangreiche Ressourcen (Speicher und Prozessor) und ein SCSI System besitzen.
Er muss in der Lage sein, mehre Backups gleichzeitg zu verwalten.
Also, was nun ?

Vorstellung

Die Wahl von Arkeia

Viele große Firmen "offerieren" Lösungen zur Datensicherung, wie sie schon oben erwähnt worden sind.
Arkeia wurde vorallem deswegen gewählt, da es auch mit vielen verschiedenen Betriebssystemen zurande kommt.
Als Backup Plattformen kommen in Frage: AIX 4.1, DEC Alpha Unix 4.0, HP-UX 10, IRIX 6.2 and up, Linux 2.* (x86), Solaris 2.5 und höher, sowie NT 4.0 Server (Intel).
Auf der Client Seite stehen neben diesen Systemen noch SCO v5 (Intel), BSD 3.0, 4.0, Novell 4.11, FreeBSD 2.2.6, Windows 95,98, NT 4.0 Server (Alpha) and NT 4.0 Workstation (Intel) zu Verfügung.
Diese Aufzählung ist jedoch nicht vollständig, unter http://www.arkeia.com kann der Leser mehr erfahren.

Die meisten Server bieten eine grafische Oberfläche, auf einer properitären Xlib Version für die Unix Derivate basierend, bzw. unter Java, für die Microsoft Produkte.
Desweiteren spielte der Preis bei der Entscheidung zugunsten Arkeia eine Rolle. Hier eine präzise Summe zu nennen ist nicht möglich, ist der Preis doch abhängig vom jeweiligen Netzwerk, der Anzahl und Art der Server und Clients.Bei Verwendung eines Bandroboters kommen zum Beispiel noch die Lizensgebühren für die Bibliothek zur Ansteuerung dieses Gerätes hinzu.
Auf den Webseiten von Arkeia kann man sich jedoch einen Überblick über die individuellen Kosten des jeweiligen Netzwerkes verschaffen.
Der letzte Grund, Arkeia zu wählen, war die Tatsache, dass das Programm in der Lage ist, beinahe jede Art von Bandlaufwerk anzusteuern, sei es DAT, EXABYTE, QIC, o.a.
Da wir über eine Menge QIC Bandlaufwerke verfügten, war dies schon mal erledigt.

Wie schaut Arkeia nun aus?

adm.jpg
Das Hauptfenster

Wie bereits erwähnt, bietet Arkeia auf der Server Seite eine grafische Benutzeroberfläche an.
Der Benutzer loggt sich in Arkeia mittels eines Login Fensters ein. Danach hat er Zugang zu allen Schaltflächen, die die Datensicherung steuern. Diese Schaltflächen können mittels Icons, Menüleiste oder Kontextmenü geöffnet werden.
Die Bedienung und das Aussehen können individuell konfiguriert werden.
Es genügt zu sagen, dass die Oberfläche intuitiv und benutzerfreundlich gestaltet worden ist.
Unter Unix läuft die grafische Oberfläche mit nahezu allen Fenstermanagern.
Unter den Microsoft Betriebssystemen muss Microsoft JVM (Java Virtual Mchine) installiert werden, bevor die Oberfläche verwendet werden kann.
Auch wenn das Design Geschmacksache sein dürfte, die grafische Oberfläche ist funktionell.

Wie funktioniert das Programm?

Arkeia realisiert ein paralleles Backupsystem, unter Verwendung des TCP/IP Protokollstapels.
Ein Backup Server steuert die Bandlaufwerke und empfängt die Daten der Clients über mehrere Kanäle.
Zum Einsatz kommen Client/Server Standardmechanismen, mit Shared Memory und Messagequeues. Auf dem Server muss IPC (Inter Process Communication) einwandfrei konfiguriert sein.

Das Benutzerhandbuch beschreibt, wie der Backup Server konfiguriert wird.
Dies geschieht recht intuitiv: es muss die Server, sowie die Client Software auf dem Bachup Server installiert werden, auf den Clients nur die Client Programme. Soweit, so gut!
Auf der Server Seite muss alles eingestellt werden, was die Bandlaufwerke, Drivepacks, Bandpool und Savepacks betrifft.

- Bandlaufwerke:
Der erste Schritt der Konfiguration.
Man wählt den Punkt Drives management aus dem Menü Devices aus. Für das Gerät muss ein Name angegeben werden, sowie die zulässigen Operationen (Lesen, Schreiben, Löschen, Komplettlöschung) und natürlich das Bandlaufwerk. Dies ist abhängig von der jeweiligen Plattform: bei Solaris zum Beispiel kann das Laufwerk unter /dev/rmt/1h zu finden sein, bei Irix unter /dev/rmt/tps1d2 und bei Linux unter /dev/st0.
Jedes Gerät und jedes dazugehörige Laufwerk müssen angegeben werden.
Angenommen, man hat vier QIC Bandlaufwerke an einem SGI O2 Server, unter Irix 6.5:
Das erste Laufwerk könnte QICone genannt werden, mit /dev/rmt/tps1d2 als korrespondierendem Gerät, das zweite Laufwerk QICtwo mit /dev/rmt/tps1d3, usw.
Die Zahl 1 hinter tps gibt die Nummer des SCSI Controllers an, die 2 nach d ist die Geräte ID.
Man muss schon mit der Funktionsweise von SCSI vertraut sein, mit IDs, Daisy Chains, usw.
Die Konfiguration eines Bandwechselroboters ist nahezu identisch und wird von der Dokumentation hinreichend erläutert.

- Drivepacks:
Im selben Menü wählt man den Punkt "Drivepacks" und legt ein Drivepack für das jeweilige Bandlaufwerk an.
Unter Verwendung des obigen Beispieles könnte man für das Laufwerk QICone das dazugehörige Drivepack QICone Pack nennen, für die anderen Laufwerke geschieht dies analog. Nun muss noch festgelegt werden, welches Drivepack zu welchem Laufwerk gehört.

- Bandpool:
Es können soviele Pools,wie benötigt, angelegt werden. Dafür wählt man aus dem Menü "Tapes management" den Punkt "Pools management" aus, klickt das Icon "New" an und füllt die Textfelder aus.

- Bänder:
In jedem Pool muss zumindest ein Band eingetragen sein. Das Fenster "Tapes in pool" wird durch Doppelklick auf den jeweiligen Pool geöffnet. Durch Auswahl von "New" wird der Dialog "Create Tape" geöffnet, dessen Felder entsprechend ausgefüllt werden.
Übrigens sei hier die wirklich nützliche Onlinehilfe erwähnt, die für jedes Fenster eine Erläuterung bietet.

- Savepacks:
Es können jetzt noch ein oder mehrere Savepacks angelegt werden. Diese enthalten den Verzeichnisbaum der zu sichernden Daten für einen bestimmten Client. Man kann durch diesen Verzeichnisbaum navigieren und die gewünschten Verzeichnisse oder Dateien auswählen.
Dies wird für jeden Client und jede zu sichernde Verzeichnisstruktur durchgeführt.
Nun ist man bereit, für ein benutzergesteuertes, paralleles Backup mehrerer Clients.

Ein Beispiel

Wir haben hier ein recht drolliges Netzwerk mit vier Servern, die gesichert werden müssen.
Der Backup Server ist eine SGI O2, als Clients fungieren ein Sun Server unter Solaris 2.6 und zwei NT 4.0 Server für die Anwendungen, sowie ein Linux Server unter RedHat 6.0 für die Kommunikation.
Nun soll ein benutzergesteuertes Backup der vier Rechner durchgeführt werden.
Es werden vier Bandgeräte erstellt, deren Namen QIC Sun, QIC Linux, QIC Pcsvr und QIC Pcdev sein sollen.
Originell, oder ?
Nun werden die vier Geräte eingebunden: QIC Sun unter /dev/rmt/tps1d4, QIC Linux unter /dev/rmt/tps1d5, QIC Pcsvr unter /dev/rmt/tps1d3 und QIC Pcdev unter /dev/rmt/tps1d2.
Alle erhalten die Rechte, die wir haben wollen, wir sind die Administratoren und wir arbeiten als root.
Is das nicht furchtbar?

Als nächstes werden die jeweiligen Drivepacks angelegt: Sun Pack, Linux Pack, Pcsvr Pack und Pcdev Pack, wieder sehr geistreiche Namensschöpfungen. Nun zum Thema Bandpool, wie gehabt: Sun Pool, Linux Pool, Pcsvr Pool und Pcdev Pool.
Für jedes Pack wird ein Pool angelegt. Dies ist aber reine Geschmackssache, wer will kann auch einen Pool für alle Packs anlegen.
Gehören mehrere Bänder zum Pool, so werden sie von Arkeia verwaltet. Das bedeutet, dass das Programm entscheidet, welches Band für welches Backup verwendet wird, falls keine Prioritäten für die Bänder angegeben worden sind.
Dies ist meiner Meinung nach der größte Schönheitsfehler des Programmes.

Zum Schluss wird in jedem Pool ein Band definiert, und wieder: Sun Tape, Linux Tape, Pcsvr Tape and Pcdev Tape.
Diese ganze Prozedur muss glücklicherweise nur einmal durchlaufen werden, alle Einstellungen können bei Bedarf wieder verwendet werden.
Ziel ist es, ein komplettes Backup jedes Servers zu erstellen.
Die Savepacks werden Sun, Linux, Pcsvr und Pcdev genannt.

Da Arkeia auf den Clients ordnungsgemäß eingerichtet worden ist, ist jeder Rechner im Browser zu sehen. Sie können durch Selektieren der jeweiligen Checkbox ausgewählt werden.
Nun soll das interaktive Backup gestartet werden. Dazu wird der entsprechende Menüpunkt ausgewählt. Im darauffolgenden Dialog wird der Savepack, der Drivepack und der Pool für jeden Server bestimmt.
Im obigen Beispiel wird für die Sicherung der Sun, das Sun Savepack, das Sun Pack Drivepack und der Sun Pool Bandpool ausgewählt. Nun sucht man sich die Art des Backups aus (im Beispiel das komplette Backup, es ist aber auch ein schrittweises Backup möglich), legt die Bandwahl fest (zum Beispiel, ob neue Bänder verwendet werden sollen oder existierende aufzufüllen sind) und entscheidet, ob man per E-Mail informiert werden soll (jeder so, wie er mag). Nun einfach die Checkbox anklicken und die Datensicherung der Sun beginnt.
Dies wird für jeden Server gemacht und man ist fertig. Es werden vier Backups gleichzeitig durchgeführt und man kann einen Kaffee trinken gehen.

linux.jpg
Das Backup Fenster

Nach vierzig Minuten ist alles vorbei.
Ein paar wichtige Daten unseres Netzwerkes: wir haben ein Kategorie 5 Netz, allerdings noch im Aufbau. Dies bedeutet, dass nicht die komplette Verkabelung auf Cat 5 basiert, es sowohl 10MBit, als auch 10/100MBit Hubs gibt und nur einige Rechner reine 100MBit Netzkarten haben.
Nichtsdestotrotz wurden in vierzig Minuten ca. 3 GB und 150000 Dateien gesichert.
In einem reinen Cat 5 Netzwerk mit 100MBit Transferrate hätte es nur ein drittel dieser Zeit gedauert.

Die Geschwindigkeit hängt von vielen Faktoren ab: dem Netzwerk, den Rechnern, den Bandlaufwerken und der Bandkapazitäten. Das hier gezeigte Beispiel ist ein spezieller Fall und kann nicht die fantastische Leistung wiederspiegeln, die mit einigen Konfigurationen erreicht werden kann. Bei einem echten Cat 5 Netz und schnellen Rechner und unter Einsatz von Bandwechselautomaten, sowie DAT Geräten können 70MB pro Minute an Backuprate erreicht werden. Im obigen Beispiel waren es ca. 25MB pro Minute.
Dies bezieht sich auf jedes einzelne Backup. Zusammen ergibt dies eine Rate von 100MB pro Minute.

linuxlog.jpg pcdevlog.jpg pcsvrlog.jpg sunlog.jpg
Die Protokolle

Um jedoch eine bessere Vorstellung der Effizienz des Programmes zu bekommen, sollte man die Ergebnisse mit denen vergleichen, die ältere Backup Strategien auf der gleichen Hardware erzielen.
Zuvor wurden Backups direkt auf dem jeweiligen Rechner erstellt, jeder mit einem Bandlaufwerk an seinem SCSI Anschluß versehen.
Obwohl bei dem neuen System die gleichen Rechner und die gleichen Laufwerke verwendet werden, wird ein Geschwindigkeitsvorteil von fünfzig Prozent erzielt.

Ein Backup der Sun, mit ihrem eigenen Laufwerk dauert 60 Minuten. Beim Einsatz von Arkeia nur 38 Minuten.
Die Datensicherung von Pcdev mit eigenem Laufwerk: über eine Stunde, unter Arkeia 32 Minuten, usw...
Eine Sicherung des Backup Servers ist etwas langsamer. In diesem Fall wird das Netzwerk nicht verwendet. Die Rate liegt bei 22Mb pro Minute.
Es wurden nur Netzwerk Server betrachtet. Aber natürlich geht das Ganze auch mit Netzwerk Clients.

Der Dokumentation zufolge kann man, die richtige Hardware vorausgesetzt, eine Datensicherung von 128 Rechnern auf 32 Bandgeräten simultan durchführen.
Dies konnte nicht nachgeprüft werden, die Firma, bei der ich arbeite, ist finanziell halt nicht so üppig ausgestattet.

Betrachtet man Datensicherung, darf man die Wiederherstellung der Daten nicht vergessen. Dies ist genauso einfach und schnell wie die Sicherung. Mittels des Browsers kann genau bestimmt werden, was wo wiederhergestellt wird, egal, in welchem Verzeichnis oder auf welchem Rechner.

Weitere Optionen

Bisher wurden periodische Backups nicht erwähnt, aber natürlich kann man mit Arkeia auch Datensicherung zu bestimmten, vorher festgelegten Zeiten durchführen. Dies wird unter Unix durch cron realisiert, unter den Microsoft Betriebssystemen durch einen Dienst.
Es können verschiedene Zeitintervalle für ein regelmäßiges Backup bestimmt werden, seien es Tage, Wochen oder Monate.

Für jedes Backup stehen drei Zeitebenen (Levels) zur Verfügung. Gegeben sei ein periodisches Backup für einen Monate. Level 1 bestimmt monatliche, Level 2 wöchentliche und Level 3 tägliche Sicherungsaktionen. Das bedeutet, dass Level 3 sechs Mal in der Woche, Level 2 drei Mal im Monat und Level 1 genau einmal durchgeführt wird.
Kleiner Nebeneffekt: Es werden relativ viele Bänder benötigt und natürlich soviele Bandlaufwerke, wie zu sichernde Server!
Jedenfalls solange man seinen Hund nicht dazu abrichtet, die Bänder in der Nacht zwischen den Backups zu wechseln...

Abgesehen davon funktioniert das System genauso, wie ein benutzergesteuertes Backup. Weiter auf die periodische Datensicherung einzugehen würde den Rahmen dieses Artikels sprengen. Ich belasse es dabei und erwähne nur, dass dies eines der besten Features von Arkeia ist.

Ein weiterer interessanter Punkt sind die Protokolle. Alles wird protokolliert, ob es die Bänder, die Geräte, die Backups, oder was auch immer betrifft.
Kostet dies einiges an Festplattenplatz, so stellt es doch eine echte Hilfe dar.
Die Protokolle sind gut strukturiert und bieten eine Vielzahl von Informationen. Das Programm archiviert sie nach Monaten sortiert.
 

avlog.jpg
Das Protokollfenster

Die Onlinehilfe verdient es wirklich, erwähnt zu werden. Man kann mit Arkeia arbeiten, ohne das man sich durch die gesamte Dokumentation arbeiten muss...jedenfalls, solange man nicht anspruchsvollere Dinge bewerkstelligen will. Die komplette Dokumentation kommt auf CD-Rom mit, im PDF Format. Man kann sie leicht ausdrucken und hat so ein Handbuch zum Anfassen.
Diese Dokumentation enthält wichtige Informationen über plattformabhängige Einstellungen, Sicherheit, Werkzeuge zur Problembehandlung, Bibliotheken für die Ansteuerung von Bandwechselautomaten...
Sollte dies noch nicht ausreichend sein, kann man sich der Mailing List bedienen, die für Arkeia angeboten wird.

Und ?

Dieser Artikel kann nicht erschöpfend auf diese Software eingehen. Es gibt viel mehr über sie zu sagen...
Man hat nicht versucht, das Rad neu zu erfinden, sondern alles zu nutzen, was die Leistung erhöht.
Einer der Schlüsselpunkte ist IPC, Unix sei's gedankt...
Erwähnenswert ist die Shareware Version für Linux, welche für den nicht-kommerziellen Gebrauch zur Verfügung gestellt wird. Es gibt nichts, was einen daran hindert, die Software im heimischen Netzwerk auszuprobieren.
Da es sich hier um Shareware handelt, werden, falls man 20 oder mehr Dollar einschickt, von dieser Summe 25 Prozent zur Unterstützung öffentlich zugänglicher Software verwandt.

Ich habe Arkeia von der europäischen Niederlassung bezogen. Die verantwortliche Person hat wirklich Ahnung von der Materie und leistet hervorragende Arbeit (Hallo Sandy!).
Von all den Firmen, mit denen ich zu tun habe, war diese die erste, mit der ich alle Angelegenheiten allein per E-Mail regeln konnte. Kein FAX, keine gelbe Post, bis auf den Versand der Software. Und, nicht zuletzt, alles in plattformunabhängigen PlainTEXT!!

Das mag zwar nicht wirklich hierhingehören, aber ich bin es leid, dauernd irgendwelche Word oder Excel Dokumente über das Netz zu bekommen. Mal ganz abgesehen davon, dass sie immer Makroviren beherbergen können: Man kann doch nicht wirklich von allen Menschen auf der Welt erwarten, dass sie Word oder Excel verwenden (wie war das denn, bevor es sie gab?). Auch ist eine Textdatei 10 bis 100 mal kleiner, als ein entsprechendes Word Dokument. In Zeiten, in denen Bandbreite im Internet immer kritischer wird, spielt Größe durchaus eine Rolle.

Man möge mir mein Abschweifen verzeihen.
Nachdem ich mir nun viele neue Freunde gemacht habe, zurück zu Arkeia.
Meiner Meinung nach ist Arkeia eine gute Backuplösung für Netzwerke. Es gibt sicherlich Punkte, die mir weniger gut gefallen, aber man arbeitet hart daran, das Programm zu verbessern. Ich würde gerne mehr Möglichkeiten, die Verwaltung von Bändern betreffend, sehen. Zum Beispiel, wieviele Bänder innerhalb eines Vorganges verwendet werden sollen oder die Möglichkeit, ein Band während der Sicherung zu überspielen, kurz gesagt, ich will einfach das Sagen haben!
Der Preis spielte bei der Entscheidung für Arkeia eine wichtige Rolle. In diesem Bereich dürfte Arkeia ausserordentlich wettbewerbsfähig sein.
Wer auf der Suche nach einer Backuplösung ist, sollte auf jeden Fall dieses Programm ausprobieren. Auch wenn man schon Arkeia über eine Linux Distribution sein Eigen nennt, sollte bei http://www.arkeia.com reischauen, es gibt viel zu erfahren.

Wir leben in einer großartien Zeit!