mdadm Email

[tech]NEO

New Member
Hallo bekommen jeden Tag eine Email mit folgenden Inhalt:

Code:
    P.S. The /proc/mdstat file currently contains the following:
    
    Personalities : [raid1] [raid0] [linear] [multipath] [raid6] [raid5] [raid4] [raid10]
    md2 : active raid1 sda4[1]
          208925568 blocks super 1.0 [2/1] [_U]
          bitmap: 2/2 pages [8KB], 65536KB chunk
    
    md0 : active raid1 sda1[1]
          1023936 blocks super 1.0 [2/1] [_U]
          
    md1 : active raid1 sda3[1]
          20479872 blocks super 1.0 [2/1] [_U]
Was bedeutet das und wie kann ich es beheben, das ich keine Emails mehr bekomme.

Vielen Dank
 

danton

Debian User
Sei froh, dass du sie bekommst. Deinem RAID 1 fehlt nämlich die zweite Festplatte für die Spiegelung.
 

Lord Gurke

Nur echt mit 32 Zähnen
Dir wird halt eine Festplatte kaputt gegangen sein...
Dass du nichts bemerkt hast ist deinem RAID1-Setup zu verdanken - aber du solltest jetzt den Support von Strato kontaktieren und ihnen mitteilen, dass eine Festplatte defekt ist und diese bitte getauscht werden soll.
Die Seriennummer der NICHT defekten Festplatte lässt sich mit
smartctl -a /dev/sda
ermitteln - denn /dev/sda ist noch vorhanden und ansprechbar.

Danach wird sich das RAID aber nicht von selbst magisch reparieren, dazu solltest du dir dann also sehr zeitnah jemanden holen, der sich damit auskennt und dir das RAID wieder repariert. Sonst sind die Daten weg...
 

danton

Debian User
Hast du auch schon mal einen Restore-Test gemacht, um zu schauen, ob dein Backup in Ernstfall auch wieder ein funktionsfähiges System erzeugt?
Du sollst vorher Massnahmen ergreifen, damit du eben nicht das Backup bemühen musst, sondern dein System möglichst unterbrechungsfrei weiter laufen kann (Strato-Support die defekte Festplatte melden und hoffen, dass diese recht kurzfristig getauscht wird, anschließend die Redundanz mit den entsprechenden Befehlen wiederherstellen).
 

[tech]NEO

New Member
Morgen, ich habe einen Hardware Test bei Strato durchgeführt und es wurde kein Fehler festgestellt.

Ich bekomme 3 Emails 2-3 mal am Tag vom Server. Vielleicht ist das wichtig!

1. Email
Code:
This is an automatically generated mail message from mdadm running on web01.casa.de

A DegradedArray event had been detected on md device /dev/md/1.

Faithfully yours, etc.

P.S. The /proc/mdstat file currently contains the following:

Personalities : [raid1] [raid0] [linear] [multipath] [raid6] [raid5] [raid4] [raid10]
md2 : active raid1 sdb4[1]
      208925568 blocks super 1.0 [2/1] [_U]
      bitmap: 2/2 pages [8KB], 65536KB chunk

md1 : active raid1 sdb3[1]
      20479872 blocks super 1.0 [2/1] [_U]
     
md0 : active raid1 sdb1[1]
      1023936 blocks super 1.0 [2/1] [_U]
     
unused devices: <none>
2. Email
Code:
This is an automatically generated mail message from mdadm running on web01.casa.de

A DegradedArray event had been detected on md device /dev/md/2.

Faithfully yours, etc.

P.S. The /proc/mdstat file currently contains the following:

Personalities : [raid1] [raid0] [linear] [multipath] [raid6] [raid5] [raid4] [raid10]
md2 : active raid1 sdb4[1]
      208925568 blocks super 1.0 [2/1] [_U]
      bitmap: 2/2 pages [8KB], 65536KB chunk

md1 : active raid1 sdb3[1]
      20479872 blocks super 1.0 [2/1] [_U]
     
md0 : active raid1 sdb1[1]
      1023936 blocks super 1.0 [2/1] [_U]
     
unused devices: <none>
3. Email
Code:
This is an automatically generated mail message from mdadm running on web01.casa.de

A DegradedArray event had been detected on md device /dev/md/0.

Faithfully yours, etc.

P.S. The /proc/mdstat file currently contains the following:

Personalities : [raid1] [raid0] [linear] [multipath] [raid6] [raid5] [raid4] [raid10]
md2 : active raid1 sdb4[1]
      208925568 blocks super 1.0 [2/1] [_U]
      bitmap: 2/2 pages [8KB], 65536KB chunk

md1 : active raid1 sdb3[1]
      20479872 blocks super 1.0 [2/1] [_U]
     
md0 : active raid1 sdb1[1]
      1023936 blocks super 1.0 [2/1] [_U]
     
unused devices: <none>
 

danton

Debian User
Die Mails widersprechen dem Zustand, der in deinem ersten Post beschrieben wurden. Jetzt die /dev/sdb wieder da, dafür fehlt den RAIDs nun die /dev/sda - gut möglich, dass du nun einen älteren Stand deiner Daten hast, da die RAIDs nun von der anderen Platte gestartet wurden.
Die Frage ist, warum deine Spiegelung aufgebrochen ist - evlt. enthalten die Logs (noch) Hinweise darauf.
 

[tech]NEO

New Member
Vielen Dank für deine Antwort, wo kann ich die Logs für Raid finden? Was das Raid angeht, habe ich leider wenig erfahren, da ich solche Probleme noch nie mit allen meine Server hatte.
 

danton

Debian User
Da müsstest du mal in die normalen Syslogs schauen, also u.a. /var/log/syslog und seine wegrotierten älteren Versionen.
 

[tech]NEO

New Member
Nach was muss ich denn genau suchen?
Die Dateien sind alle recht groß und die ganzen Verbindungen der Emails sehe.

Was mir aufgefallen ist das:
Code:
Mar 22 00:40:08 web01 postfix/smtpd[735]: disconnect from unknown[93.157.63.6] ehlo=1 auth=0/1 rset=1 quit=1 commands=3/4
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               Mar 22 04:07:28 web01 systemd-modules-load[554]: Inserted module 'iscsi_tcp'
Mar 22 04:07:28 web01 kernel: [    0.000000] microcode: microcode updated early to revision 0x25, date = 2018-04-02
Im Screenshot ist es besser zu sehen:
screenshot.jpg


Habe mal den Zeitpunkt beigefügt, da die Emails um 6:30 gekommen sind.
 

Attachments

Last edited:

danton

Debian User
Kann es sein, dass zu dem Zeitpunkt der Lücke in den Logs gerade der Hardware-Check von strato lief? Dabei ist meines Wissens der Server nämlich down, weil dann das Testsystem von Strato die Hardware-Checks durchführt.
Ansonsten musst du schauen, wann du die erste Mail vom mdadm erhalten hast und zu dem Zeitpunkt mal im Syslog schauen - falls es nicht schon so lange her ist, dass die Logs bereits komplett wegrotiert wurden...
 
Top