Geht meine Festplatte übern Jordan?

NacKteOmA

New Member
Hallo,

hatte gerade an meinen Rootserver (Gameroot) ein Problem das fast alle Gameserver abgeschmiert sind, selbst Login via SSH war nicht möglich auch nicht über einen anderen Rootserver die sogar im gleichen VLAN hängen (vllt. auch am gleichen Switch?)

Habe soweit natürlich die Logs geprüft und habe folgendes gefunden

Code:
Apr 17 06:07:32 kernel: ata1: lost interrupt (Status 0x50)
Apr 17 06:07:32 kernel: ata1: soft resetting link
Apr 17 06:07:32 kernel: ata1.00: configured for UDMA/133
Apr 17 06:07:32 kernel: ata1.00: device reported invalid CHS sector 0
Apr 17 06:07:32 kernel: ata1: EH complete

Nach einem Reboot

Code:
Apr 17 19:40:15 kernel: ata1: SATA max UDMA/133 cmd 0xc080 ctl 0xc000 bmdma 0xb800 irq 19
Apr 17 19:40:15 kernel: ata2: SATA max UDMA/133 cmd 0xbc00 ctl 0xb880 bmdma 0xb808 irq 19
Apr 17 19:40:15 kernel: ata1.00: ATA-7: SAMSUNG HD753LJ, 1AA01113, max UDMA7
Apr 17 19:40:15 kernel: ata1.00: 1465149168 sectors, multi 16: LBA48 NCQ (depth 0/32)
Apr 17 19:40:15 kernel: ata2.00: ATA-7: SAMSUNG HD753LJ, 1AA01113, max UDMA7
Apr 17 19:40:15 kernel: ata2.00: 1465149168 sectors, multi 16: LBA48 NCQ (depth 0/32)
Apr 17 19:40:15 kernel: ata2.00: configured for UDMA/133
Apr 17 19:40:15 kernel: ata1.00: configured for UDMA/133
Apr 17 19:40:15 kernel: scsi 0:0:0:0: Direct-Access     ATA      SAMSUNG HD753LJ  1AA0 PQ: 0 ANSI: 5
Apr 17 19:40:15 kernel: scsi 1:0:0:0: Direct-Access     ATA      SAMSUNG HD753LJ  1AA0 PQ: 0 ANSI: 5
Apr 17 19:40:15 kernel: sd 0:0:0:0: [sda] 1465149168 512-byte logical blocks: (750 GB/698 GiB)
Apr 17 19:40:15 kernel: sd 0:0:0:0: [sda] Write Protect is off
Apr 17 19:40:15 kernel: sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Apr 17 19:40:15 kernel: sd 1:0:0:0: [sdb] 1465149168 512-byte logical blocks: (750 GB/698 GiB)
Apr 17 19:40:15 kernel: sd 1:0:0:0: [sdb] Write Protect is off
Apr 17 19:40:15 kernel: sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Scheinbar läuft die Festplatte wieder im UDMA133 Modus, obwohls ne SATA ist. Gehen die Festplatte(n) nun langsam kaputt?

SMART
Code:
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   076   076   011    Pre-fail  Always       -       8080
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       36
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   253   253   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       9796
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       11817
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       36
 13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   070   051   000    Old_age   Always       -       30 (Lifetime Min/Max 21/30)
194 Temperature_Celsius     0x0022   068   049   000    Old_age   Always       -       32 (Lifetime Min/Max 21/32)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       18195
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   253   000    Old_age   Always       -       0

Es gibt recht hohe "Seek_Time_Performance" Werte, alles andere... okay hohe Festplatten Temparatur... ist okay. Ich habe seit heute auch hohe wa-Werte bis 10% obwohl die sonst nur ab und zu mal auf 0,1 oder 0,2% springen.

Was sagt ihr dazu?
 
Wie der Link des Vorposters bereits aussagt; meist ist dies durch eine unstabile 12V-Schiene (aka: kaputtes oder ueberladenes Netzteil) oder ein defektes Kabel, seltener durch gestoerte Controller verschuldet.

Scheinbar läuft die Festplatte wieder im UDMA133 Modus, obwohls ne SATA ist.
Lief sie denn vorhin im AHCI?
 
Leider lief der Server dafür zu lange und kann dies in den Logs nicht mehr sehen, das würde auch die plötzlich hohen WA Werte erklären - zumindest das dort irgendwas mit den Platten nicht stimmt.
 
Back
Top