Hallo Debian Freunde,
kann sich jemand erklären was genau "lost interrupt (Status 0x50)"
bedeutet bzw. wo ich mich schlau lesen kann im Internet steht viel aber
eine Erklärung was die einzelnen Logmeldungen überhaupt bedeuten habe
ich nicht gefunden.
Nun meine Fragen evtl. kann jemand diese beantworten oder einen Hinweis
geben wo ich diese Info nachlesen kann:
Was bedeutet der Status 0x50 beim lost Interrupt 1. Zeile wie kommt
dieser zu Stande?
Wie groß sind die Metadaten eines Linux Software RAID 1?
Was für Daten könnten auf dem Sector 25141733 liegen? Sind es die
Metadaten vom RAID oder schon vom LVM?
Hardware Info:
2 baugleiche Server, mit jeweils baugleichen Festplatten und mit FAI
baugleich installiert.
Als OS wird Debian Linux Version 6.0.7 mit dem Xen Kernel verwendet.
uname -r
2.6.32-5-xen-amd64
DRBD und LVM für den XEN-Gäste.
Auf allen 4 Festplatten habe ich in den vergangenen Tagen die gleiche
Fehlermeldung beobachtet, es ist jedesmal der selbe Sector. Die 3 von 4
Festplatten sind neuen Austauschfestplatten welche seit dem WoEn verbaut
wurden. Es ist zwar möglich das die Festplatten defekt sind aber sehr
unwahrscheinlich weil es jedes mal der selbe Sektor ist. Die S-ATA Kabel
sind auch ausgewechselt worden.
grep "I/O error" /var/log/*
/var/log/kern.log:May 5 22:58:33 lxhs110a kernel: [156062.572522]
end_request: I/O error, dev sdb, sector 25141733
/var/log/kern.log:May 5 22:58:33 lxhs110a kernel: [156062.636004]
end_request: I/O error, dev sda, sector 25141733
/var/log/kern.log:May 7 03:14:18 lxhs110a kernel: [257807.626851]
end_request: I/O error, dev sdb, sector 25141733
/var/log/kern.log:May 7 19:39:58 lxhs110a kernel: [316947.560831]
end_request: I/O error, dev sdb, sector 25141733
/var/log/syslog.1:May 7 19:39:58 lxhs110a kernel: [316947.560831]
end_request: I/O error, dev sdb, sector 25141733
grep "I/O error" /var/log/*
/var/log/kern.log:May 7 19:15:12 lxhs110b kernel: [315435.580027]
end_request: I/O error, dev sda, sector 25141733
/var/log/kern.log:May 7 19:15:12 lxhs110b kernel: [315435.588144]
end_request: I/O error, dev sdb, sector 25141733
Nun frage ich mich was auf diesem Sector 25141733, liegt? Die 4.
Partition beginnt mit dem Sector 25141725, und wird für /dev/md2 als
RAID1 verwendet. Möglich das hier noch Metadaten vom RAID liegen. Das
Device /dev/md2 wird als PV für das LVM verwendet.
*
*Der Angeblich defekte Sector 25141733 liegt also sehr zu beginn der 4.
Partition.
fdisk -lu /dev/sdb
Disk /dev/sdb: 750.2 GB, 750156374016 bytes
255 heads, 63 sectors/track, 91201 cylinders, total 1465149168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x0003f32f
Device Boot Start End Blocks Id System
/dev/sdb1 * 63 10474379 5237158+ fd Linux raid
autodetect
/dev/sdb2 10474380 18860309 4192965 82 Linux swap / Solaris
/dev/sdb3 18860310 25141724 3140707+ fd Linux raid
autodetect
*/dev/sdb4 25141725 1465144064 720001170 fd Linux raid
autodetect*
Der Komplette Auszug aus dem Logfile lautet:
May 5 22:58:32 lxhs110a kernel: [156061.812045] ata2: lost interrupt
(Status 0x50)
May 5 22:58:32 lxhs110a kernel: [156061.812061] ata2: exception Emask
0x10 SAct 0x0 SErr 0x44050000 action 0xf
May 5 22:58:32 lxhs110a kernel: [156061.812105] ata2: SError: {
PHYRdyChg CommWake DevExch }
May 5 22:58:32 lxhs110a kernel: [156061.812145] ata2: hard resetting link
May 5 22:58:32 lxhs110a kernel: [156061.812154] ata1: lost interrupt
(Status 0x50)
May 5 22:58:32 lxhs110a kernel: [156061.812164] ata1: exception Emask
0x10 SAct 0x0 SErr 0x44050000 action 0xf
May 5 22:58:32 lxhs110a kernel: [156061.812203] ata1: SError: {
PHYRdyChg CommWake DevExch }
May 5 22:58:32 lxhs110a kernel: [156061.812241] ata1: hard resetting link
May 5 22:58:33 lxhs110a kernel: [156062.536048] ata2: SATA link up 1.5
Gbps (SStatus 113 SControl 300)
May 5 22:58:33 lxhs110a kernel: [156062.536203] ata1: SATA link up 1.5
Gbps (SStatus 113 SControl 300)
May 5 22:58:33 lxhs110a kernel: [156062.561071] ata2.00: configured for
UDMA/133
May 5 22:58:33 lxhs110a kernel: [156062.561097] ata2: EH complete
May 5 22:58:33 lxhs110a kernel: [156062.568968] ata1.00: configured for
UDMA/133
May 5 22:58:33 lxhs110a kernel: [156062.568978] ata1: EH complete
May 5 22:58:33 lxhs110a kernel: [156062.572522] *end_request: I/O
error, dev sdb, sector 25141733*
May 5 22:58:33 lxhs110a kernel: [156062.572569] md: super_written gets
error=-5, uptodate=0
May 5 22:58:33 lxhs110a kernel: [156062.572574] raid1: Disk failure on
sdb4, disabling device.
May 5 22:58:33 lxhs110a kernel: [156062.572576] raid1: Operation
continuing on 1 devices.
May 5 22:58:33 lxhs110a kernel: [156062.636004] *end_request: I/O
error, dev sda, sector 25141733*
May 5 22:58:33 lxhs110a kernel: [156062.636043] md: super_written gets
error=-5, uptodate=0
May 5 22:58:33 lxhs110a kernel: [156062.652691] RAID1 conf printout:
May 5 22:58:33 lxhs110a kernel: [156062.652696] --- wd:1 rd:2
May 5 22:58:33 lxhs110a kernel: [156062.652700] disk 0, wo:1, o:0,
dev:sdb4
May 5 22:58:33 lxhs110a kernel: [156062.652702] disk 1, wo:0, o:1,
dev:sda4
May 5 22:58:33 lxhs110a kernel: [156062.668010] RAID1 conf printout:
May 5 22:58:33 lxhs110a kernel: [156062.668012] --- wd:1 rd:2
May 5 22:58:33 lxhs110a kernel: [156062.668014] disk 1, wo:0, o:1,
dev:sda4
Folgender S-ATA Controler ist verbaut:
01:0e.0 IDE interface: Broadcom BCM5785 [HT1000] SATA (Native SATA Mode)
(prog-if 8f [Master SecP SecO PriP PriO])
Subsystem: Broadcom BCM5785 [HT1000] SATA (Native SATA Mode)
Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop-
ParErr+ Stepping- SERR+ FastB2B- DisINTx-
Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=medium
>TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
Latency: 64
Interrupt: pin A routed to IRQ 11
Region 0: I/O ports at 3040 [size=8]
Region 1: I/O ports at 3034 [size=4]
Region 2: I/O ports at 3038 [size=8]
Region 3: I/O ports at 3030 [size=4]
Region 4: I/O ports at 3000 [size=16]
Region 5: Memory at e8100000 (32-bit, non-prefetchable) [size=8K]
[virtual] Expansion ROM at 40000000 [disabled] [size=128K]
Capabilities: [60] PCI-X non-bridge device
Command: DPERE- ERO- RBC=512 OST=8
Status: Dev=01:0e.0 64bit+ 133MHz+ SCD- USC- DC=simple
DMMRBC=512 DMOST=8 DMCRS=32 RSCEM- 266MHz- 533MHz-
Capabilities: [90] Power Management version 2
Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA
PME(D0-,D1-,D2-,D3hot-,D3cold-)
Status: D0 NoSoftRst- PME-Enable- DSel=0 DScale=0 PME-
Capabilities: [a0] MSI: Enable- Count=1/1 Maskable- 64bit-
Address: 00000000 Data: 0000
Kernel driver in use: sata_svw
lspci -vvv -s 01:0e.1
01:0e.1 IDE interface: Broadcom BCM5785 [HT1000] SATA (Native SATA Mode)
(prog-if 8f [Master SecP SecO PriP PriO])
Subsystem: Broadcom BCM5785 [HT1000] SATA (Native SATA Mode)
Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop-
ParErr+ Stepping- SERR+ FastB2B- DisINTx-
Status: Cap+ 66MHz+ UDF- FastB2B- ParErr- DEVSEL=medium
>TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
Latency: 64
Interrupt: pin A routed to IRQ 11
Region 0: I/O ports at 3058 [size=8]
Region 1: I/O ports at 304c [size=4]
Region 2: I/O ports at 3050 [size=8]
Region 3: I/O ports at 3048 [size=4]
Region 4: I/O ports at 3020 [size=16]
Capabilities: [60] PCI-X non-bridge device
Command: DPERE- ERO- RBC=512 OST=8
Status: Dev=01:0e.0 64bit+ 133MHz+ SCD- USC- DC=simple
DMMRBC=512 DMOST=8 DMCRS=32 RSCEM- 266MHz- 533MHz-
Capabilities: [90] Power Management version 2
Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA
PME(D0-,D1-,D2-,D3hot-,D3cold-)
Status: D0 NoSoftRst- PME-Enable- DSel=0 DScale=0 PME-
Capabilities: [a0] MSI: Enable- Count=1/1 Maskable- 64bit-
Address: 00000000 Data: 0000