md/raid456: When read error cannot be recovered, record bad block We may not be able to fix a bad block if: - the array is degraded - the over-write fails. In these cases we currently eject the device, but we should record a bad block if possible. Signed-off-by: majianpeng <majianpeng@gmail.com> Signed-off-by: NeilBrown <neilb@suse.de>

commit: 2e8ac30312973dd20e6807365349ecb1c7e0ea45 [log] [tgz]
author: majianpeng <majianpeng@gmail.com> Tue Jul 03 15:57:02 2012 +1000
committer: NeilBrown <neilb@suse.de> Tue Jul 03 15:57:02 2012 +1000
tree: 23c672053c6ff1cf92119e7a18d2f5b83dbab5f2
parent: 0232605d987d8230b254aa139805bbb56a7ca30c [diff] [blame]
diff --git a/drivers/md/raid5.c b/drivers/md/raid5.c
index a5135e5..51169ec 100644
--- a/drivers/md/raid5.c
+++ b/drivers/md/raid5.c

@@ -1743,6 +1743,7 @@
 	} else {
 		const char *bdn = bdevname(rdev->bdev, b);
 		int retry = 0;
+		int set_bad = 0;
 
 		clear_bit(R5_UPTODATE, &sh->dev[i].flags);
 		atomic_inc(&rdev->read_errors);
@@ -1754,7 +1755,8 @@
 				mdname(conf->mddev),
 				(unsigned long long)s,
 				bdn);
-		else if (conf->mddev->degraded >= conf->max_degraded)
+		else if (conf->mddev->degraded >= conf->max_degraded) {
+			set_bad = 1;
 			printk_ratelimited(
 				KERN_WARNING
 				"md/raid:%s: read error not correctable "
@@ -1762,8 +1764,9 @@
 				mdname(conf->mddev),
 				(unsigned long long)s,
 				bdn);
-		else if (test_bit(R5_ReWrite, &sh->dev[i].flags))
+		} else if (test_bit(R5_ReWrite, &sh->dev[i].flags)) {
 			/* Oh, no!!! */
+			set_bad = 1;
 			printk_ratelimited(
 				KERN_WARNING
 				"md/raid:%s: read error NOT corrected!! "
@@ -1771,7 +1774,7 @@
 				mdname(conf->mddev),
 				(unsigned long long)s,
 				bdn);
-		else if (atomic_read(&rdev->read_errors)
+		} else if (atomic_read(&rdev->read_errors)
 			 > conf->max_nr_stripes)
 			printk(KERN_WARNING
 			       "md/raid:%s: Too many read errors, failing device %s.\n",
@@ -1783,7 +1786,11 @@
 		else {
 			clear_bit(R5_ReadError, &sh->dev[i].flags);
 			clear_bit(R5_ReWrite, &sh->dev[i].flags);
-			md_error(conf->mddev, rdev);
+			if (!(set_bad
+			      && test_bit(In_sync, &rdev->flags)
+			      && rdev_set_badblocks(
+				      rdev, sh->sector, STRIPE_SECTORS, 0)))
+				md_error(conf->mddev, rdev);
 		}
 	}
 	rdev_dec_pending(rdev, conf->mddev);
commit	2e8ac30312973dd20e6807365349ecb1c7e0ea45	[log] [tgz]
author	majianpeng <majianpeng@gmail.com>	Tue Jul 03 15:57:02 2012 +1000
committer	NeilBrown <neilb@suse.de>	Tue Jul 03 15:57:02 2012 +1000
tree	23c672053c6ff1cf92119e7a18d2f5b83dbab5f2
parent	0232605d987d8230b254aa139805bbb56a7ca30c [diff] [blame]