Blame - drivers/md/md.h - SHIFTPHONES/kernel/common

blob: 8afd6bfdbfb9b5934097b3d0b3378dbd0d53f778 [file] [log] [blame]

Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	1	/*
Wang Sheng-Hui	7e84152	2011-09-21 15:37:46 +1000	[diff] [blame]	2	md.h : kernel internal structure of the Linux MD driver
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	3	Copyright (C) 1996-98 Ingo Molnar, Gadi Oxman
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	4
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	5	This program is free software; you can redistribute it and/or modify
				6	it under the terms of the GNU General Public License as published by
				7	the Free Software Foundation; either version 2, or (at your option)
				8	any later version.
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	9
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	10	You should have received a copy of the GNU General Public License
				11	(for example /usr/src/linux/COPYING); if not, write to the Free
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	12	Software Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	13	*/
				14
Christoph Hellwig	63fe081	2009-04-14 12:01:53 +1000	[diff] [blame]	15	#ifndef _MD_MD_H
				16	#define _MD_MD_H
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	17
Christoph Hellwig	63fe081	2009-04-14 12:01:53 +1000	[diff] [blame]	18	#include <linux/blkdev.h>
Tejun Heo	66114ca	2015-05-22 17:13:32 -0400	[diff] [blame]	19	#include <linux/backing-dev.h>
Vishal Verma	fc974ee	2015-12-24 19:20:34 -0700	[diff] [blame]	20	#include <linux/badblocks.h>
Christoph Hellwig	63fe081	2009-04-14 12:01:53 +1000	[diff] [blame]	21	#include <linux/kobject.h>
				22	#include <linux/list.h>
				23	#include <linux/mm.h>
				24	#include <linux/mutex.h>
				25	#include <linux/timer.h>
				26	#include <linux/wait.h>
				27	#include <linux/workqueue.h>
Goldwyn Rodrigues	edb39c9	2014-03-29 10:01:53 -0500	[diff] [blame]	28	#include "md-cluster.h"
David Howells	9361401	2006-09-30 20:45:40 +0200	[diff] [blame]	29
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	30	#define MaxSector (~(sector_t)0)
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	31
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	32	/*
NeilBrown	46533ff	2016-11-18 16:16:11 +1100	[diff] [blame]	33	* These flags should really be called "NO_RETRY" rather than
				34	* "FAILFAST" because they don't make any promise about time lapse,
				35	* only about the number of retries, which will be zero.
				36	* REQ_FAILFAST_DRIVER is not included because
				37	* Commit: 4a27446f3e39 ("[SCSI] modify scsi to handle new fail fast flags.")
				38	* seems to suggest that the errors it avoids retrying should usually
				39	* be retried.
				40	*/
				41	#define MD_FAILFAST (REQ_FAILFAST_DEV \| REQ_FAILFAST_TRANSPORT)
				42	/*
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	43	* MD's 'extended' device
				44	*/
NeilBrown	3cb0300	2011-10-11 16:45:26 +1100	[diff] [blame]	45	struct md_rdev {
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	46	struct list_head same_set; /* RAID devices within the same set */
				47
Andre Noll	dd8ac33	2009-03-31 14:33:13 +1100	[diff] [blame]	48	sector_t sectors; /* Device size (in 512bytes sectors) */
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	49	struct mddev mddev; / RAID array if running */
NeilBrown	eea1bf3	2009-03-31 14:27:02 +1100	[diff] [blame]	50	int last_events; /* IO event timestamp */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	51
Jonathan Brassow	a6ff7e0	2011-01-14 09:14:34 +1100	[diff] [blame]	52	/*
				53	* If meta_bdev is non-NULL, it means that a separate device is
				54	* being used to store the metadata (superblock/bitmap) which
				55	* would otherwise be contained on the same device as the data (bdev).
				56	*/
				57	struct block_device *meta_bdev;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	58	struct block_device bdev; / block device handle */
				59
NeilBrown	2699b67	2011-07-28 11:31:47 +1000	[diff] [blame]	60	struct page sb_page, bb_page;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	61	int sb_loaded;
NeilBrown	4254376	2006-06-26 00:27:57 -0700	[diff] [blame]	62	__u64 sb_events;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	63	sector_t data_offset; /* start of data in array */
NeilBrown	c6563a8	2012-05-21 09:27:00 +1000	[diff] [blame]	64	sector_t new_data_offset;/* only relevant while reshaping */
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	65	sector_t sb_start; /* offset of the super block (in 512byte sectors) */
NeilBrown	0002b27	2005-09-09 16:23:53 -0700	[diff] [blame]	66	int sb_size; /* bytes in the superblock */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	67	int preferred_minor; /* autorun support */
				68
NeilBrown	86e6ffd	2005-11-08 21:39:24 -0800	[diff] [blame]	69	struct kobject kobj;
				70
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	71	/* A device can be in one of three states based on two flags:
				72	* Not working: faulty==1 in_sync==0
				73	* Fully working: faulty==0 in_sync==1
				74	* Working, but not
				75	* in sync with array
				76	* faulty==0 in_sync==0
				77	*
				78	* It can never have faulty==1, in_sync==1
				79	* This reduces the burden of testing multiple flags in many cases
				80	*/
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	81
NeilBrown	2d78f8c	2011-12-23 10:17:51 +1100	[diff] [blame]	82	unsigned long flags; /* bit set of 'enum flag_bits' bits. */
Dan Williams	6bfe0b4	2008-04-30 00:52:32 -0700	[diff] [blame]	83	wait_queue_head_t blocked_wait;
NeilBrown	8ddf9ef	2005-09-09 16:23:45 -0700	[diff] [blame]	84
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	85	int desc_nr; /* descriptor index in the superblock */
				86	int raid_disk; /* role of device in array */
NeilBrown	e93f68a	2010-06-15 09:36:03 +0100	[diff] [blame]	87	int new_raid_disk; /* role that the device will have in
				88	* the array after a level-change completes.
				89	*/
NeilBrown	41158c7	2005-06-21 17:17:25 -0700	[diff] [blame]	90	int saved_raid_disk; /* role that device used to have in the
				91	* array and could again if we did a partial
				92	* resync from the bitmap
				93	*/
Shaohua Li	3069aa8	2015-08-13 14:31:56 -0700	[diff] [blame]	94	union {
				95	sector_t recovery_offset;/* If this device has been partially
NeilBrown	5fd6c1d	2006-06-26 00:27:40 -0700	[diff] [blame]	96	* recovered, this is where we were
				97	* up to.
				98	*/
Shaohua Li	3069aa8	2015-08-13 14:31:56 -0700	[diff] [blame]	99	sector_t journal_tail; /* If this device is a journal device,
				100	* this is the journal tail (journal
				101	* recovery start point)
				102	*/
				103	};
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	104
				105	atomic_t nr_pending; /* number of pending requests.
				106	* only maintained for arrays that
				107	* support hot removal
				108	*/
NeilBrown	ba22dcb	2005-11-08 21:39:31 -0800	[diff] [blame]	109	atomic_t read_errors; /* number of consecutive read errors that
				110	* we have tried to ignore.
				111	*/
Arnd Bergmann	0e3ef49	2016-06-17 17:33:10 +0200	[diff] [blame]	112	time64_t last_read_error; /* monotonic time since our
Robert Becker	1e50915	2009-12-14 12:49:58 +1100	[diff] [blame]	113	* last read error
				114	*/
NeilBrown	4dbcdc7	2006-01-06 00:20:52 -0800	[diff] [blame]	115	atomic_t corrected_errors; /* number of corrected read errors,
				116	* for reporting to userspace and storing
				117	* in superblock.
				118	*/
NeilBrown	5792a28	2007-04-04 19:08:18 -0700	[diff] [blame]	119	struct work_struct del_work; /* used for delayed sysfs removal */
NeilBrown	3c0ee63	2008-10-21 13:25:28 +1100	[diff] [blame]	120
Tejun Heo	324a56e	2013-12-11 14:11:53 -0500	[diff] [blame]	121	struct kernfs_node sysfs_state; / handle for 'state'
NeilBrown	3c0ee63	2008-10-21 13:25:28 +1100	[diff] [blame]	122	* sysfs entry */
NeilBrown	2230dfe	2011-07-28 11:31:46 +1000	[diff] [blame]	123
Vishal Verma	fc974ee	2015-12-24 19:20:34 -0700	[diff] [blame]	124	struct badblocks badblocks;
Artur Paszkiewicz	ea0213e	2017-03-09 09:59:57 +0100	[diff] [blame]	125
				126	struct {
				127	short offset; /* Offset from superblock to start of PPL.
				128	* Not used by external metadata. */
				129	unsigned int size; /* Size in sectors of the PPL space */
				130	sector_t sector; /* First sector of the PPL space */
				131	} ppl;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	132	};
NeilBrown	2d78f8c	2011-12-23 10:17:51 +1100	[diff] [blame]	133	enum flag_bits {
				134	Faulty, /* device is known to have a fault */
				135	In_sync, /* device is in_sync with rest of array */
NeilBrown	8313b8e	2013-12-12 10:13:33 +1100	[diff] [blame]	136	Bitmap_sync, /* ..actually, not quite In_sync. Need a
Guoqing Jiang	4aaf7694	2017-07-04 11:20:30 +0800	[diff] [blame]	137	* bitmap-based recovery to get fully in sync.
				138	* The bit is only meaningful before device
				139	* has been passed to pers->hot_add_disk.
NeilBrown	8313b8e	2013-12-12 10:13:33 +1100	[diff] [blame]	140	*/
NeilBrown	2d78f8c	2011-12-23 10:17:51 +1100	[diff] [blame]	141	WriteMostly, /* Avoid reading if at all possible */
				142	AutoDetected, /* added by auto-detect */
				143	Blocked, /* An error occurred but has not yet
				144	* been acknowledged by the metadata
				145	* handler, so don't allow writes
				146	* until it is cleared */
				147	WriteErrorSeen, /* A write error has been seen on this
				148	* device
				149	*/
				150	FaultRecorded, /* Intermediate state for clearing
				151	* Blocked. The Fault is/will-be
				152	* recorded in the metadata, but that
				153	* metadata hasn't been stored safely
				154	* on disk yet.
				155	*/
				156	BlockedBadBlocks, /* A writer is blocked because they
				157	* found an unacknowledged bad-block.
				158	* This can safely be cleared at any
				159	* time, and the writer will re-check.
				160	* It may be set at any time, and at
				161	* worst the writer will timeout and
				162	* re-check. So setting it as
				163	* accurately as possible is good, but
				164	* not absolutely critical.
				165	*/
				166	WantReplacement, /* This device is a candidate to be
				167	* hot-replaced, either because it has
				168	* reported some faults, or because
				169	* of explicit request.
				170	*/
				171	Replacement, /* This device is a replacement for
				172	* a want_replacement device with same
				173	* raid_disk number.
				174	*/
Goldwyn Rodrigues	1aee41f	2014-10-29 18:51:31 -0500	[diff] [blame]	175	Candidate, /* For clustered environments only:
				176	* This device is seen locally but not
				177	* by the whole cluster
				178	*/
Song Liu	bac624f	2015-08-13 14:31:55 -0700	[diff] [blame]	179	Journal, /* This device is used as journal for
				180	* raid-5/6.
				181	* Usually, this device should be faster
				182	* than other devices in the array
				183	*/
Guoqing Jiang	659b254	2015-12-21 10:50:59 +1100	[diff] [blame]	184	ClusterRemove,
NeilBrown	d787be4	2016-06-02 16:19:53 +1000	[diff] [blame]	185	RemoveSynchronized, /* synchronize_rcu() was called after
				186	* this device was known to be faulty,
				187	* so it is safe to remove without
				188	* another synchronize_rcu() call.
				189	*/
Tomasz Majchrzak	35b785f	2016-10-21 16:26:57 +0200	[diff] [blame]	190	ExternalBbl, /* External metadata provides bad
				191	* block management for a disk
				192	*/
NeilBrown	688834e	2016-11-18 16:16:11 +1100	[diff] [blame]	193	FailFast, /* Minimal retries should be attempted on
				194	* this device, so use REQ_FAILFAST_DEV.
				195	* Also don't try to repair failed reads.
				196	* It is expects that no bad block log
				197	* is present.
				198	*/
NeilBrown	46533ff	2016-11-18 16:16:11 +1100	[diff] [blame]	199	LastDev, /* Seems to be the last working dev as
				200	* it didn't fail, so don't use FailFast
				201	* any more for metadata
				202	*/
NeilBrown	2d78f8c	2011-12-23 10:17:51 +1100	[diff] [blame]	203	};
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	204
NeilBrown	3cb0300	2011-10-11 16:45:26 +1100	[diff] [blame]	205	static inline int is_badblock(struct md_rdev *rdev, sector_t s, int sectors,
NeilBrown	2230dfe	2011-07-28 11:31:46 +1000	[diff] [blame]	206	sector_t first_bad, int bad_sectors)
				207	{
				208	if (unlikely(rdev->badblocks.count)) {
Vishal Verma	fc974ee	2015-12-24 19:20:34 -0700	[diff] [blame]	209	int rv = badblocks_check(&rdev->badblocks, rdev->data_offset + s,
NeilBrown	2230dfe	2011-07-28 11:31:46 +1000	[diff] [blame]	210	sectors,
				211	first_bad, bad_sectors);
				212	if (rv)
				213	*first_bad -= rdev->data_offset;
				214	return rv;
				215	}
				216	return 0;
				217	}
NeilBrown	3cb0300	2011-10-11 16:45:26 +1100	[diff] [blame]	218	extern int rdev_set_badblocks(struct md_rdev *rdev, sector_t s, int sectors,
NeilBrown	c6563a8	2012-05-21 09:27:00 +1000	[diff] [blame]	219	int is_new);
				220	extern int rdev_clear_badblocks(struct md_rdev *rdev, sector_t s, int sectors,
				221	int is_new);
Goldwyn Rodrigues	c4ce867	2014-03-29 10:20:02 -0500	[diff] [blame]	222	struct md_cluster_info;
				223
Shaohua Li	394ed8e	2017-01-04 16:10:19 -0800	[diff] [blame]	224	/* change UNSUPPORTED_MDDEV_FLAGS for each array type if new flag is added */
NeilBrown	be306c2	2016-11-09 10:21:33 +1100	[diff] [blame]	225	enum mddev_flags {
NeilBrown	be306c2	2016-11-09 10:21:33 +1100	[diff] [blame]	226	MD_ARRAY_FIRST_USE, /* First use of array, needs initialization */
				227	MD_CLOSING, /* If set, we are closing the array, do not open
				228	* it then */
				229	MD_JOURNAL_CLEAN, /* A raid with journal is already clean */
				230	MD_HAS_JOURNAL, /* The raid array has journal feature set */
NeilBrown	be306c2	2016-11-09 10:21:33 +1100	[diff] [blame]	231	MD_CLUSTER_RESYNC_LOCKED, /* cluster raid only, which means node
				232	* already took resync lock, need to
				233	* release the lock */
NeilBrown	46533ff	2016-11-18 16:16:11 +1100	[diff] [blame]	234	MD_FAILFAST_SUPPORTED, /* Using MD_FAILFAST on metadata writes is
				235	* supported as calls to md_error() will
				236	* never cause the array to become failed.
				237	*/
Artur Paszkiewicz	ea0213e	2017-03-09 09:59:57 +0100	[diff] [blame]	238	MD_HAS_PPL, /* The raid array has PPL feature set */
Pawel Baldysiak	ddc0882	2017-08-16 17:13:45 +0200	[diff] [blame]	239	MD_HAS_MULTIPLE_PPLS, /* The raid array has multiple PPLs feature set */
NeilBrown	35bfc52	2017-10-17 13:46:43 +1100	[diff] [blame]	240	MD_ALLOW_SB_UPDATE, /* md_check_recovery is allowed to update
				241	* the metadata without taking reconfig_mutex.
				242	*/
				243	MD_UPDATING_SB, /* md_check_recovery is updating the metadata
				244	* without explicitly holding reconfig_mutex.
				245	*/
NeilBrown	be306c2	2016-11-09 10:21:33 +1100	[diff] [blame]	246	};
Shaohua Li	2953079	2016-12-08 15:48:19 -0800	[diff] [blame]	247
				248	enum mddev_sb_flags {
				249	MD_SB_CHANGE_DEVS, /* Some device status has changed */
				250	MD_SB_CHANGE_CLEAN, /* transition to or from 'clean' */
				251	MD_SB_CHANGE_PENDING, /* switch from 'clean' to 'active' in progress */
				252	MD_SB_NEED_REWRITE, /* metadata write needs to be repeated */
				253	};
				254
Xiao Ni	5a409b4	2018-05-21 11:49:54 +0800	[diff] [blame]	255	#define NR_FLUSH_INFOS 8
				256	#define NR_FLUSH_BIOS 64
				257	struct flush_info {
				258	struct bio *bio;
				259	struct mddev *mddev;
				260	struct work_struct flush_work;
				261	atomic_t flush_pending;
				262	};
				263	struct flush_bio {
				264	struct flush_info *fi;
				265	struct md_rdev *rdev;
				266	};
				267
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	268	struct mddev {
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	269	void *private;
NeilBrown	84fc4b5	2011-10-11 16:49:58 +1100	[diff] [blame]	270	struct md_personality *pers;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	271	dev_t unit;
				272	int md_minor;
NeilBrown	7a0a535	2013-08-27 16:28:23 +1000	[diff] [blame]	273	struct list_head disks;
NeilBrown	850b2b4	2006-10-03 01:15:46 -0700	[diff] [blame]	274	unsigned long flags;
Shaohua Li	2953079	2016-12-08 15:48:19 -0800	[diff] [blame]	275	unsigned long sb_flags;
NeilBrown	850b2b4	2006-10-03 01:15:46 -0700	[diff] [blame]	276
NeilBrown	409c57f	2009-03-31 14:39:39 +1100	[diff] [blame]	277	int suspended;
				278	atomic_t active_io;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	279	int ro;
NeilBrown	bb4f1e9	2010-08-08 21:18:03 +1000	[diff] [blame]	280	int sysfs_active; /* set when sysfs deletes
				281	* are happening, so run/
				282	* takeover/stop are not safe
				283	*/
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	284	struct gendisk *gendisk;
				285
NeilBrown	eae1701	2005-11-08 21:39:23 -0800	[diff] [blame]	286	struct kobject kobj;
NeilBrown	d337482	2009-01-09 08:31:10 +1100	[diff] [blame]	287	int hold_active;
				288	#define UNTIL_IOCTL 1
NeilBrown	efeb53c	2009-01-09 08:31:10 +1100	[diff] [blame]	289	#define UNTIL_STOP 2
NeilBrown	eae1701	2005-11-08 21:39:23 -0800	[diff] [blame]	290
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	291	/* Superblock information */
				292	int major_version,
				293	minor_version,
				294	patch_version;
				295	int persistent;
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	296	int external; /* metadata is
NeilBrown	e691063	2008-02-06 01:39:51 -0800	[diff] [blame]	297	* managed externally */
				298	char metadata_type[17]; /* externally set*/
Andre Noll	9d8f036	2009-06-18 08:45:01 +1000	[diff] [blame]	299	int chunk_sectors;
Deepa Dinamani	9ebc6ef	2015-12-21 10:51:01 +1100	[diff] [blame]	300	time64_t ctime, utime;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	301	int level, layout;
NeilBrown	d9d166c	2006-01-06 00:20:51 -0800	[diff] [blame]	302	char clevel[16];
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	303	int raid_disks;
				304	int max_disks;
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	305	sector_t dev_sectors; /* used size of
Andre Noll	58c0fed	2009-03-31 14:33:13 +1100	[diff] [blame]	306	* component devices */
Andre Noll	f233ea5	2008-07-21 17:05:22 +1000	[diff] [blame]	307	sector_t array_sectors; /* exported array size */
Dan Williams	b522adc	2009-03-31 15:00:31 +1100	[diff] [blame]	308	int external_size; /* size managed
				309	* externally */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	310	__u64 events;
NeilBrown	a8707c0	2010-05-18 09:28:43 +1000	[diff] [blame]	311	/* If the last 'event' was simply a clean->dirty transition, and
				312	* we didn't write it to the spares, then it is safe and simple
				313	* to just decrement the event count on a dirty->clean transition.
				314	* So we record that possibility here.
				315	*/
				316	int can_decrease_events;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	317
				318	char uuid[16];
				319
NeilBrown	f670557	2006-03-27 01:18:11 -0800	[diff] [blame]	320	/* If the array is being reshaped, we need to record the
				321	* new shape and an indication of where we are up to.
				322	* This is written to the superblock.
				323	* If reshape_position is MaxSector, then no reshape is happening (yet).
				324	*/
				325	sector_t reshape_position;
Andre Noll	664e7c4	2009-06-18 08:45:27 +1000	[diff] [blame]	326	int delta_disks, new_level, new_layout;
				327	int new_chunk_sectors;
NeilBrown	2c810cd	2012-05-21 09:27:00 +1000	[diff] [blame]	328	int reshape_backwards;
NeilBrown	f670557	2006-03-27 01:18:11 -0800	[diff] [blame]	329
NeilBrown	2b8bf34	2011-10-11 16:48:23 +1100	[diff] [blame]	330	struct md_thread thread; / management thread */
				331	struct md_thread sync_thread; / doing resync or reconstruct */
Jonathan Brassow	c4a3955	2013-06-25 01:23:59 -0500	[diff] [blame]	332
				333	/* 'last_sync_action' is initialized to "none". It is set when a
				334	* sync operation (i.e "data-check", "requested-resync", "resync",
				335	* "recovery", or "reshape") is started. It holds this value even
				336	* when the sync thread is "frozen" (interrupted) or "idle" (stopped
				337	* or finished). It is overwritten when a new sync operation is begun.
				338	*/
				339	char *last_sync_action;
NeilBrown	ff4e8d9	2006-07-10 04:44:16 -0700	[diff] [blame]	340	sector_t curr_resync; /* last block scheduled */
NeilBrown	97e4f42	2009-03-31 14:33:13 +1100	[diff] [blame]	341	/* As resync requests can complete out of order, we cannot easily track
				342	* how much resync has been completed. So we occasionally pause until
				343	* everything completes, then set curr_resync_completed to curr_resync.
				344	* As such it may be well behind the real resync mark, but it is a value
				345	* we are certain of.
				346	*/
				347	sector_t curr_resync_completed;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	348	unsigned long resync_mark; /* a recent timestamp */
				349	sector_t resync_mark_cnt;/* blocks written at resync_mark */
NeilBrown	ff4e8d9	2006-07-10 04:44:16 -0700	[diff] [blame]	350	sector_t curr_mark_cnt; /* blocks scheduled now */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	351
				352	sector_t resync_max_sectors; /* may be set by personality */
NeilBrown	9d88883	2005-11-08 21:39:26 -0800	[diff] [blame]	353
Jianpeng Ma	7f7583d	2012-10-11 14:17:59 +1100	[diff] [blame]	354	atomic64_t resync_mismatches; /* count of sectors where
NeilBrown	9d88883	2005-11-08 21:39:26 -0800	[diff] [blame]	355	* parity/replica mismatch found
				356	*/
NeilBrown	e464eaf	2006-03-27 01:18:14 -0800	[diff] [blame]	357
				358	/* allow user-space to request suspension of IO to regions of the array */
				359	sector_t suspend_lo;
				360	sector_t suspend_hi;
NeilBrown	88202a0	2006-01-06 00:21:36 -0800	[diff] [blame]	361	/* if zero, use the system-wide default */
				362	int sync_speed_min;
				363	int sync_speed_max;
				364
Bernd Schubert	90b0871	2008-05-23 13:04:38 -0700	[diff] [blame]	365	/* resync even though the same disks are shared among md-devices */
				366	int parallel_resync;
				367
NeilBrown	6ff8d8ec	2006-01-06 00:20:15 -0800	[diff] [blame]	368	int ok_start_degraded;
NeilBrown	5fd6c1d	2006-06-26 00:27:40 -0700	[diff] [blame]	369
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	370	unsigned long recovery;
NeilBrown	5389042	2011-07-27 11:00:36 +1000	[diff] [blame]	371	/* If a RAID personality determines that recovery (of a particular
				372	* device) will fail due to a read error on the source device, it
				373	* takes a copy of this number and does not attempt recovery again
				374	* until this number changes.
				375	*/
				376	int recovery_disabled;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	377
				378	int in_sync; /* know to not need resync */
NeilBrown	c8c00a6	2009-08-10 12:50:52 +1000	[diff] [blame]	379	/* 'open_mutex' avoids races between 'md_open' and 'do_md_stop', so
				380	* that we are never stopping an array while it is open.
				381	* 'reconfig_mutex' protects all other reconfiguration.
				382	* These locks are separate due to conflicting interactions
				383	* with bdev->bd_mutex.
				384	* Lock ordering is:
				385	* reconfig_mutex -> bd_mutex : e.g. do_md_run -> revalidate_disk
				386	* bd_mutex -> open_mutex: e.g. __blkdev_get -> md_open
				387	*/
				388	struct mutex open_mutex;
NeilBrown	df5b89b	2006-03-27 01:18:20 -0800	[diff] [blame]	389	struct mutex reconfig_mutex;
NeilBrown	f2ea68c	2008-07-21 17:05:25 +1000	[diff] [blame]	390	atomic_t active; /* general refcount */
				391	atomic_t openers; /* number of active opens */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	392
NeilBrown	f0b4f7e	2011-02-24 17:26:41 +1100	[diff] [blame]	393	int changed; /* True if we might need to
				394	* reread partition info */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	395	int degraded; /* whether md should consider
				396	* adding a spare
				397	*/
				398
				399	atomic_t recovery_active; /* blocks scheduled, but not written */
				400	wait_queue_head_t recovery_wait;
				401	sector_t recovery_cp;
Neil Brown	5e96ee6	2008-06-28 08:31:24 +1000	[diff] [blame]	402	sector_t resync_min; /* user requested sync
				403	* starts here */
NeilBrown	c620727	2008-02-06 01:39:52 -0800	[diff] [blame]	404	sector_t resync_max; /* resync should pause
				405	* when it gets here */
NeilBrown	06d91a5	2005-06-21 17:17:12 -0700	[diff] [blame]	406
Tejun Heo	324a56e	2013-12-11 14:11:53 -0500	[diff] [blame]	407	struct kernfs_node sysfs_state; / handle for 'array_state'
NeilBrown	b62b759	2008-10-21 13:25:21 +1100	[diff] [blame]	408	* file in sysfs.
				409	*/
Tejun Heo	324a56e	2013-12-11 14:11:53 -0500	[diff] [blame]	410	struct kernfs_node sysfs_action; / handle for 'sync_action' */
NeilBrown	b62b759	2008-10-21 13:25:21 +1100	[diff] [blame]	411
NeilBrown	d337482	2009-01-09 08:31:10 +1100	[diff] [blame]	412	struct work_struct del_work; /* used for delayed sysfs removal */
				413
NeilBrown	85572d7	2014-12-15 12:56:56 +1100	[diff] [blame]	414	/* "lock" protects:
				415	* flush_bio transition from NULL to !NULL
				416	* rdev superblocks, events
				417	* clearing MD_CHANGE_*
				418	* in_sync - and related safemode and MD_CHANGE changes
NeilBrown	36d091f	2014-12-15 12:56:58 +1100	[diff] [blame]	419	* pers (also protected by reconfig_mutex and pending IO).
NeilBrown	978a7a4	2014-12-15 12:56:58 +1100	[diff] [blame]	420	* clearing ->bitmap
NeilBrown	4af1a04	2014-12-15 12:57:00 +1100	[diff] [blame]	421	* clearing ->bitmap_info.file
NeilBrown	23da422	2014-12-15 12:57:01 +1100	[diff] [blame]	422	* changing ->resync_{min,max}
				423	* setting MD_RECOVERY_RUNNING (which interacts with resync_{min,max})
NeilBrown	85572d7	2014-12-15 12:56:56 +1100	[diff] [blame]	424	*/
				425	spinlock_t lock;
NeilBrown	3d310eb	2005-06-21 17:17:26 -0700	[diff] [blame]	426	wait_queue_head_t sb_wait; /* for waiting on superblock updates */
NeilBrown	7bfa19f	2005-06-21 17:17:28 -0700	[diff] [blame]	427	atomic_t pending_writes; /* number of active superblock writes */
NeilBrown	06d91a5	2005-06-21 17:17:12 -0700	[diff] [blame]	428
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	429	unsigned int safemode; /* if set, update "clean" superblock
				430	* when no writes pending.
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	431	*/
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	432	unsigned int safemode_delay;
				433	struct timer_list safemode_timer;
NeilBrown	4ad23a97	2017-03-15 14:05:14 +1100	[diff] [blame]	434	struct percpu_ref writes_pending;
				435	int sync_checkers; /* # of threads checking writes_pending */
Jens Axboe	165125e	2007-07-24 09:28:11 +0200	[diff] [blame]	436	struct request_queue queue; / for plugging ... */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	437
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	438	struct bitmap bitmap; / the bitmap for the device */
NeilBrown	c3d9714	2009-12-14 12:49:52 +1100	[diff] [blame]	439	struct {
				440	struct file file; / the bitmap file */
NeilBrown	f6af949	2009-12-14 12:49:54 +1100	[diff] [blame]	441	loff_t offset; /* offset from superblock of
NeilBrown	c3d9714	2009-12-14 12:49:52 +1100	[diff] [blame]	442	* start of bitmap. May be
				443	* negative, but not '0'
NeilBrown	f6af949	2009-12-14 12:49:54 +1100	[diff] [blame]	444	* For external metadata, offset
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	445	* from start of device.
NeilBrown	c3d9714	2009-12-14 12:49:52 +1100	[diff] [blame]	446	*/
NeilBrown	6409bb0	2012-05-22 13:55:07 +1000	[diff] [blame]	447	unsigned long space; /* space available at this offset */
NeilBrown	f6af949	2009-12-14 12:49:54 +1100	[diff] [blame]	448	loff_t default_offset; /* this is the offset to use when
NeilBrown	c3d9714	2009-12-14 12:49:52 +1100	[diff] [blame]	449	* hot-adding a bitmap. It should
				450	* eventually be settable by sysfs.
				451	*/
NeilBrown	6409bb0	2012-05-22 13:55:07 +1000	[diff] [blame]	452	unsigned long default_space; /* space available at
				453	* default offset */
NeilBrown	c3d9714	2009-12-14 12:49:52 +1100	[diff] [blame]	454	struct mutex mutex;
NeilBrown	42a04b5	2009-12-14 12:49:53 +1100	[diff] [blame]	455	unsigned long chunksize;
NeilBrown	ac2f40b	2010-06-01 19:37:31 +1000	[diff] [blame]	456	unsigned long daemon_sleep; /* how many jiffies between updates? */
NeilBrown	42a04b5	2009-12-14 12:49:53 +1100	[diff] [blame]	457	unsigned long max_write_behind; /* write-behind mode */
NeilBrown	ece5cff	2009-12-14 12:49:56 +1100	[diff] [blame]	458	int external;
Goldwyn Rodrigues	c4ce867	2014-03-29 10:20:02 -0500	[diff] [blame]	459	int nodes; /* Maximum number of nodes in the cluster */
Goldwyn Rodrigues	cf921cc	2014-03-30 00:42:49 -0500	[diff] [blame]	460	char cluster_name[64]; /* Name of the cluster */
NeilBrown	c3d9714	2009-12-14 12:49:52 +1100	[diff] [blame]	461	} bitmap_info;
NeilBrown	32a7627	2005-06-21 17:17:14 -0700	[diff] [blame]	462
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	463	atomic_t max_corr_read_errors; /* max read retries */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	464	struct list_head all_mddevs;
NeilBrown	a2826aa	2009-12-14 12:49:49 +1100	[diff] [blame]	465
NeilBrown	a64c876	2010-04-14 17:15:37 +1000	[diff] [blame]	466	struct attribute_group *to_remove;
NeilBrown	252ac52	2010-06-01 19:37:29 +1000	[diff] [blame]	467
Kent Overstreet	afeee51	2018-05-20 18:25:52 -0400	[diff] [blame]	468	struct bio_set bio_set;
				469	struct bio_set sync_set; /* for sync operations like
NeilBrown	5a85071	2017-06-21 09:12:21 +1000	[diff] [blame]	470	* metadata and bitmap writes
				471	*/
NeilBrown	a167f66	2010-10-26 18:31:13 +1100	[diff] [blame]	472
Xiao Ni	5a409b4	2018-05-21 11:49:54 +0800	[diff] [blame]	473	mempool_t *flush_pool;
				474	mempool_t *flush_bio_pool;
NeilBrown	768a418	2010-07-26 11:49:55 +1000	[diff] [blame]	475	struct work_struct event_work; /* used by dm to report failure event */
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	476	void (sync_super)(struct mddev mddev, struct md_rdev *rdev);
Goldwyn Rodrigues	c4ce867	2014-03-29 10:20:02 -0500	[diff] [blame]	477	struct md_cluster_info *cluster_info;
Guoqing Jiang	15858fa	2015-12-21 10:51:00 +1100	[diff] [blame]	478	unsigned int good_device_nr; /* good device num within cluster raid */
Heinz Mauelshagen	4b6c106	2018-02-02 23:13:19 +0100	[diff] [blame]	479
				480	bool has_superblocks:1;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	481	};
				482
NeilBrown	be306c2	2016-11-09 10:21:33 +1100	[diff] [blame]	483	enum recovery_flags {
				484	/*
				485	* If neither SYNC or RESHAPE are set, then it is a recovery.
				486	*/
				487	MD_RECOVERY_RUNNING, /* a thread is running, or about to be started */
				488	MD_RECOVERY_SYNC, /* actually doing a resync, not a recovery */
				489	MD_RECOVERY_RECOVER, /* doing recovery, or need to try it. */
				490	MD_RECOVERY_INTR, /* resync needs to be aborted for some reason */
				491	MD_RECOVERY_DONE, /* thread is done and is waiting to be reaped */
				492	MD_RECOVERY_NEEDED, /* we might need to start a resync/recover */
				493	MD_RECOVERY_REQUESTED, /* user-space has requested a sync (used with SYNC) */
				494	MD_RECOVERY_CHECK, /* user-space request for check-only, no repair */
				495	MD_RECOVERY_RESHAPE, /* A reshape is happening */
				496	MD_RECOVERY_FROZEN, /* User request to abort, and not restart, any action */
				497	MD_RECOVERY_ERROR, /* sync-action interrupted because io-error */
Song Liu	d5d885f	2017-11-19 22:17:01 -0800	[diff] [blame]	498	MD_RECOVERY_WAIT, /* waiting for pers->start() to finish */
Guoqing Jiang	0357ba2	2018-07-02 16:26:25 +0800	[diff] [blame]	499	MD_RESYNCING_REMOTE, /* remote node is running resync thread */
NeilBrown	be306c2	2016-11-09 10:21:33 +1100	[diff] [blame]	500	};
				501
NeilBrown	5c47daf	2014-12-15 12:57:01 +1100	[diff] [blame]	502	static inline int __must_check mddev_lock(struct mddev *mddev)
				503	{
				504	return mutex_lock_interruptible(&mddev->reconfig_mutex);
				505	}
				506
				507	/* Sometimes we need to take the lock in a situation where
				508	* failure due to interrupts is not acceptable.
				509	*/
				510	static inline void mddev_lock_nointr(struct mddev *mddev)
				511	{
				512	mutex_lock(&mddev->reconfig_mutex);
				513	}
				514
NeilBrown	5c47daf	2014-12-15 12:57:01 +1100	[diff] [blame]	515	static inline int mddev_trylock(struct mddev *mddev)
				516	{
				517	return mutex_trylock(&mddev->reconfig_mutex);
				518	}
				519	extern void mddev_unlock(struct mddev *mddev);
				520
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	521	static inline void md_sync_acct(struct block_device *bdev, unsigned long nr_sectors)
				522	{
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	523	atomic_add(nr_sectors, &bdev->bd_contains->bd_disk->sync_io);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	524	}
				525
Christoph Hellwig	74d4699	2017-08-23 19:10:32 +0200	[diff] [blame]	526	static inline void md_sync_acct_bio(struct bio *bio, unsigned long nr_sectors)
				527	{
				528	atomic_add(nr_sectors, &bio->bi_disk->sync_io);
				529	}
				530
NeilBrown	84fc4b5	2011-10-11 16:49:58 +1100	[diff] [blame]	531	struct md_personality
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	532	{
				533	char *name;
NeilBrown	2604b70	2006-01-06 00:20:36 -0800	[diff] [blame]	534	int level;
				535	struct list_head list;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	536	struct module *owner;
NeilBrown	cc27b0c	2017-06-05 16:49:39 +1000	[diff] [blame]	537	bool (make_request)(struct mddev mddev, struct bio *bio);
Song Liu	d5d885f	2017-11-19 22:17:01 -0800	[diff] [blame]	538	/*
				539	* start up works that do NOT require md_thread. tasks that
				540	* requires md_thread should go into start()
				541	*/
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	542	int (run)(struct mddev mddev);
Song Liu	d5d885f	2017-11-19 22:17:01 -0800	[diff] [blame]	543	/* start up works that require md threads */
				544	int (start)(struct mddev mddev);
NeilBrown	afa0f55	2014-12-15 12:56:58 +1100	[diff] [blame]	545	void (free)(struct mddev mddev, void *priv);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	546	void (status)(struct seq_file seq, struct mddev *mddev);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	547	/* error_handler must set ->faulty and clear ->in_sync
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	548	* if appropriate, and should abort recovery if needed
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	549	*/
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	550	void (error_handler)(struct mddev mddev, struct md_rdev *rdev);
				551	int (hot_add_disk) (struct mddev mddev, struct md_rdev *rdev);
NeilBrown	b8321b6	2011-12-23 10:17:51 +1100	[diff] [blame]	552	int (hot_remove_disk) (struct mddev mddev, struct md_rdev *rdev);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	553	int (spare_active) (struct mddev mddev);
NeilBrown	0931479	2015-02-19 16:04:40 +1100	[diff] [blame]	554	sector_t (sync_request)(struct mddev mddev, sector_t sector_nr, int *skipped);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	555	int (resize) (struct mddev mddev, sector_t sectors);
				556	sector_t (size) (struct mddev mddev, sector_t sectors, int raid_disks);
				557	int (check_reshape) (struct mddev mddev);
				558	int (start_reshape) (struct mddev mddev);
				559	void (finish_reshape) (struct mddev mddev);
NeilBrown	b03e0cc	2017-10-19 12:49:15 +1100	[diff] [blame]	560	/* quiesce suspends or resumes internal processing.
				561	* 1 - stop new actions and wait for action io to complete
				562	* 0 - return to normal behaviour
NeilBrown	36fa306	2005-09-09 16:23:45 -0700	[diff] [blame]	563	*/
NeilBrown	b03e0cc	2017-10-19 12:49:15 +1100	[diff] [blame]	564	void (quiesce) (struct mddev mddev, int quiesce);
NeilBrown	245f46c	2009-03-31 14:39:39 +1100	[diff] [blame]	565	/* takeover is used to transition an array from one
				566	* personality to another. The new personality must be able
				567	* to handle the data in the current layout.
				568	* e.g. 2drive raid1 -> 2drive raid5
				569	* ndrive raid5 -> degraded n+1drive raid6 with special layout
				570	* If the takeover succeeds, a new 'private' structure is returned.
				571	* This needs to be installed and then ->run used to activate the
				572	* array.
				573	*/
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	574	void (takeover) (struct mddev *mddev);
NeilBrown	5c675f8	2014-12-15 12:56:56 +1100	[diff] [blame]	575	/* congested implements bdi.congested_fn().
				576	* Will not be called while array is 'suspended' */
				577	int (congested)(struct mddev mddev, int bits);
Artur Paszkiewicz	ba903a3	2017-03-09 10:00:03 +0100	[diff] [blame]	578	/* Changes the consistency policy of an active array. */
				579	int (change_consistency_policy)(struct mddev mddev, const char *buf);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	580	};
				581
NeilBrown	007583c	2005-11-08 21:39:30 -0800	[diff] [blame]	582	struct md_sysfs_entry {
				583	struct attribute attr;
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	584	ssize_t (show)(struct mddev , char *);
				585	ssize_t (store)(struct mddev , const char *, size_t);
NeilBrown	007583c	2005-11-08 21:39:30 -0800	[diff] [blame]	586	};
NeilBrown	43a7050	2009-12-14 12:49:55 +1100	[diff] [blame]	587	extern struct attribute_group md_bitmap_group;
NeilBrown	007583c	2005-11-08 21:39:30 -0800	[diff] [blame]	588
Tejun Heo	324a56e	2013-12-11 14:11:53 -0500	[diff] [blame]	589	static inline struct kernfs_node sysfs_get_dirent_safe(struct kernfs_node sd, char *name)
NeilBrown	00bcb4a	2010-06-01 19:37:23 +1000	[diff] [blame]	590	{
				591	if (sd)
Tejun Heo	388975c	2013-09-11 23:19:13 -0400	[diff] [blame]	592	return sysfs_get_dirent(sd, name);
NeilBrown	00bcb4a	2010-06-01 19:37:23 +1000	[diff] [blame]	593	return sd;
				594	}
Tejun Heo	324a56e	2013-12-11 14:11:53 -0500	[diff] [blame]	595	static inline void sysfs_notify_dirent_safe(struct kernfs_node *sd)
NeilBrown	00bcb4a	2010-06-01 19:37:23 +1000	[diff] [blame]	596	{
				597	if (sd)
				598	sysfs_notify_dirent(sd);
				599	}
				600
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	601	static inline char * mdname (struct mddev * mddev)
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	602	{
				603	return mddev->gendisk ? mddev->gendisk->disk_name : "mdX";
				604	}
				605
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	606	static inline int sysfs_link_rdev(struct mddev mddev, struct md_rdev rdev)
Namhyung Kim	36fad85	2011-07-27 11:00:36 +1000	[diff] [blame]	607	{
				608	char nm[20];
Shaohua Li	9b15603	2015-12-18 15:19:16 +1100	[diff] [blame]	609	if (!test_bit(Replacement, &rdev->flags) &&
				610	!test_bit(Journal, &rdev->flags) &&
				611	mddev->kobj.sd) {
NeilBrown	2d78f8c	2011-12-23 10:17:51 +1100	[diff] [blame]	612	sprintf(nm, "rd%d", rdev->raid_disk);
				613	return sysfs_create_link(&mddev->kobj, &rdev->kobj, nm);
				614	} else
				615	return 0;
Namhyung Kim	36fad85	2011-07-27 11:00:36 +1000	[diff] [blame]	616	}
				617
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	618	static inline void sysfs_unlink_rdev(struct mddev mddev, struct md_rdev rdev)
Namhyung Kim	36fad85	2011-07-27 11:00:36 +1000	[diff] [blame]	619	{
				620	char nm[20];
Shaohua Li	9b15603	2015-12-18 15:19:16 +1100	[diff] [blame]	621	if (!test_bit(Replacement, &rdev->flags) &&
				622	!test_bit(Journal, &rdev->flags) &&
				623	mddev->kobj.sd) {
NeilBrown	2d78f8c	2011-12-23 10:17:51 +1100	[diff] [blame]	624	sprintf(nm, "rd%d", rdev->raid_disk);
				625	sysfs_remove_link(&mddev->kobj, nm);
				626	}
Namhyung Kim	36fad85	2011-07-27 11:00:36 +1000	[diff] [blame]	627	}
				628
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	629	/*
				630	* iterates through some rdev ringlist. It's safe to remove the
				631	* current 'rdev'. Dont touch 'tmp' though.
				632	*/
Cheng Renquan	159ec1f	2009-01-09 08:31:08 +1100	[diff] [blame]	633	#define rdev_for_each_list(rdev, tmp, head) \
				634	list_for_each_entry_safe(rdev, tmp, head, same_set)
				635
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	636	/*
				637	* iterates through the 'same array disks' ringlist
				638	*/
NeilBrown	dafb20f	2012-03-19 12:46:39 +1100	[diff] [blame]	639	#define rdev_for_each(rdev, mddev) \
				640	list_for_each_entry(rdev, &((mddev)->disks), same_set)
				641
				642	#define rdev_for_each_safe(rdev, tmp, mddev) \
Cheng Renquan	159ec1f	2009-01-09 08:31:08 +1100	[diff] [blame]	643	list_for_each_entry_safe(rdev, tmp, &((mddev)->disks), same_set)
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	644
NeilBrown	4b80991	2008-07-21 17:05:25 +1000	[diff] [blame]	645	#define rdev_for_each_rcu(rdev, mddev) \
				646	list_for_each_entry_rcu(rdev, &((mddev)->disks), same_set)
				647
NeilBrown	2b8bf34	2011-10-11 16:48:23 +1100	[diff] [blame]	648	struct md_thread {
Shaohua Li	4ed8731	2012-10-11 13:34:00 +1100	[diff] [blame]	649	void (run) (struct md_thread thread);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	650	struct mddev *mddev;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	651	wait_queue_head_t wqueue;
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	652	unsigned long flags;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	653	struct task_struct *tsk;
NeilBrown	32a7627	2005-06-21 17:17:14 -0700	[diff] [blame]	654	unsigned long timeout;
Shaohua Li	4ed8731	2012-10-11 13:34:00 +1100	[diff] [blame]	655	void *private;
NeilBrown	2b8bf34	2011-10-11 16:48:23 +1100	[diff] [blame]	656	};
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	657
				658	#define THREAD_WAKEUP 0
				659
NeilBrown	1345b1d	2006-01-06 00:20:40 -0800	[diff] [blame]	660	static inline void safe_put_page(struct page *p)
				661	{
				662	if (p) put_page(p);
				663	}
				664
NeilBrown	84fc4b5	2011-10-11 16:49:58 +1100	[diff] [blame]	665	extern int register_md_personality(struct md_personality *p);
				666	extern int unregister_md_personality(struct md_personality *p);
Goldwyn Rodrigues	edb39c9	2014-03-29 10:01:53 -0500	[diff] [blame]	667	extern int register_md_cluster_operations(struct md_cluster_operations *ops,
				668	struct module *module);
				669	extern int unregister_md_cluster_operations(void);
				670	extern int md_setup_cluster(struct mddev *mddev, int nodes);
				671	extern void md_cluster_stop(struct mddev *mddev);
NeilBrown	2b8bf34	2011-10-11 16:48:23 +1100	[diff] [blame]	672	extern struct md_thread *md_register_thread(
Shaohua Li	4ed8731	2012-10-11 13:34:00 +1100	[diff] [blame]	673	void (run)(struct md_thread thread),
NeilBrown	2b8bf34	2011-10-11 16:48:23 +1100	[diff] [blame]	674	struct mddev *mddev,
				675	const char *name);
				676	extern void md_unregister_thread(struct md_thread **threadp);
				677	extern void md_wakeup_thread(struct md_thread *thread);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	678	extern void md_check_recovery(struct mddev *mddev);
Jonathan Brassow	a91d5ac	2013-04-24 11:42:43 +1000	[diff] [blame]	679	extern void md_reap_sync_thread(struct mddev *mddev);
NeilBrown	a415c0f	2017-06-05 16:05:13 +1000	[diff] [blame]	680	extern int mddev_init_writes_pending(struct mddev *mddev);
NeilBrown	cc27b0c	2017-06-05 16:49:39 +1000	[diff] [blame]	681	extern bool md_write_start(struct mddev mddev, struct bio bi);
NeilBrown	4972805	2017-03-15 14:05:12 +1100	[diff] [blame]	682	extern void md_write_inc(struct mddev mddev, struct bio bi);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	683	extern void md_write_end(struct mddev *mddev);
				684	extern void md_done_sync(struct mddev *mddev, int blocks, int ok);
				685	extern void md_error(struct mddev mddev, struct md_rdev rdev);
NeilBrown	c6563a8	2012-05-21 09:27:00 +1000	[diff] [blame]	686	extern void md_finish_reshape(struct mddev *mddev);
NeilBrown	9202295	2009-03-31 14:33:13 +1100	[diff] [blame]	687
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	688	extern int mddev_congested(struct mddev *mddev, int bits);
				689	extern void md_flush_request(struct mddev mddev, struct bio bio);
				690	extern void md_super_write(struct mddev mddev, struct md_rdev rdev,
NeilBrown	9202295	2009-03-31 14:33:13 +1100	[diff] [blame]	691	sector_t sector, int size, struct page *page);
NeilBrown	46533ff	2016-11-18 16:16:11 +1100	[diff] [blame]	692	extern int md_super_wait(struct mddev *mddev);
NeilBrown	f72ffdd	2014-09-30 14:23:59 +1000	[diff] [blame]	693	extern int sync_page_io(struct md_rdev *rdev, sector_t sector, int size,
Mike Christie	796a5cf	2016-06-05 14:32:07 -0500	[diff] [blame]	694	struct page *page, int op, int op_flags,
				695	bool metadata_op);
Shaohua Li	4ed8731	2012-10-11 13:34:00 +1100	[diff] [blame]	696	extern void md_do_sync(struct md_thread *thread);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	697	extern void md_new_event(struct mddev *mddev);
Artur Paszkiewicz	2214c26	2017-05-08 11:56:55 +0200	[diff] [blame]	698	extern void md_allow_write(struct mddev *mddev);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	699	extern void md_wait_for_blocked_rdev(struct md_rdev rdev, struct mddev mddev);
				700	extern void md_set_array_sectors(struct mddev *mddev, sector_t array_sectors);
				701	extern int md_check_no_bitmap(struct mddev *mddev);
				702	extern int md_integrity_register(struct mddev *mddev);
Dan Williams	1501efa	2016-01-13 16:00:07 -0800	[diff] [blame]	703	extern int md_integrity_add_rdev(struct md_rdev rdev, struct mddev mddev);
NeilBrown	72e0207	2009-12-14 12:49:55 +1100	[diff] [blame]	704	extern int strict_strtoul_scaled(const char cp, unsigned long res, int scale);
Christoph Hellwig	63fe081	2009-04-14 12:01:53 +1000	[diff] [blame]	705
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	706	extern void mddev_init(struct mddev *mddev);
				707	extern int md_run(struct mddev *mddev);
Song Liu	d5d885f	2017-11-19 22:17:01 -0800	[diff] [blame]	708	extern int md_start(struct mddev *mddev);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	709	extern void md_stop(struct mddev *mddev);
				710	extern void md_stop_writes(struct mddev *mddev);
NeilBrown	3cb0300	2011-10-11 16:45:26 +1100	[diff] [blame]	711	extern int md_rdev_init(struct md_rdev *rdev);
NeilBrown	545c879	2012-05-22 13:54:30 +1000	[diff] [blame]	712	extern void md_rdev_clear(struct md_rdev *rdev);
NeilBrown	390ee60	2010-06-01 19:37:27 +1000	[diff] [blame]	713
Shaohua Li	393debc	2017-09-21 10:23:35 -0700	[diff] [blame]	714	extern void md_handle_request(struct mddev mddev, struct bio bio);
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	715	extern void mddev_suspend(struct mddev *mddev);
				716	extern void mddev_resume(struct mddev *mddev);
NeilBrown	a167f66	2010-10-26 18:31:13 +1100	[diff] [blame]	717	extern struct bio *bio_alloc_mddev(gfp_t gfp_mask, int nr_iovecs,
NeilBrown	fd01b88	2011-10-11 16:47:53 +1100	[diff] [blame]	718	struct mddev *mddev);
NeilBrown	9cbb175	2012-07-31 09:08:14 +0200	[diff] [blame]	719
Goldwyn Rodrigues	70bcecd	2015-08-21 10:33:39 -0500	[diff] [blame]	720	extern void md_reload_sb(struct mddev *mddev, int raid_disk);
Goldwyn Rodrigues	1aee41f	2014-10-29 18:51:31 -0500	[diff] [blame]	721	extern void md_update_sb(struct mddev *mddev, int force);
Goldwyn Rodrigues	fb56dfe	2015-04-14 10:43:24 -0500	[diff] [blame]	722	extern void md_kick_rdev_from_array(struct md_rdev * rdev);
Goldwyn Rodrigues	57d051d	2015-04-14 10:43:55 -0500	[diff] [blame]	723	struct md_rdev md_find_rdev_nr_rcu(struct mddev mddev, int nr);
Tomasz Majchrzak	1532d9e	2017-12-27 10:31:40 +0100	[diff] [blame]	724	struct md_rdev md_find_rdev_rcu(struct mddev mddev, dev_t dev);
Hannes Reinecke	dfe15ac	2012-07-26 11:12:18 +0200	[diff] [blame]	725
				726	static inline void rdev_dec_pending(struct md_rdev rdev, struct mddev mddev)
				727	{
				728	int faulty = test_bit(Faulty, &rdev->flags);
				729	if (atomic_dec_and_test(&rdev->nr_pending) && faulty) {
				730	set_bit(MD_RECOVERY_NEEDED, &mddev->recovery);
				731	md_wakeup_thread(mddev->thread);
				732	}
				733	}
				734
Goldwyn Rodrigues	edb39c9	2014-03-29 10:01:53 -0500	[diff] [blame]	735	extern struct md_cluster_operations *md_cluster_ops;
Goldwyn Rodrigues	c4ce867	2014-03-29 10:20:02 -0500	[diff] [blame]	736	static inline int mddev_is_clustered(struct mddev *mddev)
				737	{
				738	return mddev->cluster_info && mddev->bitmap_info.nodes > 1;
				739	}
Shaohua Li	394ed8e	2017-01-04 16:10:19 -0800	[diff] [blame]	740
				741	/* clear unsupported mddev_flags */
				742	static inline void mddev_clear_unsupported_flags(struct mddev *mddev,
				743	unsigned long unsupported_flags)
				744	{
				745	mddev->flags &= ~unsupported_flags;
				746	}
Shaohua Li	2648381	2017-02-13 16:21:49 -0800	[diff] [blame]	747
				748	static inline void mddev_check_writesame(struct mddev mddev, struct bio bio)
				749	{
				750	if (bio_op(bio) == REQ_OP_WRITE_SAME &&
Christoph Hellwig	74d4699	2017-08-23 19:10:32 +0200	[diff] [blame]	751	!bio->bi_disk->queue->limits.max_write_same_sectors)
Shaohua Li	2648381	2017-02-13 16:21:49 -0800	[diff] [blame]	752	mddev->queue->limits.max_write_same_sectors = 0;
				753	}
Christoph Hellwig	3deff1a	2017-04-05 19:21:03 +0200	[diff] [blame]	754
				755	static inline void mddev_check_write_zeroes(struct mddev mddev, struct bio bio)
				756	{
				757	if (bio_op(bio) == REQ_OP_WRITE_ZEROES &&
Christoph Hellwig	74d4699	2017-08-23 19:10:32 +0200	[diff] [blame]	758	!bio->bi_disk->queue->limits.max_write_zeroes_sectors)
Christoph Hellwig	3deff1a	2017-04-05 19:21:03 +0200	[diff] [blame]	759	mddev->queue->limits.max_write_zeroes_sectors = 0;
				760	}
Christoph Hellwig	63fe081	2009-04-14 12:01:53 +1000	[diff] [blame]	761	#endif /* _MD_MD_H */