Blame - kernel/locking/percpu-rwsem.c - SHIFTPHONES/mainline/linux

blob: 364d38a0c44415115acef4451785551df9ca8538 [file] [log] [blame]

Thomas Gleixner	457c899	2019-05-19 13:08:55 +0100	[diff] [blame]	1	// SPDX-License-Identifier: GPL-2.0-only
Oleg Nesterov	9390ef0	2012-12-17 16:01:36 -0800	[diff] [blame]	2	#include <linux/atomic.h>
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	3	#include <linux/rwsem.h>
				4	#include <linux/percpu.h>
Oleg Nesterov	8ebe347	2012-12-17 16:01:38 -0800	[diff] [blame]	5	#include <linux/lockdep.h>
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	6	#include <linux/percpu-rwsem.h>
				7	#include <linux/rcupdate.h>
				8	#include <linux/sched.h>
				9	#include <linux/errno.h>
				10
Waiman Long	46ad084	2019-03-22 10:30:06 -0400	[diff] [blame]	11	#include "rwsem.h"
				12
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	13	int __percpu_init_rwsem(struct percpu_rw_semaphore *sem,
Oleg Nesterov	8ebe347	2012-12-17 16:01:38 -0800	[diff] [blame]	14	const char name, struct lock_class_key rwsem_key)
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	15	{
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	16	sem->read_count = alloc_percpu(int);
				17	if (unlikely(!sem->read_count))
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	18	return -ENOMEM;
				19
Oleg Nesterov	8ebe347	2012-12-17 16:01:38 -0800	[diff] [blame]	20	/* ->rw_sem represents the whole percpu_rw_semaphore for lockdep */
Oleg Nesterov	95bf33b	2019-04-23 14:07:24 +0200	[diff] [blame]	21	rcu_sync_init(&sem->rss);
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	22	__init_rwsem(&sem->rw_sem, name, rwsem_key);
Davidlohr Bueso	52b9412	2017-01-11 07:22:26 -0800	[diff] [blame]	23	rcuwait_init(&sem->writer);
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	24	sem->readers_block = 0;
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	25	return 0;
				26	}
Paul E. McKenney	302707f	2015-08-31 20:21:59 -0700	[diff] [blame]	27	EXPORT_SYMBOL_GPL(__percpu_init_rwsem);
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	28
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	29	void percpu_free_rwsem(struct percpu_rw_semaphore *sem)
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	30	{
Oleg Nesterov	95b19f6	2015-08-21 19:42:55 +0200	[diff] [blame]	31	/*
				32	* XXX: temporary kludge. The error path in alloc_super()
				33	* assumes that percpu_free_rwsem() is safe after kzalloc().
				34	*/
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	35	if (!sem->read_count)
Oleg Nesterov	95b19f6	2015-08-21 19:42:55 +0200	[diff] [blame]	36	return;
				37
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	38	rcu_sync_dtor(&sem->rss);
				39	free_percpu(sem->read_count);
				40	sem->read_count = NULL; /* catch use after free bugs */
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	41	}
Daeho Jeong	c8585c6	2016-04-25 23:22:35 -0400	[diff] [blame]	42	EXPORT_SYMBOL_GPL(percpu_free_rwsem);
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	43
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	44	int __percpu_down_read(struct percpu_rw_semaphore *sem, int try)
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	45	{
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	46	/*
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	47	* Due to having preemption disabled the decrement happens on
				48	* the same CPU as the increment, avoiding the
				49	* increment-on-one-CPU-and-decrement-on-another problem.
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	50	*
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	51	* If the reader misses the writer's assignment of readers_block, then
				52	* the writer is guaranteed to see the reader's increment.
				53	*
				54	* Conversely, any readers that increment their sem->read_count after
				55	* the writer looks are guaranteed to see the readers_block value,
				56	* which in turn means that they are guaranteed to immediately
				57	* decrement their sem->read_count, so that it doesn't matter that the
				58	* writer missed them.
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	59	*/
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	60
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	61	smp_mb(); /* A matches D */
Oleg Nesterov	9390ef0	2012-12-17 16:01:36 -0800	[diff] [blame]	62
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	63	/*
				64	* If !readers_block the critical section starts here, matched by the
				65	* release in percpu_up_write().
				66	*/
				67	if (likely(!smp_load_acquire(&sem->readers_block)))
				68	return 1;
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	69
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	70	/*
				71	* Per the above comment; we still have preemption disabled and
				72	* will thus decrement on the same CPU as we incremented.
				73	*/
				74	__percpu_up_read(sem);
				75
				76	if (try)
				77	return 0;
				78
				79	/*
				80	* We either call schedule() in the wait, or we'll fall through
				81	* and reschedule on the preempt_enable() in percpu_down_read().
				82	*/
				83	preempt_enable_no_resched();
				84
				85	/*
				86	* Avoid lockdep for the down/up_read() we already have them.
				87	*/
				88	__down_read(&sem->rw_sem);
				89	this_cpu_inc(*sem->read_count);
				90	__up_read(&sem->rw_sem);
				91
				92	preempt_disable();
				93	return 1;
				94	}
				95	EXPORT_SYMBOL_GPL(__percpu_down_read);
				96
				97	void __percpu_up_read(struct percpu_rw_semaphore *sem)
				98	{
				99	smp_mb(); /* B matches C */
				100	/*
				101	* In other words, if they see our decrement (presumably to aggregate
				102	* zero, as that is the only time it matters) they will also see our
				103	* critical section.
				104	*/
				105	__this_cpu_dec(*sem->read_count);
				106
				107	/* Prod writer to recheck readers_active */
Davidlohr Bueso	52b9412	2017-01-11 07:22:26 -0800	[diff] [blame]	108	rcuwait_wake_up(&sem->writer);
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	109	}
				110	EXPORT_SYMBOL_GPL(__percpu_up_read);
				111
				112	#define per_cpu_sum(var) \
				113	({ \
				114	typeof(var) __sum = 0; \
				115	int cpu; \
				116	compiletime_assert_atomic_type(__sum); \
				117	for_each_possible_cpu(cpu) \
				118	__sum += per_cpu(var, cpu); \
				119	__sum; \
				120	})
				121
				122	/*
				123	* Return true if the modular sum of the sem->read_count per-CPU variable is
				124	* zero. If this sum is zero, then it is stable due to the fact that if any
				125	* newly arriving readers increment a given counter, they will immediately
				126	* decrement that same counter.
				127	*/
				128	static bool readers_active_check(struct percpu_rw_semaphore *sem)
				129	{
				130	if (per_cpu_sum(*sem->read_count) != 0)
				131	return false;
				132
				133	/*
				134	* If we observed the decrement; ensure we see the entire critical
				135	* section.
				136	*/
				137
				138	smp_mb(); /* C matches B */
				139
				140	return true;
				141	}
				142
				143	void percpu_down_write(struct percpu_rw_semaphore *sem)
				144	{
				145	/* Notify readers to take the slow path. */
				146	rcu_sync_enter(&sem->rss);
				147
				148	down_write(&sem->rw_sem);
				149
				150	/*
				151	* Notify new readers to block; up until now, and thus throughout the
				152	* longish rcu_sync_enter() above, new readers could still come in.
				153	*/
				154	WRITE_ONCE(sem->readers_block, 1);
				155
				156	smp_mb(); /* D matches A */
				157
				158	/*
				159	* If they don't see our writer of readers_block, then we are
				160	* guaranteed to see their sem->read_count increment, and therefore
				161	* will wait for them.
				162	*/
				163
				164	/* Wait for all now active readers to complete. */
Davidlohr Bueso	52b9412	2017-01-11 07:22:26 -0800	[diff] [blame]	165	rcuwait_wait_event(&sem->writer, readers_active_check(sem));
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	166	}
Paul E. McKenney	302707f	2015-08-31 20:21:59 -0700	[diff] [blame]	167	EXPORT_SYMBOL_GPL(percpu_down_write);
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	168
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	169	void percpu_up_write(struct percpu_rw_semaphore *sem)
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	170	{
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	171	/*
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	172	* Signal the writer is done, no fast path yet.
				173	*
				174	* One reason that we cannot just immediately flip to readers_fast is
				175	* that new readers might fail to see the results of this writer's
				176	* critical section.
				177	*
				178	* Therefore we force it through the slow path which guarantees an
				179	* acquire and thereby guarantees the critical section's consistency.
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	180	*/
Peter Zijlstra	80127a3	2016-07-14 20:08:46 +0200	[diff] [blame]	181	smp_store_release(&sem->readers_block, 0);
				182
				183	/*
				184	* Release the write lock, this will allow readers back in the game.
				185	*/
				186	up_write(&sem->rw_sem);
				187
				188	/*
				189	* Once this completes (at least one RCU-sched grace period hence) the
				190	* reader fast path will be available again. Safe to use outside the
				191	* exclusive write lock because its counting.
				192	*/
				193	rcu_sync_exit(&sem->rss);
Oleg Nesterov	a1fd3e2	2012-12-17 16:01:32 -0800	[diff] [blame]	194	}
Paul E. McKenney	302707f	2015-08-31 20:21:59 -0700	[diff] [blame]	195	EXPORT_SYMBOL_GPL(percpu_up_write);