Blame - kernel/sched/clock.c - SHIFTPHONES/mainline/linux

blob: e3e3b979f9bd2645d6cc7416e7c6c25cb7d20b2e [file] [log] [blame]

Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	1	/*
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	2	* sched_clock() for unstable CPU clocks
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	3	*
Peter Zijlstra	90eec10	2015-11-16 11:08:45 +0100	[diff] [blame]	4	* Copyright (C) 2008 Red Hat, Inc., Peter Zijlstra
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	5	*
Steven Rostedt	c300ba2	2008-07-09 00:15:33 -0400	[diff] [blame]	6	* Updates and enhancements:
				7	* Copyright (C) 2008 Red Hat, Inc. Steven Rostedt <srostedt@redhat.com>
				8	*
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	9	* Based on code by:
				10	* Ingo Molnar <mingo@redhat.com>
				11	* Guillaume Chazarain <guichaz@gmail.com>
				12	*
Peter Zijlstra	c676329	2010-05-25 10:48:51 +0200	[diff] [blame]	13	*
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	14	* What this file implements:
Peter Zijlstra	c676329	2010-05-25 10:48:51 +0200	[diff] [blame]	15	*
				16	* cpu_clock(i) provides a fast (execution time) high resolution
				17	* clock with bounded drift between CPUs. The value of cpu_clock(i)
				18	* is monotonic for constant i. The timestamp returned is in nanoseconds.
				19	*
				20	* ######################### BIG FAT WARNING ##########################
				21	* # when comparing cpu_clock(i) to cpu_clock(j) for i != j, time can #
				22	* # go backwards !! #
				23	* ####################################################################
				24	*
				25	* There is no strict promise about the base, although it tends to start
				26	* at 0 on boot (but people really shouldn't rely on that).
				27	*
				28	* cpu_clock(i) -- can be used from any context, including NMI.
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	29	* local_clock() -- is cpu_clock() on the current CPU.
Peter Zijlstra	c676329	2010-05-25 10:48:51 +0200	[diff] [blame]	30	*
Peter Zijlstra	ef08f0f	2013-11-28 19:31:23 +0100	[diff] [blame]	31	* sched_clock_cpu(i)
				32	*
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	33	* How it is implemented:
Peter Zijlstra	c676329	2010-05-25 10:48:51 +0200	[diff] [blame]	34	*
				35	* The implementation either uses sched_clock() when
				36	* !CONFIG_HAVE_UNSTABLE_SCHED_CLOCK, which means in that case the
				37	* sched_clock() is assumed to provide these properties (mostly it means
				38	* the architecture provides a globally synchronized highres time source).
				39	*
				40	* Otherwise it tries to create a semi stable clock from a mixture of other
				41	* clocks, including:
				42	*
				43	* - GTOD (clock monotomic)
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	44	* - sched_clock()
				45	* - explicit idle events
				46	*
Peter Zijlstra	c676329	2010-05-25 10:48:51 +0200	[diff] [blame]	47	* We use GTOD as base and use sched_clock() deltas to improve resolution. The
				48	* deltas are filtered to provide monotonicity and keeping it within an
				49	* expected window.
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	50	*
				51	* Furthermore, explicit sleep and wakeup hooks allow us to account for time
				52	* that is otherwise invisible (TSC gets stopped).
				53	*
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	54	*/
Ingo Molnar	325ea10	2018-03-03 12:20:47 +0100	[diff] [blame]	55	#include "sched.h"
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	56	#include <linux/sched_clock.h>
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	57
Hugh Dickins	2c3d103	2008-07-25 19:45:00 +0100	[diff] [blame]	58	/*
				59	* Scheduler clock - returns current time in nanosec units.
				60	* This is default implementation.
				61	* Architectures and sub-architectures can override this.
				62	*/
Gideon Israel Dsouza	52f5684c	2014-04-07 15:39:20 -0700	[diff] [blame]	63	unsigned long long __weak sched_clock(void)
Hugh Dickins	2c3d103	2008-07-25 19:45:00 +0100	[diff] [blame]	64	{
Ron	92d23f7	2009-05-08 22:54:49 +0930	[diff] [blame]	65	return (unsigned long long)(jiffies - INITIAL_JIFFIES)
				66	* (NSEC_PER_SEC / HZ);
Hugh Dickins	2c3d103	2008-07-25 19:45:00 +0100	[diff] [blame]	67	}
Divyesh Shah	b6ac23af	2010-04-15 08:54:59 +0200	[diff] [blame]	68	EXPORT_SYMBOL_GPL(sched_clock);
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	69
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	70	static DEFINE_STATIC_KEY_FALSE(sched_clock_running);
Peter Zijlstra	c1955a3	2008-08-11 08:59:03 +0200	[diff] [blame]	71
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	72	#ifdef CONFIG_HAVE_UNSTABLE_SCHED_CLOCK
Peter Zijlstra	acb0405	2017-01-19 14:36:33 +0100	[diff] [blame]	73	/*
				74	* We must start with !__sched_clock_stable because the unstable -> stable
				75	* transition is accurate, while the stable -> unstable transition is not.
				76	*
				77	* Similarly we start with __sched_clock_stable_early, thereby assuming we
				78	* will become stable, such that there's only a single 1 -> 0 transition.
				79	*/
Peter Zijlstra	555570d7	2016-12-15 13:21:58 +0100	[diff] [blame]	80	static DEFINE_STATIC_KEY_FALSE(__sched_clock_stable);
Peter Zijlstra	acb0405	2017-01-19 14:36:33 +0100	[diff] [blame]	81	static int __sched_clock_stable_early = 1;
Peter Zijlstra	35af99e	2013-11-28 19:38:42 +0100	[diff] [blame]	82
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	83	/*
Peter Zijlstra	698eff6	2017-03-17 12:48:18 +0100	[diff] [blame]	84	* We want: ktime_get_ns() + __gtod_offset == sched_clock() + __sched_clock_offset
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	85	*/
Peter Zijlstra	698eff6	2017-03-17 12:48:18 +0100	[diff] [blame]	86	__read_mostly u64 __sched_clock_offset;
				87	static __read_mostly u64 __gtod_offset;
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	88
				89	struct sched_clock_data {
				90	u64 tick_raw;
				91	u64 tick_gtod;
				92	u64 clock;
				93	};
				94
				95	static DEFINE_PER_CPU_SHARED_ALIGNED(struct sched_clock_data, sched_clock_data);
				96
				97	static inline struct sched_clock_data *this_scd(void)
				98	{
				99	return this_cpu_ptr(&sched_clock_data);
				100	}
				101
				102	static inline struct sched_clock_data *cpu_sdc(int cpu)
				103	{
				104	return &per_cpu(sched_clock_data, cpu);
				105	}
				106
Peter Zijlstra	35af99e	2013-11-28 19:38:42 +0100	[diff] [blame]	107	int sched_clock_stable(void)
				108	{
Peter Zijlstra	555570d7	2016-12-15 13:21:58 +0100	[diff] [blame]	109	return static_branch_likely(&__sched_clock_stable);
Peter Zijlstra	d375b4e	2014-01-22 12:59:18 +0100	[diff] [blame]	110	}
				111
Peter Zijlstra	cf15ca8	2017-04-21 12:11:53 +0200	[diff] [blame]	112	static void __scd_stamp(struct sched_clock_data *scd)
				113	{
				114	scd->tick_gtod = ktime_get_ns();
				115	scd->tick_raw = sched_clock();
				116	}
				117
Peter Zijlstra	d375b4e	2014-01-22 12:59:18 +0100	[diff] [blame]	118	static void __set_sched_clock_stable(void)
				119	{
Peter Zijlstra	45aea321	2017-05-24 08:52:02 +0200	[diff] [blame]	120	struct sched_clock_data *scd;
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	121
				122	/*
Peter Zijlstra	45aea321	2017-05-24 08:52:02 +0200	[diff] [blame]	123	* Since we're still unstable and the tick is already running, we have
				124	* to disable IRQs in order to get a consistent scd->tick* reading.
				125	*/
				126	local_irq_disable();
				127	scd = this_scd();
				128	/*
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	129	* Attempt to make the (initial) unstable->stable transition continuous.
				130	*/
Peter Zijlstra	698eff6	2017-03-17 12:48:18 +0100	[diff] [blame]	131	__sched_clock_offset = (scd->tick_gtod + __gtod_offset) - (scd->tick_raw);
Peter Zijlstra	45aea321	2017-05-24 08:52:02 +0200	[diff] [blame]	132	local_irq_enable();
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	133
				134	printk(KERN_INFO "sched_clock: Marking stable (%lld, %lld)->(%lld, %lld)\n",
Peter Zijlstra	698eff6	2017-03-17 12:48:18 +0100	[diff] [blame]	135	scd->tick_gtod, __gtod_offset,
				136	scd->tick_raw, __sched_clock_offset);
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	137
Peter Zijlstra	555570d7	2016-12-15 13:21:58 +0100	[diff] [blame]	138	static_branch_enable(&__sched_clock_stable);
Frederic Weisbecker	4f49b90	2015-07-22 17:03:52 +0200	[diff] [blame]	139	tick_dep_clear(TICK_DEP_BIT_CLOCK_UNSTABLE);
Peter Zijlstra	35af99e	2013-11-28 19:38:42 +0100	[diff] [blame]	140	}
				141
Peter Zijlstra	cf15ca8	2017-04-21 12:11:53 +0200	[diff] [blame]	142	/*
				143	* If we ever get here, we're screwed, because we found out -- typically after
				144	* the fact -- that TSC wasn't good. This means all our clocksources (including
				145	* ktime) could have reported wrong values.
				146	*
				147	* What we do here is an attempt to fix up and continue sort of where we left
				148	* off in a coherent manner.
				149	*
				150	* The only way to fully avoid random clock jumps is to boot with:
				151	* "tsc=unstable".
				152	*/
Peter Zijlstra	71fdb70	2017-03-13 13:46:21 +0100	[diff] [blame]	153	static void __sched_clock_work(struct work_struct *work)
				154	{
Peter Zijlstra	cf15ca8	2017-04-21 12:11:53 +0200	[diff] [blame]	155	struct sched_clock_data *scd;
				156	int cpu;
				157
				158	/* take a current timestamp and set 'now' */
				159	preempt_disable();
				160	scd = this_scd();
				161	__scd_stamp(scd);
				162	scd->clock = scd->tick_gtod + __gtod_offset;
				163	preempt_enable();
				164
				165	/* clone to all CPUs */
				166	for_each_possible_cpu(cpu)
				167	per_cpu(sched_clock_data, cpu) = *scd;
				168
Peter Zijlstra	7708d5f	2017-04-21 12:52:52 +0200	[diff] [blame]	169	printk(KERN_WARNING "TSC found unstable after boot, most likely due to broken BIOS. Use 'tsc=unstable'.\n");
Peter Zijlstra	cf15ca8	2017-04-21 12:11:53 +0200	[diff] [blame]	170	printk(KERN_INFO "sched_clock: Marking unstable (%lld, %lld)<-(%lld, %lld)\n",
				171	scd->tick_gtod, __gtod_offset,
				172	scd->tick_raw, __sched_clock_offset);
				173
Peter Zijlstra	71fdb70	2017-03-13 13:46:21 +0100	[diff] [blame]	174	static_branch_disable(&__sched_clock_stable);
				175	}
				176
				177	static DECLARE_WORK(sched_clock_work, __sched_clock_work);
				178
				179	static void __clear_sched_clock_stable(void)
Peter Zijlstra	35af99e	2013-11-28 19:38:42 +0100	[diff] [blame]	180	{
Peter Zijlstra	cf15ca8	2017-04-21 12:11:53 +0200	[diff] [blame]	181	if (!sched_clock_stable())
				182	return;
Peter Zijlstra	5680d80	2016-12-15 13:36:17 +0100	[diff] [blame]	183
Frederic Weisbecker	4f49b90	2015-07-22 17:03:52 +0200	[diff] [blame]	184	tick_dep_set(TICK_DEP_BIT_CLOCK_UNSTABLE);
Peter Zijlstra	cf15ca8	2017-04-21 12:11:53 +0200	[diff] [blame]	185	schedule_work(&sched_clock_work);
Peter Zijlstra	71fdb70	2017-03-13 13:46:21 +0100	[diff] [blame]	186	}
Peter Zijlstra	6577e42	2013-12-11 18:55:53 +0100	[diff] [blame]	187
				188	void clear_sched_clock_stable(void)
				189	{
Peter Zijlstra	d375b4e	2014-01-22 12:59:18 +0100	[diff] [blame]	190	__sched_clock_stable_early = 0;
				191
Peter Zijlstra	9881b02	2016-12-15 13:35:52 +0100	[diff] [blame]	192	smp_mb(); /* matches sched_clock_init_late() */
Peter Zijlstra	d375b4e	2014-01-22 12:59:18 +0100	[diff] [blame]	193
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	194	if (static_key_count(&sched_clock_running.key) == 2)
Peter Zijlstra	71fdb70	2017-03-13 13:46:21 +0100	[diff] [blame]	195	__clear_sched_clock_stable();
Peter Zijlstra	6577e42	2013-12-11 18:55:53 +0100	[diff] [blame]	196	}
				197
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	198	static void __sched_clock_gtod_offset(void)
				199	{
Peter Zijlstra	9407f5a	2018-07-20 10:09:11 +0200	[diff] [blame]	200	struct sched_clock_data *scd = this_scd();
				201
				202	__scd_stamp(scd);
				203	__gtod_offset = (scd->tick_raw + __sched_clock_offset) - scd->tick_gtod;
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	204	}
				205
				206	void __init sched_clock_init(void)
				207	{
Pavel Tatashin	857baa8	2018-07-19 16:55:42 -0400	[diff] [blame]	208	/*
				209	* Set __gtod_offset such that once we mark sched_clock_running,
				210	* sched_clock_tick() continues where sched_clock() left off.
				211	*
				212	* Even if TSC is buggered, we're still UP at this point so it
				213	* can't really be out of sync.
				214	*/
Peter Zijlstra	9407f5a	2018-07-20 10:09:11 +0200	[diff] [blame]	215	local_irq_disable();
Pavel Tatashin	857baa8	2018-07-19 16:55:42 -0400	[diff] [blame]	216	__sched_clock_gtod_offset();
Peter Zijlstra	9407f5a	2018-07-20 10:09:11 +0200	[diff] [blame]	217	local_irq_enable();
Pavel Tatashin	857baa8	2018-07-19 16:55:42 -0400	[diff] [blame]	218
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	219	static_branch_inc(&sched_clock_running);
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	220	}
Peter Zijlstra	2e44b7d	2017-04-21 12:46:57 +0200	[diff] [blame]	221	/*
				222	* We run this as late_initcall() such that it runs after all built-in drivers,
				223	* notably: acpi_processor and intel_idle, which can mark the TSC as unstable.
				224	*/
				225	static int __init sched_clock_init_late(void)
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	226	{
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	227	static_branch_inc(&sched_clock_running);
Peter Zijlstra	d375b4e	2014-01-22 12:59:18 +0100	[diff] [blame]	228	/*
				229	* Ensure that it is impossible to not do a static_key update.
				230	*
				231	* Either {set,clear}_sched_clock_stable() must see sched_clock_running
				232	* and do the update, or we must see their __sched_clock_stable_early
				233	* and do the update, or both.
				234	*/
				235	smp_mb(); /* matches {set,clear}_sched_clock_stable() */
				236
				237	if (__sched_clock_stable_early)
				238	__set_sched_clock_stable();
Peter Zijlstra	2e44b7d	2017-04-21 12:46:57 +0200	[diff] [blame]	239
				240	return 0;
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	241	}
Peter Zijlstra	2e44b7d	2017-04-21 12:46:57 +0200	[diff] [blame]	242	late_initcall(sched_clock_init_late);
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	243
				244	/*
Ingo Molnar	b342501	2009-02-26 20:20:29 +0100	[diff] [blame]	245	* min, max except they take wrapping into account
Peter Zijlstra	354879b	2008-08-25 17:15:34 +0200	[diff] [blame]	246	*/
				247
				248	static inline u64 wrap_min(u64 x, u64 y)
				249	{
				250	return (s64)(x - y) < 0 ? x : y;
				251	}
				252
				253	static inline u64 wrap_max(u64 x, u64 y)
				254	{
				255	return (s64)(x - y) > 0 ? x : y;
				256	}
				257
				258	/*
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	259	* update the percpu scd from the raw @now value
				260	*
				261	* - filter out backward motion
Peter Zijlstra	354879b	2008-08-25 17:15:34 +0200	[diff] [blame]	262	* - use the GTOD tick value to create a window to filter crazy TSC values
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	263	*/
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	264	static u64 sched_clock_local(struct sched_clock_data *scd)
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	265	{
Pavel Tatashin	7b09cc5	2017-03-22 16:24:17 -0400	[diff] [blame]	266	u64 now, clock, old_clock, min_clock, max_clock, gtod;
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	267	s64 delta;
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	268
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	269	again:
				270	now = sched_clock();
				271	delta = now - scd->tick_raw;
Peter Zijlstra	354879b	2008-08-25 17:15:34 +0200	[diff] [blame]	272	if (unlikely(delta < 0))
				273	delta = 0;
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	274
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	275	old_clock = scd->clock;
				276
Peter Zijlstra	354879b	2008-08-25 17:15:34 +0200	[diff] [blame]	277	/*
				278	* scd->clock = clamp(scd->tick_gtod + delta,
Ingo Molnar	b342501	2009-02-26 20:20:29 +0100	[diff] [blame]	279	* max(scd->tick_gtod, scd->clock),
				280	* scd->tick_gtod + TICK_NSEC);
Peter Zijlstra	354879b	2008-08-25 17:15:34 +0200	[diff] [blame]	281	*/
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	282
Pavel Tatashin	7b09cc5	2017-03-22 16:24:17 -0400	[diff] [blame]	283	gtod = scd->tick_gtod + __gtod_offset;
				284	clock = gtod + delta;
				285	min_clock = wrap_max(gtod, old_clock);
				286	max_clock = wrap_max(old_clock, gtod + TICK_NSEC);
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	287
Peter Zijlstra	354879b	2008-08-25 17:15:34 +0200	[diff] [blame]	288	clock = wrap_max(clock, min_clock);
				289	clock = wrap_min(clock, max_clock);
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	290
Eric Dumazet	152f9d0	2009-09-30 20:36:19 +0200	[diff] [blame]	291	if (cmpxchg64(&scd->clock, old_clock, clock) != old_clock)
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	292	goto again;
Ingo Molnar	56b9061	2008-07-30 10:15:55 +0200	[diff] [blame]	293
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	294	return clock;
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	295	}
				296
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	297	static u64 sched_clock_remote(struct sched_clock_data *scd)
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	298	{
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	299	struct sched_clock_data *my_scd = this_scd();
				300	u64 this_clock, remote_clock;
				301	u64 *ptr, old_val, val;
				302
Thomas Gleixner	a1cbcaa	2013-04-06 10:10:27 +0200	[diff] [blame]	303	#if BITS_PER_LONG != 64
				304	again:
				305	/*
				306	* Careful here: The local and the remote clock values need to
				307	* be read out atomic as we need to compare the values and
				308	* then update either the local or the remote side. So the
				309	* cmpxchg64 below only protects one readout.
				310	*
				311	* We must reread via sched_clock_local() in the retry case on
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	312	* 32-bit kernels as an NMI could use sched_clock_local() via the
Thomas Gleixner	a1cbcaa	2013-04-06 10:10:27 +0200	[diff] [blame]	313	* tracer and hit between the readout of
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	314	* the low 32-bit and the high 32-bit portion.
Thomas Gleixner	a1cbcaa	2013-04-06 10:10:27 +0200	[diff] [blame]	315	*/
				316	this_clock = sched_clock_local(my_scd);
				317	/*
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	318	* We must enforce atomic readout on 32-bit, otherwise the
				319	* update on the remote CPU can hit inbetween the readout of
				320	* the low 32-bit and the high 32-bit portion.
Thomas Gleixner	a1cbcaa	2013-04-06 10:10:27 +0200	[diff] [blame]	321	*/
				322	remote_clock = cmpxchg64(&scd->clock, 0, 0);
				323	#else
				324	/*
Ingo Molnar	97fb7a0	2018-03-03 14:01:12 +0100	[diff] [blame]	325	* On 64-bit kernels the read of [my]scd->clock is atomic versus the
				326	* update, so we can avoid the above 32-bit dance.
Thomas Gleixner	a1cbcaa	2013-04-06 10:10:27 +0200	[diff] [blame]	327	*/
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	328	sched_clock_local(my_scd);
				329	again:
				330	this_clock = my_scd->clock;
				331	remote_clock = scd->clock;
Thomas Gleixner	a1cbcaa	2013-04-06 10:10:27 +0200	[diff] [blame]	332	#endif
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	333
				334	/*
				335	* Use the opportunity that we have both locks
				336	* taken to couple the two clocks: we take the
				337	* larger time as the latest time for both
				338	* runqueues. (this creates monotonic movement)
				339	*/
				340	if (likely((s64)(remote_clock - this_clock) < 0)) {
				341	ptr = &scd->clock;
				342	old_val = remote_clock;
				343	val = this_clock;
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	344	} else {
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	345	/*
				346	* Should be rare, but possible:
				347	*/
				348	ptr = &my_scd->clock;
				349	old_val = this_clock;
				350	val = remote_clock;
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	351	}
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	352
Eric Dumazet	152f9d0	2009-09-30 20:36:19 +0200	[diff] [blame]	353	if (cmpxchg64(ptr, old_val, val) != old_val)
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	354	goto again;
				355
				356	return val;
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	357	}
				358
Peter Zijlstra	c676329	2010-05-25 10:48:51 +0200	[diff] [blame]	359	/*
				360	* Similar to cpu_clock(), but requires local IRQs to be disabled.
				361	*
				362	* See cpu_clock().
				363	*/
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	364	u64 sched_clock_cpu(int cpu)
				365	{
Ingo Molnar	b342501	2009-02-26 20:20:29 +0100	[diff] [blame]	366	struct sched_clock_data *scd;
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	367	u64 clock;
				368
Peter Zijlstra	35af99e	2013-11-28 19:38:42 +0100	[diff] [blame]	369	if (sched_clock_stable())
Peter Zijlstra	698eff6	2017-03-17 12:48:18 +0100	[diff] [blame]	370	return sched_clock() + __sched_clock_offset;
Peter Zijlstra	a381759	2008-05-29 10:07:15 +0200	[diff] [blame]	371
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	372	if (!static_branch_unlikely(&sched_clock_running))
Pavel Tatashin	857baa8	2018-07-19 16:55:42 -0400	[diff] [blame]	373	return sched_clock();
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	374
Fernando Luis Vazquez Cao	96b3d28	2014-03-06 14:25:28 +0900	[diff] [blame]	375	preempt_disable_notrace();
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	376	scd = cpu_sdc(cpu);
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	377
Peter Zijlstra	def0a9b	2009-09-18 20:14:01 +0200	[diff] [blame]	378	if (cpu != smp_processor_id())
				379	clock = sched_clock_remote(scd);
				380	else
				381	clock = sched_clock_local(scd);
Fernando Luis Vazquez Cao	96b3d28	2014-03-06 14:25:28 +0900	[diff] [blame]	382	preempt_enable_notrace();
Ingo Molnar	e4e4e53	2008-04-14 08:50:02 +0200	[diff] [blame]	383
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	384	return clock;
				385	}
Daniel Lezcano	2c923e9	2016-04-11 16:38:34 +0200	[diff] [blame]	386	EXPORT_SYMBOL_GPL(sched_clock_cpu);
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	387
				388	void sched_clock_tick(void)
				389	{
Peter Zijlstra	8325d9c	2009-02-26 21:40:16 +0100	[diff] [blame]	390	struct sched_clock_data *scd;
Peter Zijlstra	a381759	2008-05-29 10:07:15 +0200	[diff] [blame]	391
Peter Zijlstra	b421b22	2017-04-21 12:14:13 +0200	[diff] [blame]	392	if (sched_clock_stable())
				393	return;
				394
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	395	if (!static_branch_unlikely(&sched_clock_running))
Peter Zijlstra	b421b22	2017-04-21 12:14:13 +0200	[diff] [blame]	396	return;
				397
Frederic Weisbecker	2c11dba	2017-11-06 16:01:27 +0100	[diff] [blame]	398	lockdep_assert_irqs_disabled();
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	399
Peter Zijlstra	8325d9c	2009-02-26 21:40:16 +0100	[diff] [blame]	400	scd = this_scd();
Peter Zijlstra	cf15ca8	2017-04-21 12:11:53 +0200	[diff] [blame]	401	__scd_stamp(scd);
Peter Zijlstra	b421b22	2017-04-21 12:14:13 +0200	[diff] [blame]	402	sched_clock_local(scd);
				403	}
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	404
Peter Zijlstra	b421b22	2017-04-21 12:14:13 +0200	[diff] [blame]	405	void sched_clock_tick_stable(void)
				406	{
Peter Zijlstra	b421b22	2017-04-21 12:14:13 +0200	[diff] [blame]	407	if (!sched_clock_stable())
				408	return;
				409
				410	/*
				411	* Called under watchdog_lock.
				412	*
				413	* The watchdog just found this TSC to (still) be stable, so now is a
				414	* good moment to update our __gtod_offset. Because once we find the
				415	* TSC to be unstable, any computation will be computing crap.
				416	*/
				417	local_irq_disable();
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	418	__sched_clock_gtod_offset();
Peter Zijlstra	b421b22	2017-04-21 12:14:13 +0200	[diff] [blame]	419	local_irq_enable();
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	420	}
				421
				422	/*
				423	* We are going deep-idle (irqs are disabled):
				424	*/
				425	void sched_clock_idle_sleep_event(void)
				426	{
				427	sched_clock_cpu(smp_processor_id());
				428	}
				429	EXPORT_SYMBOL_GPL(sched_clock_idle_sleep_event);
				430
				431	/*
Peter Zijlstra	f9fccdb	2017-04-21 12:43:59 +0200	[diff] [blame]	432	* We just idled; resync with ktime.
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	433	*/
Peter Zijlstra	ac1e843	2017-04-21 12:26:23 +0200	[diff] [blame]	434	void sched_clock_idle_wakeup_event(void)
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	435	{
Peter Zijlstra	f9fccdb	2017-04-21 12:43:59 +0200	[diff] [blame]	436	unsigned long flags;
				437
				438	if (sched_clock_stable())
Thomas Gleixner	1c5745a	2008-12-22 23:05:28 +0100	[diff] [blame]	439	return;
				440
Peter Zijlstra	f9fccdb	2017-04-21 12:43:59 +0200	[diff] [blame]	441	if (unlikely(timekeeping_suspended))
				442	return;
				443
				444	local_irq_save(flags);
Peter Zijlstra	354879b	2008-08-25 17:15:34 +0200	[diff] [blame]	445	sched_clock_tick();
Peter Zijlstra	f9fccdb	2017-04-21 12:43:59 +0200	[diff] [blame]	446	local_irq_restore(flags);
Peter Zijlstra	3e51f33	2008-05-03 18:29:28 +0200	[diff] [blame]	447	}
				448	EXPORT_SYMBOL_GPL(sched_clock_idle_wakeup_event);
				449
Peter Zijlstra	8325d9c	2009-02-26 21:40:16 +0100	[diff] [blame]	450	#else /* CONFIG_HAVE_UNSTABLE_SCHED_CLOCK */
				451
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	452	void __init sched_clock_init(void)
				453	{
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	454	static_branch_inc(&sched_clock_running);
Pavel Tatashin	bd9f943	2018-07-30 09:52:52 -0400	[diff] [blame]	455	local_irq_disable();
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	456	generic_sched_clock_init();
Pavel Tatashin	bd9f943	2018-07-30 09:52:52 -0400	[diff] [blame]	457	local_irq_enable();
Pavel Tatashin	5d2a4e9	2018-07-19 16:55:41 -0400	[diff] [blame]	458	}
				459
Peter Zijlstra	8325d9c	2009-02-26 21:40:16 +0100	[diff] [blame]	460	u64 sched_clock_cpu(int cpu)
				461	{
Pavel Tatashin	46457ea	2018-07-19 16:55:43 -0400	[diff] [blame]	462	if (!static_branch_unlikely(&sched_clock_running))
Peter Zijlstra	8325d9c	2009-02-26 21:40:16 +0100	[diff] [blame]	463	return 0;
				464
				465	return sched_clock();
				466	}
Peter Zijlstra	9881b02	2016-12-15 13:35:52 +0100	[diff] [blame]	467
David Miller	b9f8fcd	2009-12-13 18:25:02 -0800	[diff] [blame]	468	#endif /* CONFIG_HAVE_UNSTABLE_SCHED_CLOCK */
				469
Cyril Bur	545a2bf	2015-02-12 15:01:24 -0800	[diff] [blame]	470	/*
				471	* Running clock - returns the time that has elapsed while a guest has been
				472	* running.
				473	* On a guest this value should be local_clock minus the time the guest was
				474	* suspended by the hypervisor (for any reason).
				475	* On bare metal this function should return the same as local_clock.
				476	* Architectures and sub-architectures can override this.
				477	*/
				478	u64 __weak running_clock(void)
				479	{
				480	return local_clock();
				481	}