Blame - mm/page_isolation.c - SHIFTPHONES/kernel/common

blob: 029a171d35dcbbe16ea3f704f589c339f9614fd5 [file] [log] [blame]

KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	1	/*
				2	* linux/mm/page_isolation.c
				3	*/
				4
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	5	#include <linux/mm.h>
				6	#include <linux/page-isolation.h>
				7	#include <linux/pageblock-flags.h>
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	8	#include <linux/memory.h>
Naoya Horiguchi	c8721bb	2013-09-11 14:22:09 -0700	[diff] [blame]	9	#include <linux/hugetlb.h>
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	10	#include "internal.h"
				11
Naoya Horiguchi	c5b4e1b	2015-09-08 15:02:09 -0700	[diff] [blame]	12	static int set_migratetype_isolate(struct page *page,
				13	bool skip_hwpoisoned_pages)
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	14	{
				15	struct zone *zone;
				16	unsigned long flags, pfn;
				17	struct memory_isolate_notify arg;
				18	int notifier_ret;
				19	int ret = -EBUSY;
				20
				21	zone = page_zone(page);
				22
				23	spin_lock_irqsave(&zone->lock, flags);
				24
				25	pfn = page_to_pfn(page);
				26	arg.start_pfn = pfn;
				27	arg.nr_pages = pageblock_nr_pages;
				28	arg.pages_found = 0;
				29
				30	/*
				31	* It may be possible to isolate a pageblock even if the
				32	* migratetype is not MIGRATE_MOVABLE. The memory isolation
				33	* notifier chain is used by balloon drivers to return the
				34	* number of pages in a range that are held by the balloon
				35	* driver to shrink memory. If all the pages are accounted for
				36	* by balloons, are free, or on the LRU, isolation can continue.
				37	* Later, for example, when memory hotplug notifier runs, these
				38	* pages reported as "can be isolated" should be isolated(freed)
				39	* by the balloon driver through the memory notifier chain.
				40	*/
				41	notifier_ret = memory_isolate_notify(MEM_ISOLATE_COUNT, &arg);
				42	notifier_ret = notifier_to_errno(notifier_ret);
				43	if (notifier_ret)
				44	goto out;
				45	/*
				46	* FIXME: Now, memory hotplug doesn't call shrink_slab() by itself.
				47	* We just check MOVABLE pages.
				48	*/
Wen Congyang	b023f46	2012-12-11 16:00:45 -0800	[diff] [blame]	49	if (!has_unmovable_pages(zone, page, arg.pages_found,
				50	skip_hwpoisoned_pages))
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	51	ret = 0;
				52
				53	/*
				54	* immobile means "not-on-lru" paes. If immobile is larger than
				55	* removable-by-driver pages reported by notifier, we'll fail.
				56	*/
				57
				58	out:
				59	if (!ret) {
Bartlomiej Zolnierkiewicz	2139cbe	2012-10-08 16:32:00 -0700	[diff] [blame]	60	unsigned long nr_pages;
Bartlomiej Zolnierkiewicz	d1ce749	2012-10-08 16:32:02 -0700	[diff] [blame]	61	int migratetype = get_pageblock_migratetype(page);
Bartlomiej Zolnierkiewicz	2139cbe	2012-10-08 16:32:00 -0700	[diff] [blame]	62
Bartlomiej Zolnierkiewicz	a458431	2013-01-04 15:35:08 -0800	[diff] [blame]	63	set_pageblock_migratetype(page, MIGRATE_ISOLATE);
Joonsoo Kim	ad53f92	2014-11-13 15:19:11 -0800	[diff] [blame]	64	zone->nr_isolate_pageblock++;
Bartlomiej Zolnierkiewicz	2139cbe	2012-10-08 16:32:00 -0700	[diff] [blame]	65	nr_pages = move_freepages_block(zone, page, MIGRATE_ISOLATE);
				66
Bartlomiej Zolnierkiewicz	d1ce749	2012-10-08 16:32:02 -0700	[diff] [blame]	67	__mod_zone_freepage_state(zone, -nr_pages, migratetype);
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	68	}
				69
				70	spin_unlock_irqrestore(&zone->lock, flags);
				71	if (!ret)
Vlastimil Babka	ec25af8	2014-12-10 15:43:04 -0800	[diff] [blame]	72	drain_all_pages(zone);
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	73	return ret;
				74	}
				75
Naoya Horiguchi	c5b4e1b	2015-09-08 15:02:09 -0700	[diff] [blame]	76	static void unset_migratetype_isolate(struct page *page, unsigned migratetype)
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	77	{
				78	struct zone *zone;
Bartlomiej Zolnierkiewicz	2139cbe	2012-10-08 16:32:00 -0700	[diff] [blame]	79	unsigned long flags, nr_pages;
Joonsoo Kim	3c60509	2014-11-13 15:19:21 -0800	[diff] [blame]	80	struct page *isolated_page = NULL;
				81	unsigned int order;
				82	unsigned long page_idx, buddy_idx;
				83	struct page *buddy;
Bartlomiej Zolnierkiewicz	2139cbe	2012-10-08 16:32:00 -0700	[diff] [blame]	84
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	85	zone = page_zone(page);
				86	spin_lock_irqsave(&zone->lock, flags);
				87	if (get_pageblock_migratetype(page) != MIGRATE_ISOLATE)
				88	goto out;
Joonsoo Kim	3c60509	2014-11-13 15:19:21 -0800	[diff] [blame]	89
				90	/*
				91	* Because freepage with more than pageblock_order on isolated
				92	* pageblock is restricted to merge due to freepage counting problem,
				93	* it is possible that there is free buddy page.
				94	* move_freepages_block() doesn't care of merge so we need other
				95	* approach in order to merge them. Isolation and free will make
				96	* these pages to be merged.
				97	*/
				98	if (PageBuddy(page)) {
				99	order = page_order(page);
				100	if (order >= pageblock_order) {
				101	page_idx = page_to_pfn(page) & ((1 << MAX_ORDER) - 1);
				102	buddy_idx = __find_buddy_index(page_idx, order);
				103	buddy = page + (buddy_idx - page_idx);
				104
Hui Zhu	1ae7013	2015-05-14 15:17:04 -0700	[diff] [blame]	105	if (pfn_valid_within(page_to_pfn(buddy)) &&
				106	!is_migrate_isolate_page(buddy)) {
Joonsoo Kim	3c60509	2014-11-13 15:19:21 -0800	[diff] [blame]	107	__isolate_free_page(page, order);
Laura Abbott	cfa8694	2015-03-25 15:55:26 -0700	[diff] [blame]	108	kernel_map_pages(page, (1 << order), 1);
Joonsoo Kim	3c60509	2014-11-13 15:19:21 -0800	[diff] [blame]	109	set_page_refcounted(page);
				110	isolated_page = page;
				111	}
				112	}
				113	}
				114
				115	/*
				116	* If we isolate freepage with more than pageblock_order, there
				117	* should be no freepage in the range, so we could avoid costly
				118	* pageblock scanning for freepage moving.
				119	*/
				120	if (!isolated_page) {
				121	nr_pages = move_freepages_block(zone, page, migratetype);
				122	__mod_zone_freepage_state(zone, nr_pages, migratetype);
				123	}
Bartlomiej Zolnierkiewicz	a458431	2013-01-04 15:35:08 -0800	[diff] [blame]	124	set_pageblock_migratetype(page, migratetype);
Joonsoo Kim	ad53f92	2014-11-13 15:19:11 -0800	[diff] [blame]	125	zone->nr_isolate_pageblock--;
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	126	out:
				127	spin_unlock_irqrestore(&zone->lock, flags);
Joonsoo Kim	3c60509	2014-11-13 15:19:21 -0800	[diff] [blame]	128	if (isolated_page)
				129	__free_pages(isolated_page, order);
Minchan Kim	ee6f509	2012-07-31 16:43:50 -0700	[diff] [blame]	130	}
				131
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	132	static inline struct page *
				133	__first_valid_page(unsigned long pfn, unsigned long nr_pages)
				134	{
				135	int i;
				136	for (i = 0; i < nr_pages; i++)
				137	if (pfn_valid_within(pfn + i))
				138	break;
				139	if (unlikely(i == nr_pages))
				140	return NULL;
				141	return pfn_to_page(pfn + i);
				142	}
				143
				144	/*
				145	* start_isolate_page_range() -- make page-allocation-type of range of pages
				146	* to be MIGRATE_ISOLATE.
				147	* @start_pfn: The lower PFN of the range to be isolated.
				148	* @end_pfn: The upper PFN of the range to be isolated.
Michal Nazarewicz	0815f3d	2012-04-03 15:06:15 +0200	[diff] [blame]	149	* @migratetype: migrate type to set in error recovery.
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	150	*
				151	* Making page-allocation-type to be MIGRATE_ISOLATE means free pages in
				152	* the range will never be allocated. Any free pages and pages freed in the
				153	* future will not be allocated again.
				154	*
				155	* start_pfn/end_pfn must be aligned to pageblock_order.
				156	* Returns 0 on success and -EBUSY if any part of range cannot be isolated.
				157	*/
Michal Nazarewicz	0815f3d	2012-04-03 15:06:15 +0200	[diff] [blame]	158	int start_isolate_page_range(unsigned long start_pfn, unsigned long end_pfn,
Wen Congyang	b023f46	2012-12-11 16:00:45 -0800	[diff] [blame]	159	unsigned migratetype, bool skip_hwpoisoned_pages)
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	160	{
				161	unsigned long pfn;
				162	unsigned long undo_pfn;
				163	struct page *page;
				164
				165	BUG_ON((start_pfn) & (pageblock_nr_pages - 1));
				166	BUG_ON((end_pfn) & (pageblock_nr_pages - 1));
				167
				168	for (pfn = start_pfn;
				169	pfn < end_pfn;
				170	pfn += pageblock_nr_pages) {
				171	page = __first_valid_page(pfn, pageblock_nr_pages);
Wen Congyang	b023f46	2012-12-11 16:00:45 -0800	[diff] [blame]	172	if (page &&
				173	set_migratetype_isolate(page, skip_hwpoisoned_pages)) {
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	174	undo_pfn = pfn;
				175	goto undo;
				176	}
				177	}
				178	return 0;
				179	undo:
				180	for (pfn = start_pfn;
KAMEZAWA Hiroyuki	dbc0e4c	2007-11-14 16:59:12 -0800	[diff] [blame]	181	pfn < undo_pfn;
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	182	pfn += pageblock_nr_pages)
Michal Nazarewicz	0815f3d	2012-04-03 15:06:15 +0200	[diff] [blame]	183	unset_migratetype_isolate(pfn_to_page(pfn), migratetype);
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	184
				185	return -EBUSY;
				186	}
				187
				188	/*
				189	* Make isolated pages available again.
				190	*/
Michal Nazarewicz	0815f3d	2012-04-03 15:06:15 +0200	[diff] [blame]	191	int undo_isolate_page_range(unsigned long start_pfn, unsigned long end_pfn,
				192	unsigned migratetype)
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	193	{
				194	unsigned long pfn;
				195	struct page *page;
				196	BUG_ON((start_pfn) & (pageblock_nr_pages - 1));
				197	BUG_ON((end_pfn) & (pageblock_nr_pages - 1));
				198	for (pfn = start_pfn;
				199	pfn < end_pfn;
				200	pfn += pageblock_nr_pages) {
				201	page = __first_valid_page(pfn, pageblock_nr_pages);
KAMEZAWA Hiroyuki	dbc0e4c	2007-11-14 16:59:12 -0800	[diff] [blame]	202	if (!page \|\| get_pageblock_migratetype(page) != MIGRATE_ISOLATE)
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	203	continue;
Michal Nazarewicz	0815f3d	2012-04-03 15:06:15 +0200	[diff] [blame]	204	unset_migratetype_isolate(page, migratetype);
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	205	}
				206	return 0;
				207	}
				208	/*
				209	* Test all pages in the range is free(means isolated) or not.
				210	* all pages in [start_pfn...end_pfn) must be in the same zone.
				211	* zone->lock must be held before call this.
				212	*
Michal Nazarewicz	0815f3d	2012-04-03 15:06:15 +0200	[diff] [blame]	213	* Returns 1 if all pages in the range are isolated.
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	214	*/
Joonsoo Kim	fea85cf	2016-01-14 15:18:39 -0800	[diff] [blame^]	215	static unsigned long
Wen Congyang	b023f46	2012-12-11 16:00:45 -0800	[diff] [blame]	216	__test_page_isolated_in_pageblock(unsigned long pfn, unsigned long end_pfn,
				217	bool skip_hwpoisoned_pages)
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	218	{
				219	struct page *page;
				220
				221	while (pfn < end_pfn) {
				222	if (!pfn_valid_within(pfn)) {
				223	pfn++;
				224	continue;
				225	}
				226	page = pfn_to_page(pfn);
Vlastimil Babka	aa016d1	2015-09-08 15:01:22 -0700	[diff] [blame]	227	if (PageBuddy(page))
Minchan Kim	435b405	2012-10-08 16:32:16 -0700	[diff] [blame]	228	/*
Vlastimil Babka	aa016d1	2015-09-08 15:01:22 -0700	[diff] [blame]	229	* If the page is on a free list, it has to be on
				230	* the correct MIGRATE_ISOLATE freelist. There is no
				231	* simple way to verify that as VM_BUG_ON(), though.
Minchan Kim	435b405	2012-10-08 16:32:16 -0700	[diff] [blame]	232	*/
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	233	pfn += 1 << page_order(page);
Vlastimil Babka	aa016d1	2015-09-08 15:01:22 -0700	[diff] [blame]	234	else if (skip_hwpoisoned_pages && PageHWPoison(page))
				235	/* A HWPoisoned page cannot be also PageBuddy */
Wen Congyang	b023f46	2012-12-11 16:00:45 -0800	[diff] [blame]	236	pfn++;
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	237	else
				238	break;
				239	}
Joonsoo Kim	fea85cf	2016-01-14 15:18:39 -0800	[diff] [blame^]	240
				241	return pfn;
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	242	}
				243
Wen Congyang	b023f46	2012-12-11 16:00:45 -0800	[diff] [blame]	244	int test_pages_isolated(unsigned long start_pfn, unsigned long end_pfn,
				245	bool skip_hwpoisoned_pages)
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	246	{
Gerald Schaefer	6c1b7f6	2008-10-02 14:50:16 -0700	[diff] [blame]	247	unsigned long pfn, flags;
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	248	struct page *page;
Gerald Schaefer	6c1b7f6	2008-10-02 14:50:16 -0700	[diff] [blame]	249	struct zone *zone;
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	250
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	251	/*
Tang Chen	85dbe70	2013-06-20 18:10:19 +0800	[diff] [blame]	252	* Note: pageblock_nr_pages != MAX_ORDER. Then, chunks of free pages
				253	* are not aligned to pageblock_nr_pages.
				254	* Then we just check migratetype first.
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	255	*/
				256	for (pfn = start_pfn; pfn < end_pfn; pfn += pageblock_nr_pages) {
				257	page = __first_valid_page(pfn, pageblock_nr_pages);
KAMEZAWA Hiroyuki	dbc0e4c	2007-11-14 16:59:12 -0800	[diff] [blame]	258	if (page && get_pageblock_migratetype(page) != MIGRATE_ISOLATE)
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	259	break;
				260	}
Gerald Schaefer	a70dcb9	2008-11-06 12:53:36 -0800	[diff] [blame]	261	page = __first_valid_page(start_pfn, end_pfn - start_pfn);
				262	if ((pfn < end_pfn) \|\| !page)
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	263	return -EBUSY;
Tang Chen	85dbe70	2013-06-20 18:10:19 +0800	[diff] [blame]	264	/* Check all pages are free or marked as ISOLATED */
Gerald Schaefer	a70dcb9	2008-11-06 12:53:36 -0800	[diff] [blame]	265	zone = page_zone(page);
Gerald Schaefer	6c1b7f6	2008-10-02 14:50:16 -0700	[diff] [blame]	266	spin_lock_irqsave(&zone->lock, flags);
Joonsoo Kim	fea85cf	2016-01-14 15:18:39 -0800	[diff] [blame^]	267	pfn = __test_page_isolated_in_pageblock(start_pfn, end_pfn,
Wen Congyang	b023f46	2012-12-11 16:00:45 -0800	[diff] [blame]	268	skip_hwpoisoned_pages);
Gerald Schaefer	6c1b7f6	2008-10-02 14:50:16 -0700	[diff] [blame]	269	spin_unlock_irqrestore(&zone->lock, flags);
Joonsoo Kim	fea85cf	2016-01-14 15:18:39 -0800	[diff] [blame^]	270
				271	return pfn < end_pfn ? -EBUSY : 0;
KAMEZAWA Hiroyuki	a5d76b54	2007-10-16 01:26:11 -0700	[diff] [blame]	272	}
Minchan Kim	723a064	2012-10-08 16:32:52 -0700	[diff] [blame]	273
				274	struct page alloc_migrate_target(struct page page, unsigned long private,
				275	int **resultp)
				276	{
				277	gfp_t gfp_mask = GFP_USER \| __GFP_MOVABLE;
				278
Naoya Horiguchi	c8721bb	2013-09-11 14:22:09 -0700	[diff] [blame]	279	/*
				280	* TODO: allocate a destination hugepage from a nearest neighbor node,
				281	* accordance with memory policy of the user process if possible. For
				282	* now as a simple work-around, we use the next node for destination.
				283	*/
				284	if (PageHuge(page)) {
				285	nodemask_t src = nodemask_of_node(page_to_nid(page));
				286	nodemask_t dst;
				287	nodes_complement(dst, src);
				288	return alloc_huge_page_node(page_hstate(compound_head(page)),
				289	next_node(page_to_nid(page), dst));
				290	}
				291
Minchan Kim	723a064	2012-10-08 16:32:52 -0700	[diff] [blame]	292	if (PageHighMem(page))
				293	gfp_mask \|= __GFP_HIGHMEM;
				294
				295	return alloc_page(gfp_mask);
				296	}