Blame - kernel/bpf/inode.c - SHIFTPHONES/mainline/linux

blob: fc5b103512e7231b1542e4495189721b7728da31 [file] [log] [blame]

Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	1	/*
				2	* Minimal file system backend for holding eBPF maps and programs,
				3	* used by bpf(2) object pinning.
				4	*
				5	* Authors:
				6	*
				7	* Daniel Borkmann <daniel@iogearbox.net>
				8	*
				9	* This program is free software; you can redistribute it and/or
				10	* modify it under the terms of the GNU General Public License
				11	* version 2 as published by the Free Software Foundation.
				12	*/
				13
Paul Gortmaker	a536a6e	2016-07-11 12:51:01 -0400	[diff] [blame]	14	#include <linux/init.h>
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	15	#include <linux/magic.h>
				16	#include <linux/major.h>
				17	#include <linux/mount.h>
				18	#include <linux/namei.h>
				19	#include <linux/fs.h>
				20	#include <linux/kdev_t.h>
Daniel Borkmann	a3af5f8	2016-11-26 01:28:08 +0100	[diff] [blame]	21	#include <linux/parser.h>
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	22	#include <linux/filter.h>
				23	#include <linux/bpf.h>
Daniel Borkmann	a67edbf	2017-01-25 02:28:18 +0100	[diff] [blame]	24	#include <linux/bpf_trace.h>
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	25
				26	enum bpf_type {
				27	BPF_TYPE_UNSPEC = 0,
				28	BPF_TYPE_PROG,
				29	BPF_TYPE_MAP,
				30	};
				31
				32	static void bpf_any_get(void raw, enum bpf_type type)
				33	{
				34	switch (type) {
				35	case BPF_TYPE_PROG:
Alexei Starovoitov	92117d8	2016-04-27 18:56:20 -0700	[diff] [blame]	36	raw = bpf_prog_inc(raw);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	37	break;
				38	case BPF_TYPE_MAP:
Alexei Starovoitov	92117d8	2016-04-27 18:56:20 -0700	[diff] [blame]	39	raw = bpf_map_inc(raw, true);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	40	break;
				41	default:
				42	WARN_ON_ONCE(1);
				43	break;
				44	}
				45
				46	return raw;
				47	}
				48
				49	static void bpf_any_put(void *raw, enum bpf_type type)
				50	{
				51	switch (type) {
				52	case BPF_TYPE_PROG:
				53	bpf_prog_put(raw);
				54	break;
				55	case BPF_TYPE_MAP:
Daniel Borkmann	c9da161	2015-11-24 21:28:15 +0100	[diff] [blame]	56	bpf_map_put_with_uref(raw);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	57	break;
				58	default:
				59	WARN_ON_ONCE(1);
				60	break;
				61	}
				62	}
				63
				64	static void bpf_fd_probe_obj(u32 ufd, enum bpf_type type)
				65	{
				66	void *raw;
				67
				68	*type = BPF_TYPE_MAP;
Daniel Borkmann	c9da161	2015-11-24 21:28:15 +0100	[diff] [blame]	69	raw = bpf_map_get_with_uref(ufd);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	70	if (IS_ERR(raw)) {
				71	*type = BPF_TYPE_PROG;
				72	raw = bpf_prog_get(ufd);
				73	}
				74
				75	return raw;
				76	}
				77
				78	static const struct inode_operations bpf_dir_iops;
				79
				80	static const struct inode_operations bpf_prog_iops = { };
				81	static const struct inode_operations bpf_map_iops = { };
				82
				83	static struct inode bpf_get_inode(struct super_block sb,
				84	const struct inode *dir,
				85	umode_t mode)
				86	{
				87	struct inode *inode;
				88
				89	switch (mode & S_IFMT) {
				90	case S_IFDIR:
				91	case S_IFREG:
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	92	case S_IFLNK:
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	93	break;
				94	default:
				95	return ERR_PTR(-EINVAL);
				96	}
				97
				98	inode = new_inode(sb);
				99	if (!inode)
				100	return ERR_PTR(-ENOSPC);
				101
				102	inode->i_ino = get_next_ino();
Deepa Dinamani	078cd82	2016-09-14 07:48:04 -0700	[diff] [blame]	103	inode->i_atime = current_time(inode);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	104	inode->i_mtime = inode->i_atime;
				105	inode->i_ctime = inode->i_atime;
				106
				107	inode_init_owner(inode, dir, mode);
				108
				109	return inode;
				110	}
				111
				112	static int bpf_inode_type(const struct inode inode, enum bpf_type type)
				113	{
				114	*type = BPF_TYPE_UNSPEC;
				115	if (inode->i_op == &bpf_prog_iops)
				116	*type = BPF_TYPE_PROG;
				117	else if (inode->i_op == &bpf_map_iops)
				118	*type = BPF_TYPE_MAP;
				119	else
				120	return -EACCES;
				121
				122	return 0;
				123	}
				124
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	125	static void bpf_dentry_finalize(struct dentry dentry, struct inode inode,
				126	struct inode *dir)
				127	{
				128	d_instantiate(dentry, inode);
				129	dget(dentry);
				130
				131	dir->i_mtime = current_time(dir);
				132	dir->i_ctime = dir->i_mtime;
				133	}
				134
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	135	static int bpf_mkdir(struct inode dir, struct dentry dentry, umode_t mode)
				136	{
				137	struct inode *inode;
				138
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	139	inode = bpf_get_inode(dir->i_sb, dir, mode \| S_IFDIR);
				140	if (IS_ERR(inode))
				141	return PTR_ERR(inode);
				142
				143	inode->i_op = &bpf_dir_iops;
				144	inode->i_fop = &simple_dir_operations;
				145
				146	inc_nlink(inode);
				147	inc_nlink(dir);
				148
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	149	bpf_dentry_finalize(dentry, inode, dir);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	150	return 0;
				151	}
				152
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	153	struct map_iter {
				154	void *key;
				155	bool done;
				156	};
				157
				158	static struct map_iter map_iter(struct seq_file m)
				159	{
				160	return m->private;
				161	}
				162
				163	static struct bpf_map seq_file_to_map(struct seq_file m)
				164	{
				165	return file_inode(m->file)->i_private;
				166	}
				167
				168	static void map_iter_free(struct map_iter *iter)
				169	{
				170	if (iter) {
				171	kfree(iter->key);
				172	kfree(iter);
				173	}
				174	}
				175
				176	static struct map_iter map_iter_alloc(struct bpf_map map)
				177	{
				178	struct map_iter *iter;
				179
				180	iter = kzalloc(sizeof(*iter), GFP_KERNEL \| __GFP_NOWARN);
				181	if (!iter)
				182	goto error;
				183
				184	iter->key = kzalloc(map->key_size, GFP_KERNEL \| __GFP_NOWARN);
				185	if (!iter->key)
				186	goto error;
				187
				188	return iter;
				189
				190	error:
				191	map_iter_free(iter);
				192	return NULL;
				193	}
				194
				195	static void map_seq_next(struct seq_file m, void v, loff_t pos)
				196	{
				197	struct bpf_map *map = seq_file_to_map(m);
				198	void *key = map_iter(m)->key;
Yonghong Song	dc1508a	2018-08-09 08:55:19 -0700	[diff] [blame]	199	void *prev_key;
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	200
				201	if (map_iter(m)->done)
				202	return NULL;
				203
				204	if (unlikely(v == SEQ_START_TOKEN))
Yonghong Song	dc1508a	2018-08-09 08:55:19 -0700	[diff] [blame]	205	prev_key = NULL;
				206	else
				207	prev_key = key;
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	208
Yonghong Song	dc1508a	2018-08-09 08:55:19 -0700	[diff] [blame]	209	if (map->ops->map_get_next_key(map, prev_key, key)) {
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	210	map_iter(m)->done = true;
				211	return NULL;
				212	}
				213
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	214	++(*pos);
				215	return key;
				216	}
				217
				218	static void map_seq_start(struct seq_file m, loff_t *pos)
				219	{
				220	if (map_iter(m)->done)
				221	return NULL;
				222
				223	return *pos ? map_iter(m)->key : SEQ_START_TOKEN;
				224	}
				225
				226	static void map_seq_stop(struct seq_file m, void v)
				227	{
				228	}
				229
				230	static int map_seq_show(struct seq_file m, void v)
				231	{
				232	struct bpf_map *map = seq_file_to_map(m);
				233	void *key = map_iter(m)->key;
				234
				235	if (unlikely(v == SEQ_START_TOKEN)) {
				236	seq_puts(m, "# WARNING!! The output is for debug purpose only\n");
				237	seq_puts(m, "# WARNING!! The output format will change\n");
				238	} else {
				239	map->ops->map_seq_show_elem(map, key, m);
				240	}
				241
				242	return 0;
				243	}
				244
				245	static const struct seq_operations bpffs_map_seq_ops = {
				246	.start = map_seq_start,
				247	.next = map_seq_next,
				248	.show = map_seq_show,
				249	.stop = map_seq_stop,
				250	};
				251
				252	static int bpffs_map_open(struct inode inode, struct file file)
				253	{
				254	struct bpf_map *map = inode->i_private;
				255	struct map_iter *iter;
				256	struct seq_file *m;
				257	int err;
				258
				259	iter = map_iter_alloc(map);
				260	if (!iter)
				261	return -ENOMEM;
				262
				263	err = seq_open(file, &bpffs_map_seq_ops);
				264	if (err) {
				265	map_iter_free(iter);
				266	return err;
				267	}
				268
				269	m = file->private_data;
				270	m->private = iter;
				271
				272	return 0;
				273	}
				274
				275	static int bpffs_map_release(struct inode inode, struct file file)
				276	{
				277	struct seq_file *m = file->private_data;
				278
				279	map_iter_free(map_iter(m));
				280
				281	return seq_release(inode, file);
				282	}
				283
				284	/* bpffs_map_fops should only implement the basic
				285	* read operation for a BPF map. The purpose is to
				286	* provide a simple user intuitive way to do
				287	* "cat bpffs/pathto/a-pinned-map".
				288	*
				289	* Other operations (e.g. write, lookup...) should be realized by
				290	* the userspace tools (e.g. bpftool) through the
				291	* BPF_OBJ_GET_INFO_BY_FD and the map's lookup/update
				292	* interface.
				293	*/
				294	static const struct file_operations bpffs_map_fops = {
				295	.open = bpffs_map_open,
				296	.read = seq_read,
				297	.release = bpffs_map_release,
				298	};
				299
Daniel Borkmann	b165585	2018-06-08 18:10:34 +0200	[diff] [blame]	300	static int bpffs_obj_open(struct inode inode, struct file file)
				301	{
				302	return -EIO;
				303	}
				304
				305	static const struct file_operations bpffs_obj_fops = {
				306	.open = bpffs_obj_open,
				307	};
				308
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	309	static int bpf_mkobj_ops(struct dentry dentry, umode_t mode, void raw,
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	310	const struct inode_operations *iops,
				311	const struct file_operations *fops)
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	312	{
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	313	struct inode *dir = dentry->d_parent->d_inode;
				314	struct inode *inode = bpf_get_inode(dir->i_sb, dir, mode);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	315	if (IS_ERR(inode))
				316	return PTR_ERR(inode);
				317
				318	inode->i_op = iops;
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	319	inode->i_fop = fops;
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	320	inode->i_private = raw;
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	321
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	322	bpf_dentry_finalize(dentry, inode, dir);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	323	return 0;
				324	}
				325
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	326	static int bpf_mkprog(struct dentry dentry, umode_t mode, void arg)
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	327	{
Daniel Borkmann	b165585	2018-06-08 18:10:34 +0200	[diff] [blame]	328	return bpf_mkobj_ops(dentry, mode, arg, &bpf_prog_iops,
				329	&bpffs_obj_fops);
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	330	}
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	331
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	332	static int bpf_mkmap(struct dentry dentry, umode_t mode, void arg)
				333	{
Martin KaFai Lau	a26ca7c	2018-04-18 15:56:03 -0700	[diff] [blame]	334	struct bpf_map *map = arg;
				335
				336	return bpf_mkobj_ops(dentry, mode, arg, &bpf_map_iops,
Daniel Borkmann	b165585	2018-06-08 18:10:34 +0200	[diff] [blame]	337	map->btf ? &bpffs_map_fops : &bpffs_obj_fops);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	338	}
				339
Al Viro	0c93b7d	2016-03-25 12:06:51 -0400	[diff] [blame]	340	static struct dentry *
				341	bpf_lookup(struct inode dir, struct dentry dentry, unsigned flags)
Daniel Borkmann	bb35a6e	2015-12-10 22:33:49 +0100	[diff] [blame]	342	{
Quentin Monnet	6d8cb04	2018-03-08 23:46:33 -0800	[diff] [blame]	343	/* Dots in names (e.g. "/sys/fs/bpf/foo.bar") are reserved for future
				344	* extensions.
				345	*/
Al Viro	0c93b7d	2016-03-25 12:06:51 -0400	[diff] [blame]	346	if (strchr(dentry->d_name.name, '.'))
				347	return ERR_PTR(-EPERM);
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	348
Al Viro	0c93b7d	2016-03-25 12:06:51 -0400	[diff] [blame]	349	return simple_lookup(dir, dentry, flags);
Daniel Borkmann	bb35a6e	2015-12-10 22:33:49 +0100	[diff] [blame]	350	}
				351
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	352	static int bpf_symlink(struct inode dir, struct dentry dentry,
				353	const char *target)
				354	{
				355	char *link = kstrdup(target, GFP_USER \| __GFP_NOWARN);
				356	struct inode *inode;
				357
				358	if (!link)
				359	return -ENOMEM;
				360
				361	inode = bpf_get_inode(dir->i_sb, dir, S_IRWXUGO \| S_IFLNK);
				362	if (IS_ERR(inode)) {
				363	kfree(link);
				364	return PTR_ERR(inode);
				365	}
				366
				367	inode->i_op = &simple_symlink_inode_operations;
				368	inode->i_link = link;
				369
				370	bpf_dentry_finalize(dentry, inode, dir);
				371	return 0;
				372	}
				373
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	374	static const struct inode_operations bpf_dir_iops = {
Al Viro	0c93b7d	2016-03-25 12:06:51 -0400	[diff] [blame]	375	.lookup = bpf_lookup,
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	376	.mkdir = bpf_mkdir,
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	377	.symlink = bpf_symlink,
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	378	.rmdir = simple_rmdir,
Al Viro	0c93b7d	2016-03-25 12:06:51 -0400	[diff] [blame]	379	.rename = simple_rename,
				380	.link = simple_link,
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	381	.unlink = simple_unlink,
				382	};
				383
				384	static int bpf_obj_do_pin(const struct filename pathname, void raw,
				385	enum bpf_type type)
				386	{
				387	struct dentry *dentry;
				388	struct inode *dir;
				389	struct path path;
				390	umode_t mode;
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	391	int ret;
				392
				393	dentry = kern_path_create(AT_FDCWD, pathname->name, &path, 0);
				394	if (IS_ERR(dentry))
				395	return PTR_ERR(dentry);
				396
				397	mode = S_IFREG \| ((S_IRUSR \| S_IWUSR) & ~current_umask());
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	398
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	399	ret = security_path_mknod(&path, dentry, mode, 0);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	400	if (ret)
				401	goto out;
				402
				403	dir = d_inode(path.dentry);
				404	if (dir->i_op != &bpf_dir_iops) {
				405	ret = -EPERM;
				406	goto out;
				407	}
				408
Al Viro	a4a0683	2017-12-01 17:22:19 -0500	[diff] [blame]	409	switch (type) {
				410	case BPF_TYPE_PROG:
				411	ret = vfs_mkobj(dentry, mode, bpf_mkprog, raw);
				412	break;
				413	case BPF_TYPE_MAP:
				414	ret = vfs_mkobj(dentry, mode, bpf_mkmap, raw);
				415	break;
				416	default:
				417	ret = -EPERM;
				418	}
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	419	out:
				420	done_path_create(&path, dentry);
				421	return ret;
				422	}
				423
				424	int bpf_obj_pin_user(u32 ufd, const char __user *pathname)
				425	{
				426	struct filename *pname;
				427	enum bpf_type type;
				428	void *raw;
				429	int ret;
				430
				431	pname = getname(pathname);
				432	if (IS_ERR(pname))
				433	return PTR_ERR(pname);
				434
				435	raw = bpf_fd_probe_obj(ufd, &type);
				436	if (IS_ERR(raw)) {
				437	ret = PTR_ERR(raw);
				438	goto out;
				439	}
				440
				441	ret = bpf_obj_do_pin(pname, raw, type);
				442	if (ret != 0)
				443	bpf_any_put(raw, type);
				444	out:
				445	putname(pname);
				446	return ret;
				447	}
				448
				449	static void bpf_obj_do_get(const struct filename pathname,
Chenbo Feng	6e71b04	2017-10-18 13:00:22 -0700	[diff] [blame]	450	enum bpf_type *type, int flags)
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	451	{
				452	struct inode *inode;
				453	struct path path;
				454	void *raw;
				455	int ret;
				456
				457	ret = kern_path(pathname->name, LOOKUP_FOLLOW, &path);
				458	if (ret)
				459	return ERR_PTR(ret);
				460
				461	inode = d_backing_inode(path.dentry);
Chenbo Feng	6e71b04	2017-10-18 13:00:22 -0700	[diff] [blame]	462	ret = inode_permission(inode, ACC_MODE(flags));
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	463	if (ret)
				464	goto out;
				465
				466	ret = bpf_inode_type(inode, type);
				467	if (ret)
				468	goto out;
				469
				470	raw = bpf_any_get(inode->i_private, *type);
Alexei Starovoitov	92117d8	2016-04-27 18:56:20 -0700	[diff] [blame]	471	if (!IS_ERR(raw))
				472	touch_atime(&path);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	473
				474	path_put(&path);
				475	return raw;
				476	out:
				477	path_put(&path);
				478	return ERR_PTR(ret);
				479	}
				480
Chenbo Feng	6e71b04	2017-10-18 13:00:22 -0700	[diff] [blame]	481	int bpf_obj_get_user(const char __user *pathname, int flags)
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	482	{
				483	enum bpf_type type = BPF_TYPE_UNSPEC;
				484	struct filename *pname;
				485	int ret = -ENOENT;
Chenbo Feng	6e71b04	2017-10-18 13:00:22 -0700	[diff] [blame]	486	int f_flags;
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	487	void *raw;
				488
Chenbo Feng	6e71b04	2017-10-18 13:00:22 -0700	[diff] [blame]	489	f_flags = bpf_get_file_flag(flags);
				490	if (f_flags < 0)
				491	return f_flags;
				492
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	493	pname = getname(pathname);
				494	if (IS_ERR(pname))
				495	return PTR_ERR(pname);
				496
Chenbo Feng	6e71b04	2017-10-18 13:00:22 -0700	[diff] [blame]	497	raw = bpf_obj_do_get(pname, &type, f_flags);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	498	if (IS_ERR(raw)) {
				499	ret = PTR_ERR(raw);
				500	goto out;
				501	}
				502
				503	if (type == BPF_TYPE_PROG)
				504	ret = bpf_prog_new_fd(raw);
				505	else if (type == BPF_TYPE_MAP)
Chenbo Feng	6e71b04	2017-10-18 13:00:22 -0700	[diff] [blame]	506	ret = bpf_map_new_fd(raw, f_flags);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	507	else
				508	goto out;
				509
Alexei Starovoitov	4d220ed	2018-04-28 19:56:37 -0700	[diff] [blame]	510	if (ret < 0)
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	511	bpf_any_put(raw, type);
				512	out:
				513	putname(pname);
				514	return ret;
				515	}
Al Viro	040ee69	2017-12-02 20:20:38 -0500	[diff] [blame]	516
				517	static struct bpf_prog __get_prog_inode(struct inode inode, enum bpf_prog_type type)
				518	{
				519	struct bpf_prog *prog;
				520	int ret = inode_permission(inode, MAY_READ \| MAY_WRITE);
				521	if (ret)
				522	return ERR_PTR(ret);
				523
				524	if (inode->i_op == &bpf_map_iops)
				525	return ERR_PTR(-EINVAL);
				526	if (inode->i_op != &bpf_prog_iops)
				527	return ERR_PTR(-EACCES);
				528
				529	prog = inode->i_private;
				530
				531	ret = security_bpf_prog(prog);
				532	if (ret < 0)
				533	return ERR_PTR(ret);
				534
				535	if (!bpf_prog_get_ok(prog, &type, false))
				536	return ERR_PTR(-EINVAL);
				537
				538	return bpf_prog_inc(prog);
				539	}
				540
				541	struct bpf_prog bpf_prog_get_type_path(const char name, enum bpf_prog_type type)
				542	{
				543	struct bpf_prog *prog;
				544	struct path path;
				545	int ret = kern_path(name, LOOKUP_FOLLOW, &path);
				546	if (ret)
				547	return ERR_PTR(ret);
				548	prog = __get_prog_inode(d_backing_inode(path.dentry), type);
				549	if (!IS_ERR(prog))
				550	touch_atime(&path);
				551	path_put(&path);
				552	return prog;
				553	}
				554	EXPORT_SYMBOL(bpf_prog_get_type_path);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	555
				556	static void bpf_evict_inode(struct inode *inode)
				557	{
				558	enum bpf_type type;
				559
				560	truncate_inode_pages_final(&inode->i_data);
				561	clear_inode(inode);
				562
Daniel Borkmann	0f98621	2016-10-29 02:30:46 +0200	[diff] [blame]	563	if (S_ISLNK(inode->i_mode))
				564	kfree(inode->i_link);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	565	if (!bpf_inode_type(inode, &type))
				566	bpf_any_put(inode->i_private, type);
				567	}
				568
David Howells	4cc7c18	2017-07-05 16:24:49 +0100	[diff] [blame]	569	/*
				570	* Display the mount options in /proc/mounts.
				571	*/
				572	static int bpf_show_options(struct seq_file m, struct dentry root)
				573	{
				574	umode_t mode = d_inode(root)->i_mode & S_IALLUGO & ~S_ISVTX;
				575
				576	if (mode != S_IRWXUGO)
				577	seq_printf(m, ",mode=%o", mode);
				578	return 0;
				579	}
				580
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	581	static const struct super_operations bpf_super_ops = {
				582	.statfs = simple_statfs,
				583	.drop_inode = generic_delete_inode,
David Howells	4cc7c18	2017-07-05 16:24:49 +0100	[diff] [blame]	584	.show_options = bpf_show_options,
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	585	.evict_inode = bpf_evict_inode,
				586	};
				587
Daniel Borkmann	a3af5f8	2016-11-26 01:28:08 +0100	[diff] [blame]	588	enum {
				589	OPT_MODE,
				590	OPT_ERR,
				591	};
				592
				593	static const match_table_t bpf_mount_tokens = {
				594	{ OPT_MODE, "mode=%o" },
				595	{ OPT_ERR, NULL },
				596	};
				597
				598	struct bpf_mount_opts {
				599	umode_t mode;
				600	};
				601
				602	static int bpf_parse_options(char data, struct bpf_mount_opts opts)
				603	{
				604	substring_t args[MAX_OPT_ARGS];
				605	int option, token;
				606	char *ptr;
				607
				608	opts->mode = S_IRWXUGO;
				609
				610	while ((ptr = strsep(&data, ",")) != NULL) {
				611	if (!*ptr)
				612	continue;
				613
				614	token = match_token(ptr, bpf_mount_tokens, args);
				615	switch (token) {
				616	case OPT_MODE:
				617	if (match_octal(&args[0], &option))
				618	return -EINVAL;
				619	opts->mode = option & S_IALLUGO;
				620	break;
				621	/* We might like to report bad mount options here, but
				622	* traditionally we've ignored all mount options, so we'd
				623	* better continue to ignore non-existing options for bpf.
				624	*/
				625	}
				626	}
				627
				628	return 0;
				629	}
				630
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	631	static int bpf_fill_super(struct super_block sb, void data, int silent)
				632	{
Eric Biggers	cda3712	2017-03-25 21:15:37 -0700	[diff] [blame]	633	static const struct tree_descr bpf_rfiles[] = { { "" } };
Daniel Borkmann	a3af5f8	2016-11-26 01:28:08 +0100	[diff] [blame]	634	struct bpf_mount_opts opts;
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	635	struct inode *inode;
				636	int ret;
				637
Daniel Borkmann	a3af5f8	2016-11-26 01:28:08 +0100	[diff] [blame]	638	ret = bpf_parse_options(data, &opts);
				639	if (ret)
				640	return ret;
				641
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	642	ret = simple_fill_super(sb, BPF_FS_MAGIC, bpf_rfiles);
				643	if (ret)
				644	return ret;
				645
				646	sb->s_op = &bpf_super_ops;
				647
				648	inode = sb->s_root->d_inode;
				649	inode->i_op = &bpf_dir_iops;
				650	inode->i_mode &= ~S_IALLUGO;
Daniel Borkmann	a3af5f8	2016-11-26 01:28:08 +0100	[diff] [blame]	651	inode->i_mode \|= S_ISVTX \| opts.mode;
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	652
				653	return 0;
				654	}
				655
				656	static struct dentry bpf_mount(struct file_system_type type, int flags,
				657	const char dev_name, void data)
				658	{
Eric W. Biederman	e27f4a9	2016-05-20 17:22:48 -0500	[diff] [blame]	659	return mount_nodev(type, flags, data, bpf_fill_super);
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	660	}
				661
				662	static struct file_system_type bpf_fs_type = {
				663	.owner = THIS_MODULE,
				664	.name = "bpf",
				665	.mount = bpf_mount,
				666	.kill_sb = kill_litter_super,
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	667	};
				668
Daniel Borkmann	b219775	2015-10-29 14:58:09 +0100	[diff] [blame]	669	static int __init bpf_init(void)
				670	{
				671	int ret;
				672
				673	ret = sysfs_create_mount_point(fs_kobj, "bpf");
				674	if (ret)
				675	return ret;
				676
				677	ret = register_filesystem(&bpf_fs_type);
				678	if (ret)
				679	sysfs_remove_mount_point(fs_kobj, "bpf");
				680
				681	return ret;
				682	}
				683	fs_initcall(bpf_init);