tile: use a more conservative __my_cpu_offset in CONFIG_PREEMPT
authorChris Metcalf <cmetcalf@tilera.com>
Thu, 26 Sep 2013 17:24:53 +0000 (13:24 -0400)
committerGreg Kroah-Hartman <gregkh@linuxfoundation.org>
Sun, 13 Oct 2013 21:51:08 +0000 (14:51 -0700)
commita9f1434b8e47776e2b6d42a5556516209f5ba3ae
tree3a4b2e1d35eb04faa988be590678841ba0f7d218
parentb8a3fdb8cfff87da926b868c3263a8a51c02af47
tile: use a more conservative __my_cpu_offset in CONFIG_PREEMPT

commit f862eefec0b68e099a9fa58d3761ffb10bad97e1 upstream.

It turns out the kernel relies on barrier() to force a reload of the
percpu offset value.  Since we can't easily modify the definition of
barrier() to include "tp" as an output register, we instead provide a
definition of __my_cpu_offset as extended assembly that includes a fake
stack read to hazard against barrier(), forcing gcc to know that it
must reread "tp" and recompute anything based on "tp" after a barrier.

This fixes observed hangs in the slub allocator when we are looping
on a percpu cmpxchg_double.

A similar fix for ARMv7 was made in June in change 509eb76ebf97.

Signed-off-by: Chris Metcalf <cmetcalf@tilera.com>
Signed-off-by: Greg Kroah-Hartman <gregkh@linuxfoundation.org>
arch/tile/include/asm/percpu.h