[PATCH] D84743: [Clang][AMDGCN] Universal device offloading macros header

Saiyedul Islam via Phabricator via cfe-commits Tue, 28 Jul 2020 05:24:22 -0700

saiislam created this revision.
saiislam added reviewers: jdoerfert, ABataev, JonChesterfield.
Herald added subscribers: cfe-commits, Anastasia.
Herald added a project: clang.
Harbormaster failed remote builds in B65994: Diff 281183!
Harbormaster returned this revision to the author for changes because remote 
builds failed.
saiislam updated this revision to Diff 281189.
saiislam added a comment.
saiislam requested review of this revision.
Herald added a subscriber: sstefan1.


Fixed clang-tidy warnings.


This header creates macros  _DEVICE_ARCH and _DEVICE_GPU with values. This
header exists because compiler macros are inconsistent in specifying if a
compiliation is a device pass or a host pass. There is also inconsistency in
how the device architecture and type are specified during a device pass. The
inconsistencies are between OpenMP, CUDA, HIP, and OpenCL. The macro logic
in this header is aware of these inconsistencies and sets useful values for
_DEVICE_ARCH and _DEVICE_GPU during a device compilation. The macros will
not be defined during a host compilation pass. So "#ifndef _DEVICE_ARCH" can
be used by users to imply a host compilation. This header must remain a
preprocessing header only because it is intended to be used by different
languages.

Originally authored by Greg Rodgers (@gregrodgers).


Repository:
  rG LLVM Github Monorepo

https://reviews.llvm.org/D84743

Files:
  clang/lib/Headers/offload_macros.h

Index: clang/lib/Headers/offload_macros.h
===================================================================
--- /dev/null
+++ clang/lib/Headers/offload_macros.h
@@ -0,0 +1,118 @@
+//===--- offload_macros.h - Universal _DEVICE Offloading Macros Header ---===//
+//
+// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
+// See https://llvm.org/LICENSE.txt for license information.
+// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
+//
+//===-----------------------------------------------------------------------===
+//
+// This header creates macros  _DEVICE_ARCH and _DEVICE_GPU with values. This
+// header exists because compiler macros are inconsistent in specifying if a
+// compiliation is a device pass or a host pass. There is also inconsistency in
+// how the device architecture and type are specified during a device pass. The
+// inconsistencies are between OpenMP, CUDA, HIP, and OpenCL. The macro logic
+// in this header is aware of these inconsistencies and sets useful values for
+// _DEVICE_ARCH and _DEVICE_GPU during a device compilation. The macros will
+// not be defined during a host compilation pass. So "#ifndef _DEVICE_ARCH" can
+// be used by users to imply a host compilation. This header must remain a
+// preprocessing header only because it is intended to be used by different
+// languages.
+//
+//===----------------------------------------------------------------------===//
+//===----------------------------------------------------------------------===//
+
+#ifndef LLVM_CLANG_LIB_HEADERS_OFFLOAD_MACROS_H
+#define LLVM_CLANG_LIB_HEADERS_OFFLOAD_MACROS_H
+
+#undef _DEVICE_GPU
+#undef _DEVICE_ARCH
+
+#if defined(_OPENMP)
+// OpenMP does not set architecture macros on host pass.
+// So if either set, this is an OpenMP  device pass.
+#if defined(__AMDGCN__) || defined(__NVPTX__)
+#if defined(__AMDGCN__)
+#define _DEVICE_ARCH amdgcn
+// _DEVICE_GPU set below
+#else
+#define _DEVICE_ARCH nvptx64
+#define _DEVICE_GPU __CUDA_ARCH__
+#endif
+#endif
+#elif defined(__CUDA_ARCH__)
+// CUDA sets macros __NVPTX__ on host pass. So use __CUDA_ARCH__
+// to determine if this is device pass.
+#define _DEVICE_ARCH nvptx64
+#define _DEVICE_GPU __CUDA_ARCH__
+#elif defined(__HIP_DEVICE_COMPILE__)
+// HIP sets macros __AMDGCN__ on host pass. So use __HIP_DEVICE_COMPILE__
+// to determine if this is device pass.
+#define _DEVICE_ARCH amdgcn
+// _DEVICE_GPU set below
+#elif defined(__SYCL_DEVICE_ONLY__)
+#if defined(__AMDGCN__)
+#define _DEVICE_ARCH amdgcn
+// _DEVICE_GPU set below
+#else
+#define _DEVICE_ARCH nvptx64
+#define _DEVICE_GPU __CUDA_ARCH__
+#endif
+#elif defined(__OPENCL_C_VERSION__) || defined(__OPENCL_CPP_VERSION__)
+#if defined(__AMDGCN__)
+#define _DEVICE_ARCH amdgcn
+// _DEVICE_GPU set below
+#endif
+#if defined(__NVPTX__)
+#define _DEVICE_ARCH nvptx64
+#define _DEVICE_GPU __CUDA_ARCH__
+#endif
+#endif
+
+#if defined(_DEVICE_ARCH) && (_DEVICE_ARCH == amdgcn)
+// AMD uses binary macros only, so create a value for _DEVICE_GPU
+#if defined(__gfx906__)
+#define _DEVICE_GPU 9060
+#elif defined(__gfx900__)
+#define _DEVICE_GPU 9000
+#elif defined(__gfx601__)
+#define _DEVICE_GPU 6010
+#elif defined(__gfx700__)
+#define _DEVICE_GPU 7000
+#elif defined(__gfx701__)
+#define _DEVICE_GPU 7010
+#elif defined(__gfx702__)
+#define _DEVICE_GPU 7020
+#elif defined(__gfx703__)
+#define _DEVICE_GPU 7030
+#elif defined(__gfx801__)
+#define _DEVICE_GPU 8010
+#elif defined(__gfx802__)
+#define _DEVICE_GPU 8020
+#elif defined(__gfx803__)
+#define _DEVICE_GPU 8030
+#elif defined(__gfx810__)
+#define _DEVICE_GPU 8100
+#elif defined(__gfx900__)
+#define _DEVICE_GPU 9000
+#elif defined(__gfx902__)
+#define _DEVICE_GPU 9020
+#elif defined(__gfx904__)
+#define _DEVICE_GPU 9040
+#elif defined(__gfx906__)
+#define _DEVICE_GPU 9060
+#elif defined(__gfx909__)
+#define _DEVICE_GPU 9090
+#elif defined(__gfx1010__)
+#define _DEVICE_GPU 10100
+#elif defined(__gfx1011__)
+#define _DEVICE_GPU 10110
+#elif defined(__gfx1012__)
+#define _DEVICE_GPU 10120
+#elif defined(__gfx1030__)
+#define _DEVICE_GPU 10300
+#else
+#define _DEVICE_GPU UNKNOWN
+#endif
+#endif
+
+#endif // LLVM_CLANG_LIB_HEADERS_OFFLOAD_MACROS_H
\ No newline at end of file

_______________________________________________
cfe-commits mailing list
[email protected]
https://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-commits

[PATCH] D84743: [Clang][AMDGCN] Universal device offloading macros header

Reply via email to