src - FreeBSD source tree

diff options


context:
space:
mode:

author	Dimitry Andric <dim@FreeBSD.org>	2016-07-23 20:41:05 +0000
committer	Dimitry Andric <dim@FreeBSD.org>	2016-07-23 20:41:05 +0000
commit	01095a5d43bbfde13731688ddcf6048ebb8b7721 (patch)
tree	4def12e759965de927d963ac65840d663ef9d1ea /test/CodeGen/AMDGPU/vgpr-spill-emergency-stack-slot-compute.ll
parent	f0f4822ed4b66e3579e92a89f368f8fb860e218e (diff)
download	src-01095a5d43bbfde13731688ddcf6048ebb8b7721.tar.gz src-01095a5d43bbfde13731688ddcf6048ebb8b7721.zip

Vendor import of llvm release_39 branch r276489:vendor/llvm/llvm-release_39-r276489

https://llvm.org/svn/llvm-project/llvm/branches/release_39@276489

Notes

Notes: svn path=/vendor/llvm/dist/; revision=303231 svn path=/vendor/llvm/llvm-release_39-r276489/; revision=303232; tag=vendor/llvm/llvm-release_39-r276489

Diffstat (limited to 'test/CodeGen/AMDGPU/vgpr-spill-emergency-stack-slot-compute.ll')

-rw-r--r--

test/CodeGen/AMDGPU/vgpr-spill-emergency-stack-slot-compute.ll

1 files changed, 30 insertions, 18 deletions

diff --git a/test/CodeGen/AMDGPU/vgpr-spill-emergency-stack-slot-compute.ll b/test/CodeGen/AMDGPU/vgpr-spill-emergency-stack-slot-compute.ll
index cd7c78f408dd..6c33bc98c605 100644
--- a/test/CodeGen/AMDGPU/vgpr-spill-emergency-stack-slot-compute.ll
+++ b/test/CodeGen/AMDGPU/vgpr-spill-emergency-stack-slot-compute.ll

@@ -1,7 +1,7 @@

-; RUN: llc -march=amdgcn -mcpu=tahiti -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=SI %s

-; RUN: llc -march=amdgcn -mcpu=fiji -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=VI %s

-; XUN: llc -march=amdgcn -mcpu=hawaii -mtriple=amdgcn-unknown-amdhsa -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=CIHSA %s

-; XUN: llc -march=amdgcn -mcpu=fiji -mtriple=amdgcn-unknown-amdhsa -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=VIHSA %s

+; RUN: llc -march=amdgcn -mcpu=tahiti -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=GCNMESA -check-prefix=SIMESA %s

+; RUN: llc -march=amdgcn -mcpu=fiji -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=GCNMESA -check-prefix=VIMESA %s

+; RUN: llc -march=amdgcn -mcpu=hawaii -mtriple=amdgcn-unknown-amdhsa -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=CIHSA -check-prefix=HSA %s

+; RUN: llc -march=amdgcn -mcpu=fiji -mtriple=amdgcn-unknown-amdhsa -mattr=+vgpr-spilling -verify-machineinstrs < %s | FileCheck -check-prefix=GCN -check-prefix=VIHSA -check-prefix=HSA %s

; This ends up using all 256 registers and requires register

; scavenging which will fail to find an unsued register.

@@ -11,24 +11,33 @@

; FIXME: The same register is initialized to 0 for every spill.

-declare i32 @llvm.r600.read.tgid.x() #1

-declare i32 @llvm.r600.read.tgid.y() #1

-declare i32 @llvm.r600.read.tgid.z() #1

; GCN-LABEL: {{^}}spill_vgpr_compute:

-; GCN: s_mov_b32 s16, s3

-; GCN: s_mov_b32 s12, SCRATCH_RSRC_DWORD0

-; GCN-NEXT: s_mov_b32 s13, SCRATCH_RSRC_DWORD1

-; GCN-NEXT: s_mov_b32 s14, -1

-; SI-NEXT: s_mov_b32 s15, 0x80f000

-; VI-NEXT: s_mov_b32 s15, 0x800000

+; HSA: enable_sgpr_private_segment_buffer = 1

+; HSA: enable_sgpr_flat_scratch_init = 0

+; HSA: workitem_private_segment_byte_size = 1024

+; GCN-NOT: flat_scr

+; GCNMESA-DAG: s_mov_b32 s16, s3

+; GCNMESA-DAG: s_mov_b32 s12, SCRATCH_RSRC_DWORD0

+; GCNMESA--DAG: s_mov_b32 s13, SCRATCH_RSRC_DWORD1

+; GCNMESA-DAG: s_mov_b32 s14, -1

+; SIMESA-DAG: s_mov_b32 s15, 0xe8f000

+; VIMESA-DAG: s_mov_b32 s15, 0xe80000

-; GCN: buffer_store_dword {{v[0-9]+}}, s[12:15], s16 offset:{{[0-9]+}} ; 4-byte Folded Spill

+; GCN: buffer_store_dword {{v[0-9]+}}, off, s[12:15], s16 offset:{{[0-9]+}} ; 4-byte Folded Spill

-; GCN: buffer_store_dword {{v[0-9]+}}, {{v[0-9]+}}, s[12:15], s16 offen offset:{{[0-9]+}}

-; GCN: buffer_load_dwordx4 {{v\[[0-9]+:[0-9]+\]}}, {{v[0-9]+}}, s[12:15], s16 offen offset:{{[0-9]+}}

+; GCN: buffer_store_dword {{v[0-9]}}, {{v[0-9]+}}, s[12:15], s16 offen offset:{{[0-9]+}}

+; GCN: buffer_load_dword {{v[0-9]+}}, {{v[0-9]+}}, s[12:15], s16 offen offset:{{[0-9]+}}

; GCN: NumVgprs: 256

; GCN: ScratchSize: 1024

@@ -175,7 +184,8 @@ bb12: ; preds = %bb145, %bb

%tmp140 = phi float [ 0.000000e+00, %bb ], [ %tmp405, %bb145 ]

%tmp141 = phi float [ 0.000000e+00, %bb ], [ %tmp406, %bb145 ]

%tmp142 = bitcast float %tmp95 to i32

- %tmp143 = icmp sgt i32 %tmp142, 125

+ %tid = call i32 @llvm.r600.read.tidig.x() #1

+ %tmp143 = icmp sgt i32 %tmp142, %tid

br i1 %tmp143, label %bb144, label %bb145

bb144: ; preds = %bb12

@@ -581,5 +591,7 @@ bb145: ; preds = %bb12

br label %bb12

}

+declare i32 @llvm.r600.read.tidig.x() #1

attributes #0 = { nounwind }

attributes #1 = { nounwind readnone }