src - FreeBSD source tree

diff options


context:
space:
mode:

author	Dimitry Andric <dim@FreeBSD.org>	2018-12-01 15:41:24 +0000
committer	Dimitry Andric <dim@FreeBSD.org>	2018-12-01 15:41:24 +0000
commit	d17fea9f4160084012c9596029dfeba3220a5ff3 (patch)
tree	7e3aea25e33e59b34dbce3a86580fe0af17efd9d /lib
parent	86392292ee722abb03af4befe2d2c8baaeadaf22 (diff)

Vendor import of llvm release_70 branch r348011:vendor/llvm/llvm-release_70-r348011

https://llvm.org/svn/llvm-project/llvm/branches/release_70@348011

Notes

Notes: svn path=/vendor/llvm/dist-release_70/; revision=341365 svn path=/vendor/llvm/llvm-release_70-r348011/; revision=341366; tag=vendor/llvm/llvm-release_70-r348011

Diffstat (limited to 'lib')

-rw-r--r--

lib/CodeGen/TargetLoweringObjectFileImpl.cpp

-rw-r--r--

lib/MC/MCExpr.cpp

-rw-r--r--

lib/Target/Mips/MCTargetDesc/MipsAsmBackend.cpp

-rw-r--r--

lib/Target/Mips/MCTargetDesc/MipsAsmBackend.h

-rw-r--r--

lib/Target/Mips/MCTargetDesc/MipsELFStreamer.cpp

-rw-r--r--

lib/Target/Mips/MCTargetDesc/MipsELFStreamer.h

-rw-r--r--

lib/Target/Mips/MicroMips32r6InstrInfo.td

-rw-r--r--

lib/Target/Mips/Mips64InstrInfo.td

-rw-r--r--

lib/Target/Mips/Mips64r6InstrInfo.td

-rw-r--r--

lib/Target/Mips/MipsFastISel.cpp

-rw-r--r--

lib/Target/Mips/MipsInstrFPU.td

-rw-r--r--

lib/Target/Mips/MipsSEFrameLowering.cpp

-rw-r--r--

lib/Target/Mips/MipsSEISelDAGToDAG.cpp

-rw-r--r--

lib/Target/Mips/MipsSEInstrInfo.cpp

-rw-r--r--

lib/Target/PowerPC/P9InstrResources.td

-rw-r--r--

lib/Target/PowerPC/PPCISelLowering.cpp

-rw-r--r--

lib/Target/PowerPC/PPCInstrVSX.td

-rw-r--r--

lib/Transforms/Utils/LCSSA.cpp

-rw-r--r--

lib/Transforms/Utils/SSAUpdater.cpp

19 files changed, 196 insertions, 36 deletions

diff --git a/lib/CodeGen/TargetLoweringObjectFileImpl.cpp b/lib/CodeGen/TargetLoweringObjectFileImpl.cpp
index f6b91a2f0231..16140f0b12be 100644
--- a/lib/CodeGen/TargetLoweringObjectFileImpl.cpp
+++ b/lib/CodeGen/TargetLoweringObjectFileImpl.cpp

@@ -1156,10 +1156,11 @@ MCSection *TargetLoweringObjectFileCOFF::SelectSectionForGlobal(

MCSymbol *Sym = TM.getSymbol(ComdatGV);

StringRef COMDATSymName = Sym->getName();

- // Append "$symbol" to the section name when targetting mingw. The ld.bfd

+ // Append "$symbol" to the section name *before* IR-level mangling is

+ // applied when targetting mingw. This is what GCC does, and the ld.bfd

// COFF linker will not properly handle comdats otherwise.

if (getTargetTriple().isWindowsGNUEnvironment())

- raw_svector_ostream(Name) << '$' << COMDATSymName;

+ raw_svector_ostream(Name) << '$' << ComdatGV->getName();

return getContext().getCOFFSection(Name, Characteristics, Kind,

COMDATSymName, Selection, UniqueID);

diff --git a/lib/MC/MCExpr.cpp b/lib/MC/MCExpr.cpp
index a4c99a0c1c15..ef6f0041e0c8 100644
--- a/lib/MC/MCExpr.cpp
+++ b/lib/MC/MCExpr.cpp

@@ -524,6 +524,11 @@ static void AttemptToFoldSymbolOffsetDifference(

if (Asm->isThumbFunc(&SA))

Addend |= 1;

+ // If symbol is labeled as micromips, we set low-bit to ensure

+ // correct offset in .gcc_except_table

+ if (Asm->getBackend().isMicroMips(&SA))

+ Addend |= 1;

// Clear the symbol expr pointers to indicate we have folded these

// operands.

A = B = nullptr;

diff --git a/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.cpp b/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.cpp
index 4397c971d080..3b1b94acb149 100644
--- a/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.cpp
+++ b/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.cpp

@@ -25,6 +25,7 @@

#include "llvm/MC/MCFixupKindInfo.h"

#include "llvm/MC/MCObjectWriter.h"

#include "llvm/MC/MCSubtargetInfo.h"

+#include "llvm/MC/MCSymbolELF.h"

#include "llvm/MC/MCTargetOptions.h"

#include "llvm/MC/MCValue.h"

#include "llvm/Support/ErrorHandling.h"

@@ -568,6 +569,14 @@ bool MipsAsmBackend::shouldForceRelocation(const MCAssembler &Asm,

}

+bool MipsAsmBackend::isMicroMips(const MCSymbol *Sym) const {

+ if (const auto *ElfSym = dyn_cast<const MCSymbolELF>(Sym)) {

+ if (ElfSym->getOther() & ELF::STO_MIPS_MICROMIPS)

+ return true;

+ }

+ return false;

MCAsmBackend *llvm::createMipsAsmBackend(const Target &T,

const MCSubtargetInfo &STI,

const MCRegisterInfo &MRI,

diff --git a/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.h b/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.h
index 3d5e16fcf9b4..30359132e92b 100644
--- a/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.h
+++ b/lib/Target/Mips/MCTargetDesc/MipsAsmBackend.h

@@ -25,6 +25,7 @@ class MCAssembler;

struct MCFixupKindInfo;

class MCObjectWriter;

class MCRegisterInfo;

+class MCSymbolELF;

class Target;

class MipsAsmBackend : public MCAsmBackend {

@@ -90,6 +91,7 @@ public:

bool shouldForceRelocation(const MCAssembler &Asm, const MCFixup &Fixup,

const MCValue &Target) override;

+ bool isMicroMips(const MCSymbol *Sym) const override;

}; // class MipsAsmBackend

} // namespace

diff --git a/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.cpp b/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.cpp
index 7b9a02503ce2..21b01e850967 100644
--- a/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.cpp
+++ b/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.cpp

@@ -15,6 +15,7 @@

#include "llvm/MC/MCAssembler.h"

#include "llvm/MC/MCCodeEmitter.h"

#include "llvm/MC/MCContext.h"

+#include "llvm/MC/MCDwarf.h"

#include "llvm/MC/MCInst.h"

#include "llvm/MC/MCObjectWriter.h"

#include "llvm/MC/MCSymbolELF.h"

@@ -53,6 +54,22 @@ void MipsELFStreamer::EmitInstruction(const MCInst &Inst,

createPendingLabelRelocs();

}

+void MipsELFStreamer::EmitCFIStartProcImpl(MCDwarfFrameInfo &Frame) {

+ Frame.Begin = getContext().createTempSymbol();

+ MCELFStreamer::EmitLabel(Frame.Begin);

+MCSymbol *MipsELFStreamer::EmitCFILabel() {

+ MCSymbol *Label = getContext().createTempSymbol("cfi", true);

+ MCELFStreamer::EmitLabel(Label);

+ return Label;

+void MipsELFStreamer::EmitCFIEndProcImpl(MCDwarfFrameInfo &Frame) {

+ Frame.End = getContext().createTempSymbol();

+ MCELFStreamer::EmitLabel(Frame.End);

void MipsELFStreamer::createPendingLabelRelocs() {

MipsTargetELFStreamer *ELFTargetStreamer =

static_cast<MipsTargetELFStreamer *>(getTargetStreamer());

diff --git a/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.h b/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.h
index d141f5d77c61..56a0ff96c7bd 100644
--- a/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.h
+++ b/lib/Target/Mips/MCTargetDesc/MipsELFStreamer.h

@@ -26,6 +26,7 @@ class MCAsmBackend;

class MCCodeEmitter;

class MCContext;

class MCSubtargetInfo;

+struct MCDwarfFrameInfo;

class MipsELFStreamer : public MCELFStreamer {

SmallVector<std::unique_ptr<MipsOptionRecord>, 8> MipsOptionRecords;

@@ -60,6 +61,12 @@ public:

void EmitValueImpl(const MCExpr *Value, unsigned Size, SMLoc Loc) override;

void EmitIntValue(uint64_t Value, unsigned Size) override;

+ // Overriding these functions allows us to avoid recording of these labels

+ // in EmitLabel and later marking them as microMIPS.

+ void EmitCFIStartProcImpl(MCDwarfFrameInfo &Frame) override;

+ void EmitCFIEndProcImpl(MCDwarfFrameInfo &Frame) override;

+ MCSymbol *EmitCFILabel() override;

/// Emits all the option records stored up until the point it's called.

void EmitMipsOptionRecords();

diff --git a/lib/Target/Mips/MicroMips32r6InstrInfo.td b/lib/Target/Mips/MicroMips32r6InstrInfo.td
index f795112ae2b7..6b0aa7756eab 100644
--- a/lib/Target/Mips/MicroMips32r6InstrInfo.td
+++ b/lib/Target/Mips/MicroMips32r6InstrInfo.td

@@ -1733,7 +1733,7 @@ defm S_MMR6 : Cmp_Pats<f32, NOR_MMR6, ZERO>, ISA_MICROMIPS32R6;

defm D_MMR6 : Cmp_Pats<f64, NOR_MMR6, ZERO>, ISA_MICROMIPS32R6;

def : MipsPat<(f32 fpimm0), (MTC1_MMR6 ZERO)>, ISA_MICROMIPS32R6;

-def : MipsPat<(f32 fpimm0neg), (FNEG_S_MMR6 (MTC1 ZERO))>, ISA_MICROMIPS32R6;

+def : MipsPat<(f32 fpimm0neg), (FNEG_S_MMR6 (MTC1_MMR6 ZERO))>, ISA_MICROMIPS32R6;

def : MipsPat<(MipsTruncIntFP FGR64Opnd:$src),

(TRUNC_W_D_MMR6 FGR64Opnd:$src)>, ISA_MICROMIPS32R6;

diff --git a/lib/Target/Mips/Mips64InstrInfo.td b/lib/Target/Mips/Mips64InstrInfo.td
index 878ec29b188d..b5317bec70c4 100644
--- a/lib/Target/Mips/Mips64InstrInfo.td
+++ b/lib/Target/Mips/Mips64InstrInfo.td

@@ -838,7 +838,7 @@ def : MipsPat<(i64 (sext (i32 (sub GPR32:$src, GPR32:$src2)))),

(SUBu GPR32:$src, GPR32:$src2), sub_32)>;

def : MipsPat<(i64 (sext (i32 (mul GPR32:$src, GPR32:$src2)))),

(INSERT_SUBREG (i64 (IMPLICIT_DEF)),

- (MUL GPR32:$src, GPR32:$src2), sub_32)>;

+ (MUL GPR32:$src, GPR32:$src2), sub_32)>, ISA_MIPS3_NOT_32R6_64R6;

def : MipsPat<(i64 (sext (i32 (MipsMFHI ACC64:$src)))),

(INSERT_SUBREG (i64 (IMPLICIT_DEF)),

(PseudoMFHI ACC64:$src), sub_32)>;

@@ -1139,3 +1139,6 @@ def SLTUImm64 : MipsAsmPseudoInst<(outs GPR64Opnd:$rs),

"sltu\t$rs, $rt, $imm">, GPR_64;

def : MipsInstAlias<"sltu\t$rs, $imm", (SLTUImm64 GPR64Opnd:$rs, GPR64Opnd:$rs,

imm64:$imm)>, GPR_64;

+def : MipsInstAlias<"rdhwr $rt, $rs",

+ (RDHWR64 GPR64Opnd:$rt, HWRegsOpnd:$rs, 0), 1>, GPR_64;

diff --git a/lib/Target/Mips/Mips64r6InstrInfo.td b/lib/Target/Mips/Mips64r6InstrInfo.td
index 9df802cc30b9..ac223bc77256 100644
--- a/lib/Target/Mips/Mips64r6InstrInfo.td
+++ b/lib/Target/Mips/Mips64r6InstrInfo.td

@@ -301,6 +301,9 @@ def : MipsPat<(select (i32 (seteq i32:$cond, immz)), immz, i64:$f),

// Patterns used for matching away redundant sign extensions.

// MIPS32 arithmetic instructions sign extend their result implicitly.

+def : MipsPat<(i64 (sext (i32 (mul GPR32:$src, GPR32:$src2)))),

+ (INSERT_SUBREG (i64 (IMPLICIT_DEF)),

+ (MUL_R6 GPR32:$src, GPR32:$src2), sub_32)>, ISA_MIPS64R6;

def : MipsPat<(i64 (sext (i32 (sdiv GPR32:$src, GPR32:$src2)))),

(INSERT_SUBREG (i64 (IMPLICIT_DEF)),

(DIV GPR32:$src, GPR32:$src2), sub_32)>, ISA_MIPS64R6;

diff --git a/lib/Target/Mips/MipsFastISel.cpp b/lib/Target/Mips/MipsFastISel.cpp
index 19b30a44e86a..22ade31a72cd 100644
--- a/lib/Target/Mips/MipsFastISel.cpp
+++ b/lib/Target/Mips/MipsFastISel.cpp

@@ -953,6 +953,11 @@ bool MipsFastISel::selectBranch(const Instruction *I) {

MachineBasicBlock *FBB = FuncInfo.MBBMap[BI->getSuccessor(1)];

// For now, just try the simplest case where it's fed by a compare.

if (const CmpInst *CI = dyn_cast<CmpInst>(BI->getCondition())) {

+ MVT CIMVT =

+ TLI.getValueType(DL, CI->getOperand(0)->getType(), true).getSimpleVT();

+ if (CIMVT == MVT::i1)

+ return false;

unsigned CondReg = getRegForValue(CI);

BuildMI(*BrBB, FuncInfo.InsertPt, DbgLoc, TII.get(Mips::BGTZ))

.addReg(CondReg)

diff --git a/lib/Target/Mips/MipsInstrFPU.td b/lib/Target/Mips/MipsInstrFPU.td
index dd30e20a743c..e986942ad8fa 100644
--- a/lib/Target/Mips/MipsInstrFPU.td
+++ b/lib/Target/Mips/MipsInstrFPU.td

@@ -485,14 +485,14 @@ let AdditionalPredicates = [NotInMicroMips] in {

def CTC1 : MMRel, MTC1_FT<"ctc1", CCROpnd, GPR32Opnd, II_CTC1>, MFC1_FM<6>,

ISA_MIPS1;

- def MFC1 : MMRel, MFC1_FT<"mfc1", GPR32Opnd, FGR32Opnd, II_MFC1,

- bitconvert>, MFC1_FM<0>, ISA_MIPS1;

+ def MFC1 : MMRel, StdMMR6Rel, MFC1_FT<"mfc1", GPR32Opnd, FGR32Opnd, II_MFC1,

+ bitconvert>, MFC1_FM<0>, ISA_MIPS1;

def MFC1_D64 : MFC1_FT<"mfc1", GPR32Opnd, FGR64Opnd, II_MFC1>, MFC1_FM<0>,

ISA_MIPS1, FGR_64 {

let DecoderNamespace = "MipsFP64";

}

- def MTC1 : MMRel, MTC1_FT<"mtc1", FGR32Opnd, GPR32Opnd, II_MTC1,

- bitconvert>, MFC1_FM<4>, ISA_MIPS1;

+ def MTC1 : MMRel, StdMMR6Rel, MTC1_FT<"mtc1", FGR32Opnd, GPR32Opnd, II_MTC1,

+ bitconvert>, MFC1_FM<4>, ISA_MIPS1;

def MTC1_D64 : MTC1_FT<"mtc1", FGR64Opnd, GPR32Opnd, II_MTC1>, MFC1_FM<4>,

ISA_MIPS1, FGR_64 {

let DecoderNamespace = "MipsFP64";

diff --git a/lib/Target/Mips/MipsSEFrameLowering.cpp b/lib/Target/Mips/MipsSEFrameLowering.cpp
index 687c9f676b34..ef1b3c09bdc4 100644
--- a/lib/Target/Mips/MipsSEFrameLowering.cpp
+++ b/lib/Target/Mips/MipsSEFrameLowering.cpp

@@ -299,8 +299,12 @@ bool ExpandPseudo::expandBuildPairF64(MachineBasicBlock &MBB,

// register). Unfortunately, we have to make this decision before register

// allocation so for now we use a spill/reload sequence for all

// double-precision values in regardless of being an odd/even register.

- if ((Subtarget.isABI_FPXX() && !Subtarget.hasMTHC1()) ||

- (FP64 && !Subtarget.useOddSPReg())) {

+ //

+ // For the cases that should be covered here MipsSEISelDAGToDAG adds $sp as

+ // implicit operand, so other passes (like ShrinkWrapping) are aware that

+ // stack is used.

+ if (I->getNumOperands() == 4 && I->getOperand(3).isReg()

+ && I->getOperand(3).getReg() == Mips::SP) {

unsigned DstReg = I->getOperand(0).getReg();

unsigned LoReg = I->getOperand(1).getReg();

unsigned HiReg = I->getOperand(2).getReg();

@@ -360,9 +364,12 @@ bool ExpandPseudo::expandExtractElementF64(MachineBasicBlock &MBB,

// register). Unfortunately, we have to make this decision before register

// allocation so for now we use a spill/reload sequence for all

// double-precision values in regardless of being an odd/even register.

- if ((Subtarget.isABI_FPXX() && !Subtarget.hasMTHC1()) ||

- (FP64 && !Subtarget.useOddSPReg())) {

+ //

+ // For the cases that should be covered here MipsSEISelDAGToDAG adds $sp as

+ // implicit operand, so other passes (like ShrinkWrapping) are aware that

+ // stack is used.

+ if (I->getNumOperands() == 4 && I->getOperand(3).isReg()

+ && I->getOperand(3).getReg() == Mips::SP) {

unsigned DstReg = I->getOperand(0).getReg();

unsigned SrcReg = Op1.getReg();

unsigned N = Op2.getImm();

diff --git a/lib/Target/Mips/MipsSEISelDAGToDAG.cpp b/lib/Target/Mips/MipsSEISelDAGToDAG.cpp
index 599c1e913acf..cf2899dd375e 100644
--- a/lib/Target/Mips/MipsSEISelDAGToDAG.cpp
+++ b/lib/Target/Mips/MipsSEISelDAGToDAG.cpp

@@ -238,6 +238,18 @@ void MipsSEDAGToDAGISel::processFunctionAfterISel(MachineFunction &MF) {

case Mips::WRDSP:

addDSPCtrlRegOperands(true, MI, MF);

break;

+ case Mips::BuildPairF64_64:

+ case Mips::ExtractElementF64_64:

+ if (!Subtarget->useOddSPReg()) {

+ MI.addOperand(MachineOperand::CreateReg(Mips::SP, false, true));

+ break;

+ }

+ // fallthrough

+ case Mips::BuildPairF64:

+ case Mips::ExtractElementF64:

+ if (Subtarget->isABI_FPXX() && !Subtarget->hasMTHC1())

+ MI.addOperand(MachineOperand::CreateReg(Mips::SP, false, true));

+ break;

default:

replaceUsesWithZeroReg(MRI, MI);

}

diff --git a/lib/Target/Mips/MipsSEInstrInfo.cpp b/lib/Target/Mips/MipsSEInstrInfo.cpp
index 7ffe4aff474d..e8589fc53492 100644
--- a/lib/Target/Mips/MipsSEInstrInfo.cpp
+++ b/lib/Target/Mips/MipsSEInstrInfo.cpp

@@ -25,9 +25,14 @@

using namespace llvm;

+static unsigned getUnconditionalBranch(const MipsSubtarget &STI) {

+ if (STI.inMicroMipsMode())

+ return STI.isPositionIndependent() ? Mips::B_MM : Mips::J_MM;

+ return STI.isPositionIndependent() ? Mips::B : Mips::J;

MipsSEInstrInfo::MipsSEInstrInfo(const MipsSubtarget &STI)

- : MipsInstrInfo(STI, STI.isPositionIndependent() ? Mips::B : Mips::J),

- RI() {}

+ : MipsInstrInfo(STI, getUnconditionalBranch(STI)), RI() {}

const MipsRegisterInfo &MipsSEInstrInfo::getRegisterInfo() const {

return RI;

@@ -643,7 +648,7 @@ unsigned MipsSEInstrInfo::getAnalyzableBrOpc(unsigned Opc) const {

Opc == Mips::BNE64 || Opc == Mips::BGTZ64 || Opc == Mips::BGEZ64 ||

Opc == Mips::BLTZ64 || Opc == Mips::BLEZ64 || Opc == Mips::BC1T ||

Opc == Mips::BC1F || Opc == Mips::B || Opc == Mips::J ||

- Opc == Mips::B_MM || Opc == Mips::BEQZC_MM ||

+ Opc == Mips::J_MM || Opc == Mips::B_MM || Opc == Mips::BEQZC_MM ||

Opc == Mips::BNEZC_MM || Opc == Mips::BEQC || Opc == Mips::BNEC ||

Opc == Mips::BLTC || Opc == Mips::BGEC || Opc == Mips::BLTUC ||

Opc == Mips::BGEUC || Opc == Mips::BGTZC || Opc == Mips::BLEZC ||

diff --git a/lib/Target/PowerPC/P9InstrResources.td b/lib/Target/PowerPC/P9InstrResources.td
index 34df8452fe16..c6cbb9037ede 100644
--- a/lib/Target/PowerPC/P9InstrResources.td
+++ b/lib/Target/PowerPC/P9InstrResources.td

@@ -592,6 +592,7 @@ def : InstRW<[P9_PM_3C, IP_EXECO_1C, IP_EXECE_1C, DISP_1C, DISP_1C, DISP_1C],

XXPERM,

XXPERMR,

XXSLDWI,

+ XXSLDWIs,

XXSPLTIB,

XXSPLTW,

XXSPLTWs,

diff --git a/lib/Target/PowerPC/PPCISelLowering.cpp b/lib/Target/PowerPC/PPCISelLowering.cpp
index 331dbcbbe060..b5bdf47ce37a 100644
--- a/lib/Target/PowerPC/PPCISelLowering.cpp
+++ b/lib/Target/PowerPC/PPCISelLowering.cpp

@@ -8454,17 +8454,6 @@ SDValue PPCTargetLowering::LowerVECTOR_SHUFFLE(SDValue Op,

if (V2.isUndef() && PPC::isSplatShuffleMask(SVOp, 4)) {

int SplatIdx = PPC::getVSPLTImmediate(SVOp, 4, DAG);

- // If the source for the shuffle is a scalar_to_vector that came from a

- // 32-bit load, it will have used LXVWSX so we don't need to splat again.

- if (Subtarget.hasP9Vector() &&

- ((isLittleEndian && SplatIdx == 3) ||

- (!isLittleEndian && SplatIdx == 0))) {

- SDValue Src = V1.getOperand(0);

- if (Src.getOpcode() == ISD::SCALAR_TO_VECTOR &&

- Src.getOperand(0).getOpcode() == ISD::LOAD &&

- Src.getOperand(0).hasOneUse())

- return V1;

- }

SDValue Conv = DAG.getNode(ISD::BITCAST, dl, MVT::v4i32, V1);

SDValue Splat = DAG.getNode(PPCISD::XXSPLT, dl, MVT::v4i32, Conv,

DAG.getConstant(SplatIdx, dl, MVT::i32));

diff --git a/lib/Target/PowerPC/PPCInstrVSX.td b/lib/Target/PowerPC/PPCInstrVSX.td
index 183512acaf9e..781a3277441a 100644
--- a/lib/Target/PowerPC/PPCInstrVSX.td
+++ b/lib/Target/PowerPC/PPCInstrVSX.td

@@ -877,6 +877,12 @@ let Uses = [RM] in {

"xxsldwi $XT, $XA, $XB, $SHW", IIC_VecPerm,

[(set v4i32:$XT, (PPCvecshl v4i32:$XA, v4i32:$XB,

imm32SExt16:$SHW))]>;

+ let isCodeGenOnly = 1 in

+ def XXSLDWIs : XX3Form_2s<60, 2,

+ (outs vsrc:$XT), (ins vsfrc:$XA, u2imm:$SHW),

+ "xxsldwi $XT, $XA, $XA, $SHW", IIC_VecPerm, []>;

def XXSPLTW : XX2Form_2<60, 164,

(outs vsrc:$XT), (ins vsrc:$XB, u2imm:$UIM),

"xxspltw $XT, $XB, $UIM", IIC_VecPerm,

@@ -886,6 +892,7 @@ let Uses = [RM] in {

def XXSPLTWs : XX2Form_2<60, 164,

(outs vsrc:$XT), (ins vfrc:$XB, u2imm:$UIM),

"xxspltw $XT, $XB, $UIM", IIC_VecPerm, []>;

} // hasSideEffects

} // UseVSXReg = 1

@@ -1466,8 +1473,6 @@ let AddedComplexity = 400 in { // Prefer VSX patterns over non-VSX patterns.

(f64 (PPCmtvsra (i64 (vector_extract v2i64:$S, 1)))))),

(f32 (XSCVUXDSP (COPY_TO_REGCLASS (XXPERMDI $S, $S, 2), VSFRC)))>;

}

- def : Pat<(v4i32 (scalar_to_vector ScalarLoads.Li32)),

- (v4i32 (XXSPLTWs (LIWAX xoaddr:$src), 1))>;

// Instructions for converting float to i64 feeding a store.

let Predicates = [NoP9Vector] in {

@@ -3050,13 +3055,47 @@ let AddedComplexity = 400, Predicates = [HasP9Vector] in {

(STXVX $rS, xoaddr:$dst)>;

def : Pat<(int_ppc_vsx_stxvd2x v2f64:$rS, xoaddr:$dst),

(STXVX $rS, xoaddr:$dst)>;

- def : Pat<(v4i32 (scalar_to_vector (i32 (load xoaddr:$src)))),

- (v4i32 (LXVWSX xoaddr:$src))>;

- def : Pat<(v4f32 (scalar_to_vector (f32 (load xoaddr:$src)))),

- (v4f32 (LXVWSX xoaddr:$src))>;

- def : Pat<(v4f32 (scalar_to_vector

- (f32 (fpround (f64 (extloadf32 xoaddr:$src)))))),

- (v4f32 (LXVWSX xoaddr:$src))>;

+ let AddedComplexity = 400 in {

+ // LIWAX - This instruction is used for sign extending i32 -> i64.

+ // LIWZX - This instruction will be emitted for i32, f32, and when

+ // zero-extending i32 to i64 (zext i32 -> i64).

+ let Predicates = [IsLittleEndian] in {

+ def : Pat<(v2i64 (scalar_to_vector (i64 (sextloadi32 xoaddr:$src)))),

+ (v2i64 (XXPERMDIs

+ (COPY_TO_REGCLASS (LIWAX xoaddr:$src), VSRC), 2))>;

+ def : Pat<(v2i64 (scalar_to_vector (i64 (zextloadi32 xoaddr:$src)))),

+ (v2i64 (XXPERMDIs

+ (COPY_TO_REGCLASS (LIWZX xoaddr:$src), VSRC), 2))>;

+ def : Pat<(v4i32 (scalar_to_vector (i32 (load xoaddr:$src)))),

+ (v4i32 (XXPERMDIs

+ (COPY_TO_REGCLASS (LIWZX xoaddr:$src), VSRC), 2))>;

+ def : Pat<(v4f32 (scalar_to_vector (f32 (load xoaddr:$src)))),

+ (v4f32 (XXPERMDIs

+ (COPY_TO_REGCLASS (LIWZX xoaddr:$src), VSRC), 2))>;

+ }

+ let Predicates = [IsBigEndian] in {

+ def : Pat<(v2i64 (scalar_to_vector (i64 (sextloadi32 xoaddr:$src)))),

+ (v2i64 (COPY_TO_REGCLASS (LIWAX xoaddr:$src), VSRC))>;

+ def : Pat<(v2i64 (scalar_to_vector (i64 (zextloadi32 xoaddr:$src)))),

+ (v2i64 (COPY_TO_REGCLASS (LIWZX xoaddr:$src), VSRC))>;

+ def : Pat<(v4i32 (scalar_to_vector (i32 (load xoaddr:$src)))),

+ (v4i32 (XXSLDWIs

+ (COPY_TO_REGCLASS (LIWZX xoaddr:$src), VSRC), 1))>;

+ def : Pat<(v4f32 (scalar_to_vector (f32 (load xoaddr:$src)))),

+ (v4f32 (XXSLDWIs

+ (COPY_TO_REGCLASS (LIWZX xoaddr:$src), VSRC), 1))>;

+ }

// Build vectors from i8 loads

def : Pat<(v16i8 (scalar_to_vector ScalarLoads.Li8)),

@@ -3218,6 +3257,39 @@ let AddedComplexity = 400, Predicates = [HasP9Vector] in {

def : Pat<(f32 (fpround (f64 (extloadf32 ixaddr:$src)))),

(f32 (DFLOADf32 ixaddr:$src))>;

+ let AddedComplexity = 400 in {

+ // The following pseudoinstructions are used to ensure the utilization

+ // of all 64 VSX registers.

+ let Predicates = [IsLittleEndian, HasP9Vector] in {

+ def : Pat<(v2i64 (scalar_to_vector (i64 (load ixaddr:$src)))),

+ (v2i64 (XXPERMDIs

+ (COPY_TO_REGCLASS (DFLOADf64 ixaddr:$src), VSRC), 2))>;

+ def : Pat<(v2i64 (scalar_to_vector (i64 (load xaddr:$src)))),

+ (v2i64 (XXPERMDIs

+ (COPY_TO_REGCLASS (XFLOADf64 xaddr:$src), VSRC), 2))>;

+ def : Pat<(v2f64 (scalar_to_vector (f64 (load ixaddr:$src)))),

+ (v2f64 (XXPERMDIs

+ (COPY_TO_REGCLASS (DFLOADf64 ixaddr:$src), VSRC), 2))>;

+ def : Pat<(v2f64 (scalar_to_vector (f64 (load xaddr:$src)))),

+ (v2f64 (XXPERMDIs

+ (COPY_TO_REGCLASS (XFLOADf64 xaddr:$src), VSRC), 2))>;

+ }

+ let Predicates = [IsBigEndian, HasP9Vector] in {

+ def : Pat<(v2i64 (scalar_to_vector (i64 (load ixaddr:$src)))),

+ (v2i64 (COPY_TO_REGCLASS (DFLOADf64 ixaddr:$src), VSRC))>;

+ def : Pat<(v2i64 (scalar_to_vector (i64 (load xaddr:$src)))),

+ (v2i64 (COPY_TO_REGCLASS (XFLOADf64 xaddr:$src), VSRC))>;

+ def : Pat<(v2f64 (scalar_to_vector (f64 (load ixaddr:$src)))),

+ (v2f64 (COPY_TO_REGCLASS (DFLOADf64 ixaddr:$src), VSRC))>;

+ def : Pat<(v2f64 (scalar_to_vector (f64 (load xaddr:$src)))),

+ (v2f64 (COPY_TO_REGCLASS (XFLOADf64 xaddr:$src), VSRC))>;

+ }

let Predicates = [IsBigEndian, HasP9Vector] in {

// (Un)Signed DWord vector extract -> QP

@@ -3932,3 +4004,4 @@ let AddedComplexity = 400 in {

(v4i32 (VEXTSH2W $A))>;

}

diff --git a/lib/Transforms/Utils/LCSSA.cpp b/lib/Transforms/Utils/LCSSA.cpp
index a1f8e7484bcf..53d444b309d5 100644
--- a/lib/Transforms/Utils/LCSSA.cpp
+++ b/lib/Transforms/Utils/LCSSA.cpp

@@ -41,6 +41,7 @@

#include "llvm/IR/Dominators.h"

#include "llvm/IR/Function.h"

#include "llvm/IR/Instructions.h"

+#include "llvm/IR/IntrinsicInst.h"

#include "llvm/IR/PredIteratorCache.h"

#include "llvm/Pass.h"

#include "llvm/Transforms/Utils.h"

@@ -201,6 +202,21 @@ bool llvm::formLCSSAForInstructions(SmallVectorImpl<Instruction *> &Worklist,

SSAUpdate.RewriteUse(*UseToRewrite);

}

+ SmallVector<DbgValueInst *, 4> DbgValues;

+ llvm::findDbgValues(DbgValues, I);

+ // Update pre-existing debug value uses that reside outside the loop.

+ auto &Ctx = I->getContext();

+ for (auto DVI : DbgValues) {

+ BasicBlock *UserBB = DVI->getParent();

+ if (InstBB == UserBB || L->contains(UserBB))

+ continue;

+ // We currently only handle debug values residing in blocks where we have

+ // inserted a PHI instruction.

+ if (Value *V = SSAUpdate.FindValueForBlock(UserBB))

+ DVI->setOperand(0, MetadataAsValue::get(Ctx, ValueAsMetadata::get(V)));

+ }

// SSAUpdater might have inserted phi-nodes inside other loops. We'll need

// to post-process them to keep LCSSA form.

for (PHINode *InsertedPN : InsertedPHIs) {

diff --git a/lib/Transforms/Utils/SSAUpdater.cpp b/lib/Transforms/Utils/SSAUpdater.cpp
index 4a1fd8d571aa..9e5fb0e7172d 100644
--- a/lib/Transforms/Utils/SSAUpdater.cpp
+++ b/lib/Transforms/Utils/SSAUpdater.cpp

@@ -64,6 +64,11 @@ bool SSAUpdater::HasValueForBlock(BasicBlock *BB) const {

return getAvailableVals(AV).count(BB);

}

+Value *SSAUpdater::FindValueForBlock(BasicBlock *BB) const {

+ AvailableValsTy::iterator AVI = getAvailableVals(AV).find(BB);

+ return (AVI != getAvailableVals(AV).end()) ? AVI->second : nullptr;

void SSAUpdater::AddAvailableValue(BasicBlock *BB, Value *V) {

assert(ProtoType && "Need to initialize SSAUpdater");

assert(ProtoType == V->getType() &&