Target/AMDGPU/AMDGPUInstrInfo.cpp

f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//===-- AMDGPUInstrInfo.cpp - Base class for AMD GPU InstrInfo ------------===//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//                     The LLVM Compiler Infrastructure
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard// This file is distributed under the University of Illinois Open Source
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard// License. See LICENSE.TXT for details.
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//===----------------------------------------------------------------------===//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard/// \file
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard/// \brief Implementation of the TargetInstrInfo class that is common to all
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard/// AMD GPUs.
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard//===----------------------------------------------------------------------===//
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard#include "AMDGPUInstrInfo.h"
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard#include "AMDGPURegisterInfo.h"
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard#include "AMDGPUTargetMachine.h"
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard#include "llvm/CodeGen/MachineFrameInfo.h"
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard#include "llvm/CodeGen/MachineInstrBuilder.h"
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard#include "llvm/CodeGen/MachineRegisterInfo.h"
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hinesusing namespace llvm;
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hines
354362524a72b3fa43a6c09380b7ae3b2380cbbaJuergen Ributzka#define GET_INSTRINFO_CTOR_DTOR
5e48a0e9ae2365a130dd1ec2e0b4beb337ab79e0Tom Stellard#define GET_INSTRINFO_NAMED_OPS
f767018b1048f228b0c2a71d7e4008750aff0ef5Christian Konig#define GET_INSTRMAP_INFO
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard#include "AMDGPUGenInstrInfo.inc"
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard
354362524a72b3fa43a6c09380b7ae3b2380cbbaJuergen Ributzka// Pin the vtable to this file.
354362524a72b3fa43a6c09380b7ae3b2380cbbaJuergen Ributzkavoid AMDGPUInstrInfo::anchor() {}
354362524a72b3fa43a6c09380b7ae3b2380cbbaJuergen Ributzka
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga NainarAMDGPUInstrInfo::AMDGPUInstrInfo(const AMDGPUSubtarget &ST)
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  : AMDGPUGenInstrInfo(-1, -1), ST(ST) {}
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hinesbool AMDGPUInstrInfo::enableClusterLoads() const {
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines  return true;
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines}
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// FIXME: This behaves strangely. If, for example, you have 32 load + stores,
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// the first 16 loads will be interleaved with the stores, and the next 16 will
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// be clustered as expected. It should really split into 2 16 store batches.
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines//
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// Loads are clustered until this returns false, rather than trying to schedule
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// groups of stores. This also means we have to deal with saying different
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// address space loads should be clustered, and ones which might cause bank
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// conflicts.
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines//
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// This might be deprecated so it might not be worth that much effort to fix.
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hinesbool AMDGPUInstrInfo::shouldScheduleLoadsNear(SDNode *Load0, SDNode *Load1,
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines                                              int64_t Offset0, int64_t Offset1,
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines                                              unsigned NumLoads) const {
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines  assert(Offset1 > Offset0 &&
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines         "Second offset should be larger than first offset!");
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines  // If we have less than 16 loads in a row, and the offsets are within 64
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines  // bytes, then schedule together.
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines  // A cacheline is 64 bytes (for global memory).
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines  return (NumLoads <= 16 && (Offset1 - Offset0) < 64);
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard}
f98f2ce29e6e2996fa58f38979143eceaa818335Tom Stellard
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellardint AMDGPUInstrInfo::getMaskedMIMGOp(uint16_t Opcode, unsigned Channels) const {
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellard  switch (Channels) {
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellard  default: return Opcode;
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellard  case 1: return AMDGPU::getMaskedMIMGOp(Opcode, AMDGPU::Channels_1);
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellard  case 2: return AMDGPU::getMaskedMIMGOp(Opcode, AMDGPU::Channels_2);
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellard  case 3: return AMDGPU::getMaskedMIMGOp(Opcode, AMDGPU::Channels_3);
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellard  }
0f9eaaa8aa10bdb658e887782b86f03dbea79cb1Tom Stellard}
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hines
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar// This must be kept in sync with the SIEncodingFamily class in SIInstrInfo.td
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainarenum SIEncodingFamily {
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  SI = 0,
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  VI = 1
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar};
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hines// Wrapper for Tablegen'd function.  enum Subtarget is not defined in any
37ed9c199ca639565f6ce88105f9e39e898d82d0Stephen Hines// header files, so we need to wrap it in a function that takes unsigned
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hines// instead.
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hinesnamespace llvm {
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hinesnamespace AMDGPU {
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hinesstatic int getMCOpcode(uint16_t Opcode, unsigned Gen) {
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  return getMCOpcodeGen(Opcode, static_cast<Subtarget>(Gen));
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hines}
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hines}
dce4a407a24b04eebc6a376f8e62b41aaa7b071fStephen Hines}
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainarstatic SIEncodingFamily subtargetEncodingFamily(const AMDGPUSubtarget &ST) {
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  switch (ST.getGeneration()) {
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  case AMDGPUSubtarget::SOUTHERN_ISLANDS:
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  case AMDGPUSubtarget::SEA_ISLANDS:
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar    return SIEncodingFamily::SI;
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  case AMDGPUSubtarget::VOLCANIC_ISLANDS:
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar    return SIEncodingFamily::VI;
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  // FIXME: This should never be called for r600 GPUs.
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  case AMDGPUSubtarget::R600:
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  case AMDGPUSubtarget::R700:
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  case AMDGPUSubtarget::EVERGREEN:
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  case AMDGPUSubtarget::NORTHERN_ISLANDS:
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar    return SIEncodingFamily::SI;
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  }
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  llvm_unreachable("Unknown subtarget generation!");
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines}
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hinesint AMDGPUInstrInfo::pseudoToMCOpcode(int Opcode) const {
de2d8694e25a814696358e95141f4b1aa4d8847ePirama Arumuga Nainar  int MCOp = AMDGPU::getMCOpcode(Opcode, subtargetEncodingFamily(ST));
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  // -1 means that Opcode is already a native instruction.
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  if (MCOp == -1)
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines    return Opcode;
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  // (uint16_t)-1 means that Opcode is a pseudo instruction that has
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  // no encoding in the given subtarget generation.
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  if (MCOp == (uint16_t)-1)
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines    return -1;
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines  return MCOp;
ebe69fe11e48d322045d5949c83283927a0d790bStephen Hines}