diff --git a/patches/spirv/0003-Support-cl_bf16_conversions.patch b/patches/spirv/0003-Support-cl_bf16_conversions.patch
new file mode 100644
index 00000000..10f059f3
--- /dev/null
+++ b/patches/spirv/0003-Support-cl_bf16_conversions.patch
@@ -0,0 +1,1290 @@
+From dbe170bc395c5c5f913acc9014debf29cbf1627e Mon Sep 17 00:00:00 2001
+From: haonanya <haonan.yang@intel.com>
+Date: Tue, 15 Mar 2022 16:35:03 +0800
+Subject: [PATCH] Support cl_bf16_conversions
+
+This backports https://github.com/KhronosGroup/SPIRV-LLVM-Translator/pull/1406
+and https://github.com/KhronosGroup/SPIRV-LLVM-Translator/pull/1103
+
+Signed-off-by: haonanya <haonan.yang@intel.com>
+---
+ include/LLVMSPIRVExtensions.inc               |   1 +
+ lib/SPIRV/OCLToSPIRV.cpp                      | 122 ++++++++++++++
+ lib/SPIRV/OCLUtil.h                           |  20 +++
+ lib/SPIRV/SPIRVToOCL.cpp                      |  31 ++++
+ lib/SPIRV/SPIRVToOCL.h                        |   7 +
+ lib/SPIRV/libSPIRV/SPIRVInstruction.h         |  71 ++++++++
+ lib/SPIRV/libSPIRV/SPIRVNameMapEnum.h         |   1 +
+ lib/SPIRV/libSPIRV/SPIRVOpCodeEnumInternal.h  |   2 +
+ lib/SPIRV/libSPIRV/spirv_internal.hpp         |   9 ++
+ ...tAsBFloat16Float_inval_scalar_signature.ll |  23 +++
+ ...onvertAsBFloat16Float_inval_vec_elem_ty.ll |  23 +++
+ .../ConvertAsBFloat16Float_inval_vec_size.ll  |  23 +++
+ ...BFloat16AsUshort_inval_scalar_signature.ll |  23 +++
+ ...nvertBFloat16AsUshort_inval_vec_elem_ty.ll |  23 +++
+ .../ConvertBFloat16AsUshort_inval_vec_size.ll |  23 +++
+ .../bf16tof_inval_input_ty.ll                 |  28 ++++
+ .../bf16tof_inval_input_ty.spt                |  39 +++++
+ .../bf16tof_inval_output_ty.ll                |  27 ++++
+ .../bf16tof_inval_output_ty.spt               |  41 +++++
+ .../bf16tof_inval_params.spt                  |  39 +++++
+ .../f2bf16_inval_input_ty.ll                  |  28 ++++
+ .../f2bf16_inval_input_ty.spt                 |  37 +++++
+ .../f2bf16_inval_output_ty.spt                |  37 +++++
+ .../f2bf16_inval_output_ty_1.ll               |  28 ++++
+ .../f2bf16_inval_output_ty_2.ll               |  28 ++++
+ .../f2bf16_inval_params.ll                    |  28 ++++
+ .../cl_bfloat16_conversions_extension.ll      | 151 ++++++++++++++++++
+ .../convert_bfloat16_generic.ll               |  66 ++++++++
+ 28 files changed, 979 insertions(+)
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_scalar_signature.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_elem_ty.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_size.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_scalar_signature.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_elem_ty.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_size.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.spt
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.spt
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_params.spt
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.spt
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty.spt
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_1.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_2.ll
+ create mode 100644 test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_params.ll
+ create mode 100644 test/transcoding/SPV_INTEL_bfloat16_conversion/cl_bfloat16_conversions_extension.ll
+ create mode 100644 test/transcoding/SPV_INTEL_bfloat16_conversion/convert_bfloat16_generic.ll
+
+diff --git a/include/LLVMSPIRVExtensions.inc b/include/LLVMSPIRVExtensions.inc
+index 262737b9..c268f49d 100644
+--- a/include/LLVMSPIRVExtensions.inc
++++ b/include/LLVMSPIRVExtensions.inc
+@@ -38,3 +38,4 @@ EXT(SPV_INTEL_long_constant_composite)
+ EXT(SPV_INTEL_optnone)
+ EXT(SPV_INTEL_memory_access_aliasing)
+ EXT(SPV_INTEL_split_barrier)
++EXT(SPV_INTEL_bfloat16_conversion)
+diff --git a/lib/SPIRV/OCLToSPIRV.cpp b/lib/SPIRV/OCLToSPIRV.cpp
+index d003a1d0..985fdea2 100644
+--- a/lib/SPIRV/OCLToSPIRV.cpp
++++ b/lib/SPIRV/OCLToSPIRV.cpp
+@@ -268,6 +268,12 @@ public:
+ 
+   void visitCallLdexp(CallInst *CI, StringRef MangledName,
+                       StringRef DemangledName);
++
++   /// For cl_intel_convert_bfloat16_as_ushort
++  void visitCallConvertBFloat16AsUshort(CallInst *CI, StringRef DemangledName);
++  /// For cl_intel_convert_as_bfloat16_float
++  void visitCallConvertAsBFloat16Float(CallInst *CI, StringRef DemangledName);
++
+   static char ID;
+ 
+ private:
+@@ -547,6 +553,24 @@ void OCLToSPIRV::visitCallInst(CallInst &CI) {
+     visitCallLdexp(&CI, MangledName, DemangledName);
+     return;
+   }
++  if (DemangledName == kOCLBuiltinName::ConvertBFloat16AsUShort ||
++      DemangledName == kOCLBuiltinName::ConvertBFloat162AsUShort2 ||
++      DemangledName == kOCLBuiltinName::ConvertBFloat163AsUShort3 ||
++      DemangledName == kOCLBuiltinName::ConvertBFloat164AsUShort4 ||
++      DemangledName == kOCLBuiltinName::ConvertBFloat168AsUShort8 ||
++      DemangledName == kOCLBuiltinName::ConvertBFloat1616AsUShort16) {
++    visitCallConvertBFloat16AsUshort(&CI, DemangledName);
++    return;
++  }
++  if (DemangledName == kOCLBuiltinName::ConvertAsBFloat16Float ||
++      DemangledName == kOCLBuiltinName::ConvertAsBFloat162Float2 ||
++      DemangledName == kOCLBuiltinName::ConvertAsBFloat163Float3 ||
++      DemangledName == kOCLBuiltinName::ConvertAsBFloat164Float4 ||
++      DemangledName == kOCLBuiltinName::ConvertAsBFloat168Float8 ||
++      DemangledName == kOCLBuiltinName::ConvertAsBFloat1616Float16) {
++    visitCallConvertAsBFloat16Float(&CI, DemangledName);
++    return;
++  }
+   visitCallBuiltinSimple(&CI, MangledName, DemangledName);
+ }
+ 
+@@ -1910,6 +1934,104 @@ void OCLToSPIRV::visitCallLdexp(CallInst *CI, StringRef MangledName,
+   visitCallBuiltinSimple(CI, MangledName, DemangledName);
+ }
+ 
++void OCLToSPIRV::visitCallConvertBFloat16AsUshort(CallInst *CI,
++                                                      StringRef DemangledName) {
++  Type *RetTy = CI->getType();
++  Type *ArgTy = CI->getOperand(0)->getType();
++  if (DemangledName == kOCLBuiltinName::ConvertBFloat16AsUShort) {
++    if (!RetTy->isIntegerTy(16U) || !ArgTy->isFloatTy())
++      report_fatal_error(
++          "OpConvertBFloat16AsUShort must be of i16 and take float");
++  } else {
++    FixedVectorType *RetTyVec = cast<FixedVectorType>(RetTy);
++    FixedVectorType *ArgTyVec = cast<FixedVectorType>(ArgTy);
++    if (!RetTyVec || !RetTyVec->getElementType()->isIntegerTy(16U) ||
++        !ArgTyVec || !ArgTyVec->getElementType()->isFloatTy())
++      report_fatal_error("OpConvertBFloat16NAsUShortN must be of <N x i16> and "
++                         "take <N x float>");
++    unsigned RetTyVecSize = RetTyVec->getNumElements();
++    unsigned ArgTyVecSize = ArgTyVec->getNumElements();
++    if (DemangledName == kOCLBuiltinName::ConvertBFloat162AsUShort2) {
++      if (RetTyVecSize != 2 || ArgTyVecSize != 2)
++        report_fatal_error("ConvertBFloat162AsUShort2 must be of <2 x i16> and "
++                           "take <2 x float>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertBFloat163AsUShort3) {
++      if (RetTyVecSize != 3 || ArgTyVecSize != 3)
++        report_fatal_error("ConvertBFloat163AsUShort3 must be of <3 x i16> and "
++                           "take <3 x float>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertBFloat164AsUShort4) {
++      if (RetTyVecSize != 4 || ArgTyVecSize != 4)
++        report_fatal_error("ConvertBFloat164AsUShort4 must be of <4 x i16> and "
++                           "take <4 x float>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertBFloat168AsUShort8) {
++      if (RetTyVecSize != 8 || ArgTyVecSize != 8)
++        report_fatal_error("ConvertBFloat168AsUShort8 must be of <8 x i16> and "
++                           "take <8 x float>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertBFloat1616AsUShort16) {
++      if (RetTyVecSize != 16 || ArgTyVecSize != 16)
++        report_fatal_error("ConvertBFloat1616AsUShort16 must be of <16 x i16> "
++                           "and take <16 x float>");
++    }
++  }
++
++  AttributeList Attrs = CI->getCalledFunction()->getAttributes();
++  mutateCallInstSPIRV(
++      M, CI,
++      [=](CallInst *, std::vector<Value *> &Args) {
++        return getSPIRVFuncName(internal::OpConvertFToBF16INTEL);
++      },
++      &Attrs);
++}
++
++void OCLToSPIRV::visitCallConvertAsBFloat16Float(CallInst *CI,
++                                                     StringRef DemangledName) {
++  Type *RetTy = CI->getType();
++  Type *ArgTy = CI->getOperand(0)->getType();
++  if (DemangledName == kOCLBuiltinName::ConvertAsBFloat16Float) {
++    if (!RetTy->isFloatTy() || !ArgTy->isIntegerTy(16U))
++      report_fatal_error(
++          "OpConvertAsBFloat16Float must be of float and take i16");
++  } else {
++    FixedVectorType *RetTyVec = cast<FixedVectorType>(RetTy);
++    FixedVectorType *ArgTyVec = cast<FixedVectorType>(ArgTy);
++    if (!RetTyVec || !RetTyVec->getElementType()->isFloatTy() || !ArgTyVec ||
++        !ArgTyVec->getElementType()->isIntegerTy(16U))
++      report_fatal_error("OpConvertAsBFloat16NFloatN must be of <N x float> "
++                         "and take <N x i16>");
++    unsigned RetTyVecSize = RetTyVec->getNumElements();
++    unsigned ArgTyVecSize = ArgTyVec->getNumElements();
++    if (DemangledName == kOCLBuiltinName::ConvertAsBFloat162Float2) {
++      if (RetTyVecSize != 2 || ArgTyVecSize != 2)
++        report_fatal_error("ConvertAsBFloat162Float2 must be of <2 x float> "
++                           "and take <2 x i16>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertAsBFloat163Float3) {
++      if (RetTyVecSize != 3 || ArgTyVecSize != 3)
++        report_fatal_error("ConvertAsBFloat163Float3 must be of <3 x float> "
++                           "and take <3 x i16>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertAsBFloat164Float4) {
++      if (RetTyVecSize != 4 || ArgTyVecSize != 4)
++        report_fatal_error("ConvertAsBFloat164Float4 must be of <4 x float> "
++                           "and take <4 x i16>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertAsBFloat168Float8) {
++      if (RetTyVecSize != 8 || ArgTyVecSize != 8)
++        report_fatal_error("ConvertAsBFloat168Float8 must be of <8 x float> "
++                           "and take <8 x i16>");
++    } else if (DemangledName == kOCLBuiltinName::ConvertAsBFloat1616Float16) {
++      if (RetTyVecSize != 16 || ArgTyVecSize != 16)
++        report_fatal_error("ConvertAsBFloat1616Float16 must be of <16 x float> "
++                           "and take <16 x i16>");
++    }
++  }
++
++  AttributeList Attrs = CI->getCalledFunction()->getAttributes();
++  mutateCallInstSPIRV(
++      M, CI,
++      [=](CallInst *, std::vector<Value *> &Args) {
++        return getSPIRVFuncName(internal::OpConvertBF16ToFINTEL);
++      },
++      &Attrs);
++}
++
+ } // namespace SPIRV
+ 
+ INITIALIZE_PASS_BEGIN(OCLToSPIRV, "ocl-to-spv", "Transform OCL 2.0 to SPIR-V",
+diff --git a/lib/SPIRV/OCLUtil.h b/lib/SPIRV/OCLUtil.h
+index 04093ff8..3c569f33 100644
+--- a/lib/SPIRV/OCLUtil.h
++++ b/lib/SPIRV/OCLUtil.h
+@@ -296,6 +296,26 @@ const static char SubgroupImageMediaBlockINTELPrefix[] =
+     "intel_sub_group_media_block";
+ const static char SplitBarrierINTELPrefix[] = "intel_work_group_barrier_";
+ const static char LDEXP[] = "ldexp";
++#define _SPIRV_OP(x)                                                           \
++  const static char ConvertBFloat16##x##AsUShort##x[] =                        \
++      "intel_convert_bfloat16" #x "_as_ushort" #x;
++_SPIRV_OP()
++_SPIRV_OP(2)
++_SPIRV_OP(3)
++_SPIRV_OP(4)
++_SPIRV_OP(8)
++_SPIRV_OP(16)
++#undef _SPIRV_OP
++#define _SPIRV_OP(x)                                                           \
++  const static char ConvertAsBFloat16##x##Float##x[] =                         \
++      "intel_convert_as_bfloat16" #x "_float" #x;
++_SPIRV_OP()
++_SPIRV_OP(2)
++_SPIRV_OP(3)
++_SPIRV_OP(4)
++_SPIRV_OP(8)
++_SPIRV_OP(16)
++#undef _SPIRV_OP
+ } // namespace kOCLBuiltinName
+ 
+ /// Offset for OpenCL image channel order enumeration values.
+diff --git a/lib/SPIRV/SPIRVToOCL.cpp b/lib/SPIRV/SPIRVToOCL.cpp
+index c3922bc3..353a52be 100644
+--- a/lib/SPIRV/SPIRVToOCL.cpp
++++ b/lib/SPIRV/SPIRVToOCL.cpp
+@@ -198,6 +198,11 @@ void SPIRVToOCL::visitCallInst(CallInst &CI) {
+       visitCallSPIRVRelational(&CI, OC);
+     return;
+   }
++  if (OC == internal::OpConvertFToBF16INTEL ||
++      OC == internal::OpConvertBF16ToFINTEL) {
++    visitCallSPIRVBFloat16Conversions(&CI, OC);
++    return;
++  }
+   if (OCLSPIRVBuiltinMap::rfind(OC))
+     visitCallSPIRVBuiltin(&CI, OC);
+ }
+@@ -971,6 +976,32 @@ void SPIRVToOCL::visitCallSPIRVGenericPtrMemSemantics(CallInst *CI) {
+       &Attrs);
+ }
+ 
++void SPIRVToOCL::visitCallSPIRVBFloat16Conversions(CallInst *CI, Op OC) {
++  AttributeList Attrs = CI->getCalledFunction()->getAttributes();
++  mutateCallInstOCL(
++      M, CI,
++      [=](CallInst *, std::vector<Value *> &Args) {
++        Type *ArgTy = CI->getOperand(0)->getType();
++        std::string N =
++            ArgTy->isVectorTy()
++                ? std::to_string(cast<FixedVectorType>(ArgTy)->getNumElements())
++                : "";
++        std::string Name;
++        switch (static_cast<uint32_t>(OC)) {
++        case internal::OpConvertFToBF16INTEL:
++          Name = "intel_convert_bfloat16" + N + "_as_ushort" + N;
++          break;
++        case internal::OpConvertBF16ToFINTEL:
++          Name = "intel_convert_as_bfloat16" + N + "_float" + N;
++          break;
++        default:
++          break; // do nothing
++        }
++        return Name;
++      },
++      &Attrs);
++}
++
+ void SPIRVToOCL::visitCallSPIRVBuiltin(CallInst *CI, Op OC) {
+   AttributeList Attrs = CI->getCalledFunction()->getAttributes();
+   mutateCallInstOCL(
+diff --git a/lib/SPIRV/SPIRVToOCL.h b/lib/SPIRV/SPIRVToOCL.h
+index 2821dcd7..eb715ae7 100644
+--- a/lib/SPIRV/SPIRVToOCL.h
++++ b/lib/SPIRV/SPIRVToOCL.h
+@@ -156,6 +156,13 @@ public:
+   ///  %1 = shl i31 %0, 8
+   void visitCallSPIRVGenericPtrMemSemantics(CallInst *CI);
+ 
++  /// Transform __spirv_ConvertFToBF16INTELDv(N)_f to:
++  /// intel_convert_bfloat16(N)_as_ushort(N)Dv(N)_f;
++  /// and transform __spirv_ConvertBF16ToFINTELDv(N)_s to:
++  /// intel_convert_as_bfloat16(N)_float(N)Dv(N)_t;
++  /// where N is vector size
++  void visitCallSPIRVBFloat16Conversions(CallInst *CI, Op OC);
++
+   /// Transform __spirv_* builtins to OCL 2.0 builtins.
+   /// No change with arguments.
+   void visitCallSPIRVBuiltin(CallInst *CI, Op OC);
+diff --git a/lib/SPIRV/libSPIRV/SPIRVInstruction.h b/lib/SPIRV/libSPIRV/SPIRVInstruction.h
+index 77ce05eb..f9cef115 100644
+--- a/lib/SPIRV/libSPIRV/SPIRVInstruction.h
++++ b/lib/SPIRV/libSPIRV/SPIRVInstruction.h
+@@ -3279,6 +3279,77 @@ _SPIRV_OP(SaveMemory, true, 3)
+ _SPIRV_OP(RestoreMemory, false, 2)
+ #undef _SPIRV_OP
+ 
++template <Op OC>
++class SPIRVBfloat16ConversionINTELInstBase : public SPIRVUnaryInst<OC> {
++protected:
++  SPIRVCapVec getRequiredCapability() const override {
++    return getVec(internal::CapabilityBfloat16ConversionINTEL);
++  }
++
++  llvm::Optional<ExtensionID> getRequiredExtension() const override {
++    return ExtensionID::SPV_INTEL_bfloat16_conversion;
++  }
++
++  void validate() const override {
++    SPIRVUnaryInst<OC>::validate();
++
++    SPIRVType *ResCompTy = this->getType();
++    SPIRVWord ResCompCount = 1;
++    if (ResCompTy->isTypeVector()) {
++      ResCompCount = ResCompTy->getVectorComponentCount();
++      ResCompTy = ResCompTy->getVectorComponentType();
++    }
++
++    // validate is a const method, whilst getOperand is non-const method
++    // because it may call a method of class Module that may modify LiteralMap
++    // of Module field. That modification is not impacting validate method for
++    // these instructions, so const_cast is safe here.
++    using SPVBf16ConvTy = SPIRVBfloat16ConversionINTELInstBase<OC>;
++    SPIRVValue *Input = const_cast<SPVBf16ConvTy *>(this)->getOperand(0);
++
++    SPIRVType *InCompTy = Input->getType();
++    SPIRVWord InCompCount = 1;
++    if (InCompTy->isTypeVector()) {
++      InCompCount = InCompTy->getVectorComponentCount();
++      InCompTy = InCompTy->getVectorComponentType();
++    }
++
++    auto InstName = OpCodeNameMap::map(OC);
++    SPIRVErrorLog &SPVErrLog = this->getModule()->getErrorLog();
++
++    if (OC == internal::OpConvertFToBF16INTEL) {
++      SPVErrLog.checkError(
++          ResCompTy->isTypeInt(16), SPIRVEC_InvalidInstruction,
++          InstName + "\nResult value must be a scalar or vector of integer "
++                     "16-bit type\n");
++      SPVErrLog.checkError(
++          InCompTy->isTypeFloat(32), SPIRVEC_InvalidInstruction,
++          InstName + "\nInput value must be a scalar or vector of "
++                     "floating-point 32-bit type\n");
++    } else {
++      SPVErrLog.checkError(
++          ResCompTy->isTypeFloat(32), SPIRVEC_InvalidInstruction,
++          InstName + "\nResult value must be a scalar or vector of "
++                     "floating-point 32-bit type\n");
++      SPVErrLog.checkError(
++          InCompTy->isTypeInt(16), SPIRVEC_InvalidInstruction,
++          InstName + "\nInput value must be a scalar or vector of integer "
++                     "16-bit type\n");
++    }
++
++    SPVErrLog.checkError(
++        ResCompCount == InCompCount, SPIRVEC_InvalidInstruction,
++        InstName + "\nInput type must have the same number of components as "
++                   "result type\n");
++  }
++};
++
++#define _SPIRV_OP(x)                                                           \
++  typedef SPIRVBfloat16ConversionINTELInstBase<internal::Op##x> SPIRV##x;
++_SPIRV_OP(ConvertFToBF16INTEL)
++_SPIRV_OP(ConvertBF16ToFINTEL)
++#undef _SPIRV_OP
++
+ class SPIRVSplitBarrierINTELBase : public SPIRVInstTemplateBase {
+ protected:
+   SPIRVCapVec getRequiredCapability() const override {
+diff --git a/lib/SPIRV/libSPIRV/SPIRVNameMapEnum.h b/lib/SPIRV/libSPIRV/SPIRVNameMapEnum.h
+index e05b0de1..71586a7f 100644
+--- a/lib/SPIRV/libSPIRV/SPIRVNameMapEnum.h
++++ b/lib/SPIRV/libSPIRV/SPIRVNameMapEnum.h
+@@ -528,6 +528,7 @@ template <> inline void SPIRVMap<Capability, std::string>::init() {
+   add(internal::CapabilityMemoryAccessAliasingINTEL,
+       "MemoryAccessAliasingINTEL");
+   add(CapabilitySplitBarrierINTEL, "SplitBarrierINTEL");
++  add(internal::CapabilityBfloat16ConversionINTEL, "Bfloat16ConversionINTEL");
+ }
+ SPIRV_DEF_NAMEMAP(Capability, SPIRVCapabilityNameMap)
+ 
+diff --git a/lib/SPIRV/libSPIRV/SPIRVOpCodeEnumInternal.h b/lib/SPIRV/libSPIRV/SPIRVOpCodeEnumInternal.h
+index fb3a01a2..e3d0a2f0 100644
+--- a/lib/SPIRV/libSPIRV/SPIRVOpCodeEnumInternal.h
++++ b/lib/SPIRV/libSPIRV/SPIRVOpCodeEnumInternal.h
+@@ -6,3 +6,5 @@ _SPIRV_OP_INTERNAL(Forward, internal::OpForward)
+ _SPIRV_OP_INTERNAL(AliasDomainDeclINTEL, internal::OpAliasDomainDeclINTEL)
+ _SPIRV_OP_INTERNAL(AliasScopeDeclINTEL, internal::OpAliasScopeDeclINTEL)
+ _SPIRV_OP_INTERNAL(AliasScopeListDeclINTEL, internal::OpAliasScopeListDeclINTEL)
++_SPIRV_OP_INTERNAL(ConvertFToBF16INTEL, internal::OpConvertFToBF16INTEL)
++_SPIRV_OP_INTERNAL(ConvertBF16ToFINTEL, internal::OpConvertBF16ToFINTEL)
+diff --git a/lib/SPIRV/libSPIRV/spirv_internal.hpp b/lib/SPIRV/libSPIRV/spirv_internal.hpp
+index 3b263606..8cf00968 100644
+--- a/lib/SPIRV/libSPIRV/spirv_internal.hpp
++++ b/lib/SPIRV/libSPIRV/spirv_internal.hpp
+@@ -40,6 +40,8 @@ enum InternalOp {
+   IOpAliasDomainDeclINTEL = 5911,
+   IOpAliasScopeDeclINTEL = 5912,
+   IOpAliasScopeListDeclINTEL = 5913,
++  IOpConvertFToBF16INTEL = 6116,
++  IOpConvertBF16ToFINTEL = 6117,
+   IOpPrev = OpMax - 2,
+   IOpForward
+ };
+@@ -52,6 +54,7 @@ enum InternalDecoration {
+ enum InternalCapability {
+   ICapOptimizationHintsINTEL = 5629,
+   ICapMemoryAccessAliasingINTEL = 5910,
++  ICapBfloat16ConversionINTEL = 6115,
+   ICapOptNoneINTEL = 6094
+ };
+ 
+@@ -78,6 +81,9 @@ constexpr Decoration DecorationAliasScopeINTEL =
+ constexpr Decoration DecorationNoAliasINTEL =
+     static_cast<Decoration>(IDecNoAliasINTEL);
+ 
++constexpr Op OpConvertFToBF16INTEL = static_cast<Op>(IOpConvertFToBF16INTEL);
++constexpr Op OpConvertBF16ToFINTEL = static_cast<Op>(IOpConvertBF16ToFINTEL);
++
+ constexpr Capability CapabilityOptimizationHintsINTEL =
+     static_cast<Capability>(ICapOptimizationHintsINTEL);
+ constexpr Capability CapabilityOptNoneINTEL =
+@@ -85,6 +91,9 @@ constexpr Capability CapabilityOptNoneINTEL =
+ constexpr Capability CapabilityMemoryAccessAliasingINTEL =
+     static_cast<Capability>(ICapMemoryAccessAliasingINTEL);
+ 
++constexpr Capability CapabilityBfloat16ConversionINTEL =
++    static_cast<Capability>(ICapBfloat16ConversionINTEL);
++
+ constexpr FunctionControlMask FunctionControlOptNoneINTELMask =
+     static_cast<FunctionControlMask>(IFunctionControlOptNoneINTELMask);
+ 
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_scalar_signature.ll b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_scalar_signature.ll
+new file mode 100644
+index 00000000..33908268
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_scalar_signature.ll
+@@ -0,0 +1,23 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not --crash llvm-spirv %t.bc -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: OpConvertAsBFloat16Float must be of float and take i16
++
++; ModuleID = 'kernel.cl'
++source_filename = "kernel.cl"
++target datalayout = "e-p:32:32-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir"
++
++; Function Attrs: convergent noinline norecurse nounwind optnone
++define dso_local spir_kernel void @f() {
++entry:
++  %call = call spir_func double @_Z31intel_convert_as_bfloat16_floatt(i32 zeroext 0)
++  ret void
++}
++
++; Function Attrs: convergent
++declare spir_func double @_Z31intel_convert_as_bfloat16_floatt(i32 zeroext)
++
++!opencl.ocl.version = !{!0}
++
++!0 = !{i32 2, i32 0}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_elem_ty.ll b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_elem_ty.ll
+new file mode 100644
+index 00000000..d69c354d
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_elem_ty.ll
+@@ -0,0 +1,23 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not --crash llvm-spirv %t.bc -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: OpConvertAsBFloat16NFloatN must be of <N x float> and take <N x i16>
++
++; ModuleID = 'kernel.cl'
++source_filename = "kernel.cl"
++target datalayout = "e-p:32:32-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir"
++
++; Function Attrs: convergent noinline norecurse nounwind optnone
++define dso_local spir_kernel void @f() {
++entry:
++  %call = call spir_func <2 x double> @_Z33intel_convert_as_bfloat162_float2Dv2_t(<2 x i32> zeroinitializer)
++  ret void
++}
++
++; ; Function Attrs: convergent
++declare spir_func <2 x double> @_Z33intel_convert_as_bfloat162_float2Dv2_t(<2 x i32>)
++
++!opencl.ocl.version = !{!0}
++
++!0 = !{i32 2, i32 0}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_size.ll b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_size.ll
+new file mode 100644
+index 00000000..f8c1c146
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertAsBFloat16Float_inval_vec_size.ll
+@@ -0,0 +1,23 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not --crash llvm-spirv %t.bc -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: ConvertAsBFloat162Float2 must be of <2 x float> and take <2 x i16>
++
++; ModuleID = 'kernel.cl'
++source_filename = "kernel.cl"
++target datalayout = "e-p:32:32-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir"
++
++; Function Attrs: convergent noinline norecurse nounwind optnone
++define dso_local spir_kernel void @f() {
++entry:
++  %call = call spir_func <8 x float> @_Z33intel_convert_as_bfloat162_float2Dv2_t(<4 x i16> zeroinitializer)
++  ret void
++}
++
++; Function Attrs: convergent
++declare spir_func <8 x float> @_Z33intel_convert_as_bfloat162_float2Dv2_t(<4 x i16>)
++
++!opencl.ocl.version = !{!0}
++
++!0 = !{i32 2, i32 0}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_scalar_signature.ll b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_scalar_signature.ll
+new file mode 100644
+index 00000000..586dce1b
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_scalar_signature.ll
+@@ -0,0 +1,23 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not --crash llvm-spirv %t.bc -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: OpConvertBFloat16AsUShort must be of i16 and take float
++
++; ModuleID = 'kernel.cl'
++source_filename = "kernel.cl"
++target datalayout = "e-p:32:32-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir"
++
++; Function Attrs: convergent noinline norecurse nounwind optnone
++define dso_local spir_kernel void @f() {
++entry:
++  %call = call spir_func zeroext i16 @_Z32intel_convert_bfloat16_as_ushortf(double 0.000000e+00)
++  ret void
++}
++
++; Function Attrs: convergent
++declare spir_func zeroext i16 @_Z32intel_convert_bfloat16_as_ushortf(double)
++
++!opencl.ocl.version = !{!0}
++
++!0 = !{i32 2, i32 0}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_elem_ty.ll b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_elem_ty.ll
+new file mode 100644
+index 00000000..ac4f2388
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_elem_ty.ll
+@@ -0,0 +1,23 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not --crash llvm-spirv %t.bc -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: OpConvertBFloat16NAsUShortN must be of <N x i16> and take <N x float>
++
++; ModuleID = 'kernel.cl'
++source_filename = "kernel.cl"
++target datalayout = "e-p:32:32-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir"
++
++; Function Attrs: convergent noinline norecurse nounwind optnone
++define dso_local spir_kernel void @f() {
++entry:
++  %call = call spir_func <2 x i32> @_Z34intel_convert_bfloat162_as_ushort2Dv2_f(<2 x double> zeroinitializer)
++  ret void
++}
++
++; Function Attrs: convergent
++declare spir_func <2 x i32> @_Z34intel_convert_bfloat162_as_ushort2Dv2_f(<2 x double>)
++
++!opencl.ocl.version = !{!0}
++
++!0 = !{i32 2, i32 0}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_size.ll b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_size.ll
+new file mode 100644
+index 00000000..7c3e71fd
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/ConvertBFloat16AsUshort_inval_vec_size.ll
+@@ -0,0 +1,23 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not --crash llvm-spirv %t.bc -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: ConvertBFloat162AsUShort2 must be of <2 x i16> and take <2 x float>
++
++; ModuleID = 'kernel.cl'
++source_filename = "kernel.cl"
++target datalayout = "e-p:32:32-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir"
++
++; Function Attrs: convergent noinline norecurse nounwind optnone
++define dso_local spir_kernel void @f() {
++entry:
++  %call = call spir_func <8 x i16> @_Z34intel_convert_bfloat162_as_ushort2Dv2_f(<4 x float> zeroinitializer)
++  ret void
++}
++
++; Function Attrs: convergent
++declare spir_func <8 x i16> @_Z34intel_convert_bfloat162_as_ushort2Dv2_f(<4 x float>)
++
++!opencl.ocl.version = !{!0}
++
++!0 = !{i32 2, i32 0}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.ll b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.ll
+new file mode 100644
+index 00000000..3663dda8
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.ll
+@@ -0,0 +1,28 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not llvm-spirv %t.bc --spirv-ext=+SPV_INTEL_bfloat16_conversion 2>&1 \
++; RUN: | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertBF16ToFINTEL
++; CHECK-ERROR-NEXT: Input type must have the same number of components as result type
++
++
++target datalayout = "e-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir64-unknown-unknown"
++
++define spir_func void @_Z1f() {
++  %1 = alloca <2 x i16>, align 4
++  %2 = load <2 x i16>, <2 x i16>* %1, align 4
++  %3 = tail call spir_func float @_Z27__spirv_ConvertBF16ToFINTELf(<2 x i16> %2)
++  ret void
++}
++
++declare spir_func float @_Z27__spirv_ConvertBF16ToFINTELf(<2 x i16>)
++
++!opencl.spir.version = !{!0}
++!spirv.Source = !{!1}
++!llvm.ident = !{!2}
++
++!0 = !{i32 1, i32 2}
++!1 = !{i32 4, i32 100000}
++!2 = !{!"clang version 13.0.0"}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.spt b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.spt
+new file mode 100644
+index 00000000..4adc3114
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_input_ty.spt
+@@ -0,0 +1,39 @@
++; RUN: not llvm-spirv %s -to-binary -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertBF16ToFINTEL
++; CHECK-ERROR-NEXT: Input value must be a scalar or vector of integer 16-bit type
++
++119734787 65536 393230 14 0
++2 Capability Addresses
++2 Capability Linkage
++2 Capability Kernel
++2 Capability Int64
++2 Capability Bfloat16ConversionINTEL
++9 Extension "SPV_INTEL_bfloat16_conversion"
++5 ExtInstImport 1 "OpenCL.std"
++3 MemoryModel 2 2
++3 Source 4 100000
++4 Name 4 "_Z1f"
++
++6 Decorate 4 LinkageAttributes "_Z1f" Export
++4 Decorate 11 Alignment 4
++4 TypeInt 6 64 0
++5 Constant 6 7 32 0
++2 TypeVoid 2
++3 TypeFunction 3 2
++2 TypeBool 8
++4 TypeArray 9 8 7
++4 TypePointer 10 7 9
++3 TypeFloat 12 32
++
++
++
++5 Function 2 4 0 3
++
++2 Label 5
++4 Variable 10 11 7
++4 ConvertBF16ToFINTEL 12 13 11
++1 Return
++
++1 FunctionEnd
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.ll b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.ll
+new file mode 100644
+index 00000000..c1fb2ea3
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.ll
+@@ -0,0 +1,27 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not llvm-spirv %t.bc --spirv-ext=+SPV_INTEL_bfloat16_conversion 2>&1 \
++; RUN: | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertBF16ToFINTEL
++; CHECK-ERROR-NEXT: Input value must be a scalar or vector of integer 16-bit type
++
++
++target datalayout = "e-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir64-unknown-unknown"
++
++define spir_func void @_Z1f() {
++  %1 = alloca [3 x i32], align 4
++  %2 = tail call spir_func float @_Z27__spirv_ConvertBF16ToFINTELf([3 x i32]* %1)
++  ret void
++}
++
++declare spir_func float @_Z27__spirv_ConvertBF16ToFINTELf([3 x i32]*)
++
++!opencl.spir.version = !{!0}
++!spirv.Source = !{!1}
++!llvm.ident = !{!2}
++
++!0 = !{i32 1, i32 2}
++!1 = !{i32 4, i32 100000}
++!2 = !{!"clang version 13.0.0"}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.spt b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.spt
+new file mode 100644
+index 00000000..a1b35c5d
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_output_ty.spt
+@@ -0,0 +1,41 @@
++; RUN: not llvm-spirv %s -to-binary -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertBF16ToFINTEL
++; CHECK-ERROR-NEXT: Result value must be a scalar or vector of floating-point 32-bit type
++
++119734787 65536 393230 16 0
++2 Capability Addresses
++2 Capability Linkage
++2 Capability Kernel
++2 Capability Int64
++2 Capability Bfloat16ConversionINTEL
++9 Extension "SPV_INTEL_bfloat16_conversion"
++5 ExtInstImport 1 "OpenCL.std"
++3 MemoryModel 2 2
++3 Source 4 100000
++4 Name 4 "_Z1f"
++
++6 Decorate 4 LinkageAttributes "_Z1f" Export
++4 Decorate 8 Alignment 4
++4 TypeInt 10 64 0
++4 TypeInt 12 32 0
++5 Constant 10 11 3 0
++2 TypeVoid 2
++3 TypeFunction 3 2
++3 TypeFloat 6 32
++4 TypePointer 7 7 6
++4 TypeArray 13 12 11
++4 TypePointer 14 7 13
++
++
++
++5 Function 2 4 0 3
++
++2 Label 5
++4 Variable 7 8 7
++6 Load 6 9 8 2 4
++4 ConvertBF16ToFINTEL 14 15 9
++1 Return
++
++1 FunctionEnd
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_params.spt b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_params.spt
+new file mode 100644
+index 00000000..874e027f
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/bf16tof_inval_params.spt
+@@ -0,0 +1,39 @@
++; RUN: not llvm-spirv %s -to-binary -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertBF16ToFINTEL
++; CHECK-ERROR-NEXT: Input type must have the same number of components as result type
++
++119734787 65536 393230 14 0
++2 Capability Addresses
++2 Capability Linkage
++2 Capability Kernel
++2 Capability Int16
++2 Capability Bfloat16ConversionINTEL
++9 Extension "SPV_INTEL_bfloat16_conversion"
++5 ExtInstImport 1 "OpenCL.std"
++3 MemoryModel 2 2
++3 Source 4 100000
++4 Name 4 "_Z1f"
++
++6 Decorate 4 LinkageAttributes "_Z1f" Export
++4 Decorate 9 Alignment 4
++4 TypeInt 6 16 0
++2 TypeVoid 2
++3 TypeFunction 3 2
++4 TypeVector 7 6 4
++4 TypePointer 8 7 7
++3 TypeFloat 11 32
++4 TypeVector 12 11 3
++
++
++
++5 Function 2 4 0 3
++
++2 Label 5
++4 Variable 8 9 7
++6 Load 7 10 9 2 4
++4 ConvertBF16ToFINTEL 12 13 10
++1 Return
++
++1 FunctionEnd
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.ll b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.ll
+new file mode 100644
+index 00000000..cdc722f8
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.ll
+@@ -0,0 +1,28 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not llvm-spirv %t.bc --spirv-ext=+SPV_INTEL_bfloat16_conversion 2>&1 \
++; RUN: | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertFToBF16INTEL
++; CHECK-ERROR-NEXT: Input value must be a scalar or vector of floating-point 32-bit type
++
++
++target datalayout = "e-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir64-unknown-unknown"
++
++define spir_func void @_Z1f() {
++  %1 = alloca double, align 8
++  %2 = load double, double* %1, align 8
++  %3 = tail call spir_func zeroext i16 @_Z27__spirv_ConvertFToBF16INTELf(double %2)
++  ret void
++}
++
++declare spir_func zeroext i16 @_Z27__spirv_ConvertFToBF16INTELf(double)
++
++!opencl.spir.version = !{!0}
++!spirv.Source = !{!1}
++!llvm.ident = !{!2}
++
++!0 = !{i32 1, i32 2}
++!1 = !{i32 4, i32 100000}
++!2 = !{!"clang version 13.0.0"}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.spt b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.spt
+new file mode 100644
+index 00000000..75c8e50c
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_input_ty.spt
+@@ -0,0 +1,37 @@
++; RUN: not llvm-spirv %s -to-binary -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertFToBF16INTEL
++; CHECK-ERROR-NEXT: Input value must be a scalar or vector of floating-point 32-bit type
++
++119734787 65536 393230 12 0
++2 Capability Addresses
++2 Capability Linkage
++2 Capability Kernel
++2 Capability Int16
++2 Capability Bfloat16ConversionINTEL
++9 Extension "SPV_INTEL_bfloat16_conversion"
++5 ExtInstImport 1 "OpenCL.std"
++3 MemoryModel 2 2
++3 Source 4 100000
++4 Name 4 "_Z1f"
++
++6 Decorate 4 LinkageAttributes "_Z1f" Export
++4 Decorate 8 Alignment 4
++4 TypeInt 10 16 0
++2 TypeVoid 2
++3 TypeFunction 3 2
++3 TypeInt 6 32 0
++4 TypePointer 7 7 6
++
++
++
++5 Function 2 4 0 3
++
++2 Label 5
++4 Variable 7 8 7
++6 Load 6 9 8 2 4
++4 ConvertFToBF16INTEL 10 11 9
++1 Return
++
++1 FunctionEnd
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty.spt b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty.spt
+new file mode 100644
+index 00000000..4e72e638
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty.spt
+@@ -0,0 +1,37 @@
++; RUN: not llvm-spirv %s -to-binary -o %t.spv 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertFToBF16INTEL
++; CHECK-ERROR-NEXT: Result value must be a scalar or vector of integer 16-bit type
++
++119734787 65536 393230 12 0
++2 Capability Addresses
++2 Capability Linkage
++2 Capability Kernel
++2 Capability Int16
++2 Capability Bfloat16ConversionINTEL
++9 Extension "SPV_INTEL_bfloat16_conversion"
++5 ExtInstImport 1 "OpenCL.std"
++3 MemoryModel 2 2
++3 Source 4 100000
++4 Name 4 "_Z1f"
++
++6 Decorate 4 LinkageAttributes "_Z1f" Export
++4 Decorate 8 Alignment 4
++4 TypeFloat 10 16
++2 TypeVoid 2
++3 TypeFunction 3 2
++3 TypeFloat 6 32
++4 TypePointer 7 7 6
++
++
++
++5 Function 2 4 0 3
++
++2 Label 5
++4 Variable 7 8 7
++6 Load 6 9 8 2 4
++4 ConvertFToBF16INTEL 10 11 9
++1 Return
++
++1 FunctionEnd
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_1.ll b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_1.ll
+new file mode 100644
+index 00000000..c19fc545
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_1.ll
+@@ -0,0 +1,28 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not llvm-spirv %t.bc --spirv-ext=+SPV_INTEL_bfloat16_conversion 2>&1 \
++; RUN: | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertFToBF16INTEL
++; CHECK-ERROR-NEXT: Result value must be a scalar or vector of integer 16-bit type
++
++
++target datalayout = "e-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir64-unknown-unknown"
++
++define spir_func void @_Z1f() {
++  %1 = alloca float, align 4
++  %2 = load float, float* %1, align 4
++  %3 = tail call spir_func zeroext i32 @_Z27__spirv_ConvertFToBF16INTELf(float %2)
++  ret void
++}
++
++declare spir_func zeroext i32 @_Z27__spirv_ConvertFToBF16INTELf(float)
++
++!opencl.spir.version = !{!0}
++!spirv.Source = !{!1}
++!llvm.ident = !{!2}
++
++!0 = !{i32 1, i32 2}
++!1 = !{i32 4, i32 100000}
++!2 = !{!"clang version 13.0.0"}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_2.ll b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_2.ll
+new file mode 100644
+index 00000000..8bfda84b
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_output_ty_2.ll
+@@ -0,0 +1,28 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not llvm-spirv %t.bc --spirv-ext=+SPV_INTEL_bfloat16_conversion 2>&1 \
++; RUN: | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertFToBF16INTEL
++; CHECK-ERROR-NEXT: Input type must have the same number of components as result type
++
++
++target datalayout = "e-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir64-unknown-unknown"
++
++define spir_func void @_Z1f() {
++  %1 = alloca float, align 4
++  %2 = load float, float* %1, align 4
++  %3 = tail call spir_func <4 x i16> @_Z27__spirv_ConvertFToBF16INTELf(float %2)
++  ret void
++}
++
++declare spir_func <4 x i16> @_Z27__spirv_ConvertFToBF16INTELf(float)
++
++!opencl.spir.version = !{!0}
++!spirv.Source = !{!1}
++!llvm.ident = !{!2}
++
++!0 = !{i32 1, i32 2}
++!1 = !{i32 4, i32 100000}
++!2 = !{!"clang version 13.0.0"}
+diff --git a/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_params.ll b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_params.ll
+new file mode 100644
+index 00000000..d8413f2f
+--- /dev/null
++++ b/test/negative/SPV_INTEL_bfloat16_conversion/f2bf16_inval_params.ll
+@@ -0,0 +1,28 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: not llvm-spirv %t.bc --spirv-ext=+SPV_INTEL_bfloat16_conversion 2>&1 \
++; RUN: | FileCheck %s --check-prefix=CHECK-ERROR
++
++; CHECK-ERROR: InvalidInstruction: Can't translate llvm instruction:
++; CHECK-ERROR-NEXT: ConvertFToBF16INTEL
++; CHECK-ERROR-NEXT: Input type must have the same number of components as result type
++
++
++target datalayout = "e-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir64-unknown-unknown"
++
++define spir_func void @_Z1f() {
++  %1 = alloca <4 x float>, align 16
++  %2 = load <4 x float>, <4 x float>* %1, align 16
++  %3 = tail call spir_func <8 x i16> @_Z27__spirv_ConvertFToBF16INTELf(<4 x float> %2)
++  ret void
++}
++
++declare spir_func <8 x i16> @_Z27__spirv_ConvertFToBF16INTELf(<4 x float>)
++
++!opencl.spir.version = !{!0}
++!spirv.Source = !{!1}
++!llvm.ident = !{!2}
++
++!0 = !{i32 1, i32 2}
++!1 = !{i32 4, i32 100000}
++!2 = !{!"clang version 13.0.0"}
+diff --git a/test/transcoding/SPV_INTEL_bfloat16_conversion/cl_bfloat16_conversions_extension.ll b/test/transcoding/SPV_INTEL_bfloat16_conversion/cl_bfloat16_conversions_extension.ll
+new file mode 100644
+index 00000000..11b869a9
+--- /dev/null
++++ b/test/transcoding/SPV_INTEL_bfloat16_conversion/cl_bfloat16_conversions_extension.ll
+@@ -0,0 +1,151 @@
++; RUN: llvm-as %s -o %t.bc
++
++; RUN: not llvm-spirv %t.bc 2>&1 | FileCheck %s --check-prefix=CHECK-WO-EXT
++
++; RUN: llvm-spirv -s %t.bc -o %t.regularized.bc
++; RUN: llvm-dis %t.regularized.bc -o %t.regularized.ll
++; RUN: FileCheck < %t.regularized.ll %s --check-prefix=CHECK-REGULARIZED
++
++; RUN: llvm-spirv --spirv-text %t.bc -o %t.spt --spirv-ext=+SPV_INTEL_bfloat16_conversion
++; RUN: FileCheck < %t.spt %s --check-prefix=CHECK-SPIRV
++
++; RUN: llvm-spirv -to-binary %t.spt -o %t.spv
++
++; RUN: llvm-spirv -r %t.spv -o %t.rev.bc --spirv-target-env=CL2.0
++; RUN: llvm-dis %t.rev.bc -o %t.rev.ll
++; RUN: FileCheck < %t.rev.ll %s --check-prefix=CHECK-LLVM-CL20
++
++; RUN: llvm-spirv -r %t.spv -o %t.rev.bc --spirv-target-env=SPV-IR
++; RUN: llvm-dis %t.rev.bc -o %t.rev.ll
++; RUN: FileCheck < %t.rev.ll %s --check-prefix=CHECK-LLVM-SPV
++
++; CHECK-WO-EXT: RequiresExtension: Feature requires the following SPIR-V extension:
++; CHECK-WO-EXT-NEXT: SPV_INTEL_bfloat16_conversion
++
++; CHECK-REGULARIZED: call spir_func zeroext i16 @_Z27__spirv_ConvertFToBF16INTELf(float 0.000000e+00)
++; CHECK-REGULARIZED: call spir_func <2 x i16> @_Z27__spirv_ConvertFToBF16INTELDv2_f(<2 x float> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <3 x i16> @_Z27__spirv_ConvertFToBF16INTELDv3_f(<3 x float> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <4 x i16> @_Z27__spirv_ConvertFToBF16INTELDv4_f(<4 x float> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <8 x i16> @_Z27__spirv_ConvertFToBF16INTELDv8_f(<8 x float> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <16 x i16> @_Z27__spirv_ConvertFToBF16INTELDv16_f(<16 x float> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func float @_Z27__spirv_ConvertBF16ToFINTELs(i16 zeroext 0)
++; CHECK-REGULARIZED: call spir_func <2 x float> @_Z27__spirv_ConvertBF16ToFINTELDv2_s(<2 x i16> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <3 x float> @_Z27__spirv_ConvertBF16ToFINTELDv3_s(<3 x i16> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <4 x float> @_Z27__spirv_ConvertBF16ToFINTELDv4_s(<4 x i16> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <8 x float> @_Z27__spirv_ConvertBF16ToFINTELDv8_s(<8 x i16> zeroinitializer)
++; CHECK-REGULARIZED: call spir_func <16 x float> @_Z27__spirv_ConvertBF16ToFINTELDv16_s(<16 x i16> zeroinitializer)
++
++; CHECK-SPIRV: TypeInt [[#Int16Ty:]] 16 0
++; CHECK-SPIRV: TypeFloat [[#FloatTy:]] 32
++; CHECK-SPIRV: TypeVector [[#VecFloat2:]] [[#FloatTy]] 2
++; CHECK-SPIRV: TypeVector [[#VecInt162:]] [[#Int16Ty]] 2
++; CHECK-SPIRV: TypeVector [[#VecFloat3:]] [[#FloatTy]] 3
++; CHECK-SPIRV: TypeVector [[#VecInt163:]] [[#Int16Ty]] 3
++; CHECK-SPIRV: TypeVector [[#VecFloat4:]] [[#FloatTy]] 4
++; CHECK-SPIRV: TypeVector [[#VecInt164:]] [[#Int16Ty]] 4
++; CHECK-SPIRV: TypeVector [[#VecFloat8:]] [[#FloatTy]] 8
++; CHECK-SPIRV: TypeVector [[#VecInt168:]] [[#Int16Ty]] 8
++; CHECK-SPIRV: TypeVector [[#VecFloat16:]] [[#FloatTy]] 16
++; CHECK-SPIRV: TypeVector [[#VecInt1616:]] [[#Int16Ty]] 16
++
++; CHECK-SPIRV: ConvertFToBF16INTEL [[#Int16Ty]]
++; CHECK-SPIRV: ConvertFToBF16INTEL [[#VecInt162]]
++; CHECK-SPIRV: ConvertFToBF16INTEL [[#VecInt163]]
++; CHECK-SPIRV: ConvertFToBF16INTEL [[#VecInt164]]
++; CHECK-SPIRV: ConvertFToBF16INTEL [[#VecInt168]]
++; CHECK-SPIRV: ConvertFToBF16INTEL [[#VecInt1616]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[#FloatTy]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[#VecFloat2]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[#VecFloat3]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[#VecFloat4]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[#VecFloat8]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[#VecFloat16]]
++
++; CHECK-LLVM-SPV: call spir_func i16 @_Z27__spirv_ConvertFToBF16INTELf(float 0.000000e+00)
++; CHECK-LLVM-SPV: call spir_func <2 x i16> @_Z27__spirv_ConvertFToBF16INTELDv2_f(<2 x float> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <3 x i16> @_Z27__spirv_ConvertFToBF16INTELDv3_f(<3 x float> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <4 x i16> @_Z27__spirv_ConvertFToBF16INTELDv4_f(<4 x float> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <8 x i16> @_Z27__spirv_ConvertFToBF16INTELDv8_f(<8 x float> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <16 x i16> @_Z27__spirv_ConvertFToBF16INTELDv16_f(<16 x float> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func float @_Z27__spirv_ConvertBF16ToFINTELs(i16 0)
++; CHECK-LLVM-SPV: call spir_func <2 x float> @_Z27__spirv_ConvertBF16ToFINTELDv2_s(<2 x i16> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <3 x float> @_Z27__spirv_ConvertBF16ToFINTELDv3_s(<3 x i16> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <4 x float> @_Z27__spirv_ConvertBF16ToFINTELDv4_s(<4 x i16> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <8 x float> @_Z27__spirv_ConvertBF16ToFINTELDv8_s(<8 x i16> zeroinitializer)
++; CHECK-LLVM-SPV: call spir_func <16 x float> @_Z27__spirv_ConvertBF16ToFINTELDv16_s(<16 x i16> zeroinitializer)
++
++; CHECK-LLVM-CL20: call spir_func i16 @_Z32intel_convert_bfloat16_as_ushortf(float 0.000000e+00)
++; CHECK-LLVM-CL20: call spir_func <2 x i16> @_Z34intel_convert_bfloat162_as_ushort2Dv2_f(<2 x float> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <3 x i16> @_Z34intel_convert_bfloat163_as_ushort3Dv3_f(<3 x float> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <4 x i16> @_Z34intel_convert_bfloat164_as_ushort4Dv4_f(<4 x float> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <8 x i16> @_Z34intel_convert_bfloat168_as_ushort8Dv8_f(<8 x float> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <16 x i16> @_Z36intel_convert_bfloat1616_as_ushort16Dv16_f(<16 x float> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func float @_Z31intel_convert_as_bfloat16_floats(i16 0)
++; CHECK-LLVM-CL20: call spir_func <2 x float> @_Z33intel_convert_as_bfloat162_float2Dv2_s(<2 x i16> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <3 x float> @_Z33intel_convert_as_bfloat163_float3Dv3_s(<3 x i16> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <4 x float> @_Z33intel_convert_as_bfloat164_float4Dv4_s(<4 x i16> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <8 x float> @_Z33intel_convert_as_bfloat168_float8Dv8_s(<8 x i16> zeroinitializer)
++; CHECK-LLVM-CL20: call spir_func <16 x float> @_Z35intel_convert_as_bfloat1616_float16Dv16_s(<16 x i16> zeroinitializer)
++
++; ModuleID = 'kernel.cl'
++source_filename = "kernel.cl"
++target datalayout = "e-p:32:32-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir"
++
++; Function Attrs: convergent noinline norecurse nounwind optnone
++define dso_local spir_kernel void @f() {
++entry:
++  %call = call spir_func zeroext i16 @_Z32intel_convert_bfloat16_as_ushortf(float 0.000000e+00)
++  %call1 = call spir_func <2 x i16> @_Z34intel_convert_bfloat162_as_ushort2Dv2_f(<2 x float> zeroinitializer)
++  %call2 = call spir_func <3 x i16> @_Z34intel_convert_bfloat163_as_ushort3Dv3_f(<3 x float> zeroinitializer)
++  %call3 = call spir_func <4 x i16> @_Z34intel_convert_bfloat164_as_ushort4Dv4_f(<4 x float> zeroinitializer)
++  %call4 = call spir_func <8 x i16> @_Z34intel_convert_bfloat168_as_ushort8Dv8_f(<8 x float> zeroinitializer)
++  %call5 = call spir_func <16 x i16> @_Z36intel_convert_bfloat1616_as_ushort16Dv16_f(<16 x float> zeroinitializer)
++  %call6 = call spir_func float @_Z31intel_convert_as_bfloat16_floatt(i16 zeroext 0)
++  %call7 = call spir_func <2 x float> @_Z33intel_convert_as_bfloat162_float2Dv2_t(<2 x i16> zeroinitializer)
++  %call8 = call spir_func <3 x float> @_Z33intel_convert_as_bfloat163_float3Dv3_t(<3 x i16> zeroinitializer)
++  %call9 = call spir_func <4 x float> @_Z33intel_convert_as_bfloat164_float4Dv4_t(<4 x i16> zeroinitializer)
++  %call10 = call spir_func <8 x float> @_Z33intel_convert_as_bfloat168_float8Dv8_t(<8 x i16> zeroinitializer)
++  %call11 = call spir_func <16 x float> @_Z35intel_convert_as_bfloat1616_float16Dv16_t(<16 x i16> zeroinitializer)
++  ret void
++}
++
++; Function Attrs: convergent
++declare spir_func zeroext i16 @_Z32intel_convert_bfloat16_as_ushortf(float)
++
++; Function Attrs: convergent
++declare spir_func <2 x i16> @_Z34intel_convert_bfloat162_as_ushort2Dv2_f(<2 x float>)
++
++; Function Attrs: convergent
++declare spir_func <3 x i16> @_Z34intel_convert_bfloat163_as_ushort3Dv3_f(<3 x float>)
++
++; Function Attrs: convergent
++declare spir_func <4 x i16> @_Z34intel_convert_bfloat164_as_ushort4Dv4_f(<4 x float>)
++
++; Function Attrs: convergent
++declare spir_func <8 x i16> @_Z34intel_convert_bfloat168_as_ushort8Dv8_f(<8 x float>)
++
++; Function Attrs: convergent
++declare spir_func <16 x i16> @_Z36intel_convert_bfloat1616_as_ushort16Dv16_f(<16 x float>)
++
++; Function Attrs: convergent
++declare spir_func float @_Z31intel_convert_as_bfloat16_floatt(i16 zeroext)
++
++; Function Attrs: convergent
++declare spir_func <2 x float> @_Z33intel_convert_as_bfloat162_float2Dv2_t(<2 x i16>)
++
++; Function Attrs: convergent
++declare spir_func <3 x float> @_Z33intel_convert_as_bfloat163_float3Dv3_t(<3 x i16>)
++
++; Function Attrs: convergent
++declare spir_func <4 x float> @_Z33intel_convert_as_bfloat164_float4Dv4_t(<4 x i16>)
++
++; Function Attrs: convergent
++declare spir_func <8 x float> @_Z33intel_convert_as_bfloat168_float8Dv8_t(<8 x i16>)
++
++; Function Attrs: convergent
++declare spir_func <16 x float> @_Z35intel_convert_as_bfloat1616_float16Dv16_t(<16 x i16>)
++
++!opencl.ocl.version = !{!0}
++
++!0 = !{i32 2, i32 0}
+diff --git a/test/transcoding/SPV_INTEL_bfloat16_conversion/convert_bfloat16_generic.ll b/test/transcoding/SPV_INTEL_bfloat16_conversion/convert_bfloat16_generic.ll
+new file mode 100644
+index 00000000..a9542a86
+--- /dev/null
++++ b/test/transcoding/SPV_INTEL_bfloat16_conversion/convert_bfloat16_generic.ll
+@@ -0,0 +1,66 @@
++; RUN: llvm-as %s -o %t.bc
++; RUN: llvm-spirv %t.bc -o %t.spv --spirv-ext=+SPV_INTEL_bfloat16_conversion
++; RUN: llvm-spirv %t.spv -o %t.spt --to-text
++; RUN: FileCheck < %t.spt %s --check-prefix=CHECK-SPIRV
++; RUN: llvm-spirv %t.spv -o %t.rev.bc -r --spirv-target-env=SPV-IR
++; RUN: llvm-dis %t.rev.bc -o %t.rev.ll
++; RUN: FileCheck < %t.rev.ll %s --check-prefix=CHECK-LLVM
++
++; RUN: not llvm-spirv %t.bc 2>&1 | FileCheck %s --check-prefix=CHECK-ERROR
++; CHECK-ERROR: RequiresExtension: Feature requires the following SPIR-V extension:
++; CHECK-ERROR-NEXT: SPV_INTEL_bfloat16_conversion
++
++target datalayout = "e-i64:64-v16:16-v24:32-v32:32-v48:64-v96:128-v192:256-v256:256-v512:512-v1024:1024-n8:16:32:64"
++target triple = "spir64-unknown-unknown"
++
++; CHECK-SPIRV: Capability Bfloat16ConversionINTEL
++; CHECK-SPIRV: Extension "SPV_INTEL_bfloat16_conversion"
++; CHECK-SPIRV: TypeInt [[Int16Ty:.*]] 16 0
++; CHECK-SPIRV: Constant [[Int16Ty]] [[IntConstId:.*]] 67
++; CHECK-SPIRV: TypeFloat [[FP32Ty:.*]] 32
++; CHECK-SPIRV: TypeVector [[FP32v8Ty:.*]] [[FP32Ty]] 8
++; CHECK-SPIRV: TypeVector [[Int16v8Ty:.*]] [[Int16Ty]] 8
++; CHECK-SPIRV: Constant [[FP32Ty]] [[FloatConstId:.*]] 1065353216
++
++; CHECK-SPIRV: FunctionParameter [[FP32Ty]] [[FP32ValId:.*]]
++; CHECK-SPIRV: FunctionParameter [[FP32v8Ty]] [[FP32v8ValId:.*]]
++
++; CHECK-SPIRV: ConvertFToBF16INTEL [[Int16Ty]] [[Int16ValId:.*]] [[FP32ValId]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[FP32Ty]] [[#]] [[Int16ValId]]
++; CHECK-SPIRV: ConvertFToBF16INTEL [[Int16v8Ty]] [[Int16v8ValId:.*]] [[FP32v8ValId]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[FP32v8Ty]] [[#]] [[Int16v8ValId]]
++; CHECK-SPIRV: ConvertFToBF16INTEL [[Int16Ty]] [[#]] [[FloatConstId]]
++; CHECK-SPIRV: ConvertBF16ToFINTEL [[FP32Ty]] [[#]] [[IntConstId]]
++
++; CHECK-LLVM: call spir_func i16 @_Z27__spirv_ConvertFToBF16INTELf(float
++; CHECK-LLVM: call spir_func float @_Z27__spirv_ConvertBF16ToFINTELs(i16
++; CHECK-LLVM: call spir_func <8 x i16> @_Z27__spirv_ConvertFToBF16INTELDv8_f(<8 x float>
++; CHECK-LLVM: call spir_func <8 x float> @_Z27__spirv_ConvertBF16ToFINTELDv8_s(<8 x i16>
++; CHECK-LLVM: call spir_func i16 @_Z27__spirv_ConvertFToBF16INTELf(float 1.000000e+00)
++; CHECK-LLVM: call spir_func float @_Z27__spirv_ConvertBF16ToFINTELs(i16 67)
++
++define spir_func void @_Z2opffv8(float %a, <8 x float> %in) {
++  %1 = tail call spir_func zeroext i16 @_Z27__spirv_ConvertFToBF16INTELf(float %a)
++  %2 = tail call spir_func float @_Z27__spirv_ConvertBF16ToFINTELs(i16 zeroext %1)
++  %3 = tail call spir_func <8 x i16> @_Z27__spirv_ConvertFToBF16INTELDv8_f(<8 x float> %in)
++  %4 = tail call spir_func <8 x float> @_Z27__spirv_ConvertBF16ToFINTELDv8_s(<8 x i16> %3)
++  %5 = tail call spir_func zeroext i16 @_Z27__spirv_ConvertFToBF16INTELf(float 1.000000e+00)
++  %6 = tail call spir_func float @_Z27__spirv_ConvertBF16ToFINTELs(i16 67)
++  ret void
++}
++
++declare spir_func zeroext i16 @_Z27__spirv_ConvertFToBF16INTELf(float)
++
++declare spir_func float @_Z27__spirv_ConvertBF16ToFINTELs(i16 zeroext)
++
++declare spir_func <8 x i16> @_Z27__spirv_ConvertFToBF16INTELDv8_f(<8 x float>)
++
++declare spir_func <8 x float> @_Z27__spirv_ConvertBF16ToFINTELDv8_s(<8 x i16>)
++
++!opencl.spir.version = !{!0}
++!spirv.Source = !{!1}
++!llvm.ident = !{!2}
++
++!0 = !{i32 1, i32 2}
++!1 = !{i32 4, i32 100000}
++!2 = !{!"clang version 13.0.0"}
+-- 
+2.17.1
+