huggingface · OlivierDehaene · Nov 28, 2023 · Nov 23, 2023 · Nov 23, 2023 · Nov 23, 2023
diff --git a/.github/workflows/build_75.yaml b/.github/workflows/build_75.yaml
@@ -77,7 +77,7 @@
            tags: |
              type=semver,pattern=turing-{{version}}
              type=semver,pattern=turing-{{major}}.{{minor}}
-             type=raw,value=turing-latest,enable=${{ github.ref == format('refs/heads/{0}', github.event.repository.default_branch) }}
+             type=raw,value=turing-latest
              type=raw,value=turing-sha-${{ env.GITHUB_SHA_SHORT }}
        - name: Build and push Docker image
          id: build-and-push-75
@@ -99,3 +99,37 @@
            labels: ${{ steps.meta-75.outputs.labels }}
            cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-75,mode=max
            cache-to: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-75,mode=max
+       - name: Extract metadata (tags, labels) for Docker
+         id: meta-75-grpc
+         uses: docker/metadata-action@v4.3.0
+         with:
+           images: |
+             registry.internal.huggingface.tech/api-inference/text-embeddings-inference
+             ghcr.io/huggingface/text-embeddings-inference
+           flavor: |
+             latest=false
+           tags: |
+             type=semver,pattern=turing-{{version}}+grpc
+             type=semver,pattern=turing-{{major}}.{{minor}}+grpc
+             type=raw,value=turing-latest+grpc
+             type=raw,value=turing-sha-${{ env.GITHUB_SHA_SHORT }}+grpc
+       - name: Build and push Docker image
+         id: build-and-push-75-grpc
+         uses: docker/build-push-action@v4
+         with:
+           context: .
+           target: grpc
+           file: Dockerfile-cuda
+           push: ${{ github.event_name != 'pull_request' }}
+           platforms: 'linux/amd64'
+           build-args: |
+             SCCACHE_GHA_ENABLED=on
+             ACTIONS_CACHE_URL=${{ env.ACTIONS_CACHE_URL }}
+             ACTIONS_RUNTIME_TOKEN=${{ env.ACTIONS_RUNTIME_TOKEN }}
+             CUDA_COMPUTE_CAP=75
+             GIT_SHA=${{ env.GITHUB_SHA }}
+             DOCKER_LABEL=sha-${{ env.GITHUB_SHA_SHORT }}
+             DEFAULT_USE_FLASH_ATTENTION=False
+           tags: ${{ steps.meta-75-grpc.outputs.tags }}
+           labels: ${{ steps.meta-75-grpc.outputs.labels }}
+           cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-75,mode=max
diff --git a/.github/workflows/build_80.yaml b/.github/workflows/build_80.yaml
@@ -98,3 +98,36 @@
            labels: ${{ steps.meta-80.outputs.labels }}
            cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-80,mode=max
            cache-to: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-80,mode=max
+       - name: Extract metadata (tags, labels) for Docker
+         id: meta-80-grpc
+         uses: docker/metadata-action@v4.3.0
+         with:
+           images: |
+             registry.internal.huggingface.tech/api-inference/text-embeddings-inference
+             ghcr.io/huggingface/text-embeddings-inference
+           flavor: |
+             latest=false
+           tags: |
+             type=semver,pattern={{version}}+grpc
+             type=semver,pattern={{major}}.{{minor}}+grpc
+             type=raw,value=latest+grpc
+             type=raw,value=sha-${{ env.GITHUB_SHA_SHORT }}+grpc
+       - name: Build and push Docker image
+         id: build-and-push-80-grpc
+         uses: docker/build-push-action@v4
+         with:
+           context: .
+           target: grpc
+           file: Dockerfile-cuda
+           push: ${{ github.event_name != 'pull_request' }}
+           platforms: 'linux/amd64'
+           build-args: |
+             SCCACHE_GHA_ENABLED=on
+             ACTIONS_CACHE_URL=${{ env.ACTIONS_CACHE_URL }}
+             ACTIONS_RUNTIME_TOKEN=${{ env.ACTIONS_RUNTIME_TOKEN }}
+             CUDA_COMPUTE_CAP=80
+             GIT_SHA=${{ env.GITHUB_SHA }}
+             DOCKER_LABEL=sha-${{ env.GITHUB_SHA_SHORT }}
+           tags: ${{ steps.meta-80-grpc.outputs.tags }}
+           labels: ${{ steps.meta-80-grpc.outputs.labels }}
+           cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-80,mode=max
diff --git a/.github/workflows/build_86.yaml b/.github/workflows/build_86.yaml
@@ -98,3 +98,37 @@
            labels: ${{ steps.meta-86.outputs.labels }}
            cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-86,mode=max
            cache-to: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-86,mode=max
+       - name: Extract metadata (tags, labels) for Docker
+         id: meta-86-grpc
+         uses: docker/metadata-action@v4.3.0
+         with:
+           images: |
+             registry.internal.huggingface.tech/api-inference/text-embeddings-inference
+             ghcr.io/huggingface/text-embeddings-inference
+           flavor: |
+             latest=false
+           tags: |
+             type=semver,pattern=86-{{version}}+grpc
+             type=semver,pattern=86-{{major}}.{{minor}}+grpc
+             type=raw,value=86-latest+grpc
+             type=raw,value=86-sha-${{ env.GITHUB_SHA_SHORT }}+grpc
+       - name: Build and push Docker image
+         id: build-and-push-86-grpc
+         uses: docker/build-push-action@v4
+         with:
+           context: .
+           target: grpc
+           file: Dockerfile-cuda
+           push: ${{ github.event_name != 'pull_request' }}
+           platforms: 'linux/amd64'
+           build-args: |
+             SCCACHE_GHA_ENABLED=on
+             ACTIONS_CACHE_URL=${{ env.ACTIONS_CACHE_URL }}
+             ACTIONS_RUNTIME_TOKEN=${{ env.ACTIONS_RUNTIME_TOKEN }}
+             CUDA_COMPUTE_CAP=86
+             GIT_SHA=${{ env.GITHUB_SHA }}
+             DOCKER_LABEL=sha-${{ env.GITHUB_SHA_SHORT }}
+           tags: ${{ steps.meta-86-grpc.outputs.tags }}
+           labels: ${{ steps.meta-86-grpc.outputs.labels }}
+           cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-86,mode=max
+
diff --git a/.github/workflows/build_89.yaml b/.github/workflows/build_89.yaml
@@ -98,3 +98,37 @@
            labels: ${{ steps.meta-89.outputs.labels }}
            cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-89,mode=max
            cache-to: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-89,mode=max
+       - name: Extract metadata (tags, labels) for Docker
+         id: meta-89-grpc
+         uses: docker/metadata-action@v4.3.0
+         with:
+           images: |
+             registry.internal.huggingface.tech/api-inference/text-embeddings-inference
+             ghcr.io/huggingface/text-embeddings-inference
+           flavor: |
+             latest=false
+           tags: |
+             type=semver,pattern=89-{{version}}+grpc
+             type=semver,pattern=89-{{major}}.{{minor}}+grpc
+             type=raw,value=89-latest+grpc
+             type=raw,value=89-sha-${{ env.GITHUB_SHA_SHORT }}+grpc
+       - name: Build and push Docker image
+         id: build-and-push-89-grpc
+         uses: docker/build-push-action@v4
+         with:
+           context: .
+           target: grpc
+           file: Dockerfile-cuda
+           push: ${{ github.event_name != 'pull_request' }}
+           platforms: 'linux/amd64'
+           build-args: |
+             SCCACHE_GHA_ENABLED=on
+             ACTIONS_CACHE_URL=${{ env.ACTIONS_CACHE_URL }}
+             ACTIONS_RUNTIME_TOKEN=${{ env.ACTIONS_RUNTIME_TOKEN }}
+             CUDA_COMPUTE_CAP=89
+             GIT_SHA=${{ env.GITHUB_SHA }}
+             DOCKER_LABEL=sha-${{ env.GITHUB_SHA_SHORT }}
+           tags: ${{ steps.meta-89-grpc.outputs.tags }}
+           labels: ${{ steps.meta-89-grpc.outputs.labels }}
+           cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-89,mode=max
+
diff --git a/.github/workflows/build_90.yaml b/.github/workflows/build_90.yaml
@@ -98,4 +98,39 @@
            labels: ${{ steps.meta-90.outputs.labels }}
            cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-90,mode=max
            cache-to: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-90,mode=max
+       - name: Extract metadata (tags, labels) for Docker
+         id: meta-90-grpc
+         uses: docker/metadata-action@v4.3.0
+         with:
+           images: |
+             registry.internal.huggingface.tech/api-inference/text-embeddings-inference
+             ghcr.io/huggingface/text-embeddings-inference
+           flavor: |
+             latest=false
+           tags: |
+             type=semver,pattern=hopper-{{version}}+grpc
+             type=semver,pattern=hopper-{{major}}.{{minor}}+grpc
+             type=raw,value=hopper-latest+grpc
+             type=raw,value=hopper-sha-${{ env.GITHUB_SHA_SHORT }}+grpc
+       - name: Build and push Docker image
+         id: build-and-push-90-grpc
+         uses: docker/build-push-action@v4
+         with:
+           context: .
+           target: grpc
+           file: Dockerfile-cuda
+           push: ${{ github.event_name != 'pull_request' }}
+           platforms: 'linux/amd64'
+           build-args: |
+             SCCACHE_GHA_ENABLED=on
+             ACTIONS_CACHE_URL=${{ env.ACTIONS_CACHE_URL }}
+             ACTIONS_RUNTIME_TOKEN=${{ env.ACTIONS_RUNTIME_TOKEN }}
+             CUDA_COMPUTE_CAP=90
+             GIT_SHA=${{ env.GITHUB_SHA }}
+             DOCKER_LABEL=sha-${{ env.GITHUB_SHA_SHORT }}
+           tags: ${{ steps.meta-90-grpc.outputs.tags }}
+           labels: ${{ steps.meta-90-grpc.outputs.labels }}
+           cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-90,mode=max
+
+
 
diff --git a/.github/workflows/build_cpu.yaml b/.github/workflows/build_cpu.yaml
@@ -97,3 +97,36 @@
            labels: ${{ steps.meta-cpu.outputs.labels }}
            cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-cpu,mode=max
            cache-to: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-cpu,mode=max
+       - name: Extract metadata (tags, labels) for Docker
+         id: meta-cpu-grpc
+         uses: docker/metadata-action@v4.3.0
+         with:
+           images: |
+             registry.internal.huggingface.tech/api-inference/text-embeddings-inference
+             ghcr.io/huggingface/text-embeddings-inference
+           flavor: |
+             latest=false
+           tags: |
+             type=semver,pattern=cpu-{{version}}+grpc
+             type=semver,pattern=cpu-{{major}}.{{minor}}+grpc
+             type=raw,value=cpu-latest+grpc
+             type=raw,value=cpu-sha-${{ env.GITHUB_SHA_SHORT }}+grpc
+       - name: Build and push Docker image
+         id: build-and-push-cpu-grpc
+         uses: docker/build-push-action@v4
+         with:
+           context: .
+           target: grpc
+           file: Dockerfile
+           push: ${{ github.event_name != 'pull_request' }}
+           platforms: 'linux/amd64'
+           build-args: |
+             SCCACHE_GHA_ENABLED=on
+             ACTIONS_CACHE_URL=${{ env.ACTIONS_CACHE_URL }}
+             ACTIONS_RUNTIME_TOKEN=${{ env.ACTIONS_RUNTIME_TOKEN }}
+             GIT_SHA=${{ env.GITHUB_SHA }}
+             DOCKER_LABEL=sha-${{ env.GITHUB_SHA_SHORT }}
+           tags: ${{ steps.meta-cpu-grpc.outputs.tags }}
+           labels: ${{ steps.meta-cpu-grpc.outputs.labels }}
+           cache-from: type=registry,ref=registry.internal.huggingface.tech/api-inference/text-embeddings-inference:cache-cpu,mode=max
+