Support gRPC and HTTP protocols at the same time #2378

simon-cj · 2020-09-04T03:23:09Z

According to following two code block:
https://github.com/SeldonIO/seldon-core/blob/master/operator/controllers/seldondeployment_controller.go#L502-L532
https://github.com/SeldonIO/seldon-core/blob/master/operator/controllers/seldondeployment_controller.go#L732-L735

it seems like that it is not support gRPC and HTTP protocols at the same time in noengine mode now.
now we are researching the tensorrt model server, it support gRPC and HTTP, so suggest it that seldon core can support it.

as results，we imagine it will update following logic:

Set more port information in container Service.

apiVersion: v1
kind: Service
metadata:
  creationTimestamp: 2020-08-31T04:44:04Z
  labels:
    app.kubernetes.io/managed-by: seldon-core
    seldon-app: savedmodel-seldon-savedmodel
    seldon-deployment-id: savedmodel-seldon
  name: savedmodel-seldon-savedmodel
  namespace: kleveross-system
  ownerReferences:
  - apiVersion: machinelearning.seldon.io/v1
    blockOwnerDeletion: true
    controller: true
    kind: SeldonDeployment
    name: savedmodel-seldon
    uid: 9935e9cc-eb44-11ea-87e4-5254001948db
  resourceVersion: "1239727"
  selfLink: /api/v1/namespaces/kleveross-system/services/savedmodel-seldon-savedmodel
  uid: 9939e748-eb44-11ea-87e4-5254001948db
spec:
  clusterIP: 10.254.216.225
  ports:
  - name: http2
    port: 8000
    protocol: TCP
    targetPort: 8000
  - name: grpc
    port: 8001
    protocol: TCP
    targetPort: 8001
  selector:
    seldon-app: savedmodel-seldon-savedmodel
  sessionAffinity: None
  type: ClusterIP
status:
  loadBalancer: {}

Set more port information in predict Service.

apiVersion: v1
kind: Service
metadata:
  creationTimestamp: 2020-08-31T04:44:04Z
  labels:
    app.kubernetes.io/managed-by: seldon-core
    default: "true"
    model: "true"
    seldon-app-svc: savedmodel-seldon-savedmodel-savedmodel
    seldon-deployment-id: savedmodel-seldon
  name: savedmodel-seldon-savedmodel-savedmodel
  namespace: kleveross-system
  ownerReferences:
  - apiVersion: machinelearning.seldon.io/v1
    blockOwnerDeletion: true
    controller: true
    kind: SeldonDeployment
    name: savedmodel-seldon
    uid: 9935e9cc-eb44-11ea-87e4-5254001948db
  resourceVersion: "1239724"
  selfLink: /api/v1/namespaces/kleveross-system/services/savedmodel-seldon-savedmodel-savedmodel
  uid: 99388e43-eb44-11ea-87e4-5254001948db
spec:
  clusterIP: 10.254.27.0
  ports:
  - name: http
    port: 8000
    protocol: TCP
    targetPort: 8000
  - name: grpc
    port: 8001
    protocol: TCP
    targetPort: 8001
  selector:
    seldon-app-svc: savedmodel-seldon-savedmodel-savedmodel
  sessionAffinity: None
  type: ClusterIP
status:
  loadBalancer: {}

Set more port information in istio VirtualService.

apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
  creationTimestamp: 2020-08-31T11:20:00Z
  generation: 4
  name: savedmodel-seldon
  namespace: kleveross-system
spec:
  gateways:
  - kleveross-gateway.istio-system
  hosts:
  - '*'
  http:
  - match:
    - headers:
        namespace:
          exact: kleveross-system
        seldon:
          exact: savedmodel-seldon
      uri:
        regex: .*nvidia\.inferenceserver.*
    route:
    - destination:
        host: savedmodel-seldon-savedmodel
        port:
          number: 8000
        subset: savedmodel
    - destination:
        host: savedmodel-seldon-savedmodel
        port:
          number: 8001
        subset: savedmodel

the main change block is Service.port part and VirtualService.route part.

what do you think about？ @cliveseldon

The text was updated successfully, but these errors were encountered:

ukclivecox · 2020-09-07T06:53:03Z

We plan to support both externally see #2299
We will try to prioritise this for 1.4 release

simon-cj · 2020-09-08T08:27:45Z

We plan to support both externally see #2299
We will try to prioritise this for 1.4 release

OK, great

simon-cj · 2020-09-08T08:39:07Z

Have any roadmap or timeline for 1.4 release?

simon-cj added the triage Needs to be triaged and prioritised accordingly label Sep 4, 2020

ukclivecox added priority/p1 and removed triage Needs to be triaged and prioritised accordingly labels Sep 7, 2020

ukclivecox added this to the 1.4 milestone Sep 7, 2020

simon-cj mentioned this issue Sep 8, 2020

[upstream] Support GPRC and HTTP at the same time kleveross/klever-model-registry#86

Closed

ukclivecox self-assigned this Oct 1, 2020

axsaucedo modified the milestones: 1.4, 1.5 Oct 15, 2020

This was referenced Oct 22, 2020

transport: is not respected on seldondeployment #2540

Closed

Allow both http and grpc #2574

Merged

adriangonz closed this as completed in #2574 Nov 16, 2020

kbarresi mentioned this issue Dec 2, 2020

Transformers model unable to run with Cuda #2680

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Support gRPC and HTTP protocols at the same time #2378

Support gRPC and HTTP protocols at the same time #2378

simon-cj commented Sep 4, 2020

ukclivecox commented Sep 7, 2020

simon-cj commented Sep 8, 2020

simon-cj commented Sep 8, 2020 •

edited

Loading

Support gRPC and HTTP protocols at the same time #2378

Support gRPC and HTTP protocols at the same time #2378

Comments

simon-cj commented Sep 4, 2020

ukclivecox commented Sep 7, 2020

simon-cj commented Sep 8, 2020

simon-cj commented Sep 8, 2020 • edited Loading

simon-cj commented Sep 8, 2020 •

edited

Loading