firebase · jba · Jul 22, 2024 · Jul 18, 2024
diff --git a/go/plugins/googleai/googleai.go b/go/plugins/googleai/googleai.go
@@ -146,8 +146,13 @@ func defineModel(name string, caps ai.ModelCapabilities) *ai.Model {
 		Label:    labelPrefix + " - " + name,
 		Supports: caps,
 	}
-	g := generator{model: name, client: state.gclient}
-	return ai.DefineModel(provider, name, meta, g.generate)
+	return ai.DefineModel(provider, name, meta, func(
+		ctx context.Context,
+		input *ai.GenerateRequest,
+		cb func(context.Context, *ai.GenerateResponseChunk) error,
+	) (*ai.GenerateResponse, error) {
+		return generate(ctx, state.gclient, name, input, cb)
+	})
 }
 
 // IsDefinedModel reports whether the named [Model] is defined by this plugin.
@@ -157,6 +162,8 @@ func IsDefinedModel(name string) bool {
 
 //copy:stop
 
+//copy:start vertexai.go defineEmbedder
+
 // DefineEmbedder defines an embedder with a given name.
 func DefineEmbedder(name string) *ai.Embedder {
 	state.mu.Lock()
@@ -172,6 +179,8 @@ func IsDefinedEmbedder(name string) bool {
 	return ai.IsDefinedEmbedder(provider, name)
 }
 
+//copy:stop
+
 // requires state.mu
 func defineEmbedder(name string) *ai.Embedder {
 	return ai.DefineEmbedder(provider, name, func(ctx context.Context, input *ai.EmbedRequest) (*ai.EmbedResponse, error) {
@@ -213,16 +222,85 @@ func Embedder(name string) *ai.Embedder {
 
 //copy:stop
 
-type generator struct {
-	model  string
-	client *genai.Client
-	//session *genai.ChatSession // non-nil if we're in the middle of a chat
-}
+//copy:start vertexai.go generate
+
+func generate(
+	ctx context.Context,
+	client *genai.Client,
+	model string,
+	input *ai.GenerateRequest,
+	cb func(context.Context, *ai.GenerateResponseChunk) error,
+) (*ai.GenerateResponse, error) {
+	gm := newModel(client, model, input)
+	cs, err := startChat(gm, input)
+	if err != nil {
+		return nil, err
+	}
+	// The last message gets added to the parts slice.
+	var parts []genai.Part
+	if len(input.Messages) > 0 {
+		last := input.Messages[len(input.Messages)-1]
+		var err error
+		parts, err = convertParts(last.Content)
+		if err != nil {
+			return nil, err
+		}
+	}
+
+	gm.Tools, err = convertTools(input.Tools)
+	if err != nil {
+		return nil, err
+	}
+	// Convert input.Tools and append to gm.Tools
+
+	// TODO: gm.ToolConfig?
+
+	// Send out the actual request.
+	if cb == nil {
+		resp, err := cs.SendMessage(ctx, parts...)
+		if err != nil {
+			return nil, err
+		}
+		r := translateResponse(resp)
+		r.Request = input
+		return r, nil
+	}
 
-func (g *generator) generate(ctx context.Context, input *ai.GenerateRequest, cb func(context.Context, *ai.GenerateResponseChunk) error) (*ai.GenerateResponse, error) {
-	gm := g.client.GenerativeModel(g.model)
+	// Streaming version.
+	iter := cs.SendMessageStream(ctx, parts...)
+	var r *ai.GenerateResponse
+	for {
+		chunk, err := iter.Next()
+		if err == iterator.Done {
+			r = translateResponse(iter.MergedResponse())
+			break
+		}
+		if err != nil {
+			return nil, err
+		}
+		// Send candidates to the callback.
+		for _, c := range chunk.Candidates {
+			tc := translateCandidate(c)
+			err := cb(ctx, &ai.GenerateResponseChunk{
+				Content: tc.Message.Content,
+				Index:   tc.Index,
+			})
+			if err != nil {
+				return nil, err
+			}
+		}
+	}
+	if r == nil {
+		// No candidates were returned. Probably rare, but it might avoid a NPE
+		// to return an empty instead of nil result.
+		r = &ai.GenerateResponse{}
+	}
+	r.Request = input
+	return r, nil
+}
 
-	// Translate from a ai.GenerateRequest to a genai request.
+func newModel(client *genai.Client, model string, input *ai.GenerateRequest) *genai.GenerativeModel {
+	gm := client.GenerativeModel(model)
 	gm.SetCandidateCount(int32(input.Candidates))
 	if c, ok := input.Config.(*ai.GenerationCommonConfig); ok && c != nil {
 		if c.MaxOutputTokens != 0 {
@@ -241,8 +319,11 @@ func (g *generator) generate(ctx context.Context, input *ai.GenerateRequest, cb
 			gm.SetTopP(float32(c.TopP))
 		}
 	}
+	return gm
+}
 
-	// Start a "chat".
+// startChat starts a chat session and configures it with the input messages.
+func startChat(gm *genai.GenerativeModel, input *ai.GenerateRequest) (*genai.ChatSession, error) {
 	cs := gm.StartChat()
 
 	// All but the last message goes in the history field.
@@ -259,18 +340,11 @@ func (g *generator) generate(ctx context.Context, input *ai.GenerateRequest, cb
 			Role:  string(m.Role),
 		})
 	}
-	// The last message gets added to the parts slice.
-	var parts []genai.Part
-	if len(messages) > 0 {
-		var err error
-		parts, err = convertParts(messages[0].Content)
-		if err != nil {
-			return nil, err
-		}
-	}
-
-	// Convert input.Tools and append to gm.Tools
-	for _, t := range input.Tools {
+	return cs, nil
+}
+func convertTools(inTools []*ai.ToolDefinition) ([]*genai.Tool, error) {
+	var outTools []*genai.Tool
+	for _, t := range inTools {
 		schema := &genai.Schema{}
 		schema.Type = genai.TypeObject
 		schema.Properties = map[string]*genai.Schema{}
@@ -286,7 +360,7 @@ func (g *generator) generate(ctx context.Context, input *ai.GenerateRequest, cb
 			case "bool":
 				typ = genai.TypeBoolean
 			default:
-				return nil, fmt.Errorf("schema value \"%s\" not allowed", v)
+				return nil, fmt.Errorf("schema value %q not allowed", v)
 			}
 			schema.Properties[k] = &genai.Schema{Type: typ}
 		}
@@ -295,54 +369,13 @@ func (g *generator) generate(ctx context.Context, input *ai.GenerateRequest, cb
 			Parameters:  schema,
 			Description: t.Description,
 		}
-		gm.Tools = append(gm.Tools, &genai.Tool{FunctionDeclarations: []*genai.FunctionDeclaration{fd}})
-	}
-	// TODO: gm.ToolConfig?
-
-	// Send out the actual request.
-	if cb == nil {
-		resp, err := cs.SendMessage(ctx, parts...)
-		if err != nil {
-			return nil, err
-		}
-		r := translateResponse(resp)
-		r.Request = input
-		return r, nil
-	}
-
-	// Streaming version.
-	iter := cs.SendMessageStream(ctx, parts...)
-	var r *ai.GenerateResponse
-	for {
-		chunk, err := iter.Next()
-		if err == iterator.Done {
-			r = translateResponse(iter.MergedResponse())
-			break
-		}
-		if err != nil {
-			return nil, err
-		}
-		// Send candidates to the callback.
-		for _, c := range chunk.Candidates {
-			tc := translateCandidate(c)
-			err := cb(ctx, &ai.GenerateResponseChunk{
-				Content: tc.Message.Content,
-				Index:   tc.Index,
-			})
-			if err != nil {
-				return nil, err
-			}
-		}
+		outTools = append(outTools, &genai.Tool{FunctionDeclarations: []*genai.FunctionDeclaration{fd}})
 	}
-	if r == nil {
-		// No candidates were returned. Probably rare, but it might avoid a NPE
-		// to return an empty instead of nil result.
-		r = &ai.GenerateResponse{}
-	}
-	r.Request = input
-	return r, nil
+	return outTools, nil
 }
 
+//copy:stop
+
 //copy:start vertexai.go translateCandidate
 
 // translateCandidate translates from a genai.GenerateContentResponse to an ai.GenerateResponse.

diff --git a/go/plugins/googleai/googleai_test.go b/go/plugins/googleai/googleai_test.go
@@ -35,6 +35,8 @@ import (
 // The tests here only work with an API key set to a valid value.
 var apiKey = flag.String("key", "", "Gemini API key")
 
+var header = flag.Bool("header", false, "run test for x-goog-client-api header")
+
 // We can't test the DefineAll functions along with the other tests because
 // we get duplicate definitions of models.
 var testAll = flag.Bool("all", false, "test DefineAllXXX functions")
@@ -203,6 +205,9 @@ func TestLive(t *testing.T) {
 }
 
 func TestHeader(t *testing.T) {
+	if !*header {
+		t.Skip("skipped; to run, pass -header and don't run the live test")
+	}
 	ctx := context.Background()
 	var header http.Header
 	server := httptest.NewServer(http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {