## 创建项目

### 1 新建一个maven 项目，并引入以下依赖：

### 2 main函数修改

@SpringBootApplication
public class Main {
    public static void main(String[] args) {
        SpringApplication.run(Main.class, args);
    }
}

### 3 application.properties

## 4 在config目录下创建类

### 4.1 本地ollama

@Configuration
public class CommonConfiguration {

    @Bean
    public ChatMemory chatMemory() {
        return new InMemoryChatMemory();
    }

    @Bean
    public ChatClient chatClient(OllamaChatModel model, ChatMemory chatMemory) {
        return ChatClient
                .builder(model)
                .defaultSystem("你是一个热心、可爱的智能助手，你的名字叫小团团，请以小团团的身份和语气回答问题。")
                .defaultAdvisors(
                        new SimpleLoggerAdvisor(),
                        new MessageChatMemoryAdvisor(chatMemory)
                )
                .build();
    }

//    @Bean
//    public ClientHttpConnector clientHttpConnector() {
//        return new JdkClientHttpConnector(HttpClient.newBuilder()
//                .version(HttpClient.Version.HTTP_1_1)
//                .build());
//    }

}

### 4.2 远程vllm和ollama

@Configuration
public class CommonConfiguration {

    @Bean
    public ChatMemory chatMemory() {
        return new InMemoryChatMemory();
    }

    @Bean
    public ChatClient chatClient(OllamaChatModel model, ChatMemory chatMemory) {
        return ChatClient
                .builder(model)
                .defaultSystem("你是一个热心、可爱的智能助手，你的名字叫小团团，请以小团团的身份和语气回答问题。")
                .defaultAdvisors(
                        new SimpleLoggerAdvisor(),
                        new MessageChatMemoryAdvisor(chatMemory)
                )
                .build();
    }

<!-- //    @Bean
//    public ClientHttpConnector clientHttpConnector() {
//        return new JdkClientHttpConnector(HttpClient.newBuilder()
//                .version(HttpClient.Version.HTTP_1_1)
//                .build());
//    } -->

}

### 5 在test/java目录下创建com.xllz目录，并创建Qwen3Test.java文件

### 5.1 测试本地ollama的qwen3服务

    @Autowired
    private OllamaChatModel ollamaChatModel;
    @Test
    public void testOllama() {
        //思考模式
//        String answer = ollamaChatModel.chat("你好,你是谁");

        // 禁止思考模式
        String answer = ollamaChatModel.chat("你好,你是谁 /no_think");
        //输出结果
        System.out.println(answer);
    }

### 5.2 测试服务器的vllm服务

python -m vllm.entrypoints.openai.api_server --served-model-name Qwen3-8B --model /root/autodl-tmp/Qwen/Qwen3-8B --dtype auto --port 6006 --max_model_len 8784 --gpu_memory_utilization 0.8

    @Autowired
    private OpenAiChatModel openAiChatModel;
    @Test
    public void testSpringBoot() {
        //向模型提问
        String answer = openAiChatModel.chat("你是谁");

        //输出结果
        System.out.println(answer);
    }


### 5.3 测试服务器ollama服务

ollama serve