Oracle Cloud Infrastructure (OCI) GenAI 嵌入
OCI GenAI 服务提供带有按需模型或专用 AI 集群的文本嵌入。
先决条件
添加存储库和 BOM
Spring AI 工件发布在 Spring Milestone 和 Snapshot 存储库中。请参阅 Repositories 部分,将这些存储库添加到您的构建系统中。
为了帮助进行依赖项管理,Spring AI 提供了一个 BOM(物料清单),以确保在整个项目中使用一致的 Spring AI 版本。请参阅依赖项管理部分,将 Spring AI BOM 添加到您的构建系统中。
自动配置
Spring AI 为 OCI GenAI 嵌入客户端提供 Spring Boot 自动配置。
要启用它,请将以下依赖项添加到项目的 Maven 中pom.xml
文件:
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-oci-genai-spring-boot-starter</artifactId>
</dependency>
或发送到您的 Gradlebuild.gradle
build 文件。
dependencies {
implementation 'org.springframework.ai:spring-ai-oci-genai-spring-boot-starter'
}
请参阅 Dependency Management 部分,将 Spring AI BOM 添加到您的构建文件中。 |
嵌入属性
前缀spring.ai.oci.genai
是用于配置与 OCI GenAI 的连接的属性前缀。
财产 | 描述 | 违约 |
---|---|---|
spring.ai.oci.genai.authenticationType |
验证到 OCI 时要使用的验证类型。可能 |
文件 |
spring.ai.oci.genai.region |
OCI 服务区域。 |
US-芝加哥-1 |
spring.ai.oci.genai.tenantId |
OCI 租户 OCID,在验证时使用 |
- |
spring.ai.oci.genai.userId |
OCI 用户 OCID,在验证时使用 |
- |
spring.ai.oci.genai.fingerprint 的 |
私钥指纹,在进行身份验证时使用 |
- |
spring.ai.oci.genai.privateKey |
私钥内容,在进行身份验证时使用 |
- |
spring.ai.oci.genai.passPhrase |
可选的私钥密码,在进行身份验证时使用 |
- |
spring.ai.oci.genai.文件 |
OCI 配置文件的路径。在进行身份验证时使用 |
<用户的主目录>/.oci/config |
spring.ai.oci.genai.profile |
OCI 概要文件名称。在进行身份验证时使用 |
违约 |
spring.ai.oci.genai.endpoint |
可选的 OCI GenAI 端点。 |
- |
前缀spring.ai.oci.genai.embedding
是配置EmbeddingModel
OCI GenAI 实施
财产 | 描述 | 违约 |
---|---|---|
spring.ai.oci.genai.embedding.enabled |
启用 OCI GenAI 嵌入模型。 |
真 |
spring.ai.oci.genai.embedding.compartment |
模型区间 OCID。 |
- |
spring.ai.oci.genai.embedding.servingMode |
要使用的模型服务模式。可能 |
按需 |
spring.ai.oci.genai.embedding.truncate |
如果文本超过嵌入上下文,如何截断文本。可能 |
结束 |
spring.ai.oci.genai.embedding.model |
用于嵌入的模型或模型终端节点。 |
- |
所有前缀为spring.ai.oci.genai.embedding.options 可以通过将特定于请求的运行时选项添加到EmbeddingRequest 叫。 |
运行时选项
这OCIEmbeddingOptions
提供嵌入请求的配置信息。
这OCIEmbeddingOptions
提供用于创建选项的生成器。
开始时,使用OCIEmbeddingOptions
constructor 设置用于所有嵌入请求的默认选项。
在运行时,您可以通过传递OCIEmbeddingOptions
实例替换为EmbeddingRequest
请求。
例如,要覆盖特定请求的默认模型名称:
EmbeddingResponse embeddingResponse = embeddingModel.call(
new EmbeddingRequest(List.of("Hello World", "World is big and salvation is near"),
OCIEmbeddingOptions.builder()
.withModel("my-other-embedding-model")
.build()
));
示例代码
这将创建一个EmbeddingModel
实现,您可以将其注入到您的类中。
下面是一个简单的示例@Controller
类使用EmbeddingModel
实现。
spring.ai.oci.genai.embedding.model=<your model>
spring.ai.oci.genai.embedding.compartment=<your model compartment>
@RestController
public class EmbeddingController {
private final EmbeddingModel embeddingModel;
@Autowired
public EmbeddingController(EmbeddingModel embeddingModel) {
this.embeddingModel = embeddingModel;
}
@GetMapping("/ai/embedding")
public Map embed(@RequestParam(value = "message", defaultValue = "Tell me a joke") String message) {
EmbeddingResponse embeddingResponse = this.embeddingModel.embedForResponse(List.of(message));
return Map.of("embedding", embeddingResponse);
}
}
手动配置
如果您不想使用 Spring Boot 自动配置,则可以手动配置OCIEmbeddingModel
在您的应用程序中。
为此,请添加spring-oci-genai-openai
依赖项添加到项目的 Mavenpom.xml
文件:
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-oci-genai-openai</artifactId>
</dependency>
或发送到您的 Gradlebuild.gradle
build 文件。
dependencies {
implementation 'org.springframework.ai:spring-oci-genai-openai'
}
请参阅 Dependency Management 部分,将 Spring AI BOM 添加到您的构建文件中。 |
接下来,创建一个OCIEmbeddingModel
实例,并使用它来计算两个输入文本之间的相似性:
final String EMBEDDING_MODEL = "cohere.embed-english-light-v2.0";
final String CONFIG_FILE = Paths.get(System.getProperty("user.home"), ".oci", "config").toString();
final String PROFILE = "DEFAULT";
final String REGION = "us-chicago-1";
final String COMPARTMENT_ID = System.getenv("OCI_COMPARTMENT_ID");
var authProvider = new ConfigFileAuthenticationDetailsProvider(
this.CONFIG_FILE, this.PROFILE);
var aiClient = GenerativeAiInferenceClient.builder()
.region(Region.valueOf(this.REGION))
.build(this.authProvider);
var options = OCIEmbeddingOptions.builder()
.withModel(this.EMBEDDING_MODEL)
.withCompartment(this.COMPARTMENT_ID)
.withServingMode("on-demand")
.build();
var embeddingModel = new OCIEmbeddingModel(this.aiClient, this.options);
List<Double> embedding = this.embeddingModel.embed(new Document("How many provinces are in Canada?"));