test(embeddings): add unittests

Files changed (4) hide show

.hfjobs/Dockerfile +3 -0
.hfjobs/deploy.json +7 -0
.hfjobs/requirements.txt +2 -0
tests/test_openai.py +55 -0

.hfjobs/Dockerfile ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ FROM python/3.12
2	+
3	+ RUN --mount=bind,source=requirements.txt,target=/opt/jobs/requirements.txt

.hfjobs/deploy.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "id": "deploy-embeddings-intel-cpu",
+  "description": "Build and deploy Embeddings endpoint",
+  "instance_type": "intel-spr",
+  "instance_size": "x4",
+  "model": "sentence-transformers/all-MiniLM-L6-v2"
+}

.hfjobs/requirements.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ openai>=1.75
2	+ pytest>=8.3.0

tests/test_openai.py ADDED Viewed

	@@ -0,0 +1,55 @@

+import os
+from typing import Literal
+import pytest
+from openai import OpenAI
+from openai.types import CreateEmbeddingResponse
+@pytest.fixture
+def client():
+    return OpenAI(
+        base_url=os.environ.get("HFENDPOINTS_BASE_URL", "http://localhost:8000/api/v1/"),
+        api_key=os.environ.get("HFENDPOINTS_API_KEY", "hf_notdefined"),
+        organization="hfendpoints-images",
+    )
+@pytest.mark.parametrize("encoding_format", ["float", "base64"])
+def test_openai_embedding_single(client, encoding_format: Literal["float", "base64"]):
+    response: CreateEmbeddingResponse = client.embeddings.create(
+        input="Hello, how are you?",
+        model="all-MiniLM-L6-v2",
+        encoding_format=encoding_format,
+    )
+    print(response)
+    assert response.model == "all-MiniLM-L6-v2"
+    assert response.object == "list"
+    assert len(response.data) == 1
+    assert response.data[0].object == "embedding"
+    assert len(response.data[0].embedding) == 384
+@pytest.mark.parametrize("encoding_format", ["float", "base64"])
+def test_openai_embedding_batch(client, encoding_format: Literal["float", "base64"]):
+    response: CreateEmbeddingResponse = client.embeddings.create(
+        input=["Hello, how are you?", "How are you?"],
+        model="all-MiniLM-L6-v2",
+        encoding_format=encoding_format,
+    )
+    print(response)
+    assert response.model == "all-MiniLM-L6-v2"
+    assert response.object == "list"
+    assert len(response.data) == 2
+    assert response.data[0].object == "embedding"
+    assert len(response.data[0].embedding) == 384
+    assert response.data[1].object == "embedding"
+    assert len(response.data[1].embedding) == 384