# 엔티티 삽입
- 컬렉션의 엔터티는 동일한 필드 집합을 공유하는 데이터 레코드
- 모든 데이터 레코드의 필드 값은 엔터티를 형성

## 개요
- Milvus에서 엔터니는 동일한 스키마를 공유하는 컬렉션 내 데이터 레코드를 의미
- 행의 각 필드에 있는 데이터가 엔터티를 구성
- 동일한 컬렉션 내의 엔터티는 동일한 속성(예: 필드 이름, 데이터 유형 및 기타 제약 조건)을 가짐
- 컬렉션에 엔터티를 삽입할 때, 삽입할 엔터티는 스키마에 정의된 모든 필드를 포함하는 경우에만 성공적으로 추가됨
- 삽입된 엔터티는 삽입 순서대로 _default라는 이름의 파티션에 저장
- 특정 파티션이 있는 경우, 삽입 요청에서 파티션 이름을 지정하여 해당 파티션에 엔터티를 삽입할 수도 있음
- Milvus는 컬렉션의 확장성을 유지하기 위해 동적 필드도 지원
- 동적 필드가 활성화되면 스키마에 정의되지 않은 필드를 컬렉션에 삽입할 수 있음
- -> $meta라는 예약된 필드에 키-값 쌍으로 저장됨

- 참고자료: https://milvus.io/docs/ko/v2.5.x/insert-update-delete.md

## 컬렉션에 엔터티 삽입
- 데이터를 삽입하기 전에 스키마에 따라 데이터를 사전 목록으로 구성해야 함
- 이 섹션에서는 id와 vector라는 두 개의 필드가 있고, 동적 필드가 활성화 되있으므로, 스키마에 정의되어 있지 않는 color가 포함

In [8]:
from pymilvus import MilvusClient, DataType

client = MilvusClient(
    uri="http://localhost:19530",
    token="root:Milvus"
)

schema = client.create_schema(
    auto_id=False,
    enable_dynamic_schema=True,
)

schema.add_field(field_name="id", datatype=DataType.INT64, is_primary=True)
schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=5)

index_params = client.prepare_index_params()
index_params.add_index(field_name="vector", index_type="AUTOINDEX", metric_type="L2")

client.create_collection(
    collection_name="quick_setup",
    vector_field_name="vector",
    dimension=5
)

client.create_partition(
    collection_name="quick_setup",
    partition_name="partitionA"
)

In [9]:
res = client.list_partitions(
    collection_name="quick_setup"
)

print(res)

['_default', 'partitionA']


In [2]:
data=[
    {"id": 0, "vector": [0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592], "color": "pink_8682"},
    {"id": 1, "vector": [0.19886812562848388, 0.06023560599112088, 0.6976963061752597, 0.2614474506242501, 0.838729485096104], "color": "red_7025"},
    {"id": 2, "vector": [0.43742130801983836, -0.5597502546264526, 0.6457887650909682, 0.7894058910881185, 0.20785793220625592], "color": "orange_6781"},
    {"id": 3, "vector": [0.3172005263489739, 0.9719044792798428, -0.36981146090600725, -0.4860894583077995, 0.95791889146345], "color": "pink_9298"},
    {"id": 4, "vector": [0.4452349528804562, -0.8757026943054742, 0.8220779437047674, 0.46406290649483184, 0.30337481143159106], "color": "red_4794"},
    {"id": 5, "vector": [0.985825131989184, -0.8144651566660419, 0.6299267002202009, 0.1206906911183383, -0.1446277761879955], "color": "yellow_4222"},
    {"id": 6, "vector": [0.8371977790571115, -0.015764369584852833, -0.31062937026679327, -0.562666951622192, -0.8984947637863987], "color": "red_9392"},
    {"id": 7, "vector": [-0.33445148015177995, -0.2567135004164067, 0.8987539745369246, 0.9402995886420709, 0.5378064918413052], "color": "grey_8510"},
    {"id": 8, "vector": [0.39524717779832685, 0.4000257286739164, -0.5890507376891594, -0.8650502298996872, -0.6140360785406336], "color": "white_9381"},
    {"id": 9, "vector": [0.5718280481994695, 0.24070317428066512, -0.3737913482606834, -0.06726932177492717, -0.6980531615588608], "color": "purple_4976"}
]

res = client.insert(
    collection_name="quick_setup",
    data=data
)

print(res)

{'insert_count': 10, 'ids': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]}


In [10]:
data=[
    {"id": 10, "vector": [0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592], "color": "pink_8682"},
    {"id": 11, "vector": [0.19886812562848388, 0.06023560599112088, 0.6976963061752597, 0.2614474506242501, 0.838729485096104], "color": "red_7025"},
    {"id": 12, "vector": [0.43742130801983836, -0.5597502546264526, 0.6457887650909682, 0.7894058910881185, 0.20785793220625592], "color": "orange_6781"},
    {"id": 13, "vector": [0.3172005263489739, 0.9719044792798428, -0.36981146090600725, -0.4860894583077995, 0.95791889146345], "color": "pink_9298"},
    {"id": 14, "vector": [0.4452349528804562, -0.8757026943054742, 0.8220779437047674, 0.46406290649483184, 0.30337481143159106], "color": "red_4794"},
    {"id": 15, "vector": [0.985825131989184, -0.8144651566660419, 0.6299267002202009, 0.1206906911183383, -0.1446277761879955], "color": "yellow_4222"},
    {"id": 16, "vector": [0.8371977790571115, -0.015764369584852833, -0.31062937026679327, -0.562666951622192, -0.8984947637863987], "color": "red_9392"},
    {"id": 17, "vector": [-0.33445148015177995, -0.2567135004164067, 0.8987539745369246, 0.9402995886420709, 0.5378064918413052], "color": "grey_8510"},
    {"id": 18, "vector": [0.39524717779832685, 0.4000257286739164, -0.5890507376891594, -0.8650502298996872, -0.6140360785406336], "color": "white_9381"},
    {"id": 19, "vector": [0.5718280481994695, 0.24070317428066512, -0.3737913482606834, -0.06726932177492717, -0.6980531615588608], "color": "purple_4976"}
]

res = client.insert(
    collection_name="quick_setup",
    # highlight-next-line
    partition_name="partitionA",
    data=data
)

print(res)

{'insert_count': 10, 'ids': [10, 11, 12, 13, 14, 15, 16, 17, 18, 19]}


In [15]:
client.describe_collection("quick_setup")

{'collection_name': 'quick_setup',
 'auto_id': False,
 'num_shards': 1,
 'description': '',
 'fields': [{'field_id': 100,
   'name': 'id',
   'description': '',
   'type': <DataType.INT64: 5>,
   'params': {},
   'is_primary': True},
  {'field_id': 101,
   'name': 'vector',
   'description': '',
   'type': <DataType.FLOAT_VECTOR: 101>,
   'params': {'dim': 5}}],
 'functions': [],
 'aliases': [],
 'collection_id': 459127794349057107,
 'consistency_level': 2,
 'properties': {},
 'num_partitions': 2,
 'enable_dynamic_field': True,
 'created_timestamp': 459243059421642757,
 'update_timestamp': 459243059421642757}