In [None]:
import pymongo
import matplotlib.pyplot as plt
import re

client = pymongo.MongoClient("mongodb://martin:rampouch@127.0.0.1:27117/?authMechanism=DEFAULT")
db = client["RampaBase"]

output = db.command("db.cars.getShardDistribution()")

# Parsování výstupu
shards = output['shards']
shard_names = []
doc_counts = []
chunk_counts = []

for shard in shards:
    shard_names.append(shard['shard'])
    doc_counts.append(shard['docs'])
    chunk_counts.append(shard['chunks'])

# Vytvoření grafu
fig, ax1 = plt.subplots(figsize=(10, 6))
ax2 = ax1.twinx()

ax1.bar(shard_names, doc_counts, color='skyblue', label='Počet dokumentů')
ax2.bar(shard_names, chunk_counts, color='orange', label='Počet chunků', alpha=0.7)

ax1.set_xlabel('Shard')
ax1.set_ylabel('Počet dokumentů', color='skyblue')
ax2.set_ylabel('Počet chunků', color='orange')
plt.title('Distribuce dokumentů a chunků mezi shardy')
plt.tight_layout()
plt.show()


In [None]:
import pymongo
import pandas as pd
import matplotlib.pyplot as plt

# Připojení k MongoDB
client = pymongo.MongoClient("mongodb://martin:rampouch@127.0.0.1:27117/?authMechanism=DEFAULT")
db = client["RampaBase"]
config_db = client["config"]

# Název kolekce
collection_name = "cars"
namespace = f"RampaBase.{collection_name}"

# Ověření, zda kolekce existuje a je shardovaná
collection_info = config_db.collections.find_one({"_id": namespace})
if not collection_info:
    print(f"Kolekce '{collection_name}' neexistuje nebo není shardovaná.")
else:
    # Získání UUID kolekce
    collection_uuid = collection_info["uuid"]

    # Získání počtu chunků na jednotlivých shardech
    chunks_pipeline = [
        {"$match": {"uuid": collection_uuid}},
        {"$group": {"_id": "$shard", "chunks": {"$sum": 1}}}
    ]
    chunks = list(config_db.chunks.aggregate(chunks_pipeline))
    if not chunks:
        print(f"Pro kolekci '{collection_name}' nebyly nalezeny žádné chunky.")
    else:
        chunks_df = pd.DataFrame(chunks)
        chunks_df.rename(columns={"_id": "shard"}, inplace=True)

        # Získání celkového počtu dokumentů v kolekci
        total_docs = db[collection_name].estimated_document_count()

        # Odhad počtu dokumentů na jednotlivých shardech
        total_chunks = chunks_df["chunks"].sum()
        chunks_df["documents"] = (chunks_df["chunks"] / total_chunks * total_docs).round().astype(int)

        # Vykreslení grafu
        fig, ax1 = plt.subplots(figsize=(10, 6))
        ax2 = ax1.twinx()

        chunks_df.plot(kind="bar", x="shard", y="documents", ax=ax1, color="skyblue", position=0, width=0.4, label="Počet dokumentů (odhad)")
        chunks_df.plot(kind="bar", x="shard", y="chunks", ax=ax2, color="orange", position=1, width=0.4, label="Počet chunků")

        ax1.set_ylabel("Počet dokumentů (odhad)")
        ax2.set_ylabel("Počet chunků")
        plt.title(f"Distribuce dokumentů a chunků pro kolekci '{collection_name}'")
        ax1.set_xlabel("Shard")

        h1, l1 = ax1.get_legend_handles_labels()
        h2, l2 = ax2.get_legend_handles_labels()
        plt.legend(h1 + h2, l1 + l2, loc="upper right")

        plt.tight_layout()
        plt.savefig(f"Statistiky/sharding_{collection_name}.png")
        plt.show()
