# Cómo recopilar y organizar los datos

## 01-01 Distribución hipergeométrica
* Distribución hipergeométrica: La población se puede dividir en dos grupos, aquellos que tienen una cierta característica y aquellos que no la tienen (como productos conformes- no conformes, etc.)
* Muestreo con reemplazo: Seguir una distribución binomial
* Muestreo sin reemplazo: Seguir una distribución hipergeométrica
* Corrección para población finita

## 01-02 Muestreo de una población finita
1. Propósito del muestreo
* Valores medibles (valores continuos)
* Valores contables (valores discretos o discontinuos)
* Muestreo intencional: Muestrear de una parte específica de la población
* Muestreo aleatorio: Extraer de manera amorosa
* Muestreo aleatorio simple
* Muestreo en dos etapas
* Muestreo estratificado
* Muestreo por conglomerados
* Muestreo sistemático
* Diseño del método de muestreo (precisión y costo)

2. Estructura del error
3. Muestreo aleatorio simple
4. Muestreo en dos etapas
5. Muestreo estratificado
6. Muestreo por conglomerados

In [1]:
import os

try:
  os.chdir('../Python/QCKentei')
except:
  pass

path = os.getcwd()

import pandas as pd
import numpy as np

## 1.1

ひと箱25個入りの洗顔ソープを一ロット200箱として出荷している。出荷検査で洗顔ソープ1個の重量 $ x $ (g)を測定しており、重量の箱間のバラつきは $ \sigma_b = 2.8 $ (g)であり、箱内のバラつきは $ \sigma_w = 1.2 $ (g)で安定状態にある。ひと箱を開梱して再梱包するのに$ k_1 = 210 $ 円の費用がかかり、１箱を検査して再梱包するのに $ k_2 = 15 $ 円の費用がかかる。その他の費用や測定誤差は無視できるものとする。

全体 $ 25 \times 25 = 5000 $ 個から10個をサンプリングする単純ランダムサンプリング法と、200箱から5箱を選び、その箱から各2個の合計10個を検査する2段サンプリング法について、洗顔ソープ1個の重量 $ x $ の平均値とサンプリングの総費用を比較せよ


Se envian lotes de 200 cajas de jabón facial, Cada una con 25 unidades. Para la inspección de envío, se mide el peso $ x $ (g) de cada jabón facial. La variación entre cajas es $ \sigma_b = 2.8 $ (g), y la variación dentro de las cajas es $ \sigma_w = 1.2 $ (g), manteniéndose estables. El costo de abrir y volver a empaquetar una caja es $ k_1 = 210 $ yenes, y el costo de inspeccionar y volver a empaquetar una caja $ k_2 = 15 $ yens. Se supone que otros costos y errores de medición son insignificantes.

Comparar la media del peso $ x $ de los jabones faciales y el costo total de muestreo en los siguientes dos métodos:
1. Muestreo aleatorios simple de 10 jabones de un total de 5000 unidad (200 x 25)
2. Muestreo en dos etapas, donde se seleccionan 5 cajas de las 200 disponibles, y se toman 2 jabones de cada una, sumando un total de 10 unidades para la inspección.

In [2]:
# Parámetros definidos
sigma_b = 2.8  # Variación entre cajas (g)
sigma_w = 1.2  # Variación dentro de las cajas (g)
k1 = 210       # Costo de abrir y volver a empaquetar una caja (g)
k2 = 15        # Cost de inspeccionar y volver a empaquetar una caja (yenes)
total_boxes = 200  # Número de lotes
soaps_per_box = 25  # Número de jabones por caja
total_soaps = total_boxes * soaps_per_box  # Número total de jabones (5000 unidades)
n = 10 # Número total de jabones a inspeccionar

# Varianza del muestreo aleatorio simple
var = (sigma_b**2 / n) + (sigma_w**2 / n)
# Corrección para población finita
adj = (total_boxes*soaps_per_box -n)/(total_boxes*soaps_per_box -1)
# Cálculo de la varianza con la corrección para población finita
var_finite = var * adj
var_finite = np.sqrt(var_finite)
print("Muestreo aleatorio simple")
print(f"Varianza de la media del peso x de un jabón facial: {var_finite:.3f} g^2")

# 1. Cuando todos los jabones faciales se seleccionan de cajas difrentes (selección de 10 cajas)
sample_size = 10
cost_diff_boxes = (sample_size * k1) + (sample_size * k2)
# 2. Cuando todos los jabones faciales se seleccionan de una sola caja (selección de 10 jabones de una caja)
cost_same_box = k1 + (sample_size * k2)

print(f"Costo total cuando todos los jabones faciales se seleccionan de cajas diferetntes: {cost_diff_boxes} Yenes")
print(f"Costo total cuando todos los jabones faciales se seleccionan de una sola caja: {cost_same_box} yenes")

Muestreo aleatorio simple
Varianza de la media del peso x de un jabón facial: 0.962 g^2
Costo total cuando todos los jabones faciales se seleccionan de cajas diferetntes: 2250 Yenes
Costo total cuando todos los jabones faciales se seleccionan de una sola caja: 360 yenes


In [3]:
# Método de muestreo 2: Muestreo en dos etapas
# Varianza de la variación entre cajas y dentro de las cajas
m = 5
variance_2stage = (sigma_b**2 / m)*(total_boxes - m)/(total_boxes - 1) + (sigma_w**2 / (m * 2)*(soaps_per_box - 2)/(soaps_per_box -1))
variance_2stage = np.sqrt(variance_2stage)
print(f"\nVarianzá de la media en el muestreo en dos etapas: {variance_2stage:.3f} g^2")

# Método de muestreo 2: Muestreo en dos etapas
sample_size_2stage = 10
cost_2stage = k1 * 5 + k2 * sample_size_2stage  # Costo de apertura + inspección
print(f"Costo total de método de muestreo en dos etapas: {cost_2stage} Yen")



Varianzá de la media en el muestreo en dos etapas: 1.294 g^2
Costo total de método de muestreo en dos etapas: 1200 Yen


In [4]:
notebook_name = 'QCKentei1-1.ipynb'
notebook_name_html = notebook_name.replace(".ipynb",".html")
print(notebook_name + '  ->  ' + notebook_name_html)

!jupyter nbconvert --to html {notebook_name}

QCKentei1-1.ipynb  ->  QCKentei1-1.html
[NbConvertApp] Converting notebook QCKentei1-1.ipynb to html
[NbConvertApp] Writing 590852 bytes to QCKentei1-1.html
