Конечно! Если у вас есть **10 признаков (фич)** в датафрейме, и вы применяете **PCA** для уменьшения размерности, то **финальный датасет** будет иметь количество признаков, равное **числу выбранных главных компонент**.

### Пример:

Предположим, у вас есть датафрейм с **10 признаками**, и вы хотите уменьшить размерность до **2 компонент** с помощью PCA. После применения PCA:

* **Исходный датасет** с 10 признаками (фичами) будет иметь форму **(n\_samples, 10)**, где `n_samples` — количество строк (образцов) в данных.
* После применения PCA для уменьшения размерности до 2 компонент, **финальный датасет** будет иметь форму **(n\_samples, 2)**, где 2 — это количество главных компонент, которые вы выбрали.

### Как это будет выглядеть:

1. **Исходный датасет (до PCA)**:

   * Пусть у вас есть датафрейм с 1000 строк и 10 признаками:

   ```python
   df = pd.DataFrame(np.random.rand(1000, 10), columns=[f"Feature_{i+1}" for i in range(10)])
   print(df.shape)  # (1000, 10)
   ```

2. **Применение PCA для уменьшения размерности**:

   * Вы хотите уменьшить количество признаков до 2, применяя PCA:

   ```python
   from sklearn.decomposition import PCA
   from sklearn.preprocessing import StandardScaler

   # Стандартизируем данные
   scaler = StandardScaler()
   df_scaled = scaler.fit_transform(df)

   # Применяем PCA
   pca = PCA(n_components=2)
   df_pca = pca.fit_transform(df_scaled)

   print(df_pca.shape)  # (1000, 2)
   ```

3. **Финальный датасет (после PCA)**:

   * Новый датафрейм после применения PCA будет иметь форму **(1000, 2)**, где 2 — это количество главных компонент:

   ```python
   df_pca_df = pd.DataFrame(df_pca, columns=["PC1", "PC2"])
   print(df_pca_df.head())
   ```

### Примерный вид финального датафрейма:

```python
    PC1       PC2
0   1.1323    -0.7541
1   -0.4625   0.3472
2   0.8823    1.0542
3   -1.2042   -0.9023
4   0.9923    0.0024
```

### Примечания:

1. **PC1** и **PC2** — это первые две главные компоненты, которые объясняют наибольшую дисперсию данных. В зависимости от вашего выбора, вы можете использовать больше или меньше компонент.

2. **Объясненная дисперсия** — это важный момент при применении PCA. Например, первые 2 компоненты могут объяснять 90% дисперсии в данных, а оставшиеся компоненты могут объяснять лишь 10%. Это поможет вам понять, сколько информации вы теряете при уменьшении размерности.

### Вывод:

* В конечном итоге ваш датасет с 10 признаками будет преобразован в датасет с 2 признаками (главными компонентами), которые максимально сохраняют информацию о вариативности данных.
