linear discriminant analysis

rasbt · Mar 28, 2016 · 8a1196b · 8a1196b
1 parent 80eea54
commit 8a1196b
Show file tree

Hide file tree

Showing 10 changed files with 570 additions and 7 deletions.
diff --git a/docs/mkdocs.yml b/docs/mkdocs.yml
@@ -45,6 +45,7 @@ pages:
     - user_guide/feature_selection/SequentialFeatureSelector.md
   - feature_extraction:
     - user_guide/feature_extraction/PrincipalComponentAnalysis.md
+    - user_guide/feature_extraction/LinearDiscriminantAnalysis.md
   - evaluate:
     - user_guide/evaluate/confusion_matrix.md
     - user_guide/evaluate/plot_decision_regions.md
@@ -86,6 +87,7 @@ pages:
     - user_guide/general_concepts/regularization-linear.md
   - Upcoming Features / 0.3.1dev:
     - user_guide/feature_extraction/PrincipalComponentAnalysis.md
+    - user_guide/feature_extraction/LinearDiscriminantAnalysis.md
     - user_guide/tf_classifier/TfMultiLayerPerceptron.md
     - user_guide/tf_classifier/TfSoftmaxRegression.md
     - user_guide/classifier/SoftmaxRegression.md

diff --git a/docs/sources/USER_GUIDE_INDEX.md b/docs/sources/USER_GUIDE_INDEX.md
@@ -26,7 +26,8 @@
 - [`SequentialFeatureSelector`](user_guide/feature_selection/SequentialFeatureSelector.md)
 
 ## `feature_extraction`
-- [`PrincipalComponentAnalysis`](user_guide/feature_extraction/PrincipalComponentAnalysis.md)
+- [`PrincipalComponentAnalysis`](user_guide/feature_extraction/PrincipalComponentAnalysis.md) (new in 0.3.1dev)
+- [`LinearDiscriminantAnalysis`](user_guide/feature_extraction/LinearDiscriminantAnalysis.md) (new in 0.3.1dev)
 
 ## `evaluate`
 - [`confusion_matrix`](user_guide/evaluate/confusion_matrix.md)

diff --git a/docs/sources/user_guide/feature_extraction/LinearDiscriminantAnalysis.ipynb b/docs/sources/user_guide/feature_extraction/LinearDiscriminantAnalysis.ipynb
diff --git a/...extraction/LinearDiscriminantAnalysis_files/LinearDiscriminantAnalysis_14_0.png b/...extraction/LinearDiscriminantAnalysis_files/LinearDiscriminantAnalysis_14_0.png
diff --git a/...extraction/LinearDiscriminantAnalysis_files/LinearDiscriminantAnalysis_18_0.png b/...extraction/LinearDiscriminantAnalysis_files/LinearDiscriminantAnalysis_18_0.png
diff --git a/mlxtend/feature_extraction/__init__.py b/mlxtend/feature_extraction/__init__.py
@@ -5,6 +5,7 @@
 # License: BSD 3 clause
 
 from .principal_component_analysis import PrincipalComponentAnalysis
+from .linear_discriminant_analysis import LinearDiscriminantAnalysis
 
 
-__all__ = ["PrincipalComponentAnalysis"]
+__all__ = ["PrincipalComponentAnalysis", "LinearDiscriminantAnalysis"]
diff --git a/mlxtend/feature_extraction/linear_discriminant_analysis.py b/mlxtend/feature_extraction/linear_discriminant_analysis.py
@@ -0,0 +1,118 @@
+# Sebastian Raschka 2014-2016
+# mlxtend Machine Learning Library Extensions
+#
+# Algorithm for sequential feature selection.
+# Author: Sebastian Raschka <sebastianraschka.com>
+#
+# License: BSD 3 clause
+
+import numpy as np
+
+
+class LinearDiscriminantAnalysis(object):
+    """
+    Linear Discriminant Analysis Class
+
+    Parameters
+    ----------
+    n_discriminants : int (default: None)
+        The number of discrimants for transformation.
+        Keeps the original dimensions of the dataset if `None`.
+
+    Attributes
+    ----------
+    w_ : array-like, shape=[n_features x n_components]
+        Projection matrix
+    e_vals_ : array-like, shape=[n_features]
+        Eigenvalues in sorted order.
+    e_vecs_ : array-like, shape=[n_features]
+       Eigenvectors in sorted order.
+
+    """
+    def __init__(self, n_discriminants=None):
+        if n_discriminants is not None and n_discriminants < 1:
+            raise AttributeError('n_discriminants must be > 1 or None')
+        self.n_discriminants = n_discriminants
+        pass
+
+    def fit(self, X, y, n_classes=None):
+        """ Fit the LDA model with X.
+
+        Parameters
+        ----------
+        X : {array-like, sparse matrix}, shape = [n_samples, n_features]
+            Training vectors, where n_samples is the number of samples and
+            n_features is the number of features.
+        y : array-like, shape = [n_samples]
+            Target values.
+        n_classes : int (default: None)
+            A positive integer to declare the number of class labels
+            if not all class labels are present in a partial training set.
+            Gets the number of class labels automatically if None.
+
+        Returns
+        -------
+        self : object
+
+        """
+        if self.n_discriminants is None or self.n_discriminants > X.shape[1]:
+            n_discriminants = X.shape[1]
+        else:
+            n_discriminants = self.n_discriminants
+
+        if n_classes:
+            self._n_classes = n_classes
+        else:
+            self._n_classes = np.max(y) + 1
+        self._n_features = X.shape[1]
+
+        mean_vecs = self._mean_vectors(X=X, y=y, n_classes=self._n_classes)
+        within_scatter = self._within_scatter(X=X, y=y, n_classes=self._n_classes, mean_vectors=mean_vecs)
+        between_scatter = self._between_scatter(X=X, y=y, mean_vectors=mean_vecs)
+        self.e_vals_, self.e_vecs_ = self._eigendecom(within_scatter=within_scatter, between_scatter=between_scatter)
+        self.w_ = self._projection_matrix(eig_vals=self.e_vals_,
+                                          eig_vecs=self.e_vecs_,
+                                          n_discriminants=n_discriminants)
+        return self
+
+    def transform(self, X):
+        """ Apply the linear transformation on X."""
+        if not hasattr(self, 'w_'):
+            raise AttributeError('Object as not been fitted, yet.')
+        return X.dot(self.w_)
+
+    def _mean_vectors(self, X, y, n_classes):
+        mean_vectors = []
+        for cl in range(n_classes):
+            mean_vectors.append(np.mean(X[y == cl], axis=0))
+        return mean_vectors
+
+    def _within_scatter(self, X, y, n_classes, mean_vectors):
+        S_W = np.zeros((X.shape[1], X.shape[1]))
+        for cl, mv in zip(range(n_classes), mean_vectors):
+            class_sc_mat = np.zeros((X.shape[1], X.shape[1]))
+            for row in X[y == cl]:
+                row, mv = row.reshape(X.shape[1], 1), mv.reshape(X.shape[1] ,1)
+                class_sc_mat += (row - mv).dot((row - mv).T)
+            S_W += class_sc_mat
+        return S_W
+
+    def _between_scatter(self, X, y, mean_vectors):
+        overall_mean = np.mean(X, axis=0)
+        S_B = np.zeros((X.shape[1], X.shape[1]))
+        for i, mean_vec in enumerate(mean_vectors):
+            n = X[y == i + 1, :].shape[0]
+            mean_vec = mean_vec.reshape(X.shape[1], 1)
+            overall_mean = overall_mean.reshape(X.shape[1], 1)
+            S_B += n * (mean_vec - overall_mean).dot((mean_vec - overall_mean).T)
+        return S_B
+
+    def _eigendecom(self, within_scatter, between_scatter):
+        e_vals, e_vecs = np.linalg.eig(np.linalg.inv(within_scatter).dot(between_scatter))
+        sort_idx = np.argsort(e_vals)[::-1]
+        e_vals, e_vecs = e_vals[sort_idx], e_vecs[sort_idx]
+        return e_vals, e_vecs
+
+    def _projection_matrix(self, eig_vals, eig_vecs, n_discriminants):
+        matrix_w = np.vstack([eig_vecs[:, i] for i in range(n_discriminants)]).T
+        return matrix_w
diff --git a/mlxtend/feature_extraction/principal_component_analysis.py b/mlxtend/feature_extraction/principal_component_analysis.py
@@ -36,7 +36,19 @@ def __init__(self, n_components=None):
         pass
 
     def fit(self, X):
-        """ Fit the PCA model with X."""
+        """ Fit the PCA model with X.
+
+        Parameters
+        ----------
+        X : {array-like, sparse matrix}, shape = [n_samples, n_features]
+            Training vectors, where n_samples is the number of samples and
+            n_features is the number of features.
+
+        Returns
+        -------
+        self : object
+
+        """
         if self.n_components is None or self.n_components > X.shape[1]:
             n_components = X.shape[1]
         else:

diff --git a/mlxtend/feature_extraction/tests/test_linear_discriminant_analysis.py b/mlxtend/feature_extraction/tests/test_linear_discriminant_analysis.py
@@ -0,0 +1,44 @@
+# Sebastian Raschka 2014-2016
+# mlxtend Machine Learning Library Extensions
+# Author: Sebastian Raschka <sebastianraschka.com>
+#
+# License: BSD 3 clause
+
+import numpy as np
+from numpy.testing import assert_almost_equal
+from nose.tools import raises
+from mlxtend.feature_extraction import LinearDiscriminantAnalysis as LDA
+from mlxtend.data import iris_data
+from mlxtend.preprocessing import standardize
+
+X, y = iris_data()
+X = standardize(X)
+
+
+def test_default_components():
+    lda = LDA()
+    lda.fit(X, y)
+    res = lda.fit(X).transform(X)
+    assert res.shape[1] == 4
+
+
+def test_default_2components():
+    lda = LDA(n_discriminants=2)
+    lda.fit(X, y)
+    res = lda.fit(X, y).transform(X)
+    assert res.shape[1] == 2
+
+
+@raises(AttributeError)
+def test_default_components():
+    lda = LDA(n_discriminants=0)
+    lda.fit(X, y)
+    res = lda.fit(X).transform(X)
+
+
+def test_evals():
+    lda = LDA(n_discriminants=2)
+    res = lda.fit(X, y).transform(X)
+    np.set_printoptions(suppress=True)
+    print('%s' % lda.e_vals_)
+    assert_almost_equal(lda.e_vals_, [20.90, 0.14, 0.0, 0.0], decimal=2)
diff --git a/mlxtend/tf_classifier/tests/tests_tf_multilayerperceptron.py b/mlxtend/tf_classifier/tests/tests_tf_multilayerperceptron.py
@@ -153,8 +153,7 @@ def test_train_acc():
               random_seed=1)
 
     mlp.fit(X, y)
-    exp = [0.33, 0.33, 0.33]
-    np.testing.assert_almost_equal(exp, mlp.train_acc_, decimal=2)
+    assert len(mlp.train_acc_) == 3
 
 
 def test_valid_acc():
@@ -167,5 +166,4 @@ def test_valid_acc():
               random_seed=1)
 
     mlp.fit(X, y, X_valid=X[:100], y_valid=y[:100])
-    exp = [0.5, 0.5, 0.5]
-    np.testing.assert_almost_equal(exp, mlp.valid_acc_, decimal=2)
+    assert len(mlp.valid_acc_) == 3