had been calling linear fitter wrong (added checks for that)

JohnMount · JohnMount · commit aa42e1db863e · 2014-09-24T11:48:09.000-07:00
added new log-linear fitter (minimizes sq-error, but doesn't match expectations)
diff --git a/Count/src/com/mzlabs/count/ctab/CTab.java b/Count/src/com/mzlabs/count/ctab/CTab.java
@@ -14,7 +14,8 @@
 import com.mzlabs.count.op.impl.SimpleSum;
 import com.mzlabs.count.op.impl.ThreadedSum;
 import com.mzlabs.count.op.iter.OrderStepperTot;
-import com.mzlabs.count.util.LinearFitter;
+import com.mzlabs.count.util.Fitter;
+import com.mzlabs.count.util.LogLinearFitter;
 import com.mzlabs.count.zeroone.ZeroOneCounter;
 
 
@@ -214,7 +215,7 @@ public static void main(final String[] args) {
 		System.out.println("n" + "\t" + "total" + "\t" + "target" + "\t" + "count" + "\t" + "date" + "\t" + "cacheSizes" + "\t" + "tableFinishTimeEst");
 		for(int n=8;n<=10;++n) {
 			final CTab ctab = new CTab(n,true);
-			final LinearFitter lf = new LinearFitter(1);
+			final Fitter lf = new LogLinearFitter();
 			final int tLast = (n*n-3*n+2)/2;
 			for(int total=0;total<=tLast;++total) {
 				final Date startTime = new Date();
@@ -223,15 +224,15 @@ public static void main(final String[] args) {
 				final Date curTime = new Date();
 				long remainingTimeEstMS = 10000;
 				if(total>0) { 
-					// simplistic model: log(time) ~ a + b*size
+					// simplistic model: time ~ exp(a + b*size + c*size*size)
 					final double[] x = { total, total*total };
 					final double y = 10000.0+curTime.getTime() - startTime.getTime();
-					lf.addObservation(x, Math.log(y),1.0);
+					lf.addObservation(x, y,1.0);
 					final double[] beta = lf.solve();
 					double timeEstMS = 0.0;
 					for(int j=total+1;j<=tLast;++j) {
-						final double predict = LinearFitter.predict(beta,new double[] {j, j*j});
-						timeEstMS += Math.exp(predict);
+						final double predict = lf.predict(beta,new double[] {j, j*j});
+						timeEstMS += predict;
 					}
 					remainingTimeEstMS = (long)Math.ceil(timeEstMS);
 				}
diff --git a/Count/src/com/mzlabs/count/util/Fitter.java b/Count/src/com/mzlabs/count/util/Fitter.java
@@ -0,0 +1,24 @@
+package com.mzlabs.count.util;
+
+public interface Fitter {
+
+	/**
+	 * add a y ~ f(x) observation
+	 * @param x
+	 * @param y
+	 * @param wt weight of observation (set to 1.0 in many cases)
+	 */
+	public abstract void addObservation(final double[] x, final double y,
+			final double wt);
+
+	public abstract double[] solve();
+
+	/**
+	 * 
+	 * @param soln
+	 * @param x length(soln)==length(x)+1
+	 * @return
+	 */
+	public abstract double predict(final double[] soln, final double[] x);
+
+}
diff --git a/Count/src/com/mzlabs/count/util/LinearFitter.java b/Count/src/com/mzlabs/count/util/LinearFitter.java
@@ -9,7 +9,7 @@
  * @author johnmount
  *
  */
-public final class LinearFitter {
+public final class LinearFitter implements Fitter {
 	private final ColtMatrix xTx;
 	private final double[] xTy;
 	
@@ -23,14 +23,15 @@ public LinearFitter(final int n) {
 		xTy = new double[n+1];
 	}
 
-	/**
-	 * add a y ~ f(x) observation
-	 * @param x
-	 * @param y
-	 * @param wt weight of observation (set to 1.0 in many cases)
+	/* (non-Javadoc)
+	 * @see com.mzlabs.count.util.Fitter#addObservation(double[], double, double)
 	 */
+	@Override
 	public void addObservation(final double[] x, final double y, final double wt) {
 		final int n = xTx.rows()-1;
+		if(n!=x.length) {
+			throw new IllegalArgumentException();
+		}
 		for(int i=0;i<=n;++i) {
 			final double xi = i<n?x[i]:1.0;
 			xTy[i] += wt*xi*y;
@@ -41,6 +42,10 @@ public void addObservation(final double[] x, final double y, final double wt) {
 		}
 	}
 	
+	/* (non-Javadoc)
+	 * @see com.mzlabs.count.util.Fitter#solve()
+	 */
+	@Override
 	public double[] solve() {
 		final int n = xTx.rows()-1;
 		final double epsilon = 1.0e-5;
@@ -56,8 +61,15 @@ public double[] solve() {
 		return soln;
 	}
 	
-	public static double predict(final double[] soln, final double[] x) {
+	/* (non-Javadoc)
+	 * @see com.mzlabs.count.util.Fitter#predict(double[], double[])
+	 */
+	@Override
+	public double predict(final double[] soln, final double[] x) {
 		final int n = soln.length-1;
+		if((n!=x.length)||(n+1!=soln.length)) {
+			throw new IllegalArgumentException();
+		}
 		double sum = 0.0;
 		for(int i=0;i<=n;++i) {
 			final double xi = i<n?x[i]:1.0;
diff --git a/Count/src/com/mzlabs/count/util/LogLinearFitter.java b/Count/src/com/mzlabs/count/util/LogLinearFitter.java
@@ -0,0 +1,178 @@
+package com.mzlabs.count.util;
+
+import java.util.ArrayList;
+import java.util.Arrays;
+
+
+import com.winvector.linalg.LinalgFactory;
+import com.winvector.linalg.colt.ColtMatrix;
+
+public final class LogLinearFitter implements Fitter {
+	public static final class Obs {
+		public final double[] x;
+		public final double y;
+		public final double wt;
+		
+		public Obs(final double[] x, final double y, final double wt) {
+			this.x = Arrays.copyOf(x,x.length);
+			this.y = y;
+			this.wt = wt;
+		}
+		
+		@Override
+		public String toString() {
+			final StringBuilder b = new StringBuilder();
+			b.append("" + wt + ":[");
+			for(final double xi:x) {
+				b.append(" " + xi);
+			}
+			b.append(" ]-> " + y);
+			return b.toString();
+		}
+	}
+	
+	private final ArrayList<Obs> obs = new ArrayList<Obs>();
+	
+	
+	@Override
+	public void addObservation(final double[] x, final double y, final double wt) {
+		if(!obs.isEmpty()) {
+			final int n = obs.get(0).x.length;
+			if(n!=x.length) {
+				throw new IllegalArgumentException();
+			}
+		}
+		final Obs obsi = new Obs(x,y,wt);
+		obs.add(obsi);
+	}
+	
+	/**
+	 *  minimize sum_i wt[i] (e^{beta.x[i]} - y[i])^2
+	 *  via Newton's method over gradient (should equal zero) and Hessian (Jacobian of vector eqn)
+	 * 
+	 */
+	
+	private static double dot(final double[] soln, final double[] x) {
+		final int n = x.length;
+		double sum = 0.0;
+		for(int i=0;i<=n;++i) {
+			final double xi = i<n?x[i]:1.0;
+			sum += xi*soln[i];
+		}
+		return sum;
+	}
+	
+	private double errAndGradAndHessian(final double[] beta, final double[] grad, final ColtMatrix hessian) {
+		final int dim = beta.length;
+		Arrays.fill(grad,0.0);
+		for(int i=0;i<dim;++i) {
+			for(int j=0;j<dim;++j) {
+				hessian.set(i,j,0.0);
+			}
+		}
+		double err = 0.0;
+		for(final Obs obsi: obs) {
+			final double ebx = Math.exp(dot(beta,obsi.x));
+			final double diff = obsi.y-ebx;
+			err += diff*diff;
+			final double gradCoef = -2*diff*ebx*obsi.wt;
+			final double hessCoef = -2*(obsi.y-2*ebx)*ebx*obsi.wt;
+			for(int i=0;i<dim;++i) {
+				final double xi = i<dim-1?obsi.x[i]:1.0;
+				grad[i] += gradCoef*xi;
+				for(int j=0;j<dim;++j) {
+					final double xj = j<dim-1?obsi.x[j]:1.0;
+					final double hij = hessian.get(i,j);
+					hessian.set(i,j,hij+xi*xj*hessCoef);
+				}
+			}
+		}
+		return err;
+	}
+
+	@Override
+	public double[] solve() {
+		final LinalgFactory<ColtMatrix> factory = ColtMatrix.factory;
+		final int dim = obs.get(0).x.length+1;
+		// start at solution to log(y) ~ b.x
+		final Fitter sf = new LinearFitter(dim-1);
+		for(final Obs obsi: obs) {
+			sf.addObservation(obsi.x, Math.log(Math.max(1.0,obsi.y)), obsi.wt);
+		}
+		final double[] beta = sf.solve();
+		double bestErr = Double.POSITIVE_INFINITY;
+		double[] bestBeta = Arrays.copyOf(beta,beta.length);
+		final double[] grad = new double[dim];
+		final ColtMatrix hessian = factory.newMatrix(dim, dim, false);
+		int nFails = 0;
+		out:
+		while(true) {
+			final double err = errAndGradAndHessian(beta,grad,hessian);
+			if((null==bestBeta)||(err<bestErr)) {
+				bestErr = err;
+				bestBeta = Arrays.copyOf(beta,beta.length);
+				nFails = 0;
+			} else {
+				++nFails;
+				if(nFails>=5) {
+					break out;
+				}
+			}
+			double absGrad = 0.0;
+			for(final double gi: grad) {
+				absGrad += Math.abs(gi);
+			}
+			if(Double.isInfinite(absGrad)||Double.isNaN(absGrad)||(absGrad<=1.0e-8)) {
+				break out;
+			}
+			try {
+//				// neaten up system a touch before solving
+//				double totAbs = 0.0;
+//				for(int i=0;i<dim;++i) {
+//					for(int j=0;j<dim;++j) {
+//						totAbs += Math.abs(hessian.get(i,j));
+//					}
+//				}
+//				if(Double.isInfinite(totAbs)||Double.isNaN(totAbs)||(totAbs<=1.0e-8)) {
+//					break out;
+//				}
+//				final double scale = (dim*dim)/totAbs;
+//				for(int i=0;i<dim;++i) {
+//					grad[i] *= scale;
+//					for(int j=0;j<dim;++j) {
+//						hessian.set(i,j,hessian.get(i,j)*scale);
+//					}
+//				}
+//				for(int i=0;i<dim;++i) {
+//					hessian.set(i,i,hessian.get(i,i)+1.e-5); // Ridge term
+//				}
+				final double[] delta = hessian.solve(grad);
+				for(final double di: delta) {
+					if(Double.isNaN(di)||Double.isNaN(di)) {
+						break out;
+					}
+				}
+				double deltaAbs = 0.0;
+				for(int i=0;i<dim;++i) {
+					beta[i] -= delta[i];
+					deltaAbs += Math.abs(delta[i]);
+				}
+				if(deltaAbs<=1.0e-7) {
+					break out;
+				}
+			} catch (Exception ex) {
+				break out;
+			}
+		}
+		return bestBeta;
+	}
+
+	@Override
+	public double predict(final double[] soln, final double[] x) {
+		final int n = obs.get(0).x.length;
+		if((n!=x.length)||(n+1!=soln.length)) {
+			throw new IllegalArgumentException();
+		}
+		return Math.exp(dot(soln,x));
+	}
+}
diff --git a/Count/tests/com/mzlabs/count/util/TestLogLinFitter.java b/Count/tests/com/mzlabs/count/util/TestLogLinFitter.java
@@ -0,0 +1,46 @@
+package com.mzlabs.count.util;
+
+import static org.junit.Assert.*;
+
+import java.util.ArrayList;
+import java.util.Random;
+
+import org.junit.Test;
+
+import com.mzlabs.count.util.LogLinearFitter.Obs;
+
+public class TestLogLinFitter {
+	@Test
+	public void testLFit() {
+		final Fitter lf = new LinearFitter(2);
+		final LogLinearFitter llf = new LogLinearFitter();
+		final Random rand = new Random(343406L);
+		final ArrayList<Obs> obs = new ArrayList<Obs>();
+		for(int i=1;i<7;++i) {
+			final double y = Math.exp(2.0*i + 3.0*i*i);
+			for(int j=0;j<10;++j) {
+				final double[] x = new double[] {i,i*i};
+				final double yObserved = y*(1+0.3*rand.nextGaussian());
+				llf.addObservation(x,yObserved,1.0);
+				lf.addObservation(x,Math.log(Math.max(1.0,yObserved)),1.0);
+				obs.add(new Obs(x,y,1.0));
+			}
+		}
+		final double[] lsoln = lf.solve();
+		final double[] llsoln = llf.solve();
+		//System.out.println("" + "y" + "\t" + "fit" + "\t" + "llfit");
+		double sqLError = 0.0;
+		double sqLLError = 0.0;
+		for(final Obs obsi: obs) {
+			final double y = obsi.y;
+			final double[] x = obsi.x;
+			final double lfit = Math.exp(lf.predict(lsoln, x));
+			final double llfit = llf.predict(llsoln, x);
+			//System.out.println("" + y + "\t" + lfit + "\t" + llfit );
+			sqLError += Math.pow(lfit-y,2);
+			sqLLError += Math.pow(llfit-y,2);
+		}
+		//System.out.println("errors\t" + sqLError + "\t" + sqLLError);
+		assertTrue(sqLLError<sqLError);
+	}
+}