repo/traffic-intelligence: python/utils.py comparison

corrected discrete distribution

author	Nicolas Saunier <nicolas.saunier@polymtl.ca>
date	Tue, 19 Apr 2011 02:01:09 -0400
parents	7f1e54234f96
children	550556378466

comparison

equal deleted inserted replaced

-:7f1e54234f96
+:f03ec4697a09
 class EmpiricalDiscreteDistribution(EmpiricalDistribution):
 '''Class to represent a sample of a distribution for a discrete random variable
 '''
+from numpy.core.fromnumeric import sum
 def __init__(self, categories, counts):
 self.categories = categories
 self.counts = counts
 def mean(self):
-from numpy.core.fromnumeric import sum
 result = [float(x*y) for x,y in zip(self.categories, self.counts)]
 return sum(result)/self.nSamples()
 def var(self, mean = None):
-from numpy.core.fromnumeric import sum
 if not mean:
 m = self.mean()
 else:
 m = mean
 result = 0.
 squares = [float((x-m)*(x-m)*y) for x,y in zip(self.categories, self.counts)]
 return sum(squares)/(self.nSamples()-1)
+def referenceCounts(self, probability):
+'''probability is a function that returns the probability of the random variable for the category values'''
+refProba = [probability(c) for c in self.categories]
+refProba[-1] = 1-sum(refProba[:-1])
+refCounts = [r*self.nSamples() for r in refProba]
+return refCounts, refProba
 class EmpiricalContinuousDistribution(EmpiricalDistribution):
 '''Class to represent a sample of a distribution for a continuous random variable
 with the number of observations for each interval
 intervals (categories variable) are defined by their left limits, the last one being the right limit

Mercurial Hosting > traffic-intelligence