repo/traffic-intelligence: python/utils.py comparison

comparison python/utils.py @ 76:64fde2b1f96d

simplified intervales in empiricalDistribution

author	Nicolas Saunier <nicolas.saunier@polymtl.ca>
date	Thu, 10 Feb 2011 22:15:54 -0500
parents	46ec876ce90e
children	5e6cd36a991c

comparison

equal deleted inserted replaced

-:46ec876ce90e
+:64fde2b1f96d
 result += ((e-o)*(e-o))/e
 return result
 class empiricalDistribution:
 '''Class to represent a sample of a distribution for a continuous random variable
-with the number of observations for each interval'''
+with the number of observations for each interval
+intervals (categories variable) are defined by their left limits, the last one being the right limit
+categories contain therefore one more element than the counts'''
 def __init__(self, categories, counts):
 self.categories = categories
 self.counts = counts
 def mean(self):
 result = 0.
-for i,c in zip(self.categories, self.counts):
+for i in range(len(self.counts)-1):
-result += c*(i[1]+i[0])/2
+result += self.counts[i]*(self.categories[i]+self.categories[i+1])/2
-return result/sum(self.counts)
+return result/self.nSamples()
 def var(self, mean = None):
 if not mean:
 m = self.mean()
 else:
 m = mean
 result = 0.
-for i,c in zip(self.categories, self.counts):
+for i in range(len(self.counts)-1):
-mid = (i[1]+i[0])/2
+mid = (self.categories[i]+self.categories[i+1])/2
-result += c*(mid - m)*(mid - m)
+result += self.counts[i]*(mid - m)*(mid - m)
 return result/(self.nSamples()-1)
 def nSamples(self):
 return sum(self.counts)
 '''cdf is a cumulative distribution function
 returning the probability of the variable being less that x'''
 # refCumulativeCounts = [0]#[cdf(self.categories[0][0])]
 #         for inter in self.categories:
 #             refCumulativeCounts.append(cdf(inter[1]))
-refCumulativeCounts = [cdf(inter[1]) for inter in self.categories[:-1]]
+refCumulativeCounts = [cdf(x) for x in self.categories[1:-1]]
 refProba = [refCumulativeCounts[0]]
 for i in xrange(1,len(refCumulativeCounts)):
 refProba.append(refCumulativeCounts[i]-refCumulativeCounts[i-1])
 refProba.append(1-refCumulativeCounts[-1])

Mercurial Hosting > traffic-intelligence

comparison python/utils.py @ 76:64fde2b1f96d