Beschleunigung scipy benutzerdefinierte kontinuierliche Zufallsvariable

Ich habe eine scipy.stats.rv_continuous Unterklasse erstellt, und es scheint zu tun, was ich will, aber es ist extrem langsam. Code und Testergebnisse unten.Beschleunigung scipy benutzerdefinierte kontinuierliche Zufallsvariable

Die Verteilungsfunktionen, die ich verwende (gebrochenes Potenzgesetz) sind einfach zu integrieren und Eigenschaften zu berechnen, gibt es also eine andere interne Methode, die ich mit analytischen Werten untergliedern sollte, um es schneller zu machen? Die Dokumentation ist unklar, wie die rvs tatsächlich gezeichnet werden, aber vermutlich ist es das Gegenteil der cdf finden.

class Broken_Power_Law(sp.stats.rv_continuous): 

    def __init__(self, slopes, breaks, name='Broken_Power_Law'): 
     """ 
     Here `slopes` are the power-law indices for each section, and 
     `breaks` are the edges of each section such that `slopes[0]` applies 
     between `breaks[0]` and `breaks[1]`, etc. 
     """ 
     super().__init__(a=np.min(breaks), b=np.max(breaks), name=name) 
     nums = len(slopes) 

     # Calculate the proper normalization of the PDF semi-analytically 
     pdf_norms = np.array([np.power(breaks[ii], slopes[ii-1] - slopes[ii]) if ii > 0 else 1.0 
           for ii in range(nums)]) 
     pdf_norms = np.cumprod(pdf_norms) 

     # The additive offsets to calculate CDF values 
     cdf_offsets = np.array([(an/(alp+1))*(np.power(breaks[ii+1], alp+1) - 
               np.power(breaks[ii], alp+1)) 
           for ii, (alp, an) in enumerate(zip(slopes, pdf_norms))]) 

     off_sum = cdf_offsets.sum() 
     cdf_offsets = np.cumsum(cdf_offsets) 
     pdf_norms /= off_sum 
     cdf_offsets /= off_sum 

     self.breaks = breaks 
     self.slopes = slopes 
     self.pdf_norms = pdf_norms 
     self.cdf_offsets = cdf_offsets 
     self.num_segments = nums 
     return 

    def _pdf(self, xx): 
     mm = np.atleast_1d(xx) 
     yy = np.zeros_like(mm) 
     # For each power-law, calculate the distribution in that region 
     for ii in range(self.num_segments): 
      idx = (self.breaks[ii] < mm) & (mm <= self.breaks[ii+1]) 
      aa = self.slopes[ii] 
      an = self.pdf_norms[ii] 
      yy[idx] = an * np.power(mm[idx], aa) 

     return yy 

    def _cdf(self, xx): 
     mm = np.atleast_1d(xx) 
     yy = np.zeros_like(mm) 
     off = 0.0 
     # For each power-law, calculate the cumulative dist in that region 
     for ii in range(self.num_segments): 
      # incorporate the cumulative offset from previous segments 
      off = self.cdf_offsets[ii-1] if ii > 0 else 0.0 
      idx = (self.breaks[ii] < mm) & (mm <= self.breaks[ii+1]) 
      aa = self.slopes[ii] 
      an = self.pdf_norms[ii] 
      ap1 = aa + 1 
      yy[idx] = (an/(ap1)) * (np.power(mm[idx], ap1) - np.power(self.breaks[ii], ap1)) + off 

     return yy

Beim Testen es:

> test1 = sp.stats.norm() 
> %timeit rvs = test1.rvs(size=100) 
46.3 µs ± 1.87 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each) 

> test2 = Broken_Power_Law([-1.3, -2.2, -2.7], [0.08, 0.5, 1.0, 150.0]) 
> %timeit rvs = test2.rvs(size=100) 
200 ms ± 8.57 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

heißt 5000x langsamer !!!

Quelle

2017-11-22 DilithiumMatrix

Ein großer Teil von Scipy ist in C geschrieben, das gut optimiert ist und mit einem Python-Frontend versehen ist. Eine Menge des Codes, den Sie geschrieben haben, erfordert das Verschieben von Daten zwischen Python und dem C-Code, der viel Overhead benötigt. Dies zusammen mit der Tatsache, dass Python natürlich langsamer als C ist, verursacht den Unterschied, den Sie sehen. – James

@James Ich glaube nicht, dass das wirklich der Kern der Antwort ist. Viele (die meisten?) Der eingebauten Funktionen haben Ausdrücke in geschlossener Form für ihre Quantilfunktionen, die ohne numerisches Invertieren der CDF gezogen werden können - was (offensichtlich) extrem langsam ist. Die Verwendung eines schönen, leicht berechenbaren Ausdrucks führt zu einer 1000fachen Beschleunigung (in diesem Fall). Sie haben natürlich vollkommen Recht, dass viele der Ausdrücke, die zur Auswertung dieser Funktionen verwendet werden (wie 'sp.special.ndtri', die mit' sp.stats.norm' verwendet werden), * hochoptimierter C-Code * sind, der auch ein wichtiger Unterschied (mindestens auf der 5x-Ebene). – DilithiumMatrix

Eine Lösung ist die _rvs Methode selbst und mit den analytischen Formeln außer Kraft zu setzen Proben ziehen inverse transform sampling Verwendung:

def _rvs(self, size=None): 
    """Invert the CDF (semi)-analytically to draw samples from distribution. 
    """ 
    if size is None: 
     size = self._size 
    rands = np.random.uniform(size=size) 
    samps = np.zeros_like(rands) 
    # Go over each segment region, find the region each random-number belongs in based on 
    # the offset values 
    for ii in range(self.num_segments): 
     lo = self.cdf_offsets[ii] 
     hi = self.cdf_offsets[ii+1] 
     idx = (lo <= rands) & (rands < hi) 

     mlo = self.breaks[ii] 
     aa = self.slopes[ii] 
     an = self.pdf_norms[ii] 
     ap1 = aa + 1 

     vals = (ap1/an) * (rands[idx] - lo) + np.power(mlo, ap1) 
     samps[idx] = np.power(vals, 1.0/ap1) 

    return samps

Geschwindigkeit fast der gleiche wie der eingebaute Probennahme ist,

> %timeit rvs = test3.rvs(size=100) 
56.8 µs ± 1 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

Quelle

2017-11-22 04:39:04 DilithiumMatrix

Beschleunigung scipy benutzerdefinierte kontinuierliche Zufallsvariable

Antwort

Verwandte Themen