Gibt es eine Möglichkeit, das arithmetische Mittel "besser" als Summe()/N zu finden?

Question

Gibt es eine Möglichkeit, das arithmetische Mittel "besser" als Summe()/N zu finden?

Gefragt el 28 de August, 2009: Wann wurde die Frage gestellt
7585 Ansichten: Anzahl der Besuche der Frage
2 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Angenommen, wir haben N Zahlen (ganze Zahlen, Gleitkommazahlen, was immer Sie wollen) und wollen ihr arithmetisches Mittel finden. Die einfachste Methode ist, alle Werte zu summieren und durch die Anzahl der Werte zu dividieren:

def simple_mean(array[N]): # pseudocode
    sum = 0
    for i = 1 to N
       sum += array[i]
    return sum / N

Es funktioniert gut, erfordert aber große ganze Zahlen. Wenn wir keine großen ganzen Zahlen wollen und mit Rundungsfehlern zurechtkommen und N eine Potenz von zwei ist, können wir "Teilen und Beherrschen" verwenden: ((a+b)/2 + (c+d)/2)/2 = (a+b+c+d)/4 , ((a+b+c+d)/4 + (e+f+g+h)/4)/2 = (a+b+c+d+e+f+g+h)/8 und so weiter.

def bisection_average(array[N]):
   if N == 1: return array[1]
   return (bisection_average(array[:N/2])+bisection_average(array[N/2:]))/2

Gibt es noch andere Möglichkeiten?

PS. Spielplatz für Faule

Gefragt el 28 de August, 2009 von maykeye

0 Stimmen

Interessant, aber der Teil über "Rundungsfehler sind kein Problem" hat mich beunruhigt. Ich würde eine Methode bevorzugen, bei der keine Fehler auftreten.

Kommentiert el 28 de August, 2009 von pavium

0 Stimmen

Wenn ich es mir recht überlege, werde ich morgen früh darauf zurückkommen und meine Antwort wieder löschen, wenn ich dann immer noch froh bin, dass sie nicht völlig falsch ist...

Kommentiert el 28 de August, 2009 von Matthew Scharley

0 Stimmen

@pavium: Wenn Sie eine fehlerfreie Methode wünschen, müssen Sie diese von Hand berechnen.

Kommentiert el 28 de August, 2009 von MusiGenesis

Anzeigen 1 weitere Kommentare

Answer 1

2 Antworten

Answer 2

0voto

Gábor Bakos Punkte 8669

En Kahan-Algorithmus (laut wikipedia) hat eine bessere Laufzeitleistung (als die paarweise Summierung) - O(n) - und ein O(1) Fehlerwachstum:

function KahanSum(input)
    var sum = 0.0
    var c = 0.0                  // A running compensation for lost low-order bits.
    for i = 1 to input.length do
        var y = input[i] - c     // So far, so good: c is zero.
        var t = sum + y          // Alas, sum is big, y small, so low-order digits of y are lost.
        c = (t - sum) - y // (t - sum) recovers the high-order part of y; subtracting y recovers -(low part of y)
        sum = t           // Algebraically, c should always be zero. Beware overly-aggressive optimizing compilers!
        // Next time around, the lost low part will be added to y in a fresh attempt.
    return sum

Die Idee dahinter ist, dass die niedrigen Bits der Gleitkommazahlen unabhängig von der Hauptsumme summiert und korrigiert werden.

Beantwortet el 7 de Januar, 2015 von Gábor Bakos (8669 Punkte )

Answer 3

0voto

Gregor y Punkte 1366

Aufbauend auf Jason S.'s Lösung um einen gewichteten Durchschnitt zu finden und wieder in S Wachstum.

Die Verwendung des M Algorithmus zusammen mit den Formeln für den gewichteten Durchschnitt und die Standardabweichung der Grundgesamtheit:

Avg = Avg(W*X) / Avg(W)
StDev = sqrt(Avg(W*X*X) / Avg(W) - Avg*Avg)

den Code umschreiben, um die drei laufenden Durchschnittswerte zu ermitteln, und dann die Gesamtberechnungen am Ende durchführen

function GetPopulationStats{
<#
.SYNOPSIS
Calculate the average, variance, and standard deviation of a weighted data set

.DESCRIPTION
Uses the Knuth method for finding means adapted by Jason S, to calculate the 
three averages required by the agregate statistical formulas

.LINK
https://stackoverflow.com/a/1346890/4496560
#>
   param(
      [decimal[]]$x #Data Points
     ,[decimal[]]$w #Weights
   )

   $N = $x.Length

   [decimal]$AvgW   = 0
   [decimal]$AvgWX  = 0
   [decimal]$AvgWXX = 0

   for($i=0; $i -lt $N; $i++){
      $AvgW   += ($w[$i]               - $AvgW)   / ($i+1)
      $AvgWX  += ($w[$i]*$x[$i]        - $AvgWX)  / ($i+1)
      $AvgWXX += ($w[$i]*$x[$i]*$x[$i] - $AvgWXX) / ($i+1)
   }

   [ordered]@{
      N     = $N
      Avg   = ($avg = $AvgWX / $AvgW)
      Var   = ($var = ($AvgWXX / $AvgW) - ($Avg * $Avg))
      StDev = SquareRoot $var
   }
}

und wenn Ihre Sprache wie Windows PowerShell ist, benötigen Sie wahrscheinlich eine höhere Genauigkeit [math]::sqrt() Funktion

function SquareRoot([decimal]$a){
<#
.SYNOPSIS
Find the square-root of $a

.DESCRIPTION
Uses the McDougall-Wotherspoon variant of the Newton-Raphson method to 
find the positive zero of:
   f(x)  = (x * x) - a
   f'(x) = 2 * x

.NOTES
ToDo: using a fitted polynomial would likely run faster
#>
   $BiCycleX = $PrevX = 0; 
   $x  = $a/2 # guess
   $y  = ($x * $x) - $a
   $xx = $x
   $m  = $x + $xx

   $del = $x - $PrevX
   if($del -lt 0){ $del = -$del }

   $i = 0
   while($del -gt 0 -and $x -ne $BiCycleX){
      $BiCycleX = $PrevX;
      $PrevX    = $x;
      $x  = $x - ($y / $m)
      $y  = ($x * $x) - $a
      $xx = $x - ($y / $m)
      $m  = $x + $xx

      $del = $x - $PrevX
      if($del -lt 0){ $del = -$del }

      if(++$i -ge 50){
         throw ("invariant sanity fail on step {0}:`r`n   x_(n-1) = {1}`r`n   x_n     = {2}`r`n   delta   = {3:0.#e0}" -f $i,$PrevX,$x,$del)
      }
   }

   ($x + $PrevX) / 2
}

Wenn Sie jedoch keine gewichtete Lösung benötigen, sollte es einfach genug sein, die w[i]=1 für alle i

Schließlich kann es nicht schaden, den Code kurz auf seine Richtigkeit zu überprüfen

describe 'tool spot-check' {
   context 'testing root calcs' {
      $TestCases = @(
         @{Value = 0; Expected = 0}
         @{Value = 1; Expected = 1}
         @{Value = 4; Expected = 2}
         @{Value = 9; Expected = 3}
         @{Value = 2; Expected = [decimal]'1.4142135623730950488016887242'}
         @{Value = (1e14-1); Expected = [decimal]'9999999.99999995'}
      )
      It 'finds the square root of: <Value>' -TestCases $TestCases {
         param($Value,$Expected)
         SquareRoot $Value | should be $Expected
      }
   }

   context 'testing stat calcs' {
      It 'calculates the values for 1 to 1000' {
         $x = 1..1000
         $w = @(1) * 1000

         $results = GetPopulationStats $x $w
         $results.N     | should be 1000
         $results.Avg   | should be 500.5
         $results.Var   | should be 83333.25
         $results.StDev | should be ([decimal]'288.67499025720950043826670416')
      }

      It 'calculates the values for a test data set' {
         $x = @(33,119,37,90,50,94,32,147,86,28,50,80,145,131,121,90,140,170,214,70,124)
         $w = @(207,139,25,144,72,162,93,91,109,151,125,87,49,99,210,105,99,169,50,59,22)

         $results = GetPopulationStats $x $w
         $results.N     | should be 21
         $results.Avg   | should be ([decimal]'94.54433171592412880458756066')
         $results.Var   | should be ([decimal]'2202.659150711314347179152603')
         $results.StDev | should be ([decimal]'46.93249567955356821948311637')
      }
   }
}

Beantwortet el 7 de April, 2022 von Gregor y (1366 Punkte )

Gibt es eine Möglichkeit, das arithmetische Mittel "besser" als Summe()/N zu finden?

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Gibt es eine Möglichkeit, das arithmetische Mittel "besser" als Summe()/N zu finden?

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: