Wie man ein gruppiertes Balkendiagramm aus mehreren Datensätzen erstellt

Question

Wie man ein gruppiertes Balkendiagramm aus mehreren Datensätzen erstellt

Gefragt el 26 de April, 2011: Wann wurde die Frage gestellt
20382 Ansichten: Anzahl der Besuche der Frage
3 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich gehe durch Denk-Statistiken und ich würde gerne mehrere Datensätze visuell vergleichen. Aus den Beispielen im Buch kann ich ersehen, dass es möglich ist, ein verschachteltes Balkendiagramm mit einer anderen Farbe für jeden Datensatz zu erstellen, indem ich ein vom Autor des Buches bereitgestelltes Modul verwende; wie erhalte ich das gleiche Ergebnis in pyplot ?

Gefragt el 26 de April, 2011 von tunnuz

Answer 1

3 Antworten

Answer 2

9voto

Winston Ewert Punkte 42219

Rufen Sie die Balkenfunktion mehrfach auf, für jede Serie einmal. Sie können die linke Position der Balken mit dem Parameter left steuern und damit Überschneidungen verhindern.

Völlig ungeprüfter Code:

pyplot.bar( numpy.arange(10) * 2, data1, color = 'red' )
pyplot.bar( numpy.arange(10) * 2 + 1, data2, color = 'red' )

Daten2 wird im Vergleich zu Daten1 nach rechts verschoben gezeichnet.

Beantwortet el 26 de April, 2011 von Winston Ewert (42219 Punkte )

Answer 3

4voto

mucaho Punkte 2049

Matplotlibs Beispielcode für verschachtelte Balkendiagramme funktioniert gut für beliebige reellwertige x-Koordinaten (wie von @db42 erwähnt).

Wenn es sich bei den x-Koordinaten jedoch um kategorische Werte handelt (wie im Fall von Wörterbüchern in der verknüpfte Frage ), ist die Umrechnung von kategorischen x-Koordinaten in reale x-Koordinaten umständlich und unnötig.

Sie können zwei Wörterbücher direkt nebeneinander darstellen, indem Sie die API von Matplotlib verwenden. Der Trick, um zwei Balkendiagramme mit einem Versatz zueinander zu plotten, besteht darin, die align=edge und eine positive Breite ( +width ) für die Darstellung eines Balkendiagramms, während eine negative Breite ( -width ) für das Plotten des anderen.

Der geänderte Beispielcode für das Plotten von zwei Wörterbüchern sieht dann wie folgt aus:

"""
========
Barchart
========

A bar plot with errorbars and height labels on individual bars
"""
import matplotlib.pyplot as plt

# Uncomment the following line if you use ipython notebook
# %matplotlib inline

width = 0.35       # the width of the bars

men_means = {'G1': 20, 'G2': 35, 'G3': 30, 'G4': 35, 'G5': 27}
men_std = {'G1': 2, 'G2': 3, 'G3': 4, 'G4': 1, 'G5': 2}

rects1 = plt.bar(men_means.keys(), men_means.values(), -width, align='edge',
                yerr=men_std.values(), color='r', label='Men')

women_means = {'G1': 25, 'G2': 32, 'G3': 34, 'G4': 20, 'G5': 25}
women_std = {'G1': 3, 'G2': 5, 'G3': 2, 'G4': 3, 'G5': 3}

rects2 = plt.bar(women_means.keys(), women_means.values(), +width, align='edge',
                yerr=women_std.values(), color='y', label='Women')

# add some text for labels, title and axes ticks
plt.xlabel('Groups')
plt.ylabel('Scores')
plt.title('Scores by group and gender')
plt.legend()

def autolabel(rects):
    """
    Attach a text label above each bar displaying its height
    """
    for rect in rects:
        height = rect.get_height()
        plt.text(rect.get_x() + rect.get_width()/2., 1.05*height,
                '%d' % int(height),
                ha='center', va='bottom')

autolabel(rects1)
autolabel(rects2)

plt.show()

Das Ergebnis:

Beantwortet el 11 de Juni, 2018 von mucaho (2049 Punkte )

Answer 4

3voto

juniper- Punkte 5874

Ich bin vor einiger Zeit auf dieses Problem gestoßen und habe eine Wrapper-Funktion erstellt, die ein 2D-Array aufnimmt und daraus automatisch ein Multibalkendiagramm erstellt:

Multi-category bar chart

Der Code:

import matplotlib.pyplot as plt
import matplotlib.cm as cm
import operator as o

import numpy as np

dpoints = np.array([['rosetta', '1mfq', 9.97],
           ['rosetta', '1gid', 27.31],
           ['rosetta', '1y26', 5.77],
           ['rnacomposer', '1mfq', 5.55],
           ['rnacomposer', '1gid', 37.74],
           ['rnacomposer', '1y26', 5.77],
           ['random', '1mfq', 10.32],
           ['random', '1gid', 31.46],
           ['random', '1y26', 18.16]])

fig = plt.figure()
ax = fig.add_subplot(111)

def barplot(ax, dpoints):
    '''
    Create a barchart for data across different categories with
    multiple conditions for each category.

    @param ax: The plotting axes from matplotlib.
    @param dpoints: The data set as an (n, 3) numpy array
    '''

    # Aggregate the conditions and the categories according to their
    # mean values
    conditions = [(c, np.mean(dpoints[dpoints[:,0] == c][:,2].astype(float))) 
                  for c in np.unique(dpoints[:,0])]
    categories = [(c, np.mean(dpoints[dpoints[:,1] == c][:,2].astype(float))) 
                  for c in np.unique(dpoints[:,1])]

    # sort the conditions, categories and data so that the bars in
    # the plot will be ordered by category and condition
    conditions = [c[0] for c in sorted(conditions, key=o.itemgetter(1))]
    categories = [c[0] for c in sorted(categories, key=o.itemgetter(1))]

    dpoints = np.array(sorted(dpoints, key=lambda x: categories.index(x[1])))

    # the space between each set of bars
    space = 0.3
    n = len(conditions)
    width = (1 - space) / (len(conditions))

    # Create a set of bars at each position
    for i,cond in enumerate(conditions):
        indeces = range(1, len(categories)+1)
        vals = dpoints[dpoints[:,0] == cond][:,2].astype(np.float)
        pos = [j - (1 - space) / 2. + i * width for j in indeces]
        ax.bar(pos, vals, width=width, label=cond, 
               color=cm.Accent(float(i) / n))

    # Set the x-axis tick labels to be equal to the categories
    ax.set_xticks(indeces)
    ax.set_xticklabels(categories)
    plt.setp(plt.xticks()[1], rotation=90)

    # Add the axis labels
    ax.set_ylabel("RMSD")
    ax.set_xlabel("Structure")

    # Add a legend
    handles, labels = ax.get_legend_handles_labels()
    ax.legend(handles[::-1], labels[::-1], loc='upper left')

barplot(ax, dpoints)
plt.show()

Wenn Sie wissen möchten, was diese Funktion bewirkt und welche Logik dahinter steckt, Hier ist ein (schamlos selbstdarstellender) Link zu dem Blogbeitrag, in dem er beschrieben wird.

Beantwortet el 14 de September, 2014 von juniper- (5874 Punkte )

Wie man ein gruppiertes Balkendiagramm aus mehreren Datensätzen erstellt

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Wie man ein gruppiertes Balkendiagramm aus mehreren Datensätzen erstellt

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: