Für meine Verwendung (Knotennamen mit xy-Positionen) fand ich die Antwort von @user4179775 am hilfreichsten / intuitivsten:
import pandas as pd
df = pd.read_csv('glycolysis_nodes_xy.tsv', sep='\t')
df.head()
nodes x y
0 c00033 146 958
1 c00031 601 195
...
xy_dict_list=dict([(i,[a,b]) for i, a,b in zip(df.nodes, df.x,df.y)])
xy_dict_list
{'c00022': [483, 868],
'c00024': [146, 868],
... }
xy_dict_tuples=dict([(i,(a,b)) for i, a,b in zip(df.nodes, df.x,df.y)])
xy_dict_tuples
{'c00022': (483, 868),
'c00024': (146, 868),
... }
Zusatz
Später kehrte ich zu diesem Thema zurück, für andere, aber verwandte Arbeiten. Hier ist ein Ansatz, der der [ausgezeichneten] akzeptierten Antwort näher kommt.
node_df = pd.read_csv('node_prop-glycolysis_tca-from_pg.tsv', sep='\t')
node_df.head()
node kegg_id kegg_cid name wt vis
0 22 22 c00022 pyruvate 1 1
1 24 24 c00024 acetyl-CoA 1 1
...
Ein Pandas-Datenframe in eine [Liste], {Dictionary}, {Dictionary von {Dictionary}}, ... umwandeln
Nach der akzeptierten Antwort:
node_df.set_index('kegg_cid').T.to_dict('list')
{'c00022': [22, 22, 'pyruvate', 1, 1],
'c00024': [24, 24, 'acetyl-CoA', 1, 1],
... }
node_df.set_index('kegg_cid').T.to_dict('dict')
{'c00022': {'kegg_id': 22, 'name': 'pyruvate', 'node': 22, 'vis': 1, 'wt': 1},
'c00024': {'kegg_id': 24, 'name': 'acetyl-CoA', 'node': 24, 'vis': 1, 'wt': 1},
... }
In meinem Fall wollte ich dasselbe tun, jedoch mit ausgewählten Spalten aus dem Pandas-Datenframe, daher musste ich die Spalten ausschneiden. Es gibt zwei Ansätze.
- Direkt:
(siehe: Pandas in ein Dictionary umwandeln und dabei die für die Schlüsselwerte verwendeten Spalten definieren)
node_df.set_index('kegg_cid')[['name', 'wt', 'vis']].T.to_dict('dict')
{'c00022': {'name': 'pyruvate', 'vis': 1, 'wt': 1},
'c00024': {'name': 'acetyl-CoA', 'vis': 1, 'wt': 1},
... }
-
"Indirekt:" zunächst die gewünschten Spalten/Daten aus dem Pandas-Datenframe ausschneiden (erneut zwei Ansätze),
node_df_sliced = node_df[['kegg_cid', 'name', 'wt', 'vis']]
oder
node_df_sliced2 = node_df.loc[:, ['kegg_cid', 'name', 'wt', 'vis']]
die dann verwendet werden können, um ein Dictionary von Dictionaries zu erstellen
node_df_sliced.set_index('kegg_cid').T.to_dict('dict')
{'c00022': {'name': 'pyruvate', 'vis': 1, 'wt': 1},
'c00024': {'name': 'acetyl-CoA', 'vis': 1, 'wt': 1},
... }