2 Stimmen

Hat jemand pubchemdb benutzt? Gibt es eine ähnliche API?

Update: Der Link in der Antwort ist sowohl interessant als auch nützlich, geht aber leider nicht auf den Bedarf an einer Java-API ein, so dass ich mich immer noch über Anregungen freue.

Ich baue eine Datenbank mit chemischen Verbindungen auf. Ich benötige alle Synonyme (IUPAC und gebräuchliche Namen) sowie die Sicherheitsdaten für jede Verbindung.
Ich werde die frei verfügbaren Daten bei PubChem (http://pubchem.ncbi.nlm.nih.gov/) verwenden.

Es gibt eine einfache Möglichkeit, jede Verbindung mit einfachen HTTP-Gets abzufragen. Um zum Beispiel Glycerin-Daten zu erhalten, lautet die URL:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753

Und die folgende URL würde ein leicht zu analysierendes Format zurückgeben:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF

aber es werden nur sehr grundlegende Informationen, keine Sicherheitsdaten und nur ein paar gebräuchliche Namen angezeigt.

Es gibt eine öffentlich zugängliche API für JAVA, die sehr vollständig zu sein scheint und von einer Gruppe bei Scripps entwickelt wurde ( Zitat ). Der Code lautet aquí .

Leider ist diese API nicht sehr gut dokumentiert und aufgrund der Komplexität der Daten nur schwer zu verstehen. Soweit ich weiß, verwendet pubchemdb die PubChem Power User Gateway (PUG) XML API

Hat jemand diese API (oder eine andere verfügbare) verwendet? Ich würde mich über eine kurze Beschreibung oder eine Anleitung freuen, wie man damit anfängt.

0 Stimmen

Dies ist wahrscheinlich ein bisschen speziell für StackOverflow. Gibt es irgendwelche Chemoinformatik-Communities, die Sie ausprobieren könnten?

0 Stimmen

@Tom es könnte ziemlich speziell sein, aber ich hoffe, dass jemand hier mit diesen Datenbanken gearbeitet hat. Es gibt eine ganze Reihe von ncbi-Fragen, die hier beantwortet werden. Vielleicht wende ich mich auch direkt an die Autoren.

2voto

El Cactvs Chemoinformatik-Werkzeugsatz (kostenlos für den akademischen/schulischen Gebrauch) verfügt über eine vollständige PubChem-Integration. Mit Hilfe der Skripting-Umgebung können Sie leicht etwas wie folgt tun

cactvs>ens create 753

ens0

cactvs>ens get ens0 E\_NAMESET

PROPANE-1,2,3-TRIOL GLYCEROL 8043-29-6 29796-42-7 30049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773\_SIGMA 15523\_RIEDEL {Glycerin, natural} NCGC00090950-03 191612\_ALDRICH 15524\_RIEDEL {Glycerol solution} L-glycerol 49767\_FLUKA {Biodiesel impurity} 49770\_FLUKA 49771\_FLUKA NCGC00090950-01 49927\_FLUKA Glycerol-Gelatine G7757\_SIAL GOL D-glycerol G9012\_SIAL {Polyhydric alcohols} c0066 MOON {NSC 9230} G2025\_SIGMA ZINC00895048 49781\_FLUKA {Concentrated glycerin} {Concentrated glycerin (JP15)} D00028 {Glycerin (JP15/USP)} 44892U\_SUPELCO {Glycerin, concentrated (JAN)} CRY 49782\_FLUKA NCGC00090950-02 G6279\_SIAL W252506\_ALDRICH G7893\_SIAL {Glycerin, concentrated} 33224\_RIEDEL Bulbold Cristal Glyceol G9281\_SIGMA Glycerol-1,2,3-3H G1901\_SIGMA G7043\_SIGMA 1,2,3-trihydroxypropane 1,2,3-trihydroxypropanol glycerin G2289\_SIAL G9406\_SIGMA {Glycerol-\[2-3H\]} CHEBI:17754 Glyzerin Oelsuess InChI=1/C3H8O3/c4-1-3(6)2-5/h3-6H,1-2H {90 Technical glycerine} Dagralax {Glycerin, anhydrous} {Glycerin, synthetic} Glycerine Glyceritol {Glycyl alcohol} Glyrol Glysanin NSC9230 Ophthalgan Osmoglyn Propanetriol {Synthetic glycerin} {Synthetic glycerine} Trihydroxypropane Vitrosupos {WLN: Q1YQ1Q} Glycerol-1,3-14C {4-01-00-02751 (Beilstein Handbook Reference)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin, wasserfrei \[German\]} {EINECS 200-289-5} {EPA Pesticide Chemical Code 063507} {FEMA No. 2525} {Glicerina \[DCIT\]} {Glicerol \[INN-Spanish\]} {Glycerin (mist)} {Glycerin \[JAN\]} {Glycerin mist} {Glycerine mist} Glycerinum {Glycerolum \[INN-Latin\]} Grocolene {HSDB 492} IFP {Incorporation factor} 1,2,3-Propanetriol C00116 Optim {Propanetriol (VAN)} {1,2,3-PROPANETRIOL, HOMOPOLYMER} {Glycerol polymer} {Glycerol, polymers} {HL 80} {PGL 300} {PGL 500} {PGL 700} Polyglycerin Polyglycerine Polyglycerol {Unigly G 2} {Unigly G 6} G5516\_SIGMA MolMap\_000024

cactvs>

Dies verbirgt alle PUG-Hässlichkeiten - aber in jedem Fall wage ich zu behaupten, dass PUG est gut dokumentiert. Das Toolkit geht weit über das einfache Herunterladen von Daten hinaus - Sie können PubChem sogar wie eine lokale SD-Datei öffnen und abfragen, wenn Sie das möchten.

PubChem enthält jedoch keine Sicherheitsdaten. Und Sicherheitsdaten sind länder- bzw. regionenabhängig und streng geregelt, und Sie sollten wirklich aufpassen, dass Sie nicht in die Haftung genommen werden. Lassen Sie Ihren Ansatz von Juristen prüfen!

0 Stimmen

Ich danke Ihnen für Ihre Antwort. Ich habe die pdf-Dokumentation von cactvs heruntergeladen und werde sie durchgehen. Es sieht sehr interessant aus.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X