293 Stimmen

Was ist der Unterschied zwischen überwachtem Lernen und unüberwachtem Lernen?

Was ist der Unterschied zwischen überwachtem und unüberwachtem Lernen im Bereich der künstlichen Intelligenz und des maschinellen Lernens? Können Sie eine einfache Erklärung mit einem Beispiel geben?

0 Stimmen

510voto

Davide Punkte 16204

Da Sie diese sehr grundsätzliche Frage stellen, scheint es sinnvoll zu sein, zu spezifizieren, was maschinelles Lernen selbst ist.

Maschinelles Lernen ist eine Klasse von Algorithmen, die datengesteuert ist, d. h. im Gegensatz zu "normalen" Algorithmen sind es die Daten, die "sagen", was die "gute Antwort" ist. Beispiel: Ein hypothetischer Algorithmus ohne maschinelles Lernen zur Erkennung von Gesichtern in Bildern würde versuchen zu definieren, was ein Gesicht ist (runde, hautähnliche Scheibe mit einem dunklen Bereich, in dem man die Augen erwartet usw.). Ein Algorithmus für maschinelles Lernen hätte keine solche kodierte Definition, sondern würde "an Beispielen lernen": Sie zeigen mehrere Bilder von Gesichtern und Nicht-Gesichtern, und ein guter Algorithmus wird schließlich lernen und in der Lage sein, vorherzusagen, ob ein ungesehenes Bild ein Gesicht ist oder nicht.

Dieses besondere Beispiel der Gesichtserkennung ist beaufsichtigt Das bedeutet, dass Ihre Beispiele wie folgt aussehen müssen mit der Bezeichnung oder ausdrücklich sagen, welche Gesichter es gibt und welche nicht.

In einem unüberwacht Algorithmus sind Ihre Beispiele nicht mit der Bezeichnung d.h. Sie sagen gar nichts. Natürlich kann der Algorithmus in einem solchen Fall nicht selbst "erfinden", was ein Gesicht ist, aber er kann versuchen Cluster die Daten in verschiedene Gruppen einteilen, z. B. kann es unterscheiden, dass Gesichter sich stark von Landschaften unterscheiden, die sich wiederum stark von Pferden unterscheiden.

Da es in einer anderen Antwort erwähnt wird (allerdings in falscher Weise): Es gibt "Zwischenformen" der Überwachung, d.h. halb-überwacht y aktives Lernen . Technisch gesehen handelt es sich dabei um überwachte Methoden, bei denen es einen "intelligenten" Weg gibt, um eine große Anzahl von markierten Beispielen zu vermeiden. Beim aktiven Lernen entscheidet der Algorithmus selbst, was Sie beschriften sollen (z. B. kann er sich ziemlich sicher sein, dass es sich um eine Landschaft und ein Pferd handelt, aber er könnte Sie bitten, zu bestätigen, dass ein Gorilla tatsächlich das Bild eines Gesichts ist). Beim halbüberwachten Lernen gibt es zwei verschiedene Algorithmen, die mit den gekennzeichneten Beispielen beginnen und sich dann gegenseitig "mitteilen", wie sie über eine große Anzahl von nicht gekennzeichneten Daten denken. Aus dieser "Diskussion" lernen sie.

0 Stimmen

@ChuckTesta Nein, das ist etwas völlig anderes. Wir können auch einige Untersuchungen über aktives Online-Lernen finden.

0 Stimmen

@ChuckTesta Aktives Lernen ist eine Teilmenge des Online-Lernens. Beim Online-Lernen erhält der Algorithmus die Daten in einer sequentiellen Reihenfolge (Stream), im Gegensatz zum Batch-Lernen, bei dem der Algorithmus den gesamten Datensatz als Ganzes lernt. Außerdem entscheidet der Algorithmus beim aktiven Lernen, von welchem eingehenden Datenpunkt er lernen will (er fragt sein Label beim Orakel ab). Im Falle von Lernkostenbeschränkungen (Vorhandensein eines Abfrage-Budgets) übertrifft das aktive Lernen im Allgemeinen mehrere Online-Lernalgorithmen.

0 Stimmen

Bitte beachten Sie, dass dieser Thread derzeit in Meta diskutiert wird, mit der Frage der Migration zu Cross Validated; Sie möchten vielleicht einen Blick darauf werfen (und sich möglicherweise einbringen): meta.stackoverflow.com/questions/404799/

62voto

Yann Schwartz Punkte 5904

Überwachtes Lernen ist, wenn die Daten, mit denen Sie Ihren Algorithmus füttern, "getaggt" oder "gelabelt" werden, um Ihrer Logik bei der Entscheidungsfindung zu helfen.

Beispiel: Bayes-Spamfilterung, bei der Sie einen Artikel als Spam kennzeichnen müssen, um die Ergebnisse zu verfeinern.

Unüberwachtes Lernen sind Arten von Algorithmen, die versuchen, Korrelationen zu finden, ohne dass es außer den Rohdaten noch andere Eingaben gibt.

Beispiel: Data-Mining-Clustering-Algorithmen.

35voto

David Robles Punkte 9179

Überwachtes Lernen

Anwendungen, bei denen die Trainingsdaten Beispiele für die Eingangsvektoren zusammen mit den entsprechenden Zielvektoren umfassen, werden als überwachte Lernprobleme bezeichnet.

Unüberwachtes Lernen

Bei anderen Problemen der Mustererkennung bestehen die Trainingsdaten aus einer Reihe von Eingangsvektoren x ohne entsprechende Zielwerte. Das Ziel bei solchen unüberwachten Lernproblemen kann darin bestehen, Gruppen ähnlicher Beispiele innerhalb der Daten zu entdecken, was als Clustering bezeichnet wird

Mustererkennung und maschinelles Lernen (Bishop, 2006)

3 Stimmen

Würden Sie bitte den Unterschied zwischen Eingangsvektoren und Zielvektoren erläutern?

22voto

GPrathap Punkte 6609

Beim überwachten Lernen wird die Eingabe x mit dem erwarteten Ergebnis versehen ist y (d. h. die Ausgabe, die das Modell erzeugen soll, wenn die Eingabe x ), die oft als "Klasse" (oder "Etikett") der entsprechenden Eingabe bezeichnet wird x .

Beim unüberwachten Lernen wird die "Klasse" eines Beispiels x ist nicht vorgesehen. Unüberwachtes Lernen kann also als Suche nach "versteckten Strukturen" in unmarkierten Datensätzen betrachtet werden.

Zu den Ansätzen des überwachten Lernens gehören:

  • Klassifizierung (1R, Naive Bayes, Entscheidungsbaum-Lernalgorithmus, wie ID3 CART, und so weiter)

  • Vorhersage numerischer Werte

Zu den Ansätzen des unüberwachten Lernens gehören:

  • Clustering (K-means, hierarchisches Clustering)

  • Assoziationsregel-Lernen

0 Stimmen

Bitte beachten Sie, dass dieser Thread derzeit in Meta diskutiert wird, mit der Frage der Migration zu Cross Validated; Sie möchten vielleicht einen Blick darauf werfen (und sich möglicherweise einbringen): meta.stackoverflow.com/questions/404799/

15voto

mehdi amirsardari Punkte 181

Ich kann Ihnen ein Beispiel nennen.

Angenommen, Sie müssen erkennen, welches Fahrzeug ein Auto und welches ein Motorrad ist.

In der beaufsichtigt Lernfall muss Ihr Eingabedatensatz (Trainingsdatensatz) beschriftet werden, d. h. für jedes Eingabeelement in Ihrem Eingabedatensatz (Trainingsdatensatz) sollten Sie angeben, ob es ein Auto oder ein Motorrad darstellt.

In der unüberwacht Lernfall, beschriften Sie die Eingänge nicht. Das unüberwachte Modell gruppiert die Eingaben in Clustern, die z. B. auf ähnlichen Merkmalen/Eigenschaften basieren. In diesem Fall gibt es also keine Bezeichnungen wie "Auto".

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X