Was ist der Unterschied zwischen überwachtem und unüberwachtem Lernen im Bereich der künstlichen Intelligenz und des maschinellen Lernens? Können Sie eine einfache Erklärung mit einem Beispiel geben?
Antworten
Zu viele Anzeigen?Überwachtes Lernen
Sie haben eine Eingabe x und eine Zielausgabe t. Also trainieren Sie den Algorithmus, um auf die fehlenden Teile zu generalisieren. Es handelt sich um ein überwachtes Verfahren, da das Ziel vorgegeben ist. Sie sind der Supervisor, der dem Algorithmus Anweisungen gibt: Für das Beispiel x sollst du t ausgeben!
Unüberwachtes Lernen
Obwohl Segmentierung, Clustering und Komprimierung normalerweise in diese Richtung gezählt werden, fällt es mir schwer, eine gute Definition dafür zu finden.
Nehmen wir Auto-Encoder für die Kompression als Beispiel. Sie haben zwar nur die Eingabe x, aber es ist der menschliche Ingenieur, der dem Algorithmus sagt, dass das Ziel ebenfalls x ist. In gewisser Weise unterscheidet sich dies also nicht vom überwachten Lernen.
Und beim Clustering und der Segmentierung bin ich mir nicht ganz sicher, ob es wirklich der Definition von maschinellem Lernen entspricht (siehe andere Frage ).
Überwachtes Lernen: Sie haben markierte Daten und müssen daraus lernen, z. B. Hausdaten zusammen mit dem Preis und dann lernen, den Preis vorherzusagen.
Unüberwachtes Lernen: Sie müssen den Trend finden und dann vorhersagen, ohne vorherige Kennzeichnung. z.B. verschiedene Personen in der Klasse und dann kommt eine neue Person, zu welcher Gruppe gehört dieser neue Schüler?
Überwachtes maschinelles Lernen
"Der Prozess, bei dem ein Algorithmus aus einem Trainingsdatensatz lernt und Vorhersage der Ausgabe. "
Genauigkeit der vorhergesagten Ausgabe direkt proportional zu den Trainingsdaten (Länge)
Beim überwachten Lernen hat man Eingabevariablen (x) (Trainingsdatensatz) und eine Ausgabevariable (Y) (Testdatensatz) und verwendet einen Algorithmus, um die Abbildungsfunktion von der Eingabe zur Ausgabe zu lernen.
Y = f(X)
Haupttypen:
- Klassifizierung (diskrete y-Achse)
- Prädiktiv (kontinuierliche y-Achse)
Algorithmen:
-
Klassifizierungsalgorithmen:
Neural Networks Naïve Bayes classifiers Fisher linear discriminant KNN Decision Tree Super Vector Machines
-
Prädiktive Algorithmen:
Nearest neighbor Linear Regression,Multi Regression
Anwendungsbereiche:
-
Einstufung von E-Mails als Spam
-
Einstufung, ob der Patient Krankheit hat oder nicht
-
Spracherkennung
-
Vorhersage, ob die Personalabteilung einen bestimmten Bewerber auswählt oder nicht
-
Vorhersage des Börsenkurses
Überwachtes Lernen bedeutet im Grunde, dass Sie Eingabevariablen (x) und Ausgabevariablen (y) haben und einen Algorithmus verwenden, um die Abbildungsfunktion von der Eingabe zur Ausgabe zu lernen. Der Grund, warum wir dies als überwachtes Lernen bezeichnen, ist, dass der Algorithmus aus dem Trainingsdatensatz lernt und iterativ Vorhersagen zu den Trainingsdaten macht. Es gibt zwei Arten von überwachten Verfahren - Klassifizierung und Regression. Klassifizierung bedeutet, dass die Ausgabevariable eine Kategorie wie ja/nein, wahr/falsch ist. Regression ist, wenn die Ausgabe reale Werte wie die Größe einer Person, Temperatur usw. sind.
Beim unüberwachten Lernen haben wir nur Eingabedaten (X) und keine Ausgabevariablen. Dies wird als unüberwachtes Lernen bezeichnet, weil es im Gegensatz zum oben beschriebenen überwachten Lernen keine richtigen Antworten und keinen Lehrer gibt. Die Algorithmen sind sich selbst überlassen, um die interessanten Strukturen in den Daten zu entdecken und darzustellen.
Arten des unüberwachten Lernens sind Clustering und Assoziation.
Überwachtes Lernen kann ein neues Element einem der trainierten Labels zuordnen, basierend auf dem Lernen während des Trainings. Sie müssen eine große Anzahl von Trainingsdaten, Validierungsdaten und Testdaten bereitstellen. Wenn Sie z. B. Pixelbildvektoren von Ziffern zusammen mit Trainingsdaten mit Beschriftungen bereitstellen, kann es die Zahlen identifizieren.
Unüberwachtes Lernen erfordert keine Trainingsdatensätze. Beim unüberwachten Lernen kann es Elemente auf der Grundlage der Unterschiede in den Eingabevektoren in verschiedene Cluster einteilen. Wenn Sie Pixelbildvektoren von Ziffern bereitstellen und das Programm auffordern, diese in 10 Kategorien zu klassifizieren, kann es dies tun. Aber es weiß, wie es zu beschriften ist, da Sie keine Trainingsbeschriftungen bereitgestellt haben.
0 Stimmen
github.com/niektuytel/Machine_Learning/tree/main