types machine learning
Aquest tutorial explica els tipus d'aprenentatge automàtic, és a dir, l'aprenentatge supervisat, no supervisat, reforçat i semi-supervisat amb exemples senzills. També aprendreu diferències entre l'aprenentatge supervisat i el no supervisat:
A la Tutorial anterior , hem après sobre l'aprenentatge automàtic, el seu funcionament i les seves aplicacions. També hem vist una comparació de l’aprenentatge automàtic contra la intel·ligència artificial.
L’aprenentatge automàtic és un camp de la ciència que s’ocupa de l’aprenentatge de programes d’ordinador mitjançant l’experiència i la predicció de la producció.
la passarel·la per defecte no està disponible Windows 10 ethernet
La principal característica de ML és aprendre de l’experiència. L’aprenentatge es produeix quan el sistema alimentat amb dades d’entrada d’entrenament fa canvis en els seus paràmetres i s’ajusta per donar la sortida desitjada. La sortida és el valor objectiu definit a les dades de formació.
=> Llegiu la sèrie completa de formació sobre aprenentatge automàtic
Què aprendreu:
- Tipus d’aprenentatge automàtic
- Exemple real d'aprenentatge supervisat i no supervisat
- Diferència entre l'aprenentatge supervisat i el no supervisat
- Aprenentatge semi-supervisat
- Conclusió
Tipus d’aprenentatge automàtic
Els programes d’aprenentatge automàtic es classifiquen en 3 tipus, tal com es mostra a continuació.
- Supervisat
- Sense supervisió
- Aprenentatge de reforç
Anem a entendre cadascun d’aquests en detall !!
# 1) Aprenentatge supervisat
L’aprenentatge supervisat passa en presència d’un supervisor, igual que l’aprenentatge realitzat per un nen petit amb l’ajut del seu professor. Quan un nen està entrenat per reconèixer fruites, colors, números sota la supervisió d’un professor, aquest mètode és un aprenentatge supervisat.
En aquest mètode, cada pas del nen és comprovat pel professor i el nen aprèn de la producció que ha de produir.
Com funciona l'aprenentatge supervisat?
A l'algorisme ML supervisat, la sortida ja és coneguda. Hi ha un mapatge d’entrada amb la sortida. Per tant, per crear un model, la màquina s’alimenta amb moltes dades d’entrada d’entrenament (es coneix l’entrada i la sortida corresponent).
Les dades de formació ajuden a assolir un nivell de precisió per al model de dades creat. El model construït ja està preparat per alimentar-se amb noves dades d’entrada i predir els resultats.
Què és un conjunt de dades etiquetat?
El conjunt de dades amb sortides conegudes per a una entrada determinada s’anomena conjunt de dades etiquetat. Per exemple, es coneix una imatge de fruita juntament amb el nom de la fruita. Per tant, quan es mostra una nova imatge de fruita, es compara amb el conjunt d’entrenament per predir la resposta.
L’aprenentatge supervisat és un mecanisme d’aprenentatge ràpid amb alta precisió. Els problemes d’aprenentatge supervisats inclouen problemes de regressió i classificació.
Alguns dels algorismes d'aprenentatge supervisats són:
- Arbres de decisió,
- K-Veí més proper,
- Regressió lineal,
- Màquina Vectorial i de suport
- Xarxes neuronals.
Exemple d'aprenentatge supervisat
- En el primer pas, s’introdueix un conjunt de dades de formació a l’algorisme d’aprenentatge automàtic.
- Amb el conjunt de dades d’entrenament, la màquina s’ajusta a si mateixa fent canvis als paràmetres per crear un model lògic.
- El model construït s'utilitza llavors per a un nou conjunt de dades per predir el resultat.
Tipus d’algorismes d’aprenentatge supervisat
- Classificació: En aquest tipus de problemes, prediuem la resposta com a classes específiques, com ara 'sí' o 'no'. Quan només hi ha 2 classes, s’anomena classificació binària. Per a més de 2 valors de classe, s’anomena classificació de diverses classes. Els valors de resposta predits són valors discrets. Per exemple, És la imatge del sol o de la lluna? L’algorisme de classificació separa les dades en classes.
- Regressió: Els problemes de regressió prediuen la resposta com a valors continus, com ara predir un valor que oscil·la entre -infinit i infinit. Pot suposar molts valors. Per exemple, l'algorisme de regressió lineal que s'aplica, prediu el cost de la casa en funció de molts paràmetres com ara la ubicació, l'aeroport proper, la mida de la casa, etc.
# 2) Aprenentatge sense supervisió
L’aprenentatge sense supervisió passa sense l’ajut d’un supervisor, de la mateixa manera que un peix aprèn a nedar tot sol. És un procés d’aprenentatge independent.
En aquest model, com que no hi ha cap sortida assignada amb l'entrada, els valors objectiu són desconeguts / sense etiquetar. El sistema ha d’aprendre per si mateix de les dades introduïdes i detectar els patrons ocults.
Què és el conjunt de dades sense etiquetar?
Un conjunt de dades amb valors de sortida desconeguts per a tots els valors d’entrada s’anomena conjunt de dades sense etiquetar.
Com funciona l'aprenentatge sense supervisió?
Com que no es coneixen valors de sortida que es puguin utilitzar per construir un model lògic entre l'entrada i la sortida, algunes tècniques s'utilitzen per extreure regles de dades, patrons i grups de dades de tipus similar. Aquests grups ajuden els usuaris finals a entendre millor les dades i a trobar un resultat significatiu.
Les entrades alimentades no tenen la forma d’una estructura adequada tal com ho són les dades de formació (en l’aprenentatge supervisat). Pot contenir valors atípics, dades sorolloses, etc. Aquestes entrades s'alimenten juntes al sistema. Durant la formació del model, les aportacions s’organitzen per formar clústers.
Els algoritmes d'aprenentatge no supervisats inclouen Algoritmes d'Agrupació i Associació com:
- A priori,
- K-significa agrupacions i altres algorismes de mineria de regles d'associació.
Quan s'introdueixen dades noves al model, predirà el resultat com a etiqueta de classe a la qual pertany l'entrada. Si no hi ha l'etiqueta de classe, es generarà una nova classe.
Tot i que experimenta el procés de descobriment de patrons a les dades, el model ajusta els seus paràmetres per si mateix, de manera que també s’anomena autoorganització. Els clústers es formaran esbrinant les similituds entre les entrades.
Per exemple, mentre es compra productes en línia, si es manté mantega al carretó, es recomana comprar pa, formatge, etc. El model sense supervisió analitza els punts de dades i prediu els altres atributs que s’associen al producte.
Exemple d'aprenentatge sense supervisió
Tipus d’algorismes no supervisats
- Algorisme de clusterització : Els mètodes per trobar les similituds entre elements de dades com la mateixa forma, mida, color, preu, etc. i agrupar-los per formar un clúster són anàlisis de clústers.
- Detecció atípica : En aquest mètode, el conjunt de dades és la cerca de qualsevol tipus de diferències i anomalies a les dades. Per exemple, el sistema detecta una transacció d’alt valor amb targeta de crèdit per detectar fraus.
- Associació Minera de Regles : En aquest tipus de mineria, descobreix els conjunts d’elements o associacions més freqüents entre elements. Associacions com 'productes que sovint es compren junts', etc.
- Autoencoders: L'entrada es comprimeix en un format codificat i es recrea per eliminar dades sorolloses. Aquesta tècnica s’utilitza per millorar la qualitat de la imatge i del vídeo.
# 3) Aprenentatge de reforç
En aquest tipus d’aprenentatge, l’algorisme aprèn mitjançant mecanismes de retroalimentació i experiències passades. Sempre es desitja que cada pas de l'algorisme es faci per assolir un objectiu.
Per tant, sempre que s’ha de fer el següent pas, rep els comentaris del pas anterior, juntament amb l’aprenentatge de l’experiència per predir quin podria ser el següent millor pas. Aquest procés també s’anomena procés d’assaig i error per assolir l’objectiu.
L’aprenentatge de reforç és un procés iteratiu a llarg termini. Com més nombre de comentaris, més precís és el sistema. L’aprenentatge bàsic de reforç també s’anomena procés de decisió de Markov.
Exemple d'aprenentatge de reforç
Un exemple d’aprenentatge de reforç són els videojocs, on els jugadors completen certs nivells d’un joc i guanyen punts de recompensa. El joc proporciona retroalimentació al jugador mitjançant moviments addicionals per millorar el seu rendiment.
L’aprenentatge de reforç s’utilitza en la formació de robots, cotxes autònoms, gestió automàtica d’inventari, etc.
Alguns algoritmes populars d'aprenentatge de reforç inclouen:
- Aprenentatge Q,
- Xarxes adversàries profundes
- Diferència temporal
La figura següent descriu el mecanisme de retroalimentació de l’aprenentatge de reforç.
- L'entrada és observada per l'agent que és l'element AI.
- Aquest agent d'IA actua sobre el medi ambient segons la decisió presa.
- La resposta de l’entorn s’envia a la IA en forma de recompensa com a retroacció.
- També es guarden l'estat i l'acció realitzada sobre el medi ambient.
(imatge font )
Exemple real d'aprenentatge supervisat i no supervisat
Per a l'aprenentatge supervisat:
# 1) Prenguem un exemple d’una cistella de verdures amb ceba, pastanaga, rave, tomàquet, etc., i les podem organitzar en forma de grups.
# 2) Creem una taula de dades de formació per entendre l’aprenentatge supervisat.
La taula de dades d’entrenament caracteritza les verdures en funció de:
- Forma
- color
- Mida
Forma | color | Mida | Vegetals |
---|---|---|---|
És més precís que l’aprenentatge sense supervisió, ja que les dades d’entrada i la sortida corresponent són ben conegudes i la màquina només ha de donar prediccions. | Té menys precisió ja que les dades d’entrada no estan etiquetades. Per tant, la màquina ha d’entendre i etiquetar primer les dades i després fer prediccions. | ||
Rodó | Marró | Gran | Ceba |
Rodó | xarxa | Mitjà | Tomàquet |
Cilíndric | Blanc | Gran | Rave |
Cilíndric | xarxa | Mitjà | Pastanaga |
Quan aquesta taula de dades d’entrenament s’alimenta a la màquina, crearà un model lògic amb la forma, el color, la mida de la verdura, etc., per predir el resultat (vegetal).
A mesura que s’introdueix una nova entrada a aquest model, l’algorisme analitzarà els paràmetres i donarà sortida al nom de la fruita.
Per a l'aprenentatge sense supervisió:
En l’aprenentatge no supervisat, crea grups o clústers basats en atributs. Al conjunt de dades de mostra anterior, els paràmetres de vegetals són:
# 1) Forma
Les verdures s’agrupen en funció de la forma.
- Ronda: Ceba i Tomàquet.
- Cilíndric: Raves i pastanaga.
Agafeu un altre paràmetre com ara la mida.
# 2) Mida
Les verdures s’agrupen segons la mida i la forma:
- Mida mitjana i forma rodona: Tomàquet
- Mida gran i forma rodona: Ceba
En l’aprenentatge no supervisat, no tenim cap conjunt de dades d’entrenament i variable de resultat, mentre que en l’aprenentatge supervisat, les dades de formació són conegudes i s’utilitzen per entrenar l’algorisme.
Diferència entre l'aprenentatge supervisat i el no supervisat
Supervisat | Sense supervisió |
---|---|
En els algorismes d'aprenentatge supervisat, es coneix la sortida de l'entrada donada. | En els algorismes d'aprenentatge no supervisats, la sortida de l'entrada donada és desconeguda. |
Els algoritmes aprenen d’un conjunt de dades etiquetats. Aquestes dades ajuden a avaluar la precisió de les dades de formació. | L'algorisme es proporciona amb dades sense etiquetar on intenta trobar patrons i associacions entre els elements de dades. |
És una tècnica de modelatge predictiu que prediu els resultats futurs amb precisió. | És una tècnica de modelatge descriptiu que explica la relació real entre els elements i la història dels elements. |
Inclou algorismes de classificació i regressió. | Inclou algorismes d’aprenentatge de regles d’agrupació i associació. |
Alguns algorismes d'aprenentatge supervisat són la regressió lineal, Naïve Bayes i les xarxes neuronals. | Alguns algoritmes per a l’aprenentatge sense supervisió són k- significa agrupació, Apriori, etc. |
Aquest tipus d’aprenentatge és relativament complex ja que requereix dades etiquetades. | És menys complex ja que no cal comprendre i etiquetar les dades. |
És un procés d’anàlisi de dades en línia i no requereix interacció humana. | Es tracta d’una anàlisi de dades en temps real. |
Aprenentatge semi-supervisat
L’enfocament d’aprenentatge semi-supervisat pren dades de formació tant etiquetades com no etiquetades. Aquest tipus d’aprenentatge és útil quan és difícil extreure funcions útils de dades sense etiquetar (enfocament supervisat) i als experts en dades els costa etiquetar les dades d’entrada (enfocament no supervisat).
Només una petita quantitat de dades etiquetades en aquests algorismes pot conduir a la precisió del model.
Exemples de l’aprenentatge semi-supervisat inclouen tomografies i ressonàncies magnètiques, on un expert mèdic pot marcar alguns punts de les exploracions per detectar qualsevol malaltia, mentre que és difícil etiquetar totes les exploracions.
Conclusió
Les tasques d’aprenentatge automàtic es classifiquen a grans trets en tasques d’aprenentatge supervisat, no supervisat, semis supervisat i reforçat.
L’aprenentatge supervisat és aprendre amb l’ajut de dades etiquetades. Els algoritmes ML s’alimenten d’un conjunt de dades d’entrenament en el qual es coneix la sortida de cada informació d’entrada, per predir resultats futurs.
Aquest model és molt precís i ràpid, però requereix una gran experiència i temps per construir-lo. A més, aquests models requereixen una reconstrucció si canvien les dades. Les tasques de ML com la regressió i la classificació es realitzen en un entorn d’aprenentatge supervisat.
com obrir fitxers .jar amb java
L’aprenentatge no supervisat té lloc sense l’ajut d’un supervisor. Les dades d'entrada alimentades als algoritmes ML no estan etiquetats, és a dir, per a cada entrada no es coneix cap sortida. L’algoritme esbrina per si mateix les tendències i el patró de les dades d’entrada i crea una associació entre els diferents atributs de l’entrada.
Aquest tipus d’aprenentatge és útil per trobar patrons en dades, crear clústers de dades i anàlisis en temps real. Tasques com ara el clúster, els algoritmes KNN, etc., són objecte d'aprenentatge sense supervisió.
Les tasques d'aprenentatge semi-supervisades són l'avantatge d'algoritmes supervisats i no supervisats mitjançant la predicció dels resultats mitjançant dades etiquetades i no etiquetades. L’aprenentatge de reforç és un tipus de mecanisme de retroalimentació on la màquina aprèn de la retroalimentació constant de l’entorn per assolir el seu objectiu.
En aquest tipus d’aprenentatge, els agents d’IA realitzen algunes accions sobre les dades i l’entorn dóna una recompensa. L’aprenentatge del reforç l’utilitzen els jocs multijugador per a nens, cotxes autònoms, etc.
Estigueu atent al nostre proper tutorial per obtenir més informació sobre l'aprenentatge automàtic i la xarxa de neurones artificials.
=> Visiteu aquí la sèrie exclusiva d’aprenentatge automàtic
Lectura recomanada
- Mineria de dades contra aprenentatge automàtic contra intel·ligència artificial contra aprenentatge profund
- 11 eines de programari d'aprenentatge automàtic més populars el 2021
- Tutorial d'aprenentatge automàtic: Introducció a ML i les seves aplicacions
- Tipus de dades Python
- Tipus de dades C ++
- Tipus de riscos en projectes de programari
- Tipus de proves de migració: amb escenaris de prova per a cada tipus
- 15 millors sistemes de gestió de l'aprenentatge (LMS de l'any 2021)