complete guide artificial neural network machine learning
Aquest tutorial explica què és la xarxa de neurones artificials, com funciona una ANN, l'estructura i els tipus d'ANN i l'arquitectura de xarxes neuronals:
Preguntes d'entrevistes basades en escenaris SQL
En aquest Formació en aprenentatge automàtic per a tothom , ho vam explorar tot Tipus d’aprenentatge automàtic al nostre tutorial anterior.
Aquí, en aquest tutorial, discutiu els diversos algoritmes de les xarxes neuronals, juntament amb la comparació entre aprenentatge automàtic i ANN. Abans d’aprendre com ANN contribueix a l’aprenentatge automàtic, hem de saber què és una xarxa de neurones artificials i un breu coneixement sobre l’aprenentatge automàtic.
Explorem més sobre l'aprenentatge automàtic i la xarxa de neurones artificials.
=> Llegiu la sèrie completa de formació sobre aprenentatge automàtic
Què aprendreu:
- Què és l'aprenentatge automàtic?
- Què és una xarxa de neurones artificials?
- Estructura d’una xarxa neuronal biològica
- Comparació de la neurona biològica i la neurona artificial
- Característiques d'ANN
- Estructura d'ANN
- Funció d'activació
- Què és una neurona artificial?
- Com funciona la neurona artificial?
- Models bàsics d'ANN
- Arquitectura de xarxes neuronals
- Exemple de xarxa de neurones artificials
- Comparació entre aprenentatge automàtic i ANN
- Xarxes neuronals i aprenentatge profund
- Aplicacions de xarxes neuronals artificials
- Limitacions de les xarxes neuronals
- Conclusió
- Lectura recomanada
Què és l'aprenentatge automàtic?
L’aprenentatge automàtic és un camp de la ciència que permet als ordinadors la capacitat d’aprendre i d’actuar sense ser programat explícitament. És un subcamp d’Intel·ligència Artificial.
Què és una xarxa de neurones artificials?
ANN és un model no lineal que s’utilitza àmpliament en l’aprenentatge automàtic i té un futur prometedor en el camp de la intel·ligència artificial.
La xarxa de neurones artificials és anàloga a una xarxa de neurones biològiques. Una xarxa neuronal biològica és una estructura de milers de milions de neurones interconnectades en un cervell humà. El cervell humà es compon de neurones que envien informació a diverses parts del cos en resposta a una acció realitzada.
De manera similar, una xarxa de neurones artificials (ANN) és una xarxa computacional en ciència que s’assembla a les característiques d’un cervell humà. Les ANN poden modelar-se com a neurones originals del cervell humà, de manera que les parts de processament de l’ANN s’anomenen neurones artificials.
Les ANN consisteixen en un gran nombre de neurones interconnectades que s’inspiren en el funcionament d’un cervell. Aquestes neurones tenen la capacitat d’aprendre, generalitzar les dades d’entrenament i obtenir resultats de dades complicades.
Aquestes xarxes s'utilitzen a les àrees de classificació i predicció, identificacions de patrons i tendències, problemes d'optimització, etc.
La xarxa neuronal apresa s’anomena an sistema expert amb la capacitat d’analitzar la informació i respondre a les preguntes d’un camp específic.
La definició formal d’ANN donada pel Dr. Robert Hecht-Nielson, inventor d’un primer neuroordinador és:
'... un sistema informàtic format per una sèrie d'elements de processament senzills i altament interconnectats, que processen la informació per la seva resposta d'estat dinàmic a les entrades externes'.
Estructura d’una xarxa neuronal biològica
Una xarxa neuronal biològica consisteix en:
- Soma: Això també s’anomena cos cel·lular. És on es troba el nucli cel·lular.
- Dendrites: Es tracta de xarxes en forma d’arbre que estan connectades al cos de la cèl·lula. Està fet de la fibra nerviosa.
- Axó: Axon transporta el senyal des del cos cel·lular. Es divideix en cadenes i cada cadena acaba en una estructura semblant a un bulb anomenada sinapsi. Els senyals elèctrics es fan passar entre la sinapsi i les dendrites.
[imatge font ]
Comparació de la neurona biològica i la neurona artificial
Neurona biològica | artificial Neuron |
---|---|
ML s’aplica al comerç electrònic, a la salut, a les recomanacions de productes, etc. | ANN s'aplica en el domini financer, l'aprenentatge automàtic i la intel·ligència artificial. |
Està format per cèl·lules. | Les cèl·lules corresponen a neurones. |
Té dendrites que són interconnexions entre el cos cel·lular. | Els pesos de connexió corresponen a dendrites. |
Soma rep l'entrada. | Soma és similar al pes net d’entrada. |
L’axó rep el senyal. | La sortida d’ANN correspon a l’axó. |
Característiques d'ANN
- No linealitat: El mecanisme seguit a ANN per a la generació del senyal d’entrada no és lineal.
- Aprenentatge supervisat: L'entrada i la sortida es mapen i l'ANN es forma amb el conjunt de dades d'entrenament.
- Aprenentatge sense supervisió: La sortida objectiu no es dóna, de manera que l’ANN aprendrà tot sol descobrint les característiques dels patrons d’entrada.
- Natura adaptativa: Els pesos de connexió als nodes de l’ANN són capaços d’ajustar-se per donar la sortida desitjada.
- Analogia de neurones biològiques: L’ANN té una estructura i funcionalitat inspirades en el cervell humà.
- Falta de tolerància: Aquestes xarxes són molt tolerants ja que la informació es distribueix en capes i el càlcul es realitza en temps real.
Estructura d'ANN
Les xarxes neuronals artificials són elements de processament en forma d’algoritmes o dispositius de maquinari modelats segons l’estructura neuronal de l’escorça cerebral del cervell humà.
Aquestes xarxes també s’anomenen simplement xarxes neuronals. El NN està format per moltes capes. Les múltiples capes interconnectades sovint s’anomenen “Perceptron multicapa”. Les neurones d’una capa s’anomenen “nodes”. Aquests nodes tenen una 'funció d'activació'.
L'ANN té 3 capes principals:
- Capa d'entrada: Els patrons d’entrada s’alimenten a les capes d’entrada. Hi ha una capa d’entrada.
- Capes ocultes: Hi pot haver una o més capes amagades. El processament que té lloc a les capes internes s'anomena 'capes ocultes'. Les capes ocultes calculen la sortida en funció dels 'pesos', que és la 'suma de connexions de sinapsi ponderades'. Les capes ocultes refinen l’entrada eliminant informació redundant i envien la informació a la següent capa oculta per a un processament posterior.
- Capa de sortida: Aquesta capa oculta es connecta a la 'capa de sortida' on es mostra la sortida.
Funció d'activació
La funció d’activació és un estat intern d’una neurona. És una funció d’entrada que rep la neurona. La funció d’activació s’utilitza per convertir el senyal d’entrada del node ANN en un senyal de sortida.
Què és una neurona artificial?
Una xarxa de neurones artificials consisteix en elements de processament altament interconnectats anomenats nodes o neurones.
Aquestes neurones funcionen en paral·lel i s’organitzen en una arquitectura. Els nodes estan connectats entre ells mitjançant enllaços de connexió. Cada neurona té un pes que conté informació sobre el senyal d’entrada.
Com funciona la neurona artificial?
Una neurona artificial rep una entrada. Aquestes entrades tenen un pes anomenat 'sinapsi'. Aquestes neurones (també anomenades nodes) tenen 'funció d'activació'. Aquesta funció d’activació funciona a l’entrada i la processa per donar una sortida.
La suma ponderada d’entrades es converteix en un senyal d’entrada a la funció d’activació per donar una sortida. Aquests pesos d’entrada són ajustables perquè la xarxa neuronal pugui ajustar els seus paràmetres per donar la sortida desitjada.
Poques funcions d’activació habituals que s’utilitzen a la xarxa de neurones artificials són:
# 1) Funció d'identitat
Es pot definir com f (x) = x per a tots els valors de x. Aquesta és una funció lineal on la sortida és la mateixa que l’entrada.
# 2) Funció de pas binari
Aquesta funció s'utilitza en xarxes d'una sola capa per convertir l'entrada neta a sortida. La sortida és binària, és a dir, 0 o 1. La t representa el valor llindar.
[imatge font ]
# 3) Funció de pas bipolar
La funció de pas bipolar té sortides bipolars (+1 o -1) per a l'entrada neta. T representa el valor llindar.
# 4) Funció sigmoidal
S'utilitza en xarxes de propagació posterior.
És de dos tipus:
- Funció binària Sigmoid: També s’anomena funció sigmoide unipolar o funció sigmoide logística. El rang de funcionalitat sigmoidal és de 0 a 1.
- Sigmoide bipolar: La funció sigmoïdal bipolar oscil·la entre -1 i +1. És similar a la funció tangent hiperbòlica.
[imatge font ]
# 5) RampFunction
El suma ponderada d’entrades significa el 'producte del pes de l'entrada i el valor de l'entrada' sumat per a totes les entrades.
Sigui I = {I1, I2, I3 ... In} el patró d'entrada a la neurona.
Sigui W = {W1, W2, W3 ... Wn} el pes associat a cada entrada al node.
Suma ponderada d’entrades = Y = (? Wi * Ii) per a i = 1 a n
Models bàsics d'ANN
Els models de xarxes neuronals artificials consten de 3 entitats:
- Pesos o connexions sinàptiques
- La regla d’aprenentatge que s’utilitza per ajustar els pesos
- Funcions d'activació de la neurona
Arquitectura de xarxes neuronals
A ANN les neurones estan interconnectades i la sortida de cada neurona està connectada a la neurona següent mitjançant pesos. L’arquitectura d’aquestes interconnexions és important en un ANN. Aquesta disposició té la forma de capes i la connexió entre les capes i dins de la capa és l’arquitectura de la xarxa neuronal.
Les arquitectures de xarxa més conegudes són:
- Xarxa de reenviament d'alimentació d'una sola capa
- Xarxa de reenviament d'alimentació de múltiples capes
- Node únic amb els seus propis comentaris
- Xarxa recurrent d'una sola capa
- Xarxa recurrent de múltiples capes
Fem una ullada a cadascun d’aquests en detall.
la millor idea de Python per a Windows 10
# 1) Xarxa de reenviament d'alimentació d'una sola capa
Una capa és una xarxa formada per neurones. Aquestes neurones estan connectades a les altres neurones de la capa següent. Per a una sola capa, només hi ha les capes d'entrada i sortida. La capa d'entrada està connectada als nodes de la capa de sortida amb pesos.
Tots els nodes d'entrada estan connectats a cadascun dels nodes de sortida. El terme feed-forward indica que no s’envia cap comentari des de la capa de sortida a la capa d’entrada. Això forma una xarxa d'alimentació d'una sola capa.
[imatge font ]
# 2) Xarxa de reenviament de múltiples capes
La xarxa multicapa consta d'una o més capes entre l'entrada i la sortida. La capa d’entrada només rep un senyal i la memòria intermèdia mentre la capa de sortida mostra la sortida. Les capes entre l'entrada i la sortida s'anomenen capes ocultes.
Les capes ocultes no estan en contacte amb l'entorn extern. Amb més nombre de capes amagades, la resposta de sortida és més eficient. Els nodes de la capa anterior estan connectats a cada node de la capa següent.
Com que no hi ha cap capa de sortida connectada a les capes d’entrada o ocultes, forma una xarxa de transmissió d’avanç multicapa.
# 3) Node únic amb els seus propis comentaris
Les xarxes on es retorna la sortida de la capa de sortida com a entrada a la capa d’entrada o a les altres capes ocultes s’anomenen Xarxes de retroalimentació. En els sistemes de retroalimentació d’un node únic, hi ha una sola capa d’entrada on la sortida es redirigeix com a retroalimentació.
# 4) Xarxa recurrent d'una sola capa
En una xarxa recurrent d'una sola capa, la xarxa de retroalimentació forma un bucle tancat. En aquest model, una sola neurona rep informació a si mateixa o a les altres neurones de la xarxa o a totes dues.
# 5) Xarxa recurrent de múltiples capes
A la xarxa recurrent de múltiples capes, existeixen múltiples capes ocultes i la sortida es redirigeix cap a les neurones de les capes anteriors i altres neurones de les mateixes capes o de la mateixa neurona.
Exemple de xarxa de neurones artificials
Prenem la xarxa següent amb l’entrada donada i calculem la neurona d’entrada neta i obtenim la sortida de la neurona Y amb funció d’activació com a sigmoidal binària.
L'entrada té 3 neurones X1, X2 i X3, i una sola sortida Y.
Els pesos associats a les entrades són: {0,2, 0,1, -0,3}
Entrades = {0,3, 0,5, 0,6}
Entrada neta = {x1 * w1 + x2 * w2 + x3 * w3}
Entrada neta = (0,3 * 0,2) + (0,5 * 0,1) + (0,6 * -0,3)
Entrada neta = -0,07
Sortida per a Sigmoidal binari:
X és -0,07
La sortida és de 0,517
referència indefinida a la funció c ++
Comparació entre aprenentatge automàtic i ANN
Aprenentatge automàtic | Xarxa de neurones artificials |
---|---|
L’aprenentatge automàtic aprèn de les dades d’entrada i descobreix patrons de dades de sortida d’interès. | Les ANN s’utilitzen en algorismes d’aprenentatge automàtic per entrenar el sistema mitjançant sinapsis, nodes i enllaços de connexió. |
ML és un subconjunt del camp de la intel·ligència artificial. | ANN també forma part del camp de la ciència de la Intel·ligència Artificial i un subconjunt d'aprenentatge automàtic. |
Els algoritmes ML aprenen de les dades que s’envien a l’algoritme per tal de prendre decisions. Alguns d'aquests algorismes són classificació. Clusterització, mineria de dades d'associació. | ANN és una ciència d’aprenentatge profund que analitza les dades amb estructures lògiques com ho fan els humans. Alguns dels esquemes d’aprenentatge de l’ANANN són Hebbian, Perceptron, propagació de l’esquena, etc. |
Els algoritmes de ML tenen capacitats d’autoaprenentatge, però requeririen una intervenció humana si el resultat és imprecís. | Els algoritmes ANN tenen la capacitat d’ajustar-se mitjançant pesos de connexió si el resultat és erroni. |
Els algoritmes ML requereixen coneixements de programació, estructura de dades i coneixements de bases de dades de big data. | ANN també requereix de fortes habilitats en matemàtiques, probabilitat, estructures de dades, etc. |
Els programes de ML poden predir el resultat del conjunt de dades apreses i ajustar-se a les noves dades. | ANN pot aprendre i prendre decisions intel·ligents pel seu compte per obtenir noves dades, però és més profunda que l’aprenentatge automàtic. |
L’aprenentatge supervisat i no supervisat pertany a l’aprenentatge automàtic. | L’aprenentatge com ara Kohenen, el biaix radial i la xarxa neuronal d’alimentació cauen sota ANN. |
Alguns exemples de ML són els resultats de la cerca de Google, etc. | Alguns exemples d’ANN són el reconeixement facial, el reconeixement d’imatges, etc. |
Xarxes neuronals i aprenentatge profund
Les xarxes Deep Learning contenen diverses capes ocultes entre l'entrada i la sortida. Aquestes xarxes es distingeixen per la profunditat de les capes amagades que hi ha. Les dades d'entrada passen per diversos passos abans que es mostri la sortida.
Aquestes xarxes difereixen de les anteriors NN, com el perceptron que tenia una sola capa oculta i que es deia Xarxes poc profundes. Cada capa oculta de la xarxa d'aprenentatge profund forma les dades amb certes funcions basades en la sortida de la capa anterior.
Les dades passen per moltes capes de funció no lineal al node. Com més nombre de capes, es poden reconèixer funcions més complexes, ja que la capa següent realitzarà l'agregació de funcions de les capes anteriors.
Diverses capes ocultes de la xarxa augmenten la complexitat i l'abstracció. Aquesta profunditat també es denomina jerarquia de funcions. Per això, les xarxes d’aprenentatge profund són capaces de manejar dades d’alta dimensió.
Alguns exemples de xarxes d’aprenentatge profund inclouen l’agrupació de milions d’imatges en funció de les seves característiques i similituds, filtrat de missatges de correu electrònic, aplicació de filtres a missatges en CRM, identificació de parla, etc.
Les xarxes d’aprenentatge profund es poden formar en un conjunt de dades etiquetats i no etiquetats. Per al conjunt de dades sense etiquetar, les xarxes com les màquines de selecció Boltzmann realitzen l'extracció automàtica de funcions.
La xarxa aprèn automàticament analitzant l'entrada mitjançant el mostreig i minimitzant la diferència de sortida i distribució de l'entrada. Aquí la xarxa neuronal troba correlacions entre les característiques i els resultats.
Les xarxes d’aprenentatge profund entrenades en dades etiquetades es poden aplicar a dades no estructurades. Com més dades de formació s’informin a la xarxa, més precises seran.
La capacitat de la xarxa d’aprendre de dades sense etiquetar és un avantatge respecte als altres algorismes d’aprenentatge.
Aplicacions de xarxes neuronals artificials
Les xarxes neuronals s’han utilitzat amb èxit en diverses solucions, tal com es mostra a continuació.
# 1) Reconeixement de patrons: L’ANN s’utilitza en el reconeixement de patrons, el reconeixement d’imatges, la visualització d’imatges, l’escriptura a mà, la parla i altres tasques d’aquest tipus.
# 2) Problemes d'optimització: Problemes com trobar la ruta més curta, la programació i la fabricació on s’han de satisfer les limitacions de problemes i cal aconseguir solucions òptimes utilitzen NN.
# 3) Previsió: NN pot predir el resultat de les situacions analitzant les tendències passades. Aplicacions com la banca, la borsa, la predicció del temps utilitzen xarxes neuronals.
# 4) Sistemes de control: Els sistemes de control com ara productes informàtics, productes químics i robòtica utilitzen xarxes neuronals.
Limitacions de les xarxes neuronals
A continuació es detallen alguns dels inconvenients de les xarxes neuronals.
- Aquestes xarxes són caixes negres per a l'usuari, ja que l'usuari no té cap funció, tret d'alimentar l'entrada i observar la sortida. L’usuari desconeix la formació que s’està produint en l’algoritme.
- Aquests algoritmes són bastant lents i requereixen moltes iteracions (també anomenades èpoques) per donar resultats precisos. Això es deu al fet que la CPU calcula els pesos, la funció d'activació de cada node per separat, cosa que fa que consumeixi temps i recursos. També causa un problema amb una gran quantitat de dades.
Conclusió
En aquest tutorial hem conegut la xarxa de neurones artificials, la seva analogia amb la neurona biològica i els tipus de xarxa de neurones.
ANN cau en l’aprenentatge automàtic. És un model computacional compost per múltiples nodes de neurones. Aquests nodes reben l'entrada, processen l'entrada mitjançant la funció d'activació i passen la sortida a les capes següents.
Les entrades s’associen a pesos d’enllaços de connexió anomenats sinapsi. Una ANN bàsica consisteix en una capa d’entrada, pesos, funció d’activació, capa oculta i una capa de sortida.
Les funcions d'activació s'utilitzen per convertir l'entrada a la sortida. Alguns d’ells són funcions binàries, bipolars, sigmoïdals i de rampa. Hi ha diferents tipus d’ANN, com ara el reenviament d’una sola capa, el reenviament d’alimentació multicapa, les xarxes recurrents, etc., segons el nombre de capes ocultes i els mecanismes de retroalimentació.
ANN amb moltes capes amagades entre l'entrada i la sortida formen una xarxa d'aprenentatge profund. Les xarxes d’aprenentatge profund tenen una alta complexitat i un nivell d’abstracció que les fa capaces de computar dades d’alta dimensió amb milers de paràmetres.
L’ANN s’utilitza en el camp de la previsió, el processament d’imatges, els sistemes de control, etc. Aquests s’han aplicat amb èxit com a solució a la matèria de problemes de la ciència.
Esperem que aquest tutorial expliqui tot el que heu de saber sobre les xarxes neuronals artificials.
=> Visiteu aquí la sèrie exclusiva d’aprenentatge automàtic
Lectura recomanada
- Mineria de dades contra aprenentatge automàtic contra intel·ligència artificial contra aprenentatge profund
- Proves de seguretat de xarxa i millors eines de seguretat de xarxa
- Tipus d’aprenentatge automàtic: supervisat contra aprenentatge no supervisat
- 11 eines de programari d'aprenentatge automàtic més populars el 2021
- Tutorial d'aprenentatge automàtic: Introducció a ML i les seves aplicacions
- Guia de màscara de subxarxa (subxarxes) i calculadora de subxarxa IP
- Guia d’avaluació i gestió de la vulnerabilitat de la xarxa
- 15 millors eines d’escaneig de xarxa (escàner de xarxa i IP) del 2021