KAS IR NEIRONU TĪKLS? - TECHCODEVIEW.COM

Neironu tīkli ir skaitļošanas modeļi, kas atdarina cilvēka smadzeņu sarežģītās funkcijas. Neironu tīkli sastāv no savstarpēji savienotiem mezgliem vai neironiem, kas apstrādā datus un mācās no tiem, ļaujot veikt tādus uzdevumus kā modeļu atpazīšana un lēmumu pieņemšana mašīnmācībā. Rakstā ir apskatīts vairāk par neironu tīkliem, to darbību, arhitektūru un daudz ko citu.

Satura rādītājs

Neironu tīklu evolūcija
Kas ir neironu tīkli?
Kā darbojas neironu tīkli?
Neironu tīkla apguve
Neironu tīklu veidi
Vienkārša neironu tīkla ieviešana

Neironu tīklu evolūcija

Kopš 1940. gadiem neironu tīklu jomā ir notikuši vairāki vērā ņemami sasniegumi:

1940.-1950. gadi: agrīnās koncepcijas
Neironu tīkli sākās, kad McCulloch un Pitts ieviesa pirmo mākslīgo neironu matemātisko modeli. Taču skaitļošanas ierobežojumi apgrūtināja progresu.

1960.-1970. gadi: Perceptrons
Šo laikmetu nosaka Rozenblata darbs par perceptroniem. Perceptrons ir viena slāņa tīkli, kuru pielietojamība aprobežojās ar problēmām, kuras varēja atrisināt lineāri atsevišķi.

1980. gadi: Backpropagation un konekcionisms
Daudzslāņu tīkls apmācība bija iespējama, pateicoties Rumelharta, Hintona un Viljamsa izgudrojumam par atpakaļpavairošanas metodi. Ar savu uzsvaru uz mācīšanos, izmantojot savstarpēji savienotus mezglus, konnekcionisms ieguva pievilcību.

1990. gadi: uzplaukums un ziema
Ar lietojumprogrammām attēlu identificēšanā, finansēs un citās jomās neironu tīkli piedzīvoja uzplaukumu. Tomēr neironu tīklu pētījumi piedzīvoja ziemu pārmērīgo skaitļošanas izmaksu un palielināto cerību dēļ.

2000. gadi: atdzimšana un dziļa mācīšanās
Lielākas datu kopas, novatoriskas struktūras un uzlabotas apstrādes iespējas veicināja atgriešanos. Dziļa mācīšanās ir parādījis pārsteidzošu efektivitāti vairākās disciplīnās, izmantojot daudzus slāņus.

2010. gadi — šobrīd: dziļas mācīšanās dominēšana
Konvolucionālie neironu tīkli (CNN) un atkārtotie neironu tīkli (RNN), divas dziļās mācīšanās arhitektūras, dominēja mašīnmācībā. To spēku demonstrēja jauninājumi spēlēšanas, attēlu atpazīšanas un dabiskās valodas apstrādes jomā.

Kas ir neironu tīkli?

Neironu tīkli no datiem izvilkt identifikācijas pazīmes, kurām trūkst iepriekš ieprogrammētas izpratnes. Tīkla komponenti ietver neironus, savienojumus, svarus, novirzes, izplatīšanās funkcijas un mācīšanās likumu. Neironi saņem ievadi, ko regulē sliekšņi un aktivizācijas funkcijas. Savienojumi ietver svarus un novirzes, kas regulē informācijas pārsūtīšanu. Mācīšanās, svaru un novirzes pielāgošana notiek trīs posmos: ievades aprēķināšana, izvades ģenerēšana un iteratīva pilnveidošana, kas uzlabo tīkla prasmes dažādu uzdevumu veikšanā.

android process acore turpina apstāties

Tie ietver:

Neironu tīklu simulē jauna vide.
Tad šīs simulācijas rezultātā tiek mainīti neironu tīkla brīvie parametri.
Pēc tam neironu tīkls reaģē uz vidi jaunā veidā, jo mainās tā brīvie parametri.

Neironu tīklu nozīme

Neironu tīklu spēja identificēt modeļus, atrisināt sarežģītas mīklas un pielāgoties mainīgajai videi ir būtiska. Viņu spējai mācīties no datiem ir tālejoša ietekme, sākot no tādām revolucionārām tehnoloģijām kā dabiskās valodas apstrāde un pašbraucošas automašīnas, lai automatizētu lēmumu pieņemšanas procesus un palielinātu efektivitāti daudzās nozarēs. Mākslīgā intelekta attīstība lielā mērā ir atkarīga no neironu tīkliem, kas arī virza inovācijas un ietekmē tehnoloģiju virzienu.

Kā darbojas neironu tīkli?

Apskatīsim neironu tīkla darbības piemēru:

Apsveriet neironu tīklu e-pasta klasifikācijai. Ievades slānis ietver tādas funkcijas kā e-pasta saturs, sūtītāja informācija un tēma. Šīs ievades, kas reizinātas ar pielāgotajiem svariem, iziet cauri slēptajiem slāņiem. Tīkls apmācību laikā iemācās atpazīt modeļus, kas norāda, vai e-pasts ir surogātpasts vai nē. Izvades slānis ar bināro aktivizācijas funkciju paredz, vai e-pasts ir surogātpasts (1) vai nav (0). Tā kā tīkls iteratīvi precizē savus svarus, izmantojot atpakaļejošo izplatīšanu, tas prasmīgi spēj atšķirt surogātpastu un likumīgus e-pastus, parādot neironu tīklu praktiskumu reālās pasaules lietojumprogrammās, piemēram, e-pasta filtrēšanā.

aritmētiskā loģiskā vienība

Neironu tīkla darbība

Neironu tīkli ir sarežģītas sistēmas, kas atdarina dažas cilvēka smadzeņu darbības iezīmes. Tas sastāv no ievades slāņa, viena vai vairākiem slēptiem slāņiem un izvades slāņa, kas sastāv no mākslīgo neironu slāņiem, kas ir savienoti. Divus pamatprocesa posmus sauc par backpropagation un pavairošana uz priekšu .

Pavairošana uz priekšu

Ievades slānis: Katru ievades slāņa līdzekli attēlo tīkla mezgls, kas saņem ievades datus.
Svari un savienojumi: Katra neironu savienojuma svars norāda, cik stiprs ir savienojums. Treniņa laikā šie svari tiek mainīti.
Slēptie slāņi: Katrs slēptā slāņa neirons apstrādā ievades datus, reizinot tos ar svariem, saskaitot un pēc tam izlaižot caur aktivizācijas funkciju. To darot, tiek ieviesta nelinearitāte, kas ļauj tīklam atpazīt sarežģītus modeļus.
Izvade: Gala rezultāts tiek iegūts, atkārtojot procesu, līdz tiek sasniegts izvades slānis.

Pavairošana atpakaļ

Zaudējumu aprēķins: Tīkla izvade tiek novērtēta attiecībā pret reālajām mērķa vērtībām, un starpības aprēķināšanai tiek izmantota zaudējuma funkcija. Regresijas problēmai, Vidējā kvadrāta kļūda (MSE) parasti izmanto kā izmaksu funkciju.
Zaudēšanas funkcija: $MSE = frac{1}{n} Sigma^{n}_{i=1} (y_{i} - hat y_{i})^2$
Gradienta nolaišanās: Pēc tam tīkls izmanto gradienta nolaišanos, lai samazinātu zaudējumus. Lai samazinātu neprecizitāti, svari tiek mainīti, pamatojoties uz zaudējumu atvasinājumu attiecībā pret katru svaru.
Svaru regulēšana: Svari tiek pielāgoti katrā savienojumā, izmantojot šo iteratīvo procesu vai atpakaļpavairošana , atpakaļ visā tīklā.
Apmācība: Apmācības laikā ar dažādiem datu paraugiem viss tālākās izplatīšanas, zaudējumu aprēķināšanas un atpakaļpavairošanas process tiek veikts iteratīvi, ļaujot tīklam pielāgoties un apgūt modeļus no datiem.
Aktivizācijas funkcijas: Modeļa nelinearitāti ievieš tādas aktivizācijas funkcijas kā rektificēta lineāra vienība (ReLU) st sigmoīds . Viņu lēmums par to, vai aktivizēt neironu, ir balstīts uz visu svērto ievadi.

Neironu tīkla apguve

1. Mācīšanās ar uzraudzītu mācīšanos

In uzraudzīta mācīšanās , neironu tīklu vada skolotājs, kuram ir piekļuve abiem ievades-izejas pāriem. Tīkls izveido izejas, pamatojoties uz ieejām, neņemot vērā apkārtni. Salīdzinot šīs izejas ar skolotāja zināmajām vēlamajām izejām, tiek ģenerēts kļūdas signāls. Lai samazinātu kļūdas, tīkla parametri tiek mainīti iteratīvi un tiek pārtraukti, kad veiktspēja ir pieņemamā līmenī.

virkne sadalīta java

2. Mācīšanās bez uzraudzības

Ekvivalenti izvades mainīgie nav pieejami mācīšanās bez uzraudzības . Tās galvenais mērķis ir izprast ienākošo datu (X) pamatā esošo struktūru. Neviens instruktors nav klāt, lai sniegtu padomu. Tā vietā paredzētais rezultāts ir datu modeļu un attiecību modelēšana. Tādi vārdi kā regresija un klasifikācija ir saistīti ar uzraudzītu mācīšanos, turpretim neuzraudzīta mācīšanās ir saistīta ar klasterizāciju un asociāciju.

3. Mācīšanās ar pastiprināšanu Mācīšanās

Mijiedarbojoties ar vidi un atgriezenisko saiti atlīdzības vai sodu veidā, tīkls iegūst zināšanas. Tīkla mērķis ir atrast politiku vai stratēģiju, kas laika gaitā optimizē kumulatīvo atlīdzību. Šo veidu bieži izmanto spēļu un lēmumu pieņemšanas lietojumprogrammās.

Neironu tīklu veidi

Tur ir septiņi neironu tīklu veidi, kurus var izmantot.

Pārejas tīkli: A uz priekšu vērstais neironu tīkls ir vienkārša mākslīgā neironu tīkla arhitektūra, kurā dati tiek pārvietoti no ievades uz izvadi vienā virzienā. Tam ir ievades, slēptie un izvades slāņi; atgriezeniskās saites cilpas nav. Tā vienkāršā arhitektūra padara to piemērotu vairākām lietojumprogrammām, piemēram, regresijai un modeļa atpazīšanai.
Daudzslāņu perceptrons (MLP): MLP ir virzītā neironu tīkla veids ar trim vai vairākiem slāņiem, tostarp ievades slāni, vienu vai vairākus slēptos slāņus un izvades slāni. Tas izmanto nelineāras aktivizācijas funkcijas.
Konvolucionālais neironu tīkls (CNN): A Konvolūcijas neironu tīkls (CNN) ir specializēts mākslīgais neironu tīkls, kas paredzēts attēlu apstrādei. Tas izmanto konvolucionālus slāņus, lai automātiski apgūtu hierarhijas funkcijas no ievades attēliem, nodrošinot efektīvu attēlu atpazīšanu un klasifikāciju. CNN ir mainījuši datora redzi, un tiem ir izšķiroša nozīme tādos uzdevumos kā objektu noteikšana un attēlu analīze.
Atkārtots neironu tīkls (RNN): Mākslīgo neironu tīklu, kas paredzēts secīgai datu apstrādei, sauc par a Atkārtots neironu tīkls (RNN). Tas ir piemērots lietojumprogrammām, kurās kontekstuālās atkarības ir kritiskas, piemēram, laika rindu prognozēšana un dabiskās valodas apstrāde, jo tajā tiek izmantotas atgriezeniskās saites cilpas, kas ļauj informācijai izdzīvot tīklā.
Ilgtermiņa īstermiņa atmiņa (LSTM): LSTM ir RNN veids, kas ir paredzēts, lai pārvarētu izzūdoša gradienta problēmu RNN apmācībā. Tas izmanto atmiņas šūnas un vārtus, lai selektīvi lasītu, rakstītu un dzēstu informāciju.

Vienkārša neironu tīkla ieviešana

Python3

import> numpy as np> # array of any amount of numbers. n = m> X>=> np.array([[>1>,>2>,>3>],> >[>3>,>4>,>1>],> >[>2>,>5>,>3>]])> # multiplication> y>=> np.array([[.>5>, .>3>, .>2>]])> # transpose of y> y>=> y.T> # sigma value> sigm>=> 2> # find the delta> delt>=> np.random.random((>3>,>3>))>-> 1> for> j>in> range>(>100>):> > ># find matrix 1. 100 layers.> >m1>=> (y>-> (>1>/>(>1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt))))))>*>((>1>/>(> >1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt)))))>*>(>1>->(>1>/>(> >1> +> np.exp(>->(np.dot((>1>/>(>1> +> np.exp(> >->(np.dot(X, sigm))))), delt)))))))> ># find matrix 2> >m2>=> m1.dot(delt.T)>*> ((>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))> >*> (>1>->(>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))))> ># find delta> >delt>=> delt>+> (>1>/>(>1> +> np.exp(>->(np.dot(X, sigm))))).T.dot(m1)> ># find sigma> >sigm>=> sigm>+> (X.T.dot(m2))> # print output from the matrix> print>(>1>/>(>1> +> np.exp(>->(np.dot(X, sigm)))))>

Izvade:

[[0.99999325 0.99999375 0.99999352]  [0.99999988 0.99999989 0.99999988]  [1. 1. 1. ]]>

Neironu tīklu priekšrocības

Neironu tīklus plaši izmanto daudzās dažādās lietojumprogrammās, jo tiem ir daudz priekšrocību:

Pielāgošanās spēja: Neironu tīkli ir noderīgi darbībām, kurās saikne starp ievadi un izvadi ir sarežģīta vai nav precīzi definēta, jo tie var pielāgoties jaunām situācijām un mācīties no datiem.
Modeļa atpazīšana: Viņu prasmes paraugu atpazīšanā padara tos efektīvus tādos uzdevumos kā audio un attēlu identifikācija, dabiskās valodas apstrāde un citi sarežģīti datu modeļi.
Paralēlā apstrāde: Tā kā neironu tīkli pēc būtības spēj veikt paralēlu apstrādi, tie var apstrādāt daudzus darbus vienlaikus, kas paātrina un uzlabo aprēķinu efektivitāti.
Nelinearitāte: Neironu tīkli spēj modelēt un izprast sarežģītas datu attiecības, pateicoties neironos atrodamajām nelineārām aktivizācijas funkcijām, kas novērš lineāro modeļu trūkumus.

Neironu tīklu trūkumi

Neironu tīkli, lai arī spēcīgi, nav bez trūkumiem un grūtībām:

Aprēķinu intensitāte: Liela neironu tīkla apmācība var būt darbietilpīgs un skaitļošanas ziņā prasīgs process, kas prasa lielu skaitļošanas jaudu.
Melnās kastes daba: Kā melnās kastes modeļi neironu tīkli rada problēmas svarīgās lietojumprogrammās, jo ir grūti saprast, kā tie pieņem lēmumus.
Pārmērīga uzstādīšana: Pārmērīga pielāgošana ir parādība, kurā neironu tīkli ievieto apmācību materiālu atmiņā, nevis identificē datu modeļus. Lai gan legalizācijas pieejas palīdz to mazināt, problēma joprojām pastāv.
Nepieciešamas lielas datu kopas: Efektīvai apmācībai neironu tīkliem bieži ir vajadzīgas apjomīgas, marķētas datu kopas; pretējā gadījumā to veiktspēja var ciest no nepilnīgiem vai izkropļotiem datiem.

Bieži uzdotie jautājumi (FAQ)

1. Kas ir neironu tīkls?

Neironu tīkls ir mākslīga sistēma, kas veidota no savstarpēji savienotiem mezgliem (neironiem), kas apstrādā informāciju un veidota pēc cilvēka smadzeņu struktūras. To izmanto mašīnmācības darbos, kur modeļi tiek iegūti no datiem.
javascript apgriešana

2. Kā darbojas neironu tīkls?

Savienoto neironu slāņi apstrādā datus neironu tīklos. Tīkls apstrādā ievades datus, maina svarus treniņa laikā un rada izvadi atkarībā no atklātajiem modeļiem.

3. Kādi ir izplatītākie neironu tīklu arhitektūras veidi?

Feedforward neironu tīkli, atkārtotie neironu tīkli (RNN), konvolucionālie neironu tīkli (CNN) un ilgtermiņa īstermiņa atmiņas tīkli (LSTM) ir kopīgu arhitektūru piemēri, kas katrs ir paredzēts noteiktam uzdevumam.

4. Kāda ir atšķirība starp uzraudzītu un nekontrolētu mācīšanos neironu tīklos?

Uzraudzītās mācībās marķētie dati tiek izmantoti, lai apmācītu neironu tīklu, lai tas varētu iemācīties kartēt ievades ar atbilstošiem rezultātiem. Neuzraudzīta mācīšanās darbojas ar datiem, kas nav marķēti, un meklē datos struktūras vai modeļus .

5. Kā neironu tīkli apstrādā secīgus datus?

Atgriezeniskās saites cilpas, kas iekļautas atkārtotajos neironu tīklos (RNN), ļauj tiem apstrādāt secīgus datus un laika gaitā uztvert atkarības un kontekstu.