logo

Mašīnmācīšanās veidi

Mašīnmācīšanās ir AI apakškopa, kas ļauj mašīnai automātiski mācīties no datiem, uzlabot veiktspēju no iepriekšējās pieredzes un veikt prognozes. . Mašīnmācība ietver algoritmu kopumu, kas darbojas ar milzīgu datu apjomu. Dati tiek ievadīti šiem algoritmiem, lai tos apmācītu, un, pamatojoties uz apmācību, tie veido modeli un veic noteiktu uzdevumu.

Mašīnmācīšanās veidi

Šie ML algoritmi palīdz atrisināt dažādas biznesa problēmas, piemēram, regresiju, klasifikāciju, prognozēšanu, klasterizāciju un asociācijas utt.

Pamatojoties uz mācīšanās metodēm un veidu, mašīnmācība ir sadalīta galvenokārt četros veidos, kas ir:

  1. Uzraudzīta mašīnmācīšanās
  2. Mašīnmācīšanās bez uzraudzības
  3. Daļēji uzraudzīta mašīnmācīšanās
  4. Pastiprināšanas mācības
Mašīnmācīšanās veidi

Šajā tēmā mēs sniegsim detalizētu mašīnmācīšanās veidu aprakstu, kā arī to attiecīgos algoritmus.

binārs uz bcd

1. Uzraudzīta mašīnmācīšanās

Kā norāda nosaukums, Uzraudzīta mašīnmācība ir balstīta uz uzraudzību. Tas nozīmē, ka uzraudzītā mācību tehnikā mēs apmācām mašīnas, izmantojot “marķēto” datu kopu, un, pamatojoties uz apmācību, iekārta prognozē rezultātu. Šeit marķētie dati norāda, ka dažas ievades jau ir kartētas uz izvadi. Vēl vērtīgāk mēs varam teikt; vispirms mēs apmācām iekārtu ar ievadi un atbilstošo izvadi, un pēc tam mēs lūdzam mašīnu paredzēt izvadi, izmantojot testa datu kopu.

Sapratīsim uzraudzīto mācīšanos ar piemēru. Pieņemsim, ka mums ir kaķu un suņu attēlu ievades datu kopa. Tātad, pirmkārt, mēs nodrošināsim mašīnas apmācību, lai saprastu attēlus, piemēram, kaķa un suņa astes forma un izmērs, acu forma, krāsa, augums (suņi ir garāki, kaķi mazāki) utt. Pēc apmācības pabeigšanas mēs ievadām kaķa attēlu un lūdzam mašīnu identificēt objektu un paredzēt rezultātu. Tagad iekārta ir labi apmācīta, tāpēc tā pārbaudīs visas objekta pazīmes, piemēram, augstumu, formu, krāsu, acis, ausis, asti utt., un atklās, ka tas ir kaķis. Tātad tas tiks iekļauts kategorijā Cat. Šis ir process, kā iekārta identificē objektus uzraudzītajā apmācībā.

Uzraudzītās mācīšanās metodes galvenais mērķis ir kartēt ievades mainīgo (x) ar izvades mainīgo (y). Daži reālās pasaules uzraudzītās mācīšanās pielietojumi ir Riska novērtējums, krāpšanas atklāšana, surogātpasta filtrēšana, utt.

Uzraudzītās mašīnmācīšanās kategorijas

Uzraudzīto mašīnmācību var iedalīt divos problēmu veidos, kas ir norādīti tālāk.

    Klasifikācija Regresija

a) Klasifikācija

Klasifikācijas algoritmi tiek izmantoti, lai atrisinātu klasifikācijas problēmas, kurās izvades mainīgais ir kategorisks, piemēram, ' Jā vai nē, vīrietis vai sieviete, sarkans vai zils utt . Klasifikācijas algoritmi paredz datu kopā esošās kategorijas. Daži reālās pasaules klasifikācijas algoritmu piemēri ir Surogātpasta noteikšana, e-pasta filtrēšana utt.

Tālāk ir sniegti daži populāri klasifikācijas algoritmi:

    Nejaušs meža algoritms Lēmumu koka algoritms Loģistikas regresijas algoritms Atbalstiet vektora mašīnu algoritmu

b) Regresija

Regresijas algoritmi tiek izmantoti, lai atrisinātu regresijas problēmas, kurās pastāv lineāra sakarība starp ievades un izvades mainīgajiem. Tos izmanto, lai prognozētu nepārtrauktus izlaides mainīgos lielumus, piemēram, tirgus tendences, laikapstākļu prognozes utt.

Tālāk ir sniegti daži populāri regresijas algoritmi:

    Vienkāršs lineārās regresijas algoritms Daudzfaktoru regresijas algoritms Lēmumu koka algoritms Laso regresija

Uzraudzītas mācīšanās priekšrocības un trūkumi

Priekšrocības:

  • Tā kā uzraudzīts mācību darbs ar marķēto datu kopu, mēs varam iegūt precīzu priekšstatu par objektu klasēm.
  • Šie algoritmi palīdz prognozēt rezultātu, pamatojoties uz iepriekšējo pieredzi.

Trūkumi:

  • Šie algoritmi nespēj atrisināt sarežģītus uzdevumus.
  • Tas var paredzēt nepareizu izvadi, ja testa dati atšķiras no apmācības datiem.
  • Lai apmācītu algoritmu, nepieciešams daudz skaitļošanas laika.

Uzraudzītās mācīšanās pielietojumi

Tālāk ir sniegti daži izplatīti uzraudzītās apmācības lietojumi.

    Attēla segmentācija:
    Uzraudzītās mācīšanās algoritmi tiek izmantoti attēlu segmentācijā. Šajā procesā attēlu klasifikācija tiek veikta dažādiem attēlu datiem ar iepriekš definētām etiķetēm.Medicīniskā diagnoze:
    Uzraudzīti algoritmi tiek izmantoti arī medicīnas jomā diagnostikas nolūkos. To veic, izmantojot medicīniskos attēlus un iepriekšējos marķētos datus ar slimības stāvokļu etiķetēm. Izmantojot šādu procesu, iekārta var identificēt slimību jaunajiem pacientiem.Krāpšanas atklāšana —Uzraudzītās mācīšanās klasifikācijas algoritmi tiek izmantoti, lai identificētu krāpnieciskus darījumus, krāpnieciskus klientus utt. Tas tiek darīts, izmantojot vēsturiskos datus, lai identificētu modeļus, kas var izraisīt iespējamu krāpšanu.Surogātpasta noteikšana —Surogātpasta atklāšanā un filtrēšanā tiek izmantoti klasifikācijas algoritmi. Šie algoritmi klasificē e-pastu kā surogātpastu vai ne. Surogātpasta vēstules tiek nosūtītas uz surogātpasta mapi.Runas atpazīšana -Uzraudzīti mācību algoritmi tiek izmantoti arī runas atpazīšanā. Algoritms ir apmācīts ar balss datiem, un ar to pašu var veikt dažādas identifikācijas, piemēram, ar balsi aktivizējamas paroles, balss komandas utt.

2. Mašīnmācīšanās bez uzraudzības

Mācīšanās bez uzraudzības g atšķiras no uzraudzītās mācīšanās tehnikas; kā norāda nosaukums, uzraudzība nav nepieciešama. Tas nozīmē, ka bez uzraudzības mašīnmācībā iekārta tiek apmācīta, izmantojot nemarķēto datu kopu, un iekārta paredz izvadi bez uzraudzības.

Nepārraudzītās mācībās modeļi tiek apmācīti ar datiem, kas nav ne klasificēti, ne marķēti, un modelis iedarbojas uz šiem datiem bez uzraudzības.

Nepārraudzītā mācību algoritma galvenais mērķis ir grupēt vai kategorizēt nešķiroto datu kopu atbilstoši līdzībām, modeļiem un atšķirībām. Mašīnām ir dots norādījums atrast slēptos modeļus no ievades datu kopas.

Ņemsim piemēru, lai to precīzāk saprastu; pieņemsim, ka ir augļu attēlu grozs, un mēs to ievadām mašīnmācīšanās modelī. Attēli modelim ir pilnīgi nezināmi, un mašīnas uzdevums ir atrast objektu modeļus un kategorijas.

segmentācijas vainas kodols izmests

Tātad tagad iekārta atklās savus modeļus un atšķirības, piemēram, krāsu atšķirības, formas atšķirības, un prognozēs izvadi, kad tā tiks pārbaudīta ar testa datu kopu.

Nepārraudzītas mašīnmācīšanās kategorijas

Mācības bez uzraudzības var iedalīt divos veidos, kas norādīti tālāk:

    Klasterizācija asociācija

1) Klasterizācija

Klasterizācijas paņēmiens tiek izmantots, ja no datiem vēlamies atrast raksturīgās grupas. Tas ir veids, kā objektus grupēt klasterī tā, lai objekti, kuriem ir visvairāk līdzību, paliktu vienā grupā un tiem būtu mazāk vai nav līdzību ar citu grupu objektiem. Klasterizācijas algoritma piemērs ir klientu grupēšana pēc viņu pirkšanas uzvedības.

Tālāk ir norādīti daži no populārajiem klasterizācijas algoritmiem.

    K-Means klasterizācijas algoritms Vidējās nobīdes algoritms DBSCAN algoritms Galvenās sastāvdaļas analīze Neatkarīgu komponentu analīze

2) Biedrība

Asociācijas noteikumu mācīšanās ir nepārraudzīta mācīšanās metode, kas atrod interesantas attiecības starp mainīgajiem lielajā datu kopā. Šī mācīšanās algoritma galvenais mērķis ir atrast viena datu vienuma atkarību no cita datu vienuma un attiecīgi kartēt šos mainīgos, lai tas varētu radīt maksimālu peļņu. Šis algoritms galvenokārt tiek izmantots Tirgus groza analīze, Web izmantošanas ieguve, nepārtraukta ražošana utt.

Daži populāri asociācijas noteikumu apguves algoritmi ir Apriori algoritms, Eclat, FP izaugsmes algoritms.

Nepārraudzīta mācību algoritma priekšrocības un trūkumi

Priekšrocības:

  • Šos algoritmus var izmantot sarežģītiem uzdevumiem, salīdzinot ar uzraudzītajiem, jo ​​šie algoritmi darbojas ar neiezīmētu datu kopu.
  • Nepārraudzīti algoritmi ir ieteicami dažādiem uzdevumiem, jo ​​​​neiezīmētās datu kopas iegūšana ir vienkāršāka salīdzinājumā ar marķētu datu kopu.

Trūkumi:

  • Nepārraudzīta algoritma izvade var būt mazāk precīza, jo datu kopa nav marķēta un algoritmi netiek apmācīti ar precīzu izvadi iepriekš.
  • Darbs ar neuzraudzītu mācīšanos ir grūtāks, jo tas darbojas ar neiezīmētu datu kopu, kas netiek kartēta ar izvadi.

Neuzraudzītas mācīšanās pielietojumi

    Tīkla analīze:Neuzraudzīta apmācība tiek izmantota, lai identificētu plaģiātu un autortiesības zinātnisko rakstu teksta datu dokumentu tīkla analīzē.Ieteikumu sistēmas:Ieteikumu sistēmas plaši izmanto nepārraudzītas mācību metodes, lai izveidotu ieteikumu lietojumprogrammas dažādām tīmekļa lietojumprogrammām un e-komercijas vietnēm.Anomāliju noteikšana:Anomāliju noteikšana ir populāra neuzraudzītas mācīšanās lietojumprogramma, kas var identificēt neparastus datu punktus datu kopā. To izmanto, lai atklātu krāpnieciskus darījumus.Vienskaitļa vērtību sadalīšana:Singular Value Decomposition jeb SVD tiek izmantots, lai no datu bāzes iegūtu noteiktu informāciju. Piemēram, iegūstot informāciju par katru lietotāju, kas atrodas noteiktā vietā.

3. Daļēji uzraudzīta mācīšanās

Daļēji uzraudzīta mācīšanās ir mašīnmācīšanās algoritma veids, kas atrodas starp uzraudzītu un neuzraudzītu mašīnmācīšanos . Tas ir starpposms starp uzraudzītās (ar iezīmētiem apmācības datiem) un neuzraudzītas mācīšanās (bez marķētiem apmācības datiem) algoritmiem un apmācības periodā izmanto marķētu un nemarķētu datu kopu kombināciju.

A Lai gan daļēji uzraudzīta mācīšanās ir vidusceļš starp uzraudzītu un neuzraudzītu mācīšanos un darbojas ar datiem, kas sastāv no dažām iezīmēm, tā lielākoties sastāv no nemarķētiem datiem. Tā kā etiķetes ir dārgas, taču korporatīvajiem nolūkiem tām var būt maz etiķešu. Tā ir pilnīgi atšķirīga no uzraudzītas un bez uzraudzības, jo tās ir balstītas uz etiķešu esamību un neesamību.

java pāris

Lai pārvarētu uzraudzītās mācīšanās un bez uzraudzības mācīšanās algoritmu trūkumus, tiek ieviests daļēji uzraudzītas mācīšanās jēdziens. . Daļēji uzraudzītās mācīšanās galvenais mērķis ir efektīvi izmantot visus pieejamos datus, nevis tikai marķētos datus, piemēram, uzraudzītajā apmācībā. Sākotnēji līdzīgi dati tiek grupēti kopā ar nepārraudzītu mācību algoritmu, un tālāk tas palīdz marķēt nemarķētos datus marķētos datos. Tas ir tāpēc, ka marķēti dati ir salīdzinoši dārgāka iegūšana nekā nemarķēti dati.

Mēs varam iedomāties šos algoritmus ar piemēru. Uzraudzīta mācīšanās ir vieta, kur students atrodas instruktora uzraudzībā mājās un koledžā. Turklāt, ja šis students pats analizē vienu un to pašu jēdzienu bez instruktora palīdzības, tas tiek apgūts bez uzraudzības. Daļēji uzraudzītā apmācībā studentam ir jāpārskata sevi pēc tās pašas koncepcijas analīzes koledžas instruktora vadībā.

Daļēji uzraudzītas mācīšanās priekšrocības un trūkumi

Priekšrocības:

  • Tas ir vienkārši un viegli saprotams algoritms.
  • Tas ir ļoti efektīvs.
  • To izmanto, lai atrisinātu uzraudzītās un neuzraudzītās mācīšanās algoritmu trūkumus.

Trūkumi:

  • Iterāciju rezultāti var nebūt stabili.
  • Mēs nevaram piemērot šos algoritmus tīkla līmeņa datiem.
  • Precizitāte ir zema.

4. Pastiprināšanas mācības

Mācību pastiprināšana darbojas uz atgriezenisko saiti balstītā procesā, kurā AI aģents (programmatūras komponents) automātiski izpēta savu apkārtni, trāpot un izsekojot, rīkojoties, mācoties no pieredzes un uzlabojot veiktspēju. Aģents saņem atlīdzību par katru labu darbību un saņem sodu par katru sliktu darbību; tāpēc pastiprināšanas mācību aģenta mērķis ir maksimāli palielināt atlīdzību.

Pastiprināšanas mācībās nav tādu marķētu datu kā uzraudzīta mācīšanās, un aģenti mācās tikai no savas pieredzes.

Pastiprināšanas mācību process ir līdzīgs cilvēkam; piemēram, bērns mācās dažādas lietas no ikdienas dzīves pieredzes. Pastiprināšanas mācīšanās piemērs ir spēlēt spēli, kur spēle ir vide, aģenta kustības katrā solī nosaka stāvokļus, un aģenta mērķis ir iegūt augstu rezultātu. Aģents saņem atsauksmes par sodu un atlīdzību.

Pateicoties tā darba veidam, pastiprināšanas mācības tiek izmantotas dažādās jomās, piemēram, Spēļu teorija, operāciju izpēte, informācijas teorija, vairāku aģentu sistēmas.

Pastiprināšanas mācīšanās problēmu var formalizēt, izmantojot Markova lēmumu process (MDP). MDP aģents pastāvīgi mijiedarbojas ar vidi un veic darbības; pie katras darbības vide reaģē un ģenerē jaunu stāvokli.

Pastiprināšanas mācību kategorijas

Mācību pastiprināšana tiek iedalīta galvenokārt divu veidu metodēs/algoritmos:

kā pārvērst virkni par veselu skaitli
    Pozitīvas pastiprināšanas mācības:Pozitīvas pastiprināšanas mācīšanās norāda, ka, kaut ko pievienojot, palielinās tendence, ka vajadzīgā uzvedība atkārtojas. Tas palielina aģenta uzvedības spēku un pozitīvi ietekmē to.Negatīvās pastiprināšanas mācības:Negatīvā pastiprināšanas mācīšanās darbojas tieši pretēji pozitīvajai RL. Tas palielina tendenci, ka konkrētā uzvedība atkārtojas, izvairoties no negatīvā stāvokļa.

Pastiprināšanas mācīšanās reāli lietošanas gadījumi

    Video spēles:
    RL algoritmi ir ļoti populāri spēļu lietojumprogrammās. To izmanto, lai iegūtu pārcilvēcisku sniegumu. Dažas populāras spēles, kurās tiek izmantoti RL algoritmi, ir AlphaGO un AlphaGO Zero .Resursu pārvaldība:
    Dokumentā “Resursu pārvaldība ar dziļu apmācību” tika parādīts, kā datorā izmantot RL, lai automātiski mācītos un ieplānotu resursus, lai gaidītu dažādus darbus, lai samazinātu vidējo darba palēnināšanos.Robotika:
    RL tiek plaši izmantots robotikas lietojumprogrammās. Roboti tiek izmantoti rūpnieciskajā un ražošanas jomā, un šie roboti ir padarīti jaudīgāki, izmantojot pastiprināšanas mācīšanos. Ir dažādas nozares, kurām ir sava vīzija par viedo robotu izveidi, izmantojot AI un mašīnmācīšanās tehnoloģiju.Teksta ieguve
    Teksta ieguve, viena no lieliskajām NLP lietojumprogrammām, tagad tiek ieviesta, izmantojot uzņēmuma Salesforce programmu Reinforcement Learning.

Mācību pastiprināšanas priekšrocības un trūkumi

Priekšrocības

  • Tas palīdz atrisināt sarežģītas reālās pasaules problēmas, kuras ir grūti atrisināt ar vispārīgām metodēm.
  • RL mācīšanās modelis ir līdzīgs cilvēku mācībām; tādējādi var atrast visprecīzākos rezultātus.
  • Palīdz sasniegt ilgtermiņa rezultātus.

Trūkums

  • RL algoritmi nav ieteicami vienkāršām problēmām.
  • RL algoritmiem ir nepieciešami milzīgi dati un aprēķini.
  • Pārāk daudz pastiprināšanas mācīšanās var izraisīt stāvokļu pārslodzi, kas var vājināt rezultātus.

Dimensiju lāsts ierobežo reālu fizisko sistēmu pastiprināšanas mācīšanos.