Mašīnmācīšanās ir AI apakškopa, kas ļauj mašīnai automātiski mācīties no datiem, uzlabot veiktspēju no iepriekšējās pieredzes un veikt prognozes. . Mašīnmācība ietver algoritmu kopumu, kas darbojas ar milzīgu datu apjomu. Dati tiek ievadīti šiem algoritmiem, lai tos apmācītu, un, pamatojoties uz apmācību, tie veido modeli un veic noteiktu uzdevumu.
Šie ML algoritmi palīdz atrisināt dažādas biznesa problēmas, piemēram, regresiju, klasifikāciju, prognozēšanu, klasterizāciju un asociācijas utt.
Pamatojoties uz mācīšanās metodēm un veidu, mašīnmācība ir sadalīta galvenokārt četros veidos, kas ir:
- Uzraudzīta mašīnmācīšanās
- Mašīnmācīšanās bez uzraudzības
- Daļēji uzraudzīta mašīnmācīšanās
- Pastiprināšanas mācības
Šajā tēmā mēs sniegsim detalizētu mašīnmācīšanās veidu aprakstu, kā arī to attiecīgos algoritmus.
binārs uz bcd
1. Uzraudzīta mašīnmācīšanās
Kā norāda nosaukums, Uzraudzīta mašīnmācība ir balstīta uz uzraudzību. Tas nozīmē, ka uzraudzītā mācību tehnikā mēs apmācām mašīnas, izmantojot “marķēto” datu kopu, un, pamatojoties uz apmācību, iekārta prognozē rezultātu. Šeit marķētie dati norāda, ka dažas ievades jau ir kartētas uz izvadi. Vēl vērtīgāk mēs varam teikt; vispirms mēs apmācām iekārtu ar ievadi un atbilstošo izvadi, un pēc tam mēs lūdzam mašīnu paredzēt izvadi, izmantojot testa datu kopu.
Sapratīsim uzraudzīto mācīšanos ar piemēru. Pieņemsim, ka mums ir kaķu un suņu attēlu ievades datu kopa. Tātad, pirmkārt, mēs nodrošināsim mašīnas apmācību, lai saprastu attēlus, piemēram, kaķa un suņa astes forma un izmērs, acu forma, krāsa, augums (suņi ir garāki, kaķi mazāki) utt. Pēc apmācības pabeigšanas mēs ievadām kaķa attēlu un lūdzam mašīnu identificēt objektu un paredzēt rezultātu. Tagad iekārta ir labi apmācīta, tāpēc tā pārbaudīs visas objekta pazīmes, piemēram, augstumu, formu, krāsu, acis, ausis, asti utt., un atklās, ka tas ir kaķis. Tātad tas tiks iekļauts kategorijā Cat. Šis ir process, kā iekārta identificē objektus uzraudzītajā apmācībā.
Uzraudzītās mācīšanās metodes galvenais mērķis ir kartēt ievades mainīgo (x) ar izvades mainīgo (y). Daži reālās pasaules uzraudzītās mācīšanās pielietojumi ir Riska novērtējums, krāpšanas atklāšana, surogātpasta filtrēšana, utt.
Uzraudzītās mašīnmācīšanās kategorijas
Uzraudzīto mašīnmācību var iedalīt divos problēmu veidos, kas ir norādīti tālāk.
a) Klasifikācija
Klasifikācijas algoritmi tiek izmantoti, lai atrisinātu klasifikācijas problēmas, kurās izvades mainīgais ir kategorisks, piemēram, ' Jā vai nē, vīrietis vai sieviete, sarkans vai zils utt . Klasifikācijas algoritmi paredz datu kopā esošās kategorijas. Daži reālās pasaules klasifikācijas algoritmu piemēri ir Surogātpasta noteikšana, e-pasta filtrēšana utt.
Tālāk ir sniegti daži populāri klasifikācijas algoritmi:
b) Regresija
Regresijas algoritmi tiek izmantoti, lai atrisinātu regresijas problēmas, kurās pastāv lineāra sakarība starp ievades un izvades mainīgajiem. Tos izmanto, lai prognozētu nepārtrauktus izlaides mainīgos lielumus, piemēram, tirgus tendences, laikapstākļu prognozes utt.
Tālāk ir sniegti daži populāri regresijas algoritmi:
Uzraudzītas mācīšanās priekšrocības un trūkumi
Priekšrocības:
- Tā kā uzraudzīts mācību darbs ar marķēto datu kopu, mēs varam iegūt precīzu priekšstatu par objektu klasēm.
- Šie algoritmi palīdz prognozēt rezultātu, pamatojoties uz iepriekšējo pieredzi.
Trūkumi:
- Šie algoritmi nespēj atrisināt sarežģītus uzdevumus.
- Tas var paredzēt nepareizu izvadi, ja testa dati atšķiras no apmācības datiem.
- Lai apmācītu algoritmu, nepieciešams daudz skaitļošanas laika.
Uzraudzītās mācīšanās pielietojumi
Tālāk ir sniegti daži izplatīti uzraudzītās apmācības lietojumi.
Uzraudzītās mācīšanās algoritmi tiek izmantoti attēlu segmentācijā. Šajā procesā attēlu klasifikācija tiek veikta dažādiem attēlu datiem ar iepriekš definētām etiķetēm.
Uzraudzīti algoritmi tiek izmantoti arī medicīnas jomā diagnostikas nolūkos. To veic, izmantojot medicīniskos attēlus un iepriekšējos marķētos datus ar slimības stāvokļu etiķetēm. Izmantojot šādu procesu, iekārta var identificēt slimību jaunajiem pacientiem.
2. Mašīnmācīšanās bez uzraudzības
Mācīšanās bez uzraudzības g atšķiras no uzraudzītās mācīšanās tehnikas; kā norāda nosaukums, uzraudzība nav nepieciešama. Tas nozīmē, ka bez uzraudzības mašīnmācībā iekārta tiek apmācīta, izmantojot nemarķēto datu kopu, un iekārta paredz izvadi bez uzraudzības.
Nepārraudzītās mācībās modeļi tiek apmācīti ar datiem, kas nav ne klasificēti, ne marķēti, un modelis iedarbojas uz šiem datiem bez uzraudzības.
Nepārraudzītā mācību algoritma galvenais mērķis ir grupēt vai kategorizēt nešķiroto datu kopu atbilstoši līdzībām, modeļiem un atšķirībām. Mašīnām ir dots norādījums atrast slēptos modeļus no ievades datu kopas.
Ņemsim piemēru, lai to precīzāk saprastu; pieņemsim, ka ir augļu attēlu grozs, un mēs to ievadām mašīnmācīšanās modelī. Attēli modelim ir pilnīgi nezināmi, un mašīnas uzdevums ir atrast objektu modeļus un kategorijas.
segmentācijas vainas kodols izmests
Tātad tagad iekārta atklās savus modeļus un atšķirības, piemēram, krāsu atšķirības, formas atšķirības, un prognozēs izvadi, kad tā tiks pārbaudīta ar testa datu kopu.
Nepārraudzītas mašīnmācīšanās kategorijas
Mācības bez uzraudzības var iedalīt divos veidos, kas norādīti tālāk:
1) Klasterizācija
Klasterizācijas paņēmiens tiek izmantots, ja no datiem vēlamies atrast raksturīgās grupas. Tas ir veids, kā objektus grupēt klasterī tā, lai objekti, kuriem ir visvairāk līdzību, paliktu vienā grupā un tiem būtu mazāk vai nav līdzību ar citu grupu objektiem. Klasterizācijas algoritma piemērs ir klientu grupēšana pēc viņu pirkšanas uzvedības.
Tālāk ir norādīti daži no populārajiem klasterizācijas algoritmiem.
2) Biedrība
Asociācijas noteikumu mācīšanās ir nepārraudzīta mācīšanās metode, kas atrod interesantas attiecības starp mainīgajiem lielajā datu kopā. Šī mācīšanās algoritma galvenais mērķis ir atrast viena datu vienuma atkarību no cita datu vienuma un attiecīgi kartēt šos mainīgos, lai tas varētu radīt maksimālu peļņu. Šis algoritms galvenokārt tiek izmantots Tirgus groza analīze, Web izmantošanas ieguve, nepārtraukta ražošana utt.
Daži populāri asociācijas noteikumu apguves algoritmi ir Apriori algoritms, Eclat, FP izaugsmes algoritms.
Nepārraudzīta mācību algoritma priekšrocības un trūkumi
Priekšrocības:
- Šos algoritmus var izmantot sarežģītiem uzdevumiem, salīdzinot ar uzraudzītajiem, jo šie algoritmi darbojas ar neiezīmētu datu kopu.
- Nepārraudzīti algoritmi ir ieteicami dažādiem uzdevumiem, jo neiezīmētās datu kopas iegūšana ir vienkāršāka salīdzinājumā ar marķētu datu kopu.
Trūkumi:
- Nepārraudzīta algoritma izvade var būt mazāk precīza, jo datu kopa nav marķēta un algoritmi netiek apmācīti ar precīzu izvadi iepriekš.
- Darbs ar neuzraudzītu mācīšanos ir grūtāks, jo tas darbojas ar neiezīmētu datu kopu, kas netiek kartēta ar izvadi.
Neuzraudzītas mācīšanās pielietojumi
3. Daļēji uzraudzīta mācīšanās
Daļēji uzraudzīta mācīšanās ir mašīnmācīšanās algoritma veids, kas atrodas starp uzraudzītu un neuzraudzītu mašīnmācīšanos . Tas ir starpposms starp uzraudzītās (ar iezīmētiem apmācības datiem) un neuzraudzītas mācīšanās (bez marķētiem apmācības datiem) algoritmiem un apmācības periodā izmanto marķētu un nemarķētu datu kopu kombināciju.
A Lai gan daļēji uzraudzīta mācīšanās ir vidusceļš starp uzraudzītu un neuzraudzītu mācīšanos un darbojas ar datiem, kas sastāv no dažām iezīmēm, tā lielākoties sastāv no nemarķētiem datiem. Tā kā etiķetes ir dārgas, taču korporatīvajiem nolūkiem tām var būt maz etiķešu. Tā ir pilnīgi atšķirīga no uzraudzītas un bez uzraudzības, jo tās ir balstītas uz etiķešu esamību un neesamību.
java pāris
Lai pārvarētu uzraudzītās mācīšanās un bez uzraudzības mācīšanās algoritmu trūkumus, tiek ieviests daļēji uzraudzītas mācīšanās jēdziens. . Daļēji uzraudzītās mācīšanās galvenais mērķis ir efektīvi izmantot visus pieejamos datus, nevis tikai marķētos datus, piemēram, uzraudzītajā apmācībā. Sākotnēji līdzīgi dati tiek grupēti kopā ar nepārraudzītu mācību algoritmu, un tālāk tas palīdz marķēt nemarķētos datus marķētos datos. Tas ir tāpēc, ka marķēti dati ir salīdzinoši dārgāka iegūšana nekā nemarķēti dati.
Mēs varam iedomāties šos algoritmus ar piemēru. Uzraudzīta mācīšanās ir vieta, kur students atrodas instruktora uzraudzībā mājās un koledžā. Turklāt, ja šis students pats analizē vienu un to pašu jēdzienu bez instruktora palīdzības, tas tiek apgūts bez uzraudzības. Daļēji uzraudzītā apmācībā studentam ir jāpārskata sevi pēc tās pašas koncepcijas analīzes koledžas instruktora vadībā.
Daļēji uzraudzītas mācīšanās priekšrocības un trūkumi
Priekšrocības:
- Tas ir vienkārši un viegli saprotams algoritms.
- Tas ir ļoti efektīvs.
- To izmanto, lai atrisinātu uzraudzītās un neuzraudzītās mācīšanās algoritmu trūkumus.
Trūkumi:
- Iterāciju rezultāti var nebūt stabili.
- Mēs nevaram piemērot šos algoritmus tīkla līmeņa datiem.
- Precizitāte ir zema.
4. Pastiprināšanas mācības
Mācību pastiprināšana darbojas uz atgriezenisko saiti balstītā procesā, kurā AI aģents (programmatūras komponents) automātiski izpēta savu apkārtni, trāpot un izsekojot, rīkojoties, mācoties no pieredzes un uzlabojot veiktspēju. Aģents saņem atlīdzību par katru labu darbību un saņem sodu par katru sliktu darbību; tāpēc pastiprināšanas mācību aģenta mērķis ir maksimāli palielināt atlīdzību.
Pastiprināšanas mācībās nav tādu marķētu datu kā uzraudzīta mācīšanās, un aģenti mācās tikai no savas pieredzes.
Pastiprināšanas mācību process ir līdzīgs cilvēkam; piemēram, bērns mācās dažādas lietas no ikdienas dzīves pieredzes. Pastiprināšanas mācīšanās piemērs ir spēlēt spēli, kur spēle ir vide, aģenta kustības katrā solī nosaka stāvokļus, un aģenta mērķis ir iegūt augstu rezultātu. Aģents saņem atsauksmes par sodu un atlīdzību.
Pateicoties tā darba veidam, pastiprināšanas mācības tiek izmantotas dažādās jomās, piemēram, Spēļu teorija, operāciju izpēte, informācijas teorija, vairāku aģentu sistēmas.
Pastiprināšanas mācīšanās problēmu var formalizēt, izmantojot Markova lēmumu process (MDP). MDP aģents pastāvīgi mijiedarbojas ar vidi un veic darbības; pie katras darbības vide reaģē un ģenerē jaunu stāvokli.
Pastiprināšanas mācību kategorijas
Mācību pastiprināšana tiek iedalīta galvenokārt divu veidu metodēs/algoritmos:
kā pārvērst virkni par veselu skaitli
Pastiprināšanas mācīšanās reāli lietošanas gadījumi
RL algoritmi ir ļoti populāri spēļu lietojumprogrammās. To izmanto, lai iegūtu pārcilvēcisku sniegumu. Dažas populāras spēles, kurās tiek izmantoti RL algoritmi, ir AlphaGO un AlphaGO Zero .
Dokumentā “Resursu pārvaldība ar dziļu apmācību” tika parādīts, kā datorā izmantot RL, lai automātiski mācītos un ieplānotu resursus, lai gaidītu dažādus darbus, lai samazinātu vidējo darba palēnināšanos.
RL tiek plaši izmantots robotikas lietojumprogrammās. Roboti tiek izmantoti rūpnieciskajā un ražošanas jomā, un šie roboti ir padarīti jaudīgāki, izmantojot pastiprināšanas mācīšanos. Ir dažādas nozares, kurām ir sava vīzija par viedo robotu izveidi, izmantojot AI un mašīnmācīšanās tehnoloģiju.
Teksta ieguve, viena no lieliskajām NLP lietojumprogrammām, tagad tiek ieviesta, izmantojot uzņēmuma Salesforce programmu Reinforcement Learning.
Mācību pastiprināšanas priekšrocības un trūkumi
Priekšrocības
- Tas palīdz atrisināt sarežģītas reālās pasaules problēmas, kuras ir grūti atrisināt ar vispārīgām metodēm.
- RL mācīšanās modelis ir līdzīgs cilvēku mācībām; tādējādi var atrast visprecīzākos rezultātus.
- Palīdz sasniegt ilgtermiņa rezultātus.
Trūkums
- RL algoritmi nav ieteicami vienkāršām problēmām.
- RL algoritmiem ir nepieciešami milzīgi dati un aprēķini.
- Pārāk daudz pastiprināšanas mācīšanās var izraisīt stāvokļu pārslodzi, kas var vājināt rezultātus.
Dimensiju lāsts ierobežo reālu fizisko sistēmu pastiprināšanas mācīšanos.