UZRAUDZĪTA UN NEUZRAUDZĪTA MĀCĪŠANĀS - TECHCODEVIEW.COM

Mašīnmācība ir datorzinātņu joma, kas sniedz datoriem iespēju mācīties bez tiešas programmēšanas. Uzraudzīta mācīšanās un neuzraudzīta mācīšanās ir divi galvenie veidi mašīnmācība .

In uzraudzīta mācīšanās , iekārta ir apmācīta izmantot marķētu datu kopu, kas nozīmē, ka ievades dati ir savienoti pārī ar vēlamo izvadi. Pēc tam iekārta iemācās paredzēt jaunu ievades datu izvadi. Uzraudzīta mācīšanās bieži tiek izmantota tādiem uzdevumiem kā klasifikācija, regresija un objektu noteikšana.

Neuzraudzītas mācīšanās laikā iekārta tiek apmācīta, izmantojot nemarķētu datu kopu, kas nozīmē, ka ievades dati nav savienoti pārī ar vēlamo izvadi. Pēc tam iekārta iemācās atrast datos modeļus un attiecības. Mācīšanās bez uzraudzības bieži tiek izmantota tādiem uzdevumiem kā grupēšana , izmēru samazināšana un anomāliju noteikšana.

Kas ir uzraudzītā mācīšanās?

Uzraudzīta mācīšanās ir sava veida mašīnmācīšanās algoritms kas mācās no iezīmētiem datiem. Apzīmētie dati ir dati, kas ir marķēti ar pareizu atbildi vai klasifikāciju.

Uzraudzītajā mācībā, kā norāda nosaukums, ir supervizora kā skolotāja klātbūtne. Uzraudzīta mācīšanās ir tad, kad mēs mācām vai apmācām mašīnu, izmantojot datus, kas ir labi marķēti. Tas nozīmē, ka daži dati jau ir marķēti ar pareizo atbildi. Pēc tam iekārta tiek nodrošināta ar jaunu piemēru (datu) kopu, lai uzraudzītais mācību algoritms analizētu apmācības datus (apmācības piemēru kopu) un iegūtu pareizu rezultātu no marķētiem datiem.

Piemēram, iezīmētā ziloņa, kamieļa un govs attēlu datu kopā katrs attēls būtu atzīmēts ar ziloni vai kamieļa govs.

Uzraudzīta mācīšanās

Galvenie punkti:

Uzraudzītā mācīšanās ietver mašīnas apmācību no marķētiem datiem.
Apzīmētie dati sastāv no piemēriem ar pareizo atbildi vai klasifikāciju.
Iekārta apgūst attiecības starp ievadi (augļu attēli) un izvadi (augļu etiķetes).
Pēc tam apmācītā iekārta var prognozēt jaunus, nemarķētus datus.

Piemērs:

Pieņemsim, ka jums ir augļu grozs, kuru vēlaties identificēt. Iekārta vispirms analizē attēlu, lai iegūtu tādas pazīmes kā tā forma, krāsa un faktūra. Pēc tam tas salīdzina šīs īpašības ar to augļu īpašībām, par kuriem tas jau ir iemācījies. Ja jaunā attēla īpašības visvairāk līdzinās ābola īpašībām, iekārta prognozēs, ka auglis ir ābols.

fontu izmēri lateksā

Piemēram , pieņemsim, ka jums tiek iedots grozs, kas piepildīts ar dažāda veida augļiem. Tagad pirmais solis ir apmācīt mašīnu ar visiem dažādajiem augļiem pa vienam šādi:

iestatīts java

Ja objekta forma ir noapaļota un augšpusē ir padziļinājums, sarkanā krāsā, tas tiks apzīmēts kā – Apple .
Ja objekta forma ir garš, izliekts cilindrs ar zaļi dzeltenu krāsu, tas tiks apzīmēts kā - Banāns .

Tagad pieņemsim, ka pēc datu apmācības esat devis jaunu atsevišķu augli, piemēram, Banānu no groza, un lūdzis to identificēt.

Tā kā mašīna jau ir iemācījusies lietas no iepriekšējiem datiem un šoreiz ir jāizmanto saprātīgi. Vispirms tas klasificēs augļus pēc formas un krāsas un apstiprinās augļa nosaukumu kā BANANA un iekļauj to kategorijā Banāns. Tādējādi iekārta apgūst lietas no apmācības datiem (grozs, kurā ir augļi) un pēc tam izmanto zināšanas, lai pārbaudītu datus (jauni augļi).

Uzraudzītās mācīšanās veidi

Uzraudzītā mācīšanās ir iedalīta divās algoritmu kategorijās:

Regresija : Regresijas problēma ir tad, ja izejas mainīgais ir reāla vērtība, piemēram, dolāri vai svars.
Klasifikācija : Klasifikācijas problēma ir tad, ja izvades mainīgais ir kategorija, piemēram, Sarkans vai zils , slimība vai bez slimības.

Uzraudzītā mācīšanās nodarbojas ar marķētiem datiem vai mācās ar tiem. Tas nozīmē, ka daži dati jau ir marķēti ar pareizo atbildi.

1- Regresija

Regresija ir uzraudzītas mācīšanās veids, ko izmanto, lai prognozētu nepārtrauktas vērtības, piemēram, mājokļu cenas, akciju cenas vai klientu samazināšanos. Regresijas algoritmi apgūst funkciju, kas kartē no ievades līdzekļiem uz izvades vērtību.

Dažas izplatītas regresijas algoritmi ietver:

Lineārā regresija
Polinoma regresija
Atbalstiet vektora mašīnu regresiju
Lēmumu koka regresija
Meža izlases regresija

2- Klasifikācija

Klasifikācija ir uzraudzītas mācīšanās veids, ko izmanto, lai prognozētu kategoriskas vērtības, piemēram, vai klients atteiksies vai nē, vai e-pasts ir surogātpasts vai nē, vai medicīniskajā attēlā ir redzams audzējs. Klasifikācijas algoritmi apgūst funkciju, kas kartē no ievades līdzekļiem uz varbūtības sadalījumu pa izvades klasēm.

Dažas izplatītas klasifikācijas algoritmi ietver:

Loģistiskā regresija
Atbalstiet vektoru mašīnas
Lēmumu koki
Izlases meži
Naivai Beija

Uzraudzītu mācību modeļu novērtēšana

Uzraudzīto mācību modeļu novērtēšana ir svarīgs solis, lai nodrošinātu, ka modelis ir precīzs un vispārināms. Ir vairāki dažādi metriku ko var izmantot, lai novērtētu uzraudzītus mācību modeļus, taču daži no visizplatītākajiem ir:

Regresijai

Vidējā kvadrāta kļūda (MSE): MSE mēra vidējo kvadrātā starpību starp prognozētajām vērtībām un faktiskajām vērtībām. Zemākas MSE vērtības norāda uz labāku modeļa veiktspēju.
Root Mean Squared Error (RMSE): RMSE ir MSE kvadrātsakne, kas atspoguļo prognozēšanas kļūdu standarta novirzi. Līdzīgi kā MSE, zemākas RMSE vērtības norāda uz labāku modeļa veiktspēju.
Vidējā absolūtā kļūda (MAE): MAE mēra vidējo absolūto starpību starp prognozētajām vērtībām un faktiskajām vērtībām. Tas ir mazāk jutīgs pret novirzēm, salīdzinot ar MSE vai RMSE.
R kvadrāts (noteikšanas koeficients): R kvadrāts mēra mērķa mainīgā dispersijas proporciju, kas ir izskaidrota ar modeli. Augstākas R kvadrāta vērtības norāda uz labāku modeļa atbilstību.

Klasifikācijai

Precizitāte: Precizitāte ir to prognožu procentuālā daļa, ko modelis veic pareizi. To aprēķina, dalot pareizo prognožu skaitu ar kopējo prognožu skaitu.
Precizitāte: Precizitāte ir to pozitīvo prognožu procentuālā daļa, ko modelis sniedz un kuras faktiski ir pareizas. To aprēķina, patieso pozitīvo prognožu skaitu dalot ar kopējo pozitīvo prognožu skaitu.
Atsaukt: Atsaukt ir visu pozitīvo piemēru procentuālā daļa, ko modelis pareizi identificē. To aprēķina, dalot patieso pozitīvo skaitu ar kopējo pozitīvo piemēru skaitu.
F1 rezultāts: F1 rezultāts ir vidējais svērtais precizitātes un atsaukšanas rādītājs. To aprēķina, ņemot precizitātes un atsaukšanas harmonisko vidējo.
Apjukuma matrica: Sajaukšanas matrica ir tabula, kas parāda katras klases prognožu skaitu, kā arī faktiskās klases etiķetes. To var izmantot, lai vizualizētu modeļa veiktspēju un noteiktu jomas, kurās modelim ir grūtības.

Uzraudzītās mācīšanās pielietojumi

Uzraudzītu mācīšanos var izmantot, lai atrisinātu dažādas problēmas, tostarp:

Surogātpasta filtrēšana: Uzraudzītus mācību algoritmus var apmācīt identificēt un klasificēt surogātpasta e-pastus, pamatojoties uz to saturu, palīdzot lietotājiem izvairīties no nevēlamiem ziņojumiem.
Attēlu klasifikācija: Uzraudzīta apmācība var automātiski klasificēt attēlus dažādās kategorijās, piemēram, dzīvnieki, objekti vai ainas, atvieglojot uzdevumus, piemēram, attēlu meklēšanu, satura regulēšanu un uz attēliem balstītu produktu ieteikumus.
Medicīniskā diagnoze: Uzraudzīta mācīšanās var palīdzēt medicīniskajā diagnostikā, analizējot pacientu datus, piemēram, medicīniskos attēlus, testu rezultātus un pacienta vēsturi, lai noteiktu modeļus, kas liecina par konkrētām slimībām vai stāvokļiem.
Krāpšanas atklāšana: Uzraudzīti mācību modeļi var analizēt finanšu darījumus un noteikt modeļus, kas norāda uz krāpnieciskām darbībām, palīdzot finanšu iestādēm novērst krāpšanu un aizsargāt savus klientus.
Dabiskās valodas apstrāde (NLP): Uzraudzītai apmācībai ir izšķiroša nozīme NLP uzdevumos, tostarp noskaņojuma analīzē, mašīntulkošanā un teksta apkopošanā, ļaujot mašīnām efektīvi saprast un apstrādāt cilvēku valodu.

Uzraudzītās mācīšanās priekšrocības

Uzraudzīta mācīšanās ļauj vākt datus un iegūt datus no iepriekšējās pieredzes.
Ar pieredzes palīdzību palīdz optimizēt darbības kritērijus.
Uzraudzīta mašīnmācīšanās palīdz atrisināt dažāda veida reālās pasaules skaitļošanas problēmas.
Tā veic klasifikācijas un regresijas uzdevumus.
Tas ļauj novērtēt vai kartēt rezultātu uz jaunu paraugu.
Mums ir pilnīga kontrole pār apmācību datos vēlamo nodarbību skaita izvēli.

Uzraudzītās mācīšanās trūkumi

Lielo datu klasificēšana var būt sarežģīta.
Apmācībai uzraudzītai apmācībai ir nepieciešams daudz skaitļošanas laika. Tātad, tas prasa daudz laika.
Uzraudzīta mācīšanās nevar tikt galā ar visiem sarežģītajiem uzdevumiem mašīnmācībā.
Aprēķina laiks ir milzīgs uzraudzītai mācībām.
Tam nepieciešama marķēta datu kopa.
Tas prasa apmācības procesu.

Kas ir mācīšanās bez uzraudzības?

Neuzraudzīta mācīšanās ir mašīnmācīšanās veids, kas mācās no nemarķētiem datiem. Tas nozīmē, ka datiem nav iepriekš esošu etiķešu vai kategoriju. Nepārraudzītas mācīšanās mērķis ir atklāt datos modeļus un attiecības bez skaidriem norādījumiem.

bash virknes garums

Nepārraudzīta mācīšanās ir mašīnas apmācība, izmantojot informāciju, kas nav ne klasificēta, ne marķēta, un ļauj algoritmam rīkoties ar šo informāciju bez norādījumiem. Šeit mašīnas uzdevums ir grupēt nešķiroto informāciju pēc līdzībām, modeļiem un atšķirībām bez iepriekšējas datu apmācības.

Atšķirībā no uzraudzītas mācīšanās, skolotājs netiek nodrošināts, kas nozīmē, ka iekārta netiks apmācīta. Tāpēc iekārtai ir ierobežota iespēja pati atrast slēpto struktūru nemarķētos datos.

Varat izmantot mācīšanos bez uzraudzības, lai pārbaudītu savāktos datus par dzīvniekiem un atšķirtu vairākas grupas atbilstoši dzīvnieku īpašībām un darbībām. Šie grupējumi var atbilst dažādām dzīvnieku sugām, ļaujot jums klasificēt radības, neatkarīgi no jau esošām etiķetēm.

Bez uzraudzības – mācīšanās

Galvenie punkti

Neuzraudzīta mācīšanās ļauj modelim atklāt modeļus un attiecības nemarķētos datos.
Klasterizācijas algoritmi sagrupē līdzīgus datu punktus, pamatojoties uz to raksturīgajām īpašībām.
Funkciju iegūšana no datiem tver būtisku informāciju, ļaujot modelim veikt nozīmīgas atšķirības.
Iezīmju saistība piešķir kategorijas klasteriem, pamatojoties uz iegūtajiem modeļiem un īpašībām.

Piemērs

Iedomājieties, ka jums ir mašīnmācīšanās modelis, kas apmācīts, izmantojot lielu neiezīmētu attēlu datu kopu, kurā ir gan suņi, gan kaķi. Modelis nekad iepriekš nav redzējis suņa vai kaķa attēlu, un tam nav iepriekš esošu etiķešu vai kategoriju šiem dzīvniekiem. Tavs uzdevums ir izmantot bez uzraudzības mācīšanos, lai identificētu suņus un kaķus jaunā, neredzētā attēlā.

Piemēram , pieņemsim, ka tam ir dots attēls, kurā redzami gan suņi, gan kaķi, ko tas nekad nav redzējis.

Tādējādi iekārtai nav ne jausmas par suņu un kaķu īpašībām, tāpēc mēs to nevaram klasificēt kā 'suņus un kaķus'. Bet tas var tos iedalīt kategorijās pēc to līdzībām, modeļiem un atšķirībām, t.i., mēs varam viegli iedalīt iepriekš minēto attēlu divās daļās. Pirmajā var būt visi attēli suņi tajos un otrajā daļā var būt visi attēli ar kaķi viņos. Šeit jūs iepriekš neko nemācījāties, kas nozīmē, ka nav apmācības datu vai piemēru.

Tas ļauj modelim darboties pašam, lai atklātu modeļus un informāciju, kas iepriekš nebija atklāta. Tas galvenokārt attiecas uz nemarķētiem datiem.

Nepārraudzītās mācīšanās veidi

Neuzraudzīta mācīšanās ir iedalīta divās algoritmu kategorijās:

Klasterizācija : Klasterizācijas problēma ir vieta, kur vēlaties atklāt datiem raksturīgās grupēšanas, piemēram, klientu grupēšana pēc pirkuma uzvedības.
asociācija : Asociācijas kārtulu apguves problēma ir tā, kur vēlaties atklāt noteikumus, kas apraksta lielu daļu jūsu datu, piemēram, cilvēki, kas pērk X, mēdz iegādāties arī Y.

Klasterizācija

Klasterizācija ir neuzraudzītas mācīšanās veids, ko izmanto, lai grupētu līdzīgus datu punktus. Klasterizācijas algoritmi strādāt, iteratīvi pārvietojot datu punktus tuvāk to klasteru centriem un tālāk no datu punktiem citos klasteros.

Ekskluzīvs (sadalīšana)
Aglomeratīvs
Pārklāšanās
Varbūtības

Klasterizācijas veidi: -

Hierarhiskā klasterizācija
K-nozīmē klasterizāciju
Galvenās sastāvdaļas analīze
Singular Value Dekompozīcija
Neatkarīgu komponentu analīze
Gausa maisījumu modeļi (GMM)
Uz blīvumu balstīta telpiskā lietojumprogrammu klasterizācija ar troksni (DBSCAN)

Asociācijas noteikumu apguve

Asociācijas noteikumu mācīšanās ir neuzraudzītas mācīšanās veids, ko izmanto, lai identificētu datu modeļus. Asociācijas noteikums mācību algoritmi darbojas, atrodot attiecības starp dažādiem datu kopas vienumiem.

Daži izplatīti asociācijas noteikumu mācīšanās algoritmi ietver:

Apriori algoritms
Eclat algoritms
FP izaugsmes algoritms

Neuzraudzītu mācību modeļu novērtēšana

Nepārraudzītu mācību modeļu novērtēšana ir svarīgs solis, lai nodrošinātu, ka modelis ir efektīvs un noderīgs. Tomēr tas var būt grūtāk nekā uzraudzītu mācību modeļu novērtēšana, jo nav pamata patiesības datu, ar kuriem salīdzināt modeļa prognozes.

Ir vairāki dažādi rādītāji, ko var izmantot, lai novērtētu neuzraudzītu mācību modeļus, taču daži no visizplatītākajiem ietver:

Silueta rezultāts: Silueta rādītājs mēra, cik labi katrs datu punkts ir sagrupēts ar saviem klastera locekļiem un atdalīts no citām kopām. Tas svārstās no -1 līdz 1, un augstāki rādītāji norāda uz labāku klasterizāciju.
Calinski-Harabasz rezultāts: Calinski-Harabasz rādītājs mēra attiecību starp klasteru dispersiju un klasteru dispersiju. Tas svārstās no 0 līdz bezgalībai, un augstāki rādītāji norāda uz labāku klasterizāciju.
Pielāgots Rand indekss: Koriģētais Randa indekss mēra divu klasteru līdzību. Tas svārstās no -1 līdz 1, un augstāki rādītāji norāda uz līdzīgākām klasteru grupām.
Deivisa-Bouldina indekss: Deivisa-Bouldina indekss mēra klasteru vidējo līdzību. Tas svārstās no 0 līdz bezgalībai, un zemāki rādītāji norāda uz labāku klasterizāciju.
F1 rezultāts: F1 rezultāts ir vidējais svērtais precizitātes un atsaukšanas rādītājs, kas ir divi rādītāji, kurus parasti izmanto uzraudzītā apmācībā, lai novērtētu klasifikācijas modeļus. Tomēr F1 rezultātu var izmantot arī, lai novērtētu neuzraudzītus mācību modeļus, piemēram, klasterizācijas modeļus.

Pieteikums mācīšanās bez uzraudzības

Neuzraudzītu mācīšanos var izmantot, lai atrisinātu dažādas problēmas, tostarp:

Anomāliju noteikšana: neuzraudzīta mācīšanās var identificēt neparastus modeļus vai novirzes no parastās datos, ļaujot atklāt krāpšanu, ielaušanos vai sistēmas kļūmes.
Zinātnisks atklājums: Nepārraudzīta mācīšanās var atklāt slēptās attiecības un modeļus zinātniskajos datos, radot jaunas hipotēzes un atziņas dažādās zinātnes jomās.
Ieteikumu sistēmas. Nepārraudzīta mācīšanās var identificēt lietotāju uzvedības modeļus un līdzības un vēlmes, lai ieteiktu produktus, filmas vai mūziku, kas atbilst viņu interesēm.
Klientu segmentēšana. Neuzraudzīta apmācība var identificēt klientu grupas ar līdzīgām īpašībām, ļaujot uzņēmumiem atlasīt mārketinga kampaņas un efektīvāk uzlabot klientu apkalpošanu.
Attēlu analīze: bez uzraudzības mācīšanās var grupēt attēlus, pamatojoties uz to saturu, atvieglojot tādus uzdevumus kā attēlu klasifikācija, objektu noteikšana un attēlu izguve.

Priekšrocības mācīšanās bez uzraudzības

Tam nav nepieciešams marķēt apmācības datus.
Dimensiju samazināšanu var viegli paveikt, izmantojot bez uzraudzības mācīšanos.
Spēj atrast iepriekš nezināmus datu modeļus.
Neuzraudzīta mācīšanās var palīdzēt gūt ieskatu no nemarķētiem datiem, ko citādi nebūtu varējis iegūt.
Nepārraudzīta mācīšanās ir laba, lai atrastu modeļus un attiecības datos, nepasakot, ko meklēt. Tas var palīdzēt jums uzzināt jaunas lietas par jūsu datiem.

Trūkumi mācīšanās bez uzraudzības

Grūti izmērīt precizitāti vai efektivitāti, jo apmācības laikā trūkst iepriekš definētu atbilžu.
Rezultātiem bieži ir mazāka precizitāte.
Lietotājam ir jāpavada laiks, lai interpretētu un marķētu klases, kas atbilst šai klasifikācijai.
Neuzraudzīta mācīšanās var būt jutīga pret datu kvalitāti, tostarp trūkstošām vērtībām, novirzēm un trokšņainiem datiem.
Bez marķētiem datiem var būt grūti novērtēt nepārraudzītu mācību modeļu veiktspēju, tāpēc ir grūti novērtēt to efektivitāti.

Uzraudzīta un neuzraudzīta mašīnmācīšanās

Parametri	Uzraudzīta mašīnmācība	Neuzraudzīta mašīnmācīšanās
Ievaddati	Algoritmi tiek apmācīti, izmantojot marķētos datus.	Algoritmi tiek izmantoti pret datiem, kas nav marķēti
Skaitļošanas sarežģītība	Vienkāršāka metode	Skaitļošanas ziņā sarežģīts
Precizitāte	Ļoti precīzi	Mazāk precīzi
Nodarbību skaits	Nodarbību skaits ir zināms	Nodarbību skaits nav zināms
Datu analīze	Izmanto bezsaistes analīzi	Izmanto reāllaika datu analīzi
Izmantotie algoritmi	Lineārā un loģistikas regresija, izlases mežs, vairāku klašu klasifikācija, lēmumu koks, atbalsta vektora mašīna, neironu tīkls utt. primitīvie datu tipi java	K-Means klasterizācija, hierarhiskā klasterizācija, KNN, Apriori algoritms utt.
Izvade	Tiek dota vēlamā produkcija.	Vēlamā produkcija netiek dota.
Apmācības dati	Izmantojiet apmācības datus, lai secinātu modeli.	Treniņu dati netiek izmantoti.
Sarežģīts modelis	Nav iespējams apgūt lielākus un sarežģītākus modeļus nekā ar uzraudzītu mācīšanos.	Ir iespējams apgūt lielākus un sarežģītākus modeļus bez uzraudzības.
Modelis	Mēs varam pārbaudīt savu modeli.	Mēs nevaram pārbaudīt savu modeli.
Sauc kā	Uzraudzīto mācīšanos sauc arī par klasifikāciju.	Nepārraudzītu mācīšanos sauc arī par klasterizāciju.
Piemērs	Piemērs: rakstzīmju optiskā atpazīšana.	Piemērs: atrodiet seju attēlā.
Uzraudzība rekha filmu aktrise	uzraudzītām mācībām ir nepieciešama supervīzija, lai apmācītu modeli.	Nepārraudzītai apmācībai nav nepieciešama uzraudzība, lai apmācītu modeli.

Secinājums

Uzraudzīta un neuzraudzīta mācīšanās ir divi spēcīgi rīki, kurus var izmantot dažādu problēmu risināšanai. Uzraudzītā mācīšanās ir labi piemērota uzdevumiem, kur vēlamais rezultāts ir zināms, savukārt bez uzraudzības ir labi piemērota uzdevumiem, kur vēlamais rezultāts nav zināms.

Bieži uzdotie jautājumi (FAQ)

1. Kāda ir atšķirība starp uzraudzītu un neuzraudzītu mašīnvalodu?

Uzraudzīta un neuzraudzīta mācīšanās ir divas pamatpieejas mašīnmācībai, kas atšķiras pēc apmācības datiem un mācību mērķiem.

Uzraudzīta mācīšanās ietver mašīnmācīšanās modeļa apmācību marķētā datu kopā, kur katram datu punktam ir atbilstoša etiķete vai izvades vērtība. Algoritms iemācās kartēt ievades datus ar vēlamo izvadi, ļaujot tai prognozēt jaunus, neredzētus datus.

Mācības bez uzraudzības no otras puses, attiecas uz neiezīmētām datu kopām, kur datu punktiem nav saistītu etiķešu vai izvades vērtību.

2. Kas ir uzraudzīta mācīšanās?

Uzraudzītā mācīšanās ir mašīnmācīšanās veids, kurā algoritms tiek apmācīts ar marķētu datu kopu, kur katram datu punktam ir atbilstoša etiķete vai izvades vērtība. Algoritms iemācās kartēt ievades datus ar vēlamo izvadi, ļaujot tai prognozēt jaunus, neredzētus datus.

3. Kādi ir izplatītākie uzraudzītās mācību algoritmi?

Kopējie uzraudzītie mācību algoritmi ietver:

Klasifikācija: Izmanto, lai datu punktiem piešķirtu kategorijas. Piemēri ietver atbalsta vektora mašīnas (SVM), loģistikas regresiju un lēmumu kokus.

Regresija: Izmanto nepārtrauktu skaitlisko vērtību prognozēšanai. Piemēri: lineārā regresija, polinoma regresija un grēdas regresija.

4. Kādi ir izplatītākie neuzraudzītās mācību algoritmi?

Izplatīti nepārraudzīti mācību algoritmi ietver:

Klasterizācija: Datu punktu grupēšana klasteros, pamatojoties uz to līdzību. Piemēri ietver k-means klasterizāciju un hierarhisko klasterizāciju.

Izmēru samazināšana: Funkciju skaita samazināšana datu kopā, vienlaikus saglabājot vissvarīgāko informāciju. Kā piemērus var minēt galveno komponentu analīzi (PCA) un automātiskos kodētājus.

5. Kas ir mācīšanās bez uzraudzības?

Nepārraudzīta mācīšanās ir mašīnmācīšanās veids, kurā algoritms tiek apmācīts, izmantojot neiezīmētu datu kopu, kur datu punktiem nav atbilstošu etiķešu vai izvades vērtību. Algoritms iemācās identificēt datu modeļus un struktūras bez skaidriem norādījumiem.

6. Kad izmantot uzraudzītu mācīšanos salīdzinājumā ar neuzraugāmo mācīšanos?

Izmantojiet uzraudzītu mācīšanos, ja jums ir marķēta datu kopa un vēlaties paredzēt jaunus datus. Izmantojiet neuzraudzītu mācīšanos, ja jums ir neiezīmēta datu kopa un vēlaties datos identificēt modeļus vai struktūras.