logo

Mašīnmācīšanās bez uzraudzības

Iepriekšējā tēmā mēs uzzinājām par uzraudzītu mašīnmācīšanos, kurā modeļi tiek apmācīti, izmantojot marķētos datus apmācības datu uzraudzībā. Taču var būt daudz gadījumu, kad mums nav marķētu datu un mums ir jāatrod slēptie modeļi no dotās datu kopas. Tātad, lai atrisinātu šāda veida gadījumus mašīnmācībā, mums ir vajadzīgas nepārraudzītas mācīšanās metodes.

Kas ir mācīšanās bez uzraudzības?

Kā norāda nosaukums, neuzraudzīta mācīšanās ir mašīnmācīšanās tehnika, kurā modeļi netiek uzraudzīti, izmantojot apmācības datu kopu. Tā vietā modeļi paši atrod slēptos modeļus un ieskatus no dotajiem datiem. To var salīdzināt ar mācīšanos, kas notiek cilvēka smadzenēs, apgūstot jaunas lietas. To var definēt šādi:

kaudze kārtot
Neuzraudzīta mācīšanās ir mašīnmācīšanās veids, kurā modeļi tiek apmācīti, izmantojot nemarķētu datu kopu, un tiem ir atļauts rīkoties ar šiem datiem bez uzraudzības.

Nepārraudzītu mācīšanos nevar tieši pielietot regresijas vai klasifikācijas problēmai, jo atšķirībā no uzraudzītās mācīšanās mums ir ievades dati, bet nav atbilstošu izejas datu. Nepārraudzītas mācīšanās mērķis ir atrodiet datu kopas pamatā esošo struktūru, grupējiet šos datus atbilstoši līdzībām un attēlojiet šo datu kopu saspiestā formātā .

Piemērs: Pieņemsim, ka nepārraudzītam mācību algoritmam tiek dota ievades datu kopa, kas satur dažādu veidu kaķu un suņu attēlus. Algoritms nekad netiek apmācīts uz dotās datu kopas, kas nozīmē, ka tam nav ne jausmas par datu kopas funkcijām. Nepārraudzītā mācību algoritma uzdevums ir pašam identificēt attēla pazīmes. Neuzraudzīts mācību algoritms veiks šo uzdevumu, sagrupējot attēlu datu kopu grupās atbilstoši attēlu līdzībām.

Uzraudzīta mašīnmācība

Kāpēc izmantot bez uzraudzības apmācību?

Tālāk ir norādīti daži galvenie iemesli, kas raksturo nekontrolētas mācīšanās nozīmi.

  • Neuzraudzīta mācīšanās palīdz iegūt noderīgu ieskatu no datiem.
  • Mācības bez uzraudzības ir daudz līdzīgas tam, kā cilvēks mācās domāt pēc savas pieredzes, kas padara to tuvāku reālajam AI.
  • Neuzraudzīta mācīšanās darbojas ar nemarķētiem un nekategorizētiem datiem, kas padara neuzraudzītu mācīšanos svarīgāku.
  • Reālajā pasaulē mums ne vienmēr ir ievades dati ar atbilstošo izvadi, tāpēc, lai atrisinātu šādus gadījumus, mums ir nepieciešama nekontrolēta mācīšanās.

Darbs bez uzraudzības

Nepārraudzītas apmācības darbu var saprast pēc šādas diagrammas:

Uzraudzīta mašīnmācība

Šeit mēs esam paņēmuši neiezīmētus ievades datus, kas nozīmē, ka tie nav iedalīti kategorijās un nav norādīti arī attiecīgie izvadi. Tagad šie neiezīmētie ievades dati tiek ievadīti mašīnmācīšanās modelī, lai to apmācītu. Pirmkārt, tā interpretēs neapstrādātos datus, lai no datiem atrastu slēptos modeļus, un pēc tam izmantos piemērotus algoritmus, piemēram, k-means klasterizāciju, lēmumu koku utt.

Kad tas izmanto piemērotu algoritmu, algoritms sadala datu objektus grupās atbilstoši objektu līdzībām un atšķirībām.

Nepārraudzītu mācību algoritmu veidi:

Nepārraudzīto mācību algoritmu var iedalīt divos problēmu veidos:

Uzraudzīta mašīnmācība
    Klasterizācija: Klasterizācija ir metode objektu grupēšanai klasteros tā, lai objekti ar lielāko līdzību paliek grupā un tiem ir mazāka līdzība vai nav līdzības ar citas grupas objektiem. Klasteru analīze atrod kopīgās iezīmes starp datu objektiem un iedala tos kategorijās atkarībā no šo kopīgo elementu esamības un neesamības.asociācija: Asociācijas noteikums ir nepārraudzīta mācīšanās metode, ko izmanto, lai atrastu attiecības starp mainīgajiem lielajā datu bāzē. Tas nosaka vienumu kopu, kas datu kopā parādās kopā. Asociācijas noteikums padara mārketinga stratēģiju efektīvāku. Piemēram, cilvēki, kas pērk X preci (pieņemsim, ka maizi), mēdz iegādāties arī Y (sviesta/ievārījuma) preci. Tipisks asociācijas noteikuma piemērs ir tirgus groza analīze.

Piezīme. Šos algoritmus mēs apgūsim turpmākajās nodaļās.

Nepārraudzīti mācību algoritmi:

Zemāk ir saraksts ar dažiem populāriem neuzraudzītiem mācību algoritmiem:

pilna forma ide
    K-nozīmē klasterizāciju KNN (tuvākie kaimiņi) Hierarhiskā klasterizācija Anomāliju noteikšana Neironu tīkli Principu komponentu analīze Neatkarīgu komponentu analīze Apriori algoritms Singulārās vērtības dekompozīcija

Bez uzraudzības mācīšanās priekšrocības

  • Nepārraudzīta mācīšanās tiek izmantota sarežģītākiem uzdevumiem, salīdzinot ar uzraudzītu mācīšanos, jo bez uzraudzības mācībām mums nav marķētu ievades datu.
  • Ir vēlama mācīšanās bez uzraudzības, jo ir viegli iegūt nemarķētus datus salīdzinājumā ar marķētiem datiem.

Neuzraudzītas mācīšanās trūkumi

  • Nepārraudzīta mācīšanās pēc būtības ir grūtāka nekā uzraudzīta mācīšanās, jo tai nav atbilstoša rezultāta.
  • Nepārraudzītā mācību algoritma rezultāts var būt mazāk precīzs, jo ievades dati nav marķēti un algoritmi iepriekš nezina precīzu izvadi.