logo

Mašīnmācīšanās modeļi

Mašīnmācīšanās modelis ir definēts kā apmācības procesa iznākuma matemātisks attēlojums. Mašīnmācība ir dažādu algoritmu izpēte, kurus var automātiski uzlabot, izmantojot pieredzi un vecos datus, un izveidot modeli. Mašīnmācīšanās modelis ir līdzīgs datora programmatūrai, kas izstrādāta, lai atpazītu modeļus vai uzvedību, pamatojoties uz iepriekšējo pieredzi vai datiem. Mācīšanās algoritms atklāj modeļus apmācības datos un izvada ML modeli, kas uztver šos modeļus un paredz jaunus datus.

Mašīnmācīšanās modeļi

Sapratīsim ML modeļa piemēru, kur mēs veidojam lietotni, lai atpazītu lietotāja emocijas, pamatojoties uz sejas izteiksmēm. Tātad šādas lietotnes izveide ir iespējama, izmantojot mašīnmācības modeļus, kur mēs apmācīsim modeli, barojot seju attēlus ar dažādām emocijām. Ikreiz, kad šī lietotne tiek izmantota lietotāja noskaņojuma noteikšanai, tā nolasa visus ievadītos datus un pēc tam nosaka jebkura lietotāja noskaņojumu.

Tādējādi, vienkāršiem vārdiem sakot, mēs varam teikt, ka a mašīnmācīšanās modelis ir kaut kā vai procesa vienkāršots attēlojums. Šajā tēmā mēs apspriedīsim dažādus mašīnmācīšanās modeļus un to metodes un algoritmus .

Kas ir mašīnmācīšanās modelis?

Mašīnmācīšanās modeļus var saprast kā programmu, kas ir apmācīta atrast modeļus jaunos datos un veikt prognozes. Šie modeļi ir attēloti kā matemātiska funkcija, kas pieņem pieprasījumus ievades datu veidā, veic ievades datu prognozes un pēc tam atbildē nodrošina izvadi. Pirmkārt, šie modeļi tiek apmācīti, izmantojot datu kopu, un pēc tam tiem tiek nodrošināts algoritms, kas ļauj apsvērt datus, iegūt modeli no plūsmas datiem un mācīties no šiem datiem. Kad šie modeļi ir apmācīti, tos var izmantot, lai prognozētu neredzētu datu kopu.

Ir pieejami dažāda veida mašīnmācīšanās modeļi, kuru pamatā ir dažādi uzņēmējdarbības mērķi un datu kopas.

Mašīnmācīšanās modeļu klasifikācija:

Pamatojoties uz dažādiem uzņēmējdarbības mērķiem un datu kopām, ir trīs algoritmu mācīšanās modeļi. Katrs mašīnmācīšanās algoritms tiek izmantots vienā no trim modeļiem:

  • Uzraudzīta mācīšanās
  • Mācības bez uzraudzības
  • Pastiprināšanas mācības
Mašīnmācīšanās modeļi

Uzraudzītās mācības tiek iedalītas divās kategorijās:

  • Klasifikācija
  • Regresija

Mācības bez uzraudzības ir sadalītas arī šādās kategorijās:

  • Klasterizācija
  • Asociācijas noteikums
  • Izmēru samazināšana

1. Uzraudzīti mašīnmācīšanās modeļi

Uzraudzītā mācīšanās ir vienkāršākais mašīnmācīšanās modelis, lai saprastu, kuri ievades dati tiek saukti par apmācības datiem un kuriem ir zināma etiķete vai rezultāts kā izvade. Tātad, tas darbojas pēc ieejas-izejas pāru principa. Tam ir jāizveido funkcija, kuru var apmācīt, izmantojot apmācības datu kopu, un pēc tam tā tiek lietota nezināmiem datiem un nodrošina paredzamu veiktspēju. Uzraudzītā mācīšanās ir balstīta uz uzdevumiem un tiek pārbaudīta ar marķētām datu kopām.

Mēs varam ieviest uzraudzītu mācību modeli par vienkāršām reālās dzīves problēmām. Piemēram, mums ir datu kopa, kas sastāv no vecuma un auguma; tad mēs varam izveidot uzraudzītu mācību modeli, lai prognozētu personas augumu, pamatojoties uz viņa vecumu.

Uzraudzītās mācīšanās modeļus iedala divās kategorijās:

Regresija

Regresijas problēmās izvade ir nepārtraukts mainīgais. Daži parasti izmantotie regresijas modeļi ir šādi:

a) Lineārā regresija

Lineārā regresija ir vienkāršākais mašīnmācīšanās modelis, kurā mēs cenšamies paredzēt vienu izvades mainīgo, izmantojot vienu vai vairākus ievades mainīgos. Lineārās regresijas attēlojums ir lineārs vienādojums, kas apvieno ievades vērtību kopu (x) un paredzamo izvadi (y) šo ievades vērtību kopai. Tas ir attēlots līnijas veidā:

Y = bx + c.

Mašīnmācīšanās modeļi

Lineārās regresijas modeļa galvenais mērķis ir atrast vislabāko atbilstības līniju, kas vislabāk atbilst datu punktiem.

Lineārā regresija tiek paplašināta līdz daudzkārtējai lineārajai regresijai (atrodiet vislabāk atbilstošo plakni) un polinoma regresiju (atrodiet vislabākās atbilstības līkni).

b) Lēmumu koks

kā virkni pārvērst par int

Lēmumu koki ir populāri mašīnmācīšanās modeļi, kurus var izmantot gan regresijas, gan klasifikācijas problēmām.

Lēmumu koks izmanto kokam līdzīgu lēmumu struktūru, kā arī to iespējamās sekas un rezultātus. Šajā gadījumā katrs iekšējais mezgls tiek izmantots, lai attēlotu atribūta pārbaudi; katrs zars tiek izmantots, lai attēlotu testa rezultātu. Jo vairāk mezglu ir lēmumu kokam, jo ​​precīzāks būs rezultāts.

Lēmumu koku priekšrocība ir tā, ka tie ir intuitīvi un viegli īstenojami, taču tiem trūkst precizitātes.

Lēmumu koki tiek plaši izmantoti operāciju izpēte, īpaši lēmumu analīzē, stratēģiskā plānošanā un galvenokārt mašīnmācībā.

c) Random Forest

Random Forest ir ansambļa mācību metode, kas sastāv no liela skaita lēmumu koku. Katrs lēmumu koks nejaušā mežā paredz iznākumu, un par iznākumu tiek uzskatīts pareģojums ar balsu vairākumu.

Nejaušs meža modelis var tikt izmantots gan regresijas, gan klasifikācijas problēmām.

Klasifikācijas uzdevumam izlases meža iznākums tiek ņemts no balsu vairākuma. Savukārt regresijas uzdevumā rezultāts tiek ņemts no katra koka radīto prognožu vidējā vai vidējā.

d) Neironu tīkli

Neironu tīkli ir mašīnmācības apakškopa, un tos sauc arī par mākslīgajiem neironu tīkliem. Neironu tīkli sastāv no mākslīgiem neironiem un ir veidoti tā, lai tie atgādina cilvēka smadzeņu struktūru un darbību. Katrs mākslīgais neirons savienojas ar daudziem citiem neironiem neironu tīklā, un šādi miljoniem savienoto neironu veido izsmalcinātu kognitīvo struktūru.

Mašīnmācīšanās modeļi

Neironu tīkli sastāv no daudzslāņu struktūras, kas satur vienu ievades slāni, vienu vai vairākus slēptos slāņus un vienu izvades slāni. Tā kā katrs neirons ir savienots ar citu neironu, tas pārsūta datus no viena slāņa uz otru nākamo slāņu neironu. Visbeidzot, dati sasniedz neironu tīkla pēdējo slāni vai izvades slāni un ģenerē izvadi.

Neironu tīkli ir atkarīgi no apmācības datiem, lai mācītos un uzlabotu to precizitāti. Tomēr perfekti apmācīts un precīzs neironu tīkls var ātri apkopot datus un kļūt par spēcīgu mašīnmācības un AI rīku. Viens no pazīstamākajiem neironu tīkliem ir Google meklēšanas algoritms.

Klasifikācija

Klasifikācijas modeļi ir otrā veida uzraudzītās mācīšanās metodes, kuras izmanto, lai ģenerētu secinājumus no novērotajām vērtībām kategoriskā formā. Piemēram, klasifikācijas modelis var noteikt, vai e-pasts ir surogātpasts vai nē; pircējs iegādāsies preci vai nē, utt. Klasifikācijas algoritmi tiek izmantoti, lai paredzētu divas klases un iedalītu produkciju dažādās grupās.

Klasifikācijā ir izveidots klasifikatora modelis, kas klasificē datu kopu dažādās kategorijās, un katrai kategorijai tiek piešķirta etiķete.

Mašīnmācībā ir divu veidu klasifikācijas:

    Binārā klasifikācija: ja problēmai ir tikai divas iespējamās klases, ko sauc par bināro klasifikatoru. Piemēram, kaķis vai suns, jā vai nē,Daudzu klašu klasifikācija: Ja problēmai ir vairāk nekā divas iespējamās klases, tas ir vairāku klašu klasifikators.

Daži populāri klasifikācijas algoritmi ir šādi:

a) Loģistiskā regresija

Loģistisko regresiju izmanto, lai atrisinātu klasifikācijas problēmas mašīnmācībā. Tie ir līdzīgi lineārajai regresijai, bet tiek izmantoti, lai prognozētu kategoriskos mainīgos. Tas var paredzēt izvadi ar Jā vai Nē, 0 vai 1, Patiess vai Aplams utt. Tomēr tā vietā, lai norādītu precīzas vērtības, tiek nodrošinātas varbūtības vērtības no 0 līdz 1.

b) Atbalstiet vektoru mašīnu

Atbalsta vektora mašīna jeb SVM ir populārs mašīnmācīšanās algoritms, ko plaši izmanto klasifikācijas un regresijas uzdevumos. Tomēr īpaši to izmanto, lai atrisinātu klasifikācijas problēmas. SVM galvenais mērķis ir atrast labākās lēmumu robežas N-dimensiju telpā, kas var sadalīt datu punktus klasēs, un labākā lēmuma robeža ir pazīstama kā hiperplakne. SVM atlasa galējo vektoru, lai atrastu hiperplakni, un šie vektori ir pazīstami kā atbalsta vektori.

Mašīnmācīšanās modeļi

c) naivais Bejs

Naive Bayes ir vēl viens populārs klasifikācijas algoritms, ko izmanto mašīnmācībā. To sauc tā, ka tas ir balstīts uz Bayes teorēmu un seko naivam (neatkarīgam) pieņēmumam starp pazīmēm, kas tiek dotas šādi:

Mašīnmācīšanās modeļi

Katrs naivais Bayes klasifikators pieņem, ka konkrēta mainīgā vērtība ir neatkarīga no jebkura cita mainīgā/iezīmes. Piemēram, ja auglis ir jāklasificē pēc krāsas, formas un garšas. Tātad dzeltens, ovāls un salds tiks atzīts par mango. Šeit katra funkcija ir neatkarīga no citām funkcijām.

2. Nepārraudzīti mašīnmācīšanās modeļi

Neuzraudzīti mašīnmācīšanās modeļi īsteno mācību procesu, kas ir pretējs uzraudzītai mācīšanai, kas nozīmē, ka tas ļauj modelim mācīties no nemarķētās apmācības datu kopas. Pamatojoties uz neiezīmēto datu kopu, modelis prognozē izvadi. Izmantojot neuzraudzītu mācīšanos, modelis pats bez uzraudzības apgūst slēptos modeļus no datu kopas.

Nepārraudzīti mācību modeļi galvenokārt tiek izmantoti, lai veiktu trīs uzdevumus, kas ir šādi:

    Klasterizācija
    Klasterizācija ir neuzraudzīta mācīšanās metode, kas ietver datu punktu grupēšanu vai satveršanu dažādās kopās, pamatojoties uz līdzībām un atšķirībām. Objekti ar visvairāk līdzību paliek tajā pašā grupā, un tiem nav vai ir ļoti maz līdzību no citām grupām.
    Klasterizācijas algoritmus var plaši izmantot dažādos uzdevumos, piemēram Attēlu segmentēšana, Statistisko datu analīze, Tirgus segmentācija utt.
    Daži parasti izmantotie klasterizācijas algoritmi ir K-nozīmē klasterizācija, hierarhiskā klasterizācija, DBSCAN utt.
    Mašīnmācīšanās modeļi Asociācijas noteikumu apguve
    Asociācijas noteikumu mācīšanās ir nepārraudzīta mācīšanās metode, kas atrod interesantas attiecības starp mainīgajiem lielajā datu kopā. Šī mācīšanās algoritma galvenais mērķis ir atrast viena datu vienuma atkarību no cita datu vienuma un attiecīgi kartēt šos mainīgos, lai tas varētu radīt maksimālu peļņu. Šis algoritms galvenokārt tiek izmantots Tirgus groza analīze, Web izmantošanas ieguve, nepārtraukta ražošana utt.
    Daži populāri asociācijas noteikumu apguves algoritmi ir Apriori algoritms, Eclat, FP izaugsmes algoritms. Izmēru samazināšana
    Datu kopā esošo pazīmju/mainīgo skaitu sauc par datu kopas dimensiju, un dimensijas samazināšanas paņēmienu sauc par dimensiju samazināšanas paņēmienu.
    Lai gan vairāk datu nodrošina precīzākus rezultātus, tas var ietekmēt arī modeļa/algoritma veiktspēju, piemēram, pārmērīgas pielāgošanas problēmas. Šādos gadījumos tiek izmantotas izmēru samazināšanas metodes.
    ' Tas ir process, kurā augstāku dimensiju datu kopa tiek pārveidota par mazāku dimensiju datu kopu, nodrošinot, ka tā sniedz līdzīgu informāciju .'
    Dažādas izmēru samazināšanas metodes, piemēram kā PCA (galveno komponentu analīze), Singular Value Decomposition utt.

Pastiprināšanas mācības

Pastiprināšanas mācībās algoritms apgūst darbības noteiktai stāvokļu kopai, kas noved pie mērķa stāvokļa. Tas ir uz atgriezenisko saiti balstīts mācīšanās modelis, kas saņem atgriezeniskās saites signālus pēc katra stāvokļa vai darbības, mijiedarbojoties ar vidi. Šīs atsauksmes darbojas kā atlīdzība (pozitīva par katru labu darbību un negatīva par katru sliktu darbību), un aģenta mērķis ir maksimāli palielināt pozitīvo atlīdzību, lai uzlabotu savu sniegumu.

Modeļa uzvedība pastiprināšanas mācībās ir līdzīga cilvēka mācībām, jo ​​cilvēki mācās lietas, izmantojot pieredzi kā atgriezenisko saiti un mijiedarbojas ar vidi.

Tālāk ir norādīti daži populāri algoritmi, kas attiecas uz pastiprināšanas apmācību.

    Q-mācības:Q-learning ir viens no populārajiem bezmodeļu pastiprināšanas mācīšanās algoritmiem, kas ir balstīts uz Bellmana vienādojumu.

Tās mērķis ir apgūt politiku, kas var palīdzēt AI aģentam veikt labāko darbību, lai konkrētos apstākļos maksimāli palielinātu atlīdzību. Tas ietver Q vērtības katram stāvokļa-darbības pārim, kas norāda atlīdzību, sekojot noteiktam stāvokļa ceļam, un mēģina maksimāli palielināt Q vērtību.

    State-Action-Reward-State-Action (SARSA):SARSA ir politikas algoritms, kura pamatā ir Markova lēmumu pieņemšanas process. Tā izmanto darbību, ko veic pašreizējā politika, lai uzzinātu Q vērtību. SARSA algoritms stāv valsts darbībai Atlīdzība valsts darbība, kas simbolizē korteži (s, a, r, s', a'). Dziļais Q tīkls:DQN vai Deep Q neironu tīkls ir Q-mācības neironu tīkla ietvaros. To pamatā izmanto lielas stāvokļa telpas vidē, kur Q tabulas definēšana būtu sarežģīts uzdevums. Tātad šādā gadījumā, nevis izmantojot Q tabulu, neironu tīkls izmanto Q vērtības katrai darbībai, pamatojoties uz stāvokli.

Apmācības mašīnmācīšanās modeļi

Kad mašīnmācīšanās modelis ir izveidots, tas tiek apmācīts, lai iegūtu atbilstošus rezultātus. Lai apmācītu mašīnmācības modeli, ir nepieciešams milzīgs iepriekš apstrādātu datu apjoms. Šeit iepriekš apstrādāti dati nozīmē datus strukturētā formā ar samazinātām nulles vērtībām utt. Ja mēs nesniedzam iepriekš apstrādātus datus, pastāv liela iespēja, ka mūsu modelis var darboties briesmīgi.

Kā izvēlēties labāko modeli?

Iepriekšējā sadaļā mēs esam apsprieduši dažādus mašīnmācīšanās modeļus un algoritmus. Bet viens mulsinošākais jautājums, kas var rasties ikvienam iesācējam, “kuru modeli man izvēlēties?”. Tātad atbilde ir tāda, ka tas galvenokārt ir atkarīgs no biznesa prasībām vai projekta prasībām. Bez tam tas ir atkarīgs arī no saistītajiem atribūtiem, pieejamās datu kopas apjoma, funkciju skaita, sarežģītības utt. Tomēr praksē ieteicams vienmēr sākt ar vienkāršāko modeli, ko var pielietot konkrētajam problēmu un pēc tam pakāpeniski palieliniet sarežģītību un pārbaudiet precizitāti, izmantojot parametru regulēšanu un savstarpējo validāciju.

Atšķirība starp mašīnmācīšanās modeli un algoritmiem

Viens no mulsinošajiem jautājumiem iesācēju vidū ir tas, vai mašīnmācīšanās modeļi un algoritmi ir vienādi? Tā kā dažādos gadījumos mašīnmācībā un datu zinātnē šie divi termini tiek lietoti kā sinonīmi.

Atbilde uz šo jautājumu ir nē, un mašīnmācīšanās modelis nav tas pats, kas algoritms. Vienkāršā veidā an ML algoritms ir kā procedūra vai metode, kas darbojas ar datiem, lai atklātu no tiem modeļus un ģenerē modeli. Tajā pašā laikā a mašīnmācīšanās modelis ir kā datorprogramma, kas ģenerē izvadi vai paredz prognozes . Konkrētāk, kad mēs apmācām algoritmu ar datiem, tas kļūst par modeli.

 Machine Learning Model = Model Data + Prediction Algorithm