Mašīnmācīšanās hiperparametri ir tie parametri, kurus lietotājs ir skaidri definējis, lai kontrolētu mācību procesu. Šie hiperparametri tiek izmantoti, lai uzlabotu modeļa apguvi, un to vērtības tiek iestatītas pirms modeļa apguves procesa uzsākšanas.
Šajā tēmā mēs apspriedīsim vienu no svarīgākajiem mašīnmācīšanās jēdzieniem, t.i., hiperparametri, to piemēri, hiperparametru regulēšana, hiperparametru kategorijas, kā hiperparametrs atšķiras no parametra mašīnmācībā? Bet pirms darba sākšanas vispirms sapratīsim hiperparametru.
Kas ir hiperparametri?
Mašīnmācībā/dziļā apmācībā modelis tiek attēlots ar tā parametriem. Turpretim apmācības process ietver labāko/optimālo hiperparametru atlasi, ko izmanto mācību algoritmi, lai nodrošinātu vislabāko rezultātu. Tātad, kādi ir šie hiperparametri? Atbilde ir:' Hiperparametri ir definēti kā parametri, kurus lietotājs ir skaidri definējis, lai kontrolētu mācību procesu.
Šeit prefikss 'hiper' norāda, ka parametri ir augstākā līmeņa parametri, kas tiek izmantoti mācību procesa kontrolē. Hiperparametra vērtību atlasa un iestata mašīnmācīšanās inženieris, pirms mācību algoritms sāk apmācīt modeli. Tādējādi tie ir ārpus modeļa, un to vērtības nevar mainīt apmācības procesa laikā .
raksturs uz int java
Daži hiperparametru piemēri mašīnmācībā
- K in kNN vai K-tuvākā kaimiņa algoritms
- Mācību ātrums neironu tīkla apmācībai
- Vilciena un testa sadalījuma attiecība
- Partijas lielums
- Laikmetu skaits
- Zari lēmumu kokā
- Klasteru skaits klasterizācijas algoritmā
Atšķirība starp parametru un hiperparametru?
Vienmēr pastāv liela neskaidrība starp parametriem un hiperparametriem vai modeļa hiperparametriem. Tātad, lai novērstu šo neskaidrību, sapratīsim atšķirību starp abiem un to, kā tie ir saistīti viens ar otru.
Modeļa parametri:
Modeļa parametri ir konfigurācijas mainīgie, kas ir modeļa iekšēji, un modelis tos apgūst pats. Piemēram , W Neatkarīgo mainīgo svari vai koeficienti lineārās regresijas modelī . vai Neatkarīgo mainīgo svērumi vai koeficienti SVM, neironu tīkla svars un novirzes, klasteru centroīds klasterizācijā. Daži galvenie modeļa parametru punkti ir šādi:
- Modelis tos izmanto prognožu veikšanai.
- Modelis tos apgūst no pašiem datiem
- Tie parasti netiek iestatīti manuāli.
- Šī ir modeļa daļa un mašīnmācīšanās algoritma atslēga.
Modeļa hiperparametri:
Hiperparametri ir tie parametri, kurus lietotājs ir skaidri definējis, lai kontrolētu mācību procesu. Daži galvenie modeļa parametru punkti ir šādi:
- Parasti tos manuāli definē mašīnmācīšanās inženieris.
- Nevar zināt precīzu hiperparametru labāko vērtību konkrētajai problēmai. Labāko vērtību var noteikt vai nu pēc īkšķa principa, vai ar izmēģinājumu un kļūdu metodi.
- Daži hiperparametru piemēri ir mācīšanās ātrums neironu tīkla apmācībai, K KNN algoritmā,
Hiperparametru kategorijas
Vispārīgi hiperparametrus var iedalīt divās kategorijās, kas norādītas tālāk:
Hiperparametrs optimizācijai
Labāko izmantojamo hiperparametru atlases process ir pazīstams kā hiperparametru regulēšana, un regulēšanas process ir pazīstams arī kā hiperparametru optimizācija. Optimizācijas parametri tiek izmantoti modeļa optimizēšanai.
Tālāk ir norādīti daži no populārākajiem optimizācijas parametriem:
Piezīme. Mācīšanās ātrums ir būtisks hiperparametrs modeļa optimizēšanai, tādēļ, ja ir nepieciešams noregulēt tikai vienu hiperparametru, ir ieteicams noregulēt mācīšanās ātrumu.
Hiperparametrs konkrētiem modeļiem
Hiperparametri, kas ir iesaistīti modeļa struktūrā, ir zināmi kā hiperparametri konkrētiem modeļiem. Tie ir norādīti zemāk:
Ir svarīgi norādīt neironu tīkla slēpto vienību hiperparametru skaitu. Tam jābūt starp ievades slāņa izmēru un izvades slāņa izmēru. Precīzāk, slēpto vienību skaitam jābūt 2/3 no ievades slāņa lieluma, kam pieskaita izvades slāņa izmēru.
Sarežģītām funkcijām ir jānorāda slēpto vienību skaits, taču tam nevajadzētu pārspīlēt modeli.
Secinājums
Hiperparametri ir parametri, kas ir skaidri definēti, lai kontrolētu mācību procesu pirms mašīnmācības algoritma izmantošanas datu kopai. Tos izmanto, lai norādītu modeļa mācīšanās spēju un sarežģītību. Daži hiperparametri tiek izmantoti modeļu optimizēšanai, piemēram, partijas lielums, mācīšanās ātrums utt., un daži ir specifiski modeļiem, piemēram, slēpto slāņu skaits utt.