logo

Nominālie vs ordinālie dati

Datu zinātne ir saistīta ar datu apstrādi un analīzi, izmantojot dažādus rīkus un metodes. Mūsdienu uz datiem balstītajā pasaulē mēs sastopamies ar datu veidiem, kuriem katram ir nepieciešama apstrāde un interpretācija. Ir svarīgi izprast dažādus datu veidus pareizai datu analīzei un statistiskai interpretācijai. Datu veids nosaka pareizās statistikas metodes un darbības, kas būtu jāizmanto. Lai izdarītu nozīmīgus secinājumus, dažādiem datu tipiem ir vajadzīgas dažādas analīzes un interpretācijas metodes. Šajā rakstā mēs izpētīsim datu jēdzienu, kā arī to nozīmi, sniegsim reālus piemērus un sniegsim norādījumus, kā strādāt ar tiem.

Mērījumu līmeņi

Pirms datu kopas analīzes ir ļoti svarīgi noteikt tajā ietverto datu veidu. Par laimi, visus datus var grupēt vienā no četrām kategorijām: nominālie, kārtas, intervāla vai attiecības dati. Lai gan tos bieži dēvē par datu veidiem, patiesībā tie ir dažādi mērījumu līmeņi. Mērījumu līmenis atspoguļo precizitāti, ar kādu mainīgais ir kvantitatīvi noteikts, un tas nosaka metodes, kuras var izmantot, lai no datiem iegūtu ieskatu.



Četras datu kategorijas ne vienmēr ir vienkārši nošķiramas, un tās pieder hierarhijai, un katrs līmenis balstās uz iepriekšējo.

1

Ir četri datu veidi: kategoriskie, kurus var iedalīt nominālajos un kārtas, un skaitliskie, kurus var iedalīt intervālos un koeficientos. Nominālās un kārtas skalas ir salīdzinoši neprecīzas, kas padara tās vieglāk analizējamas, taču tās sniedz mazāk precīzu ieskatu. No otras puses, intervālu un attiecību skalas ir sarežģītākas un grūtāk analizējamas, taču tām ir potenciāls sniegt daudz bagātāku ieskatu.



  • Nominālie dati – Nominālie dati ir pamata datu tips, kas klasificē datus, iezīmējot vai nosaucot vērtības, piemēram, dzimumu, matu krāsu vai dzīvnieku veidus. Tam nav nekādas hierarhijas.
  • Kārtējie dati – Parastos datos ietilpst datu klasificēšana pēc ranga, piemēram, sociālā statusa tādās kategorijās kā “bagāti”, “vidēji ienākumi” vai “nabadzīgi”. Tomēr starp šīm kategorijām nav noteikti intervāli.
  • Intervāla dati – Intervālu dati ir veids, kā kārtot un salīdzināt datus, kas ietver izmērītos intervālus. Temperatūras skalas, piemēram, Celsija vai Fārenheita skalas, ir labi intervālu datu piemēri. Tomēr intervālu datiem nav patiesas nulles, kas nozīmē, ka nulles mērījums joprojām var būt kvantitatīvi nosakāms rādītājs (piemēram, nulle grādi pēc Celsija, kas ir tikai vēl viens skalas punkts un faktiski nenozīmē, ka nav temperatūras). .
  • Attiecības dati – Sarežģītākais mērījumu līmenis ir attiecību dati. Līdzīgi kā intervālu dati, tas klasificē un sakārto datus, izmantojot izmērītos intervālus. Bet atšķirībā no intervālu datiem attiecību datos ir ietverta patiesa nulle. Ja mainīgais ir nulle, šī mainīgā nav. Lielisks attiecību datu piemērs ir augstuma mērījums, kas nevar būt negatīvs.

Kas ir nominālie dati?

Kategoriskie dati, kas pazīstami arī kā nominālie dati, ir būtisks informācijas veids, ko izmanto dažādās jomās, piemēram, pētniecībā, statistikā un datu analīzē. Tas sastāv no kategorijām vai etiķetēm, kas palīdz klasificēt un sakārtot datus. Kategorisko datu būtiska iezīme ir tāda, ka tiem nav raksturīgas secības vai klasifikācijas starp kategorijām. Tā vietā šīs kategorijas ir atsevišķas, atšķirīgas un viena otru izslēdzošas.

2

Piemēram, nominālie dati tiek izmantoti, lai klasificētu informāciju atsevišķās etiķetēs vai kategorijās bez dabiskas secības vai ranžēšanas. Šīs etiķetes vai kategorijas ir attēlotas, izmantojot nosaukumus vai terminus, un starp tiem nav dabiskas secības vai ranžēšanas. Nominālie dati ir noderīgi informācijas kvalitatīvai klasifikācijai un organizēšanai, ļaujot pētniekiem un analītiķiem grupēt datu punktus, pamatojoties uz konkrētiem atribūtiem vai raksturlielumiem, neparedzot nekādas skaitliskās attiecības.



  • Acu krāsu kategorijas, piemēram, zila vai zaļa, atspoguļo nominālos datus. Katra kategorija ir atšķirīga, bez secības vai ranga.
  • Viedtālruņu zīmoli, piemēram, iPhone vai Samsung, ir nominālie dati. Starp zīmoliem nav hierarhijas.
  • Transporta veidi, piemēram, automašīna vai velosipēds, ir nominālie dati. Tās ir atsevišķas kategorijas bez noteiktas kārtības.

Nominālo datu raksturojums

  • Dati, kas ir klasificēti kā nomināli, sastāv no kategorijām, kas ir pilnīgi atsevišķas un atšķiras viena no otras.
  • Dati, kas ietilpst nominālajā kategorijā, tiek atšķirti ar aprakstošām iezīmēm, nevis ar skaitliskām vai kvantitatīvām vērtībām
  • Nominālos datus nevar ranžēt vai sakārtot hierarhiski, jo neviena kategorija nav augstāka vai zemāka par citu.

Piemērs

Šeit ir daži piemēri, kā nominālie dati tiek izmantoti, lai klasificētu un klasificētu informāciju atsevišķās un nesakārtotās kategorijās.

1. Automašīnas krāsas: Automašīnu krāsas ir nominālie dati ar skaidrām kategorijām, bet bez raksturīgās secības vai ranga. Katra automašīna ietilpst vienā krāsu kategorijā bez loģiskas vai skaitliskas saiknes starp krāsām.

2. Augļu veidi: Augļu kategorijas grozā ir nominālas. Katrs auglis pieder noteiktai kategorijai bez hierarhijas vai kārtības. Visas kategorijas ir atšķirīgas un diskrētas.

3. Filmu žanri: Filmu žanri ir nominālie dati, jo starp kategorijām, piemēram, asa sižeta vai komēdijas, nav klasifikācijas. Katrs žanrs ir unikāls, taču mēs nevaram pateikt, vai viens ir labāks par citu, pamatojoties tikai uz šiem datiem.

Kas ir ordinālie dati?

Kārtējie dati ir kvalitatīvu datu veids, kas klasificē mainīgos lielumus aprakstošās kategorijās. To raksturo fakts, ka tajā izmantotās kategorijas ir sarindotas kaut kādā hierarhiskā skalā, piemēram, no augstas uz zemu. Kārtējie dati ir otrs sarežģītākais mērījumu veids pēc nominālajiem datiem. Lai gan tie ir sarežģītāki nekā nominālie dati, kuriem nav nekādas raksturīgās secības, tie joprojām ir samērā vienkāršoti.

3

Piemēram, kārtas dati ir datu veids, ko izmanto, lai klasificētu vienumus ar nozīmīgu hierarhiju vai secību. Šīs kategorijas palīdz mums salīdzināt un sakārtot dažādus skolēnu sasniegumus, pozīcijas vai sniegumu, pat ja intervāli starp tiem nav vienādi. Kārtības dati ir noderīgi, lai izprastu sakārtotās izvēles vai preferences un novērtētu relatīvās atšķirības.

  • Skolas atzīmes: Atzīmes, piemēram, A, B, C ir kārtas dati, kas sakārtoti pēc sasniegumiem, taču intervāli starp tiem atšķiras.
  • Izglītības līmenis: tādi līmeņi kā vidusskola, bakalaura, maģistra grāds ir kārtas dati, kas sakārtoti pēc izglītības, taču atšķirības starp līmeņiem atšķiras.
  • Darba stāža līmenis: amatu līmeņi, piemēram, iesācējs, vidējais, vecākais, ir kārtas dati, kas norāda uz hierarhiju, taču atšķirības atšķiras atkarībā no darba un nozares.

Ordinālo datu raksturojums

  • Kārtējie dati ietilpst neskaitlisko un kategorisko datu kategorijā, taču tajos joprojām var izmantot skaitliskās vērtības kā etiķetes.
  • Kārtības dati vienmēr tiek sarindoti hierarhijā (tātad nosaukums “kārta”).
  • Kārtējos datus var sarindot, taču to vērtības nav vienmērīgi sadalītas.
  • Izmantojot kārtas datus, varat aprēķināt frekvences sadalījumu, režīmu, mediānu un mainīgo lielumu diapazonu.

Piemērs

Šeit ir daži piemēri, kā laukos un domēnos tiek izmantoti kārtas dati.

1. Izglītības līmeņi: Kārtējos datus parasti izmanto, lai attēlotu izglītības līmeņus, piemēram, skolu, bakalaura grādu, maģistra grādu un doktora grādu. Šiem līmeņiem ir noteikta kārtība.

2. Klientu apmierinātības vērtējumi: Vēl viens datu pielietojums ir klientu apmierinātības aptaujās. Šajās aptaujās respondentiem bieži tiek lūgts novērtēt savu pieredzi skalā no sliktas līdz izcilai.

3. Ekonomiskās klases: klases, ieskaitot klases vidusšķiru un augstāko klasi, var klasificēt kā kārtas datus, pamatojoties uz to klasifikāciju.

Šie piemēri parāda veidus, kādos laukos un domēnos tiek izmantoti kārtas dati.

Nominālie un parastie dati

Raksturlielumi

Nominālie dati

Kārtējie dati

Kategoriju būtība

Atšķirīgs un diskrēts

Diskrēts un atšķirīgs

Pasūtījums/Rangs

Nav raksturīgas kārtības

Ir skaidra secība vai rangs

Skaitliskās vērtības

Nav nozīmīgu skaitlisko vērtību

Nav nozīmīgu skaitlisko vērtību

Analīzes metodes

Frekvenču skaits, procenti, joslu diagrammas

Ranking, mediānas, neparametriskas pārbaudes, sakārtotas joslu diagrammas, kārtas regresija

Piemērs

Krāsas, dzimums, dzīvnieku veidi

kas ir ziemas guļas režīms

Skolas atzīmes, izglītības līmenis, darba stāža līmenis

Interpretācija

Izmanto klasifikācijai un grupēšanai pēc kategorijas

Izmanto, lai novērtētu sakārtotas preferences, hierarhiju vai klasifikāciju