Datu konvertēšanas process no vienas formas uz citu ir pazīstams kā kodēšana. To izmanto, lai pārveidotu datus, lai datus varētu atbalstīt un izmantot dažādas sistēmas. Kodēšana darbojas līdzīgi temperatūras konvertēšanai no grādiem pēc Celsija uz Fārenheitu, jo tā tiek pārveidota citā formā, taču sākotnējā vērtība vienmēr paliek nemainīga. Kodēšana tiek izmantota galvenokārt divos laukos:
Piezīme. Kodēšana atšķiras no šifrēšanas, jo tās galvenais mērķis ir nevis slēpt datus, bet gan pārveidot tos formātā, lai tos varētu pareizi izmantot.
Šajā tēmā mēs apspriedīsim dažāda veida kodēšanas metodes, kas tiek izmantotas skaitļošanā.
Kodēšanas tehnikas veids
Rakstzīmju kodēšana
Rakstzīmju kodējums kodē rakstzīmes baitos . Tas informē datorus, kā interpretēt nulli un vieniniekus reālās rakstzīmēs, skaitļos un simbolos. Dators saprot tikai bināros datus; tāpēc šīs rakstzīmes ir jāpārvērš ciparu kodos. Lai to panāktu, katra rakstzīme tiek pārveidota par bināro kodu, un šim nolūkam teksta dokumenti tiek saglabāti ar kodēšanas veidiem. To var izdarīt, savienojot pārī ciparus ar rakstzīmēm. Ja mēs neizmantosim rakstzīmju kodējumu, mūsu vietne rakstzīmes un tekstu neparādīs pareizā formātā. Tādējādi tas samazinās lasāmību, un iekārta nespēs pareizi apstrādāt datus. Turklāt rakstzīmju kodēšana nodrošina, lai katra rakstzīme būtu pareizi attēlota datora vai binārā formātā.
Ir dažādi rakstzīmju kodēšanas paņēmienu veidi, kas ir norādīti tālāk:
HTML kodējums
HTML kodējums tiek izmantots, lai parādītu HTML lapu pareizā formātā. Izmantojot kodējumu, tīmekļa pārlūkprogramma uzzina, kuru rakstzīmju kopu izmantot.
HTML valodā HTML iezīmēšanā tiek izmantotas dažādas rakstzīmes, piemēram, . Lai šīs rakstzīmes kodētu kā saturu, mums ir jāizmanto kodējums.
URL kodējums
URL (Uniform Resource locator) Kodējums tiek izmantots pārvērst rakstzīmes tādā formātā, lai tās varētu pārsūtīt internetā . To sauc arī par procentuālo kodējumu. URL kodēšana tiek veikta, lai nosūtītu URL uz internetu, izmantojot ASCII rakstzīmju kopu. Rakstzīmes, kas nav ASCII rakstzīmes, tiek aizstātas ar %, kam seko heksadecimālie cipari.
UNICODE kodējums
Unicode ir universālas rakstzīmju kopas kodēšanas standarts. Tas ļauj kodēt, attēlot un apstrādāt tekstu, kas attēlots lielākajā daļā valodu vai rakstīšanas sistēmu, kas ir pieejamas visā pasaulē. Tas nodrošina koda punktu vai numuru katrai rakstzīmei katrā atbalstītajā valodā. Tas var attēlot aptuveni visas iespējamās rakstzīmes visās valodās. Noteikta bitu secība ir pazīstama kā kodēšanas vienība.
UNICODE standarts var izmantot 8, 16 vai 32 bitus, lai attēlotu rakstzīmes.
Unikoda standarts definē Unicode Transformation Format (UTF), lai kodētu koda punktus.
UNICODE kodēšanas standartam ir šādas UTF shēmas:
UTF8 definē UNICODE standarts, kas ir mainīga platuma rakstzīmju kodējums, ko izmanto elektroniskajā komunikācijā. UTF-8 spēj kodēt visus 1 112 064 derīgos rakstzīmju koda punktus Unicode, izmantojot vienu līdz četras viena baita (8 bitu) koda vienības.
UTF16 kodējums attēlo rakstzīmes koda punktus, izmantojot vienu no diviem 16 bitu veseliem skaitļiem.
UTF32 kodējums attēlo katru koda punktu kā 32 bitu veselus skaitļus.
Base64 kodējums
Base64 kodējums tiek izmantots, lai kodētu bināros datus līdzvērtīgās ASCII rakstzīmēs. Base64 kodējums tiek izmantots pasta sistēmā, jo pasta sistēmas, piemēram, SMTP, nevar strādāt ar binārajiem datiem, jo tās pieņem tikai ASCII teksta datus. To izmanto arī vienkāršā HTTP autentifikācijā, lai kodētu akreditācijas datus. Turklāt to izmanto arī bināro datu pārsūtīšanai sīkfailos un citos parametros, lai padarītu datus nelasāmus, lai novērstu manipulācijas. Ja attēls vai cits fails tiek pārsūtīts bez Base64 kodējuma, tas tiks bojāts, jo pasta sistēma nevar tikt galā ar binārajiem datiem.
Base64 attēlo datus 3 baitu blokos, kur katrs baits satur 8 bitus; tāpēc tas apzīmē 24 bitus. Šie 24 biti ir sadalīti četrās grupās pa 6 bitiem. Katra no šīm grupām vai gabaliem tiek konvertēta līdzvērtīgā Base64 vērtībā.
ASCII kodējums
Amerikas standarta informācijas apmaiņas kods (ASCII) ir rakstzīmju kodēšanas veids. Tas bija pirmais rakstzīmju kodēšanas standarts, kas tika izlaists 1963. gadā.
ASCII kods tiek izmantots, lai attēlotu angļu rakstzīmes kā ciparus, kur katram burtam tiek piešķirts numurs no 0 līdz 127. Lielākā daļa mūsdienu rakstzīmju kodēšanas shēmu ir balstītas uz ASCII, lai gan tās atbalsta daudzas papildu rakstzīmes. Tas ir viena baita kodējums, izmantojot tikai apakšējos 7 bitus. ASCII failā katra alfabēta, ciparu vai speciālā rakstzīme tiek attēlota ar 7 bitu bināru skaitli. Katrai tastatūras rakstzīmei ir līdzvērtīga ASCII vērtība.
Attēlu un audio un video kodēšana
Attēlu un audio un video kodēšana tiek veikta, lai ietaupītu vietu krātuvē. Multivides faili, piemēram, attēls, audio un video, ir kodēti, lai tos saglabātu efektīvākā un saspiestākā formātā.
Šie kodētie faili satur vienu un to pašu saturu ar parasti līdzīgu kvalitāti, bet saspiestā izmērā, lai tos varētu saglabāt mazākā vietā, viegli pārsūtīt pa pastu vai lejupielādēt sistēmā.
Mēs to varam saprast kā . WAV audio fails tiek pārveidots par .MP3 failu, lai samazinātu izmēru par 1/10thlīdz tā sākotnējam izmēram.