logo

Java rakstzīmju klase

Rakstzīmju klase parasti iesaiņo visu primitīvā tipa char vērtību objektā. Jebkurš objekta tipa Character var saturēt vienu lauku, kura tips ir char.

Visi klases Character lauki, metodes un konstruktori ir norādīti Unicode datu failā, kas ir īpaši daļa no Unicode rakstzīmju datu bāzes un ko uztur Unicode konsorcijs.

Rakstzīmju kopa no U+0000 līdz U+FFFF dažkārt tiek saukta par pamata daudzvalodu plakni (t.i., BMP). Rakstzīmes, kuru koda punkti ir lielāki par U+FFFF, sauc par papildu rakstzīmēm. Java valoda parasti izmanto UTF-16 kodēšanas metodi, lai attēlotu rakstzīmju masīvus virknē vai virknes buferī. Šāda veida attēlojumā papildu rakstzīmes tiek attēlotas kā rakstzīmju pāris, no kuriem pirmā ir no augstākā surogātdiapazona (uD800-uDBFF) un otrā, kas ir no zemā aizstājēja diapazona (uDc00- uDBFF).

Metodes

Metode Apraksts
charCount(int codePoint) Nosaka rakstzīmju vērtību skaitu, kas nepieciešams, lai attēlotu doto rakstzīmi.
charValue() Atgriež dotā rakstzīmju objekta vērtību.
codePointAt(char[]a, int index) Atgriež norādītā masīva norādītā indeksa koda punktu.
codePointAt(char[]a, int index, int limit ) Atgriež masīva koda punktu norādītajā indeksā, kur tiek izmantoti tikai tie masīva elementi, kuru indekss ir mazāks par norādīto ierobežojumu.
codePointAt(CharSequence secība, int index) Atgriež CodePoint norādītajā rādītājā konkrētajai CharSequence.
codePointBefore(char[]a, int index) Atgriež CodePoint norādītajam masīvam iepriekšējā rādītājā.
codePointBefore(char[]a, int index, int start) Atgriež koda punktu dotajam masīvam iepriekšējā rādītājā, kur tiek izmantoti tikai tie masīva elementi, kuru indekss ir lielāks par sākumu vai vienāds ar to.
codePointBefore(CharSequence, int index) Atgriež CodePoint dotajai CharSequence iepriekšējā indeksā.
codePointCount(char[]a, int offset, int count) Atgriež kopējo Unikoda koda punktu skaitu dotajā char masīva argumenta apakšmasīvā.
codePointCount(CharSequence sekv., int beginIndex, int endIndex) Atgriež unikoda koda punktu skaitu, kas nodrošināts norādītajā teksta diapazonā norādītajai rakstzīmju secībai.
codePointOf(virknes nosaukums) Atgriež CodePoint vērtību dotajai unikoda rakstzīmei, kas norādīta ar noteiktu rakstzīmes nosaukumu.
salīdzināt (char x, char y) Skaitliski salīdzina divas rakstzīmju tipu vērtības.
salīdzināt Ar (rakstzīme citu rakstzīmi) Skaitliski salīdzina divus rakstzīmju tipa objektus.
cipars (char ch, int radix) Atgriež norādītās rakstzīmes skaitlisko vērtību norādītajā rādītājā.
cipars (int codePoint, int radix) Atgriež dotās rakstzīmes skaitlisko vērtību norādītajā radiksā.
vienāds(objekta objekts) Salīdzina doto objektu ar norādīto objektu.
ciparam(int cipars, int radix) Nosaka rakstzīmes noformējumu konkrētam ciparam dotajā radiksā.
getDirectionality (char ch) Atgriež Unikoda virziena rekvizītu norādītajai rakstzīmei.
getDirectionality (int codePoint) Atgriež Unikoda virziena rekvizītu norādītajam koda punktam.
getName(int codePoint) Atgriež unikoda nosaukumu dotajam codePoint vai var atgriezt nulli, ja codePoint nav piešķirts.
getNumericValue(char ch) Atgriež norādītās unikoda rakstzīmes veselā skaitļa tipa vērtību.
getNumericValue(int codePoint) Atgriež norādītā Unicode codePoint vesela skaitļa tipa vērtību.
getType (char ch) Atgriež vērtību, kas norāda rakstzīmes vispārējo kategoriju.
getType (int codePoint) Atgriež vērtību, kas norāda rakstzīmes vispārējo kategoriju.
hashcode () Atgriež norādītās rakstzīmes jaucējkodu. Šī metode ir vienāda ar metodes charValue() izsaukšanas rezultātu.
hashcode (rakstzīmes vērtība) Atgriež jaucējkodu konkrētai rakstzīmes vērtībai.
highSurogate(int codePoint) Atgriež vadošā surogātkoda punktu konkrētam surogātpārim, kas apzīmē papildu rakstzīmi UTF-16 kodējumā.
ir alfabētisks(int codePoint) Nosaka, vai dotā rakstzīme ir alfabēts vai nav.
isBmpCodePoint(int codePoint) Nosaka, vai dotā rakstzīme atrodas pamata daudzvalodu plaknē.
isDefined(char ch) Nosaka, vai rakstzīme ir definēta unikodā.
isDefined(int codePoint) Nosaka, vai rakstzīme (Unikoda koda punkts) ir definēta unikodā.
irCipars(char ch) Nosaka, vai dotā rakstzīme ir cipars vai nav.
irDigit(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) ir cipars vai nav.
isHighSurogate (char ch) Nosaka, vai norādītās char vērtības ir Unicode augsta aizstājēja koda punkts vai nav.
isIndentifierIgnorable(char ch) Nosaka, vai dotā rakstzīme Java identifikatorā tiek uzskatīta par ignorējamu rakstzīmi vai nē.
isIndentifierIgnorable(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) tiek uzskatīta par ignorējamu rakstzīmi Java identifikatorā.
isIdeographic(int codePoint) Nosaka, vai norādītā rakstzīme ir CJKV (ķīniešu, japāņu, korejiešu un vjetnamiešu) ideogrāfs.
isISOControl(char ch) Nosaka, vai dotā rakstzīme ir ISO kontroles rakstzīme vai nav.
isISOControl(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) ir vai nav ISO kontroles rakstzīme.
isJavaIdentifierPart(char ch) Nosaka, vai dotā rakstzīme ir daļa no Java identifikatora, kas nav pirmā rakstzīme.
isJavaIdentifierPart(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) ir daļa no Java identifikatora, kas nav pirmā rakstzīme vai nav.
isJavaIdentifierStart(char ch) Nosaka, vai dotā rakstzīme ir pieļaujama kā pirmā rakstzīme Java identifikatorā.
isJavaIdentifierStart(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts ir pieļaujama kā pirmā rakstzīme Java identifikatorā vai nē.
isJavaLetter(char ch) Aizstāts ar isJavaIdentifierStart(char).
irJavaLetterOrDigit(int codePoint) Aizstāts ar isJavaIdentifierPart(char).
irBurts (char ch) Nosaka, vai norādītā rakstzīme ir burts vai nav.
irBurts(int codePoint) Nosaka, vai norādītā rakstzīme (Unikoda koda punkts) ir burts vai nav.
isLetterOrDigit(char ch) Nosaka, vai norādītā rakstzīme ir burts vai cipars, vai nav.
irBurtsOrDigit(int codePoint) Nosaka, vai norādītā rakstzīme (Unikoda koda punkts) ir burts vai cipars, vai nav.
ir mazie burti (char ch) Nosaka, vai norādītā rakstzīme ir mazie burti vai nav.
ir mazie burti(int codePoint) Nosaka, vai norādītā rakstzīme (Unikoda koda punkts) ir mazais burts vai nav.
ir LowSurogate (char ch) Nosaka, vai norādītā simbola vērtība ir Unikoda zema surogātkoda vienība.
ir spoguļots (char ch) Nosaka, vai varonis ir atspoguļots vai nē.
ir Mirrored(int codePoint) Nosaka, vai rakstzīme (Unikoda koda punkts) ir atspoguļota vai nē.
isSpace (char ch) Aizstāts ar isWhiteSpace(char ch) metodi.
isSpaceChar(char ch) Nosaka, vai norādītā rakstzīme ir unikoda atstarpes rakstzīme vai nav.
isSupplementaryCodePoint(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) atrodas papildu rakstzīmju diapazonā vai nav.
ir surogāts (char ch) Nosaka, vai dotā rakstzīmes vērtība ir unikoda surogātkoda vienība.
isSurogatePair (augsts rakstzīmju skaits, mazs rakstzīmju skaits) Nosaka, vai dotais char vērtības pāris ir derīgs Unikoda surogātpāris vai nav.
isTitleCase(char ch) Nosaka, vai dotā rakstzīme ir virsraksta rakstzīme vai nav.
isTitleCase(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) ir vai nav virsraksta rakstzīme.
isUnicodeIdentifierPart(char ch) Nosaka, vai dotā rakstzīme ir daļa no Unicode identifikatora vai nav.
isUnicodeIdentifierPart(int codePoint) Nosaka, vai dotā rakstzīme (unicofde koda punkts) ir daļa no Unicode identifikatora vai nav.
isUnicodeIdentifierStart(char ch) Nosaka, vai dotā rakstzīme ir pieļaujama kā pirmā rakstzīme unikoda identifikatorā.
isUnicodeIdentifierStart(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) ir pieļaujama kā pirmā rakstzīme unikoda identifikatorā.
ir Lielais burts (char ch) Nosaka, vai dotā rakstzīme ir lielais burts vai nav.
ir Lielais burts(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) ir lielie burti vai nav.
irValidCodePoint(int codePoint) Nosaka, vai dotā rakstzīme ir derīga Unikoda koda punkta vērtība.
isWhitespace (char ch) Nosaka, vai dotā rakstzīme ir atstarpe vai nav.
isWhitespace(int codePoint) Nosaka, vai dotā rakstzīme (Unikoda koda punkts) ir atstarpe vai nav .
zemais surogāts(int codePoint) Atgriež surogātpāra zemo surogātkoda vienību (t.i., beigu surogātu), kas apzīmē papildu rakstzīmi UTF-16 kodējumā.
offsetByCodePoints(char[]a, int sākums, int skaits, int indekss, int codePointOffset) Atgriež indeksu dotajai zīmju apakšgrupai, kas ir nobīde no dotā indeksa ar codePointOffset koda punktiem.
offsetByCodePoints (CharSequence sekv., int indekss, int codePointOffset) Atgriež indeksu dotajai zīmju apakšgrupai, kas ir nobīde no dotā indeksa ar codePointOffset koda punktiem.
reversebaiti (char ch) Atgriež vērtību, kas iegūta, apgriežot doto baitu secību norādītajās char vērtībās.
to Chars(int codePoint) Pārvērš norādīto rakstzīmi (unikoda koda punktu) tās UTF-16 attēlojumā, kas tiek glabāts rakstzīmju masīvā.
toChars(int codePoint, char[] dst, int dstIndex) Pārvērš norādīto rakstzīmi (unikoda koda punktu) tās UTF-16 attēlojumā.
toCodePoint (augsts rakstzīmju skaits, mazs rakstzīmju skaits) Pārvērš doto surogātpāri par atbilstošo papildu koda punktu vērtību.
mazie burti (char ch) Pārvērš rakstzīmju tipa argumentu par mazajiem burtiem, izmantojot reģistru kartēšanas informāciju, kas iegūta no Unicode datu faila.
mazie burti (int codePoint) Pārvērš rakstzīmju tipa argumentu (unikoda koda punktu) par mazajiem burtiem, izmantojot reģistru kartēšanas informāciju, kas iegūta no Unikoda datu faila.
toString() Atgriež String tipa objektu, kas attēlo rakstzīmes vērtību.
toString(char ch) Atgriež String tipa objektu, kas apzīmē norādīto rakstzīmi
toTitleCase (char ch) Pārvērš rakstzīmju tipa argumentu par nosaukuma reģistru, izmantojot reģistra kartēšanas informāciju, kas iegūta no Unicode datu faila.
toTitleCase(int codePoint) Pārvērš rakstzīmju tipa argumentu (unikoda koda punktu) par mazajiem burtiem, izmantojot reģistru kartēšanas informāciju, kas iegūta no Unikoda datu faila.
lielais burts (char ch) Pārvērš rakstzīmju tipa argumentu par lielajiem burtiem, izmantojot reģistru kartēšanas informāciju, kas iegūta no unikoda datu faila.
lielais burts(int codePoint) Pārvērš rakstzīmju tipa argumentu (unikoda koda punktu) par lielajiem burtiem, izmantojot reģistru kartēšanas informāciju, kas iegūta no unikoda datu faila.
valueOf(char c) Atgriež rakstzīmes gadījumu, kas apzīmē norādīto rakstzīmes vērtību.

1. piemērs

 import java.util.Scanner; public class JavaCharacterExample1 { public static void main(String[] args) { // Ask the user for the first input. System.out.print('Enter the first input:'); // Use the Scanner class to get the user input. Scanner scanner = new Scanner(System.in); // Gets the user input. char[] value1 = scanner.nextLine().toCharArray(); int result1 = 0; // Count the characters for a specific character. for (char ch1 : value1) { result1 = Character.charCount(ch1); } // Print the result. System.out.print('The value comes to: '+result1+'
'); System.out.print('Enter the second input:'); char[] value2 = scanner.nextLine().toCharArray(); for (char ch2 : value2) { int result2 = Character.hashCode(ch2); System.out.print('The hash code for the character ''+ch2+'' is given as:'+result2+'
'); } System.out.print('Enter the third input:'); char[] value3 = scanner.nextLine().toCharArray(); for (char ch3 : value3) { boolean result3 = Character.isDigit(ch3); if(result3){ System.out.println('The character '' + ch3 + '' is a digit. '); } else{ System.out.println('The character '' + ch3 + '' is not a digit.'); } System.out.print('Enter the fourth input:'); char[] value4 = scanner.nextLine().toCharArray(); for (char ch4 : value4) { boolean result4 = Character.isISOControl(ch4); System.out.println('The fourth character ''+ch4+'' is an ISO Control:'+result4); } } } } 

Izvade:

 Enter the first input:89 The value comes to: 1 Enter the second input:J The hash code for the character 'J' is given as:74 Enter the third input:5 The character '5' is a digit. Enter the fourth input:h The fourth character 'h' is an ISO Control:false 

2. piemērs

 public class JavaCharacterExample2{ public static void main(String[] args) { // Create four char primitives ch1, ch2, ch3 and ch4. char ch1, ch2, ch3, ch4; // Assign the values to ch1, ch2, ch3 and ch4. ch1 = 'T'; ch2 = 'k'; ch3 = '
'; ch4 = 'G'; // Create four boolean primitives b1, b2, b3 and b4. boolean b1, b2, b3,b4; // Assign the results to b1, b2, b3 and b4. b1 = Character.isLetter(ch1); b2 = Character.isLowerCase(ch2); b3 = Character.isSpace(ch3); b4 = Character.isDefined(ch3); String str1 = ' The first character is a letter: ' + b1; String str2 = ' The second character is a lower-case: ' + b2; String str3 = ' The third character is for space: ' + b3; String str4 = ' The fourth character is defined in Java identifier: ' + b3; // Print the values of b1, b2, b3 and b4. System.out.println( str1 ); System.out.println( str2 ); System.out.println( str3 ); System.out.println( str3 ); } } 
Izmēģiniet to tagad

Izvade:

 The first character is a letter: true The second character is a lower-case: true The third character has a space: true The third character has a space: true