isSpaceChar(int codePoint)
isSpaceChar(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) é um caractere de espaço Unicode.
public static boolean isSpaceChar(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) é um caractere de espaço Unicode. Um caractere é considerado um caractere de espaço se e somente se for especificado como um caractere de espaço pelo Padrão Unicode. Este método retorna true se o tipo de categoria geral do personagem for um dos seguintes:
Parâmetros:
codePoint – o caractere (ponto de código Unicode) a ser testado.
Retorno:
true se o caractere é um caractere de espaço; false caso contrário.
Esse método existe desde a versão 1.5.
Veja também:
Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/2440__Character.isSpaceChar_int_codePoint_.htm
1 2 3 4 5 6 7 8 9 10 11 12 13 |
public class Main { /* w w w . j av a 2 s . c o m*/ public static void main(String[] args) { int cp1 = 0x2029; // PARAGRAPH_SEPARATOR int cp2 = 0x1010; boolean b1 = Character.isSpaceChar(cp1); boolean b2 = Character.isSpaceChar(cp2); System.out.println( "cp1 represents a space character is " + b1 ); System.out.println( "cp2 represents a space character is " + b2 ); } } |
isSupplementaryCodePoint(int codePoint)
isSupplementaryCodePoint(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) está no intervalo de caracteres suplementares.
public static boolean isSupplementaryCodePoint(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) está no intervalo de caracteres suplementares.
Parâmetros:
codePoint – o caractere (ponto de código Unicode) a ser testado
Retorno:
true se o ponto de código especificado estiver entre MIN_SUPPLEMENTARY_CODE_POINT e MAX_CODE_POINT, inclusive; false caso contrário.
Esse método existe desde a versão 1.5.
Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/2460__Character.isSupplementaryCodePoint_int_codePoint_.htm
1 2 3 4 5 6 7 8 9 10 11 12 |
public class Main { // ww w. j ava2 s .c o m public static void main(String[] args) { int cp1 = 0x0065, cp2 = 0x0abcd; boolean b1 = Character.isSupplementaryCodePoint(cp1); boolean b2 = Character.isSupplementaryCodePoint(cp2); System.out.println( b1 ); System.out.println( b2 ); } } |
isSurrogate(char ch)
isSurrogate(char ch) – Determina se o valor do caractere especificado é uma unidade de código substituto Unicode.
public static boolean isSurrogate(char ch) – Determina se o valor do caractere especificado é uma unidade de código substituto Unicode.
Esses valores não representam caracteres sozinhos, mas são usados na representação de caracteres suplementares na codificação UTF-16.
Um valor de char é uma unidade de código substituto se e somente se for uma unidade de código substituto baixo ou uma unidade de código substituto alto.
Parâmetros:
ch – o valor do char a ser testado.
Retorno:
true se o valor do char estiver entre MIN_SURROGATE e MAX_SURROGATE, inclusive; false caso contrário.
Esse método existe desde a versão 1.7.
Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/Java_Character_isSurrogate_char_ch_.htm
1 2 3 4 5 6 7 8 9 10 11 |
public class Main{ public static void main(String[] args) { for(char ch = Character.MIN_VALUE;ch<Character.MAX_VALUE;ch++){ if(Character.isSurrogate(ch)){ String s = String.format ("\\u%04x", (int)ch); System.out.println(s);/*from ww w . j a v a 2 s . c o m*/ } } } } |
isSurrogatePair(char high, char low)
isSurrogatePair(char high, char low) – Determina se o par especificado de valores de caracteres é um par substituto Unicode válido.
public static boolean isSurrogatePair(char high, char low) – Determina se o par especificado de valores de caracteres é um par substituto Unicode válido.
Este método é equivalente à expressão:
1 |
isHighSurrogate(high) && isLowSurrogate(low) |
Parâmetros:
alto – o valor do código substituto alto a ser testado
baixo – o valor do código substituto baixo a ser testado
Retorno:
true se os valores altos e baixos do código substituto representam um par substituto válido; false caso contrário.
Esse método existe desde a versão 1.5.
Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/2500__Character.isSurrogatePair_char_high_char_low_.htm
1 2 3 4 5 6 |
public class Main { public static void main(String[] args) { System.out.println( "A valid Unicode surrogate pair: " + Character.isSurrogatePair('\ud800', '\udc00') ); } } |
isTitleCase(char ch)
isTitleCase(char ch) – Determina se o caractere especificado é um caractere de titlecase.
public static boolean isTitleCase(char ch) – Determina se o caractere especificado é um caractere de titlecase.
Um caractere é um caractere de titlecase se seu tipo de categoria geral, fornecido por Character.getType (ch), for TITLECASE_LETTER.
Alguns caracteres parecem pares de letras latinas. Por exemplo, há uma letra maiúscula que se parece com “LJ” e tem uma letra minúscula correspondente que se parece com “lj”. Uma terceira forma, que se parece com “Lj”, é a forma apropriada a ser usada ao renderizar uma palavra em letras minúsculas com maiúsculas iniciais, como no título de um livro.
Estes são alguns dos caracteres Unicode para os quais esse método retorna verdadeiro:
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Muitos outros caracteres Unicode também são titlecase.
Nota: Este método não pode manipular caracteres suplementares. Para oferecer suporte a todos os caracteres Unicode, incluindo caracteres suplementares, use o método isTitleCase (int).
Parâmetros:
ch – o personagem a ser testado.
Retorno:
true se o personagem for titlecase; false caso contrário.
Esse método existe desde a versão 1.0.2.
Veja também:
isLowerCase(char)
, isUpperCase(char)
, toTitleCase(char)
, getType(char)
Fonte do código: http://www.java2s.com/example/java-api/java/lang/character/istitlecase-1-0.html
1 2 3 4 5 6 7 |
public static void main(String[] args) { String str1 = "A titlecase character:" + Character.isTitleCase(0x01c8); String str2 = "A titlecase character:" + Character.isTitleCase(0x1f09); System.out.println(str1);//from w w w. ja v a 2 s.c om System.out.println(str2); } |
isTitleCase(int codePoint)
isTitleCase(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) é um caractere de titlecase.
public static boolean isTitleCase(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) é um caractere de titlecase.
Um caractere é um caractere de titlecase se seu tipo de categoria geral, fornecido por getType (codePoint), for TITLECASE_LETTER.
Alguns caracteres parecem pares de letras latinas. Por exemplo, há uma letra maiúscula que se parece com “LJ” e tem uma letra minúscula correspondente que se parece com “lj”. Uma terceira forma, que se parece com “Lj”, é a forma apropriada a ser usada ao renderizar uma palavra em letras minúsculas com maiúsculas iniciais, como no título de um livro.
Estes são alguns dos caracteres Unicode para os quais esse método retorna verdadeiro:
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Muitos outros caracteres Unicode também são titlecase.
Parâmetros:
codePoint – o caractere (ponto de código Unicode) a ser testado.
Retorno:
true se o personagem for titlecase; false caso contrário.
Esse método existe desde a versão 1.5.
Veja também:
isLowerCase(int)
, isUpperCase(int)
, toTitleCase(int)
, getType(int)
Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/2540__Character.isTitleCase_int_codePoint_.htm
1 2 3 4 5 6 7 8 9 10 |
public class Main { /*from w w w. j ava2 s .com*/ public static void main(String[] args) { String str1 = "A titlecase character:" + Character.isTitleCase(0x01c8); String str2 = "A titlecase character:" + Character.isTitleCase(0x1f09); System.out.println( str1 ); System.out.println( str2 ); } } |
isUnicodeIdentifierPart(char ch)
isUnicodeIdentifierPart(char ch) – Determina se o caractere especificado pode fazer parte de um identificador Unicode como outro que não o primeiro caractere.
public static boolean isUnicodeIdentifierPart(char ch) – Determina se o caractere especificado pode fazer parte de um identificador Unicode como outro que não o primeiro caractere.
Um caractere pode fazer parte de um identificador Unicode se, e somente se, uma das seguintes instruções for verdadeira:
- é uma letra
- é um caractere de pontuação de conexão (como ‘_’)
- é um dígito
- é uma letra numérica (como um caractere de número romano)
- é uma marca combinada
- é uma marca sem espaçamento
- isIdentifierIgnorable retorna true para esse caractere.
- é um caractere Other_ID_Start.
- é um caractere Other_ID_Continue.
Este método está em conformidade com o UAX31-R1: Requisito de Identificadores Padrão do Padrão Unicode, com o seguinte perfil do UAX31:
1 2 3 |
Continue := Start + ID_Continue + ignorable Medial := empty ignorable := isIdentifierIgnorable(char) returns true for the character |
ignorable é adicionado a Continue para compatibilidade com versões anteriores.
Nota: Este método não pode manipular caracteres suplementares. Para oferecer suporte a todos os caracteres Unicode, incluindo caracteres suplementares, use o método isUnicodeIdentifierPart (int).
Parâmetros:
ch – o personagem a ser testado.
Retorno:
true se o caractere puder fazer parte de um identificador Unicode; false caso contrário.
Esse método existe desde a versão 1.1.
Veja também:
isIdentifierIgnorable(char)
, isJavaIdentifierPart(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierStart(char)
Fonte do código: http://www.java2s.com/Code/JavaAPI/java.lang/CharacterisUnicodeIdentifierPartcharch.htm
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 |
public class Main { public static void main(String[] args) throws java.io.IOException { char c = 'a'; System.out.println("Character = " + (int) c); System.out.println("Defined = " + Character.isDefined(c)); System.out.println("Digit = " + Character.isDigit(c)); System.out.println("Ignorable = " + Character.isIdentifierIgnorable(c)); System.out.println("ISO control = " + Character.isISOControl(c)); System.out.println("Java identifier part = " + Character.isJavaIdentifierPart(c)); System.out.println("Java identifier start = " + Character.isJavaIdentifierStart(c)); System.out.println("Letter = " + Character.isLetter(c)); System.out.println("Letter or digit = " + Character.isLetterOrDigit(c)); System.out.println("Lowercase = " + Character.isLowerCase(c)); System.out.println("Space = " + Character.isSpaceChar(c)); System.out.println("Titlecase = " + Character.isTitleCase(c)); System.out.println("Unicode identifier part = " + Character.isUnicodeIdentifierPart(c)); System.out.println("Unicode identifier start = " + Character.isUnicodeIdentifierStart(c)); System.out.println("Uppercase = " + Character.isUpperCase(c)); System.out.println("White space = " + Character.isWhitespace(c)); byte[] types = { Character.COMBINING_SPACING_MARK, Character.CONNECTOR_PUNCTUATION, Character.CONTROL, Character.CURRENCY_SYMBOL, Character.DASH_PUNCTUATION, Character.DECIMAL_DIGIT_NUMBER, Character.ENCLOSING_MARK, Character.END_PUNCTUATION, Character.FORMAT, Character.LETTER_NUMBER, Character.LINE_SEPARATOR, Character.LOWERCASE_LETTER, Character.MATH_SYMBOL, Character.MODIFIER_SYMBOL, Character.NON_SPACING_MARK, Character.OTHER_LETTER, Character.OTHER_NUMBER, Character.OTHER_PUNCTUATION, Character.OTHER_SYMBOL, Character.PARAGRAPH_SEPARATOR, Character.PRIVATE_USE, Character.SPACE_SEPARATOR, Character.START_PUNCTUATION, Character.SURROGATE, Character.TITLECASE_LETTER, Character.UNASSIGNED, Character.UPPERCASE_LETTER }; String[] typeNames = { "Combining spacing mark", "Connector punctuation", "Control", "Currency symbol", "Dash punctuation", "Decimal digit number", "Enclosing mark", "End punctuation", "Format", "Letter number", "Line separator", "Lowercase letter", "Math symbol", "Modifier symbol", "Non spacing mark", "Other letter", "Other number", "Other punctuation", "Other symbol", "Paragraph separator", "Private use", "Space separator", "Start punctuation", "Surrogate", "Titlecase letter", "Unassigned", "Uppercase letter" }; int type = Character.getType(c); for (int i = 0; i < types.length; i++) if (type == types[i]) { System.out.println("Type name = " + typeNames[i]); break; } System.out.println("Unicode block = " + Character.UnicodeBlock.of(c)); } } |
isUnicodeIdentifierPart(int codePoint)
isUnicodeIdentifierPart(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) pode fazer parte de um identificador Unicode como outro que não o primeiro caractere.
public static boolean isUnicodeIdentifierPart(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) pode fazer parte de um identificador Unicode como outro que não o primeiro caractere.
Um caractere pode fazer parte de um identificador Unicode se, e somente se, uma das seguintes instruções for verdadeira:
é uma letra
é um caractere de pontuação de conexão (como ‘_’)
é um dígito
é uma letra numérica (como um caractere de número romano)
é uma marca combinada
é uma marca sem espaçamento
isIdentifierIgnorable retorna true para esse caractere.
é um caractere Other_ID_Start.
é um caractere Other_ID_Continue.
Este método está em conformidade com o UAX31-R1: Requisito de Identificadores Padrão do Padrão Unicode, com o seguinte perfil do UAX31:
1 2 3 |
Continue := Start + ID_Continue + ignorable Medial := empty ignorable := isIdentifierIgnorable(int) returns true for the character |
ignorable é adicionado a Continue para compatibilidade com versões anteriores.
Parâmetros:
codePoint – o caractere (ponto de código Unicode) a ser testado.
Retorno:
true se o caractere puder fazer parte de um identificador Unicode; false caso contrário.
Esse método existe desde a versão 1.5.
Veja também:
isIdentifierIgnorable(int)
, isJavaIdentifierPart(int)
, isLetterOrDigit(int)
, isUnicodeIdentifierStart(int)
Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/Java_Character_isUnicodeIdentifierPart_int_codePoint_.htm
1 2 3 4 5 6 7 8 9 10 11 12 13 |
public class Main { // www.jav a2s . co m public static void main(String[] args) { int cp1 = 0x053e; // represents ARMENIAN CAPITAL LETTER CA int cp2 = 0x0040; // represents @ boolean b1 = Character.isUnicodeIdentifierPart(cp1); boolean b2 = Character.isUnicodeIdentifierPart(cp2); System.out.println( b1 ); System.out.println( b2 ); } } |
isUnicodeIdentifierStart(char ch)
isUnicodeIdentifierStart(char ch) – Determina se o caractere especificado é permitido como o primeiro caractere em um identificador Unicode.
public static boolean isUnicodeIdentifierStart(char ch) – Determina se o caractere especificado é permitido como o primeiro caractere em um identificador Unicode.
Um caractere pode iniciar um identificador Unicode se, e somente se, uma das seguintes condições for verdadeira:
isLetter(ch)
returnstrue
getType(ch)
returnsLETTER_NUMBER
.- it is an
Other_ID_Start
character.
Este método está em conformidade com o UAX31-R1: Requisito de Identificadores Padrão do Padrão Unicode, com o seguinte perfil do UAX31:
1 |
Start := ID_Start + 'VERTICAL TILDE' (U+2E2F) |
‘VERTICAL TILDE’ é adicionado ao Start para compatibilidade com versões anteriores.
Nota: Este método não pode manipular caracteres suplementares. Para oferecer suporte a todos os caracteres Unicode, incluindo caracteres suplementares, use o método isUnicodeIdentifierStart (int).
Parâmetros:
ch – o personagem a ser testado.
Retorno:
true se o caractere pode iniciar um identificador Unicode; false caso contrário.
Esse método existe desde a versão 1.1.
Veja também:
isJavaIdentifierStart(char)
, isLetter(char)
, isUnicodeIdentifierPart(char)
Fonte do código: http://www.java2s.com/Code/JavaAPI/java.lang/CharacterisUnicodeIdentifierStartcharch.htm
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 |
public class Main { public static void main(String[] args) throws java.io.IOException { char c = 'a'; System.out.println("Character = " + (int) c); System.out.println("Defined = " + Character.isDefined(c)); System.out.println("Digit = " + Character.isDigit(c)); System.out.println("Ignorable = " + Character.isIdentifierIgnorable(c)); System.out.println("ISO control = " + Character.isISOControl(c)); System.out.println("Java identifier part = " + Character.isJavaIdentifierPart(c)); System.out.println("Java identifier start = " + Character.isJavaIdentifierStart(c)); System.out.println("Letter = " + Character.isLetter(c)); System.out.println("Letter or digit = " + Character.isLetterOrDigit(c)); System.out.println("Lowercase = " + Character.isLowerCase(c)); System.out.println("Space = " + Character.isSpaceChar(c)); System.out.println("Titlecase = " + Character.isTitleCase(c)); System.out.println("Unicode identifier part = " + Character.isUnicodeIdentifierPart(c)); System.out.println("Unicode identifier start = " + Character.isUnicodeIdentifierStart(c)); System.out.println("Uppercase = " + Character.isUpperCase(c)); System.out.println("White space = " + Character.isWhitespace(c)); byte[] types = { Character.COMBINING_SPACING_MARK, Character.CONNECTOR_PUNCTUATION, Character.CONTROL, Character.CURRENCY_SYMBOL, Character.DASH_PUNCTUATION, Character.DECIMAL_DIGIT_NUMBER, Character.ENCLOSING_MARK, Character.END_PUNCTUATION, Character.FORMAT, Character.LETTER_NUMBER, Character.LINE_SEPARATOR, Character.LOWERCASE_LETTER, Character.MATH_SYMBOL, Character.MODIFIER_SYMBOL, Character.NON_SPACING_MARK, Character.OTHER_LETTER, Character.OTHER_NUMBER, Character.OTHER_PUNCTUATION, Character.OTHER_SYMBOL, Character.PARAGRAPH_SEPARATOR, Character.PRIVATE_USE, Character.SPACE_SEPARATOR, Character.START_PUNCTUATION, Character.SURROGATE, Character.TITLECASE_LETTER, Character.UNASSIGNED, Character.UPPERCASE_LETTER }; String[] typeNames = { "Combining spacing mark", "Connector punctuation", "Control", "Currency symbol", "Dash punctuation", "Decimal digit number", "Enclosing mark", "End punctuation", "Format", "Letter number", "Line separator", "Lowercase letter", "Math symbol", "Modifier symbol", "Non spacing mark", "Other letter", "Other number", "Other punctuation", "Other symbol", "Paragraph separator", "Private use", "Space separator", "Start punctuation", "Surrogate", "Titlecase letter", "Unassigned", "Uppercase letter" }; int type = Character.getType(c); for (int i = 0; i < types.length; i++) if (type == types[i]) { System.out.println("Type name = " + typeNames[i]); break; } System.out.println("Unicode block = " + Character.UnicodeBlock.of(c)); } } |
isUnicodeIdentifierStart(int codePoint)
isUnicodeIdentifierStart(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) é permitido como o primeiro caractere em um identificador Unicode.
public static boolean isUnicodeIdentifierStart(int codePoint) – Determina se o caractere especificado (ponto de código Unicode) é permitido como o primeiro caractere em um identificador Unicode.
Um caractere pode iniciar um identificador Unicode se, e somente se, uma das seguintes condições for verdadeira:
isLetter(codePoint)
returnstrue
getType(codePoint)
returnsLETTER_NUMBER
.- it is an
Other_ID_Start
character.
Este método está em conformidade com o UAX31-R1: Requisito de Identificadores Padrão do Padrão Unicode, com o seguinte perfil do UAX31:
1 |
Start := ID_Start + 'VERTICAL TILDE' (U+2E2F) |
‘VERTICAL TILDE’ é adicionado ao Start para compatibilidade com versões anteriores.
Parâmetros:
codePoint – o caractere (ponto de código Unicode) a ser testado.
Retorno:
true se o caractere pode iniciar um identificador Unicode; false caso contrário.
Esse método existe desde a versão 1.5.
Veja também:
isJavaIdentifierStart(int)
, isLetter(int)
, isUnicodeIdentifierPart(int)
Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/Java_Character_isUnicodeIdentifierStart_int_codePoint_.htm
1 2 3 4 5 6 7 8 9 10 11 12 |
public class Main { public static void main(String[] args) { int cp1 = 0x037e; // represents GREEK QUESTION MARK int cp2 = 0x05d1; // represents HEBREW LETTER BET //from w ww. j av a 2 s .c om boolean b1 = Character.isUnicodeIdentifierStart(cp1); boolean b2 = Character.isUnicodeIdentifierStart(cp2); System.out.println( b1 ); System.out.println( b2 ); } } |
Fonte: https://docs.oracle.com/en/java/javase/14/docs/api/java.base/java/lang/Character.htm
Deixe um comentário