Classe Character #2

Table of Contents

Classes Aninhadas

Character.Subset

Character.Subset – Instâncias desta classe representam subconjuntos específicos do conjunto de caracteres Unicode.

Fonte do código: https://www.geeksforgeeks.org/java-lang-character-subset-class-java/

import java.lang.*; 
  
public class CharacterSubsetDemo extends Character.Subset  
{ 
   CharacterSubsetDemo(String s)  
   { 
      // Use of super keyword :  
      // Invokes immediate parent class constructor. 
      super(s);  
   } 
  
   public static void main(String[] args)  
   { 
      // Initializing two Subsets. 
      CharacterSubsetDemo a = new CharacterSubsetDemo("geeks"); 
      CharacterSubsetDemo b = new CharacterSubsetDemo("for"); 
  
      // use of equals() :  
      boolean check2 = a.equals(a); 
      System.out.println("Is a equals a ? : " + check2); 
      check2 = b.equals(a); 
      System.out.println("Is b equals a ? : " + check2); 
      System.out.println(); 
        
      // Use of hashCode() :  
      int check1 = a.hashCode(); 
      System.out.println("hashCode " + a + " : " + check1); 
      check1 = b.hashCode(); 
      System.out.println("hashCode " + b + " : " + check1); 
      System.out.println(); 
        
      // Use of toString() :  
      System.out.println("a : " + a.toString()); 
      System.out.println("b : " + b.toString()); 
   } 
}

import java.lang.*;

public class CharacterSubsetDemo extends Character.Subset

{

CharacterSubsetDemo(String s)

{

// Use of super keyword :

// Invokes immediate parent class constructor.

super(s);

}

public static void main(String[] args)

{

// Initializing two Subsets.

CharacterSubsetDemo a = new CharacterSubsetDemo("geeks");

CharacterSubsetDemo b = new CharacterSubsetDemo("for");

// use of equals() :

boolean check2 = a.equals(a);

System.out.println("Is a equals a ? : " + check2);

check2 = b.equals(a);

System.out.println("Is b equals a ? : " + check2);

System.out.println();

// Use of hashCode() :

int check1 = a.hashCode();

System.out.println("hashCode " + a + " : " + check1);

check1 = b.hashCode();

System.out.println("hashCode " + b + " : " + check1);

System.out.println();

// Use of toString() :

System.out.println("a : " + a.toString());

System.out.println("b : " + b.toString());

}

Character.UnicodeBlock

Character.UnicodeBlock – Uma família de subconjuntos de caracteres que representam os blocos de caracteres na especificação Unicode.

Fonte do código: https://stackoverflow.com/questions/1499804/how-can-i-detect-japanese-text-in-a-java-string

private boolean isCharCJK(final char c) {
    if ((Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS)
            || (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A)
            || (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B)
            || (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_COMPATIBILITY_FORMS)
            || (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS)
            || (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_RADICALS_SUPPLEMENT)
            || (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION)
            || (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.ENCLOSED_CJK_LETTERS_AND_MONTHS)) {
        return true;
    }
    return false;
}

private boolean isCharCJK(final char c) {

if ((Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS)

|| (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A)

|| (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B)

|| (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_COMPATIBILITY_FORMS)

|| (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS)

|| (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_RADICALS_SUPPLEMENT)

|| (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION)

|| (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.ENCLOSED_CJK_LETTERS_AND_MONTHS)) {

return true;

}

return false;

}

Character.UnicodeScript

Character.UnicodeScript – Uma família de subconjuntos de caracteres que representam os scripts de caracteres definidos no Anexo # 24 do Padrão Unicode: Nomes de Scripts.

Campos

BYTES

BYTES – O número de bytes usados para representar um valor de char no formato binário não assinado.

public static final int BYTES – O número de bytes usados para representar um valor de char no formato binário não assinado.

Esse campo existe desde a versão 1.8.

Veja também:

Constant Field Values

COMBINING_SPACING_MARK

COMBINING_SPACING_MARK – Categoria geral “Mc” na especificação Unicode.

public static final byte COMBINING_SPACING_MARK – Categoria geral “Mc” na especificação Unicode.

Esse campo existe desde a versão 1.1.

Veja também:

Constant Field Values

Fonte do código: https://stackoverflow.com/questions/29110887/detect-any-combining-character-in-java

String codePointStr = new String(new byte[]{(byte) 0xe1, (byte) 0x9f, (byte) 0x80}, "UTF-8"); // unicode 17c0
System.out.println(codePointStr.matches("\\p{Mc}"));
System.out.println(
    Character.COMBINING_SPACING_MARK == Character.getType(codePointStr.codePointAt(0)));

String codePointStr = new String(new byte[]{(byte) 0xe1, (byte) 0x9f, (byte) 0x80}, "UTF-8"); // unicode 17c0

System.out.println(codePointStr.matches("\\p{Mc}"));

System.out.println(

Character.COMBINING_SPACING_MARK == Character.getType(codePointStr.codePointAt(0)));

CONNECTOR_PUNCTUATION

CONNECTOR_PUNCTUATION – Categoria geral “Pc” na especificação Unicode.

public static final byte CONNECTOR_PUNCTUATION – Categoria geral “Pc” na especificação Unicode.

Esse método existe desde a versão 1.1.

Veja também:

Constant Field Values

CONTROL

CONTROL – Categoria geral “Cc” na especificação Unicode.

public static final byte CONTROL – Categoria geral “Cc” na especificação Unicode.

Esse método existe desde a versão 1.1.

Veja também:

Constant Field Values

CURRENCY_SYMBOL

CURRENCY_SYMBOL – Categoria geral “Sc” na especificação Unicode.

public static final byte CURRENCY_SYMBOL – Categoria geral “Sc” na especificação Unicode.

Esse método existe desde a versão 1.1.

Veja também:

Constant Field Values

Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/Java_Character_CURRENCY_SYMBOL.htm

public class Main{
   public static void main(String[] args) {
     for(char ch = Character.MIN_VALUE;ch&lt;Character.MAX_VALUE;ch++){
       if(Character.CURRENCY_SYMBOL == Character.getType(ch)){
         String s = String.format ("\\u%04x", (int)ch);
         System.out.println(s);
       }
     }
   }
}

public class Main{

public static void main(String[] args) {

for(char ch = Character.MIN_VALUE;ch<Character.MAX_VALUE;ch++){

if(Character.CURRENCY_SYMBOL == Character.getType(ch)){

String s = String.format ("\\u%04x", (int)ch);

System.out.println(s);

}

DASH_PUNCTUATION

DASH_PUNCTUATION – Categoria geral “Pd” na especificação Unicode.

public static final byte DASH_PUNCTUATION – Categoria geral “Pd” na especificação Unicode.

Esse método existe desde a versão 1.1.

Veja também:

Constant Field Values

Fonte do código: http://www.java2s.com/Tutorials/Java/java.lang/Character/0120__Character.DASH_PUNCTUATION.htm

<strong>public</strong> <strong>class</strong> Main{
   <strong>public</strong> <strong>static</strong> <strong>void</strong> main(String[] args) {
     <strong>for</strong>(<strong>char</strong> ch = Character.MIN_VALUE;ch&lt;Character.MAX_VALUE;ch++){
       <strong>if</strong>(Character.DASH_PUNCTUATION == Character.getType(ch)){
         String s = String.format (<strong>"\\u%04x"</strong>, (<strong>int</strong>)ch);
         System.out.println(s);/*from ww w .  j  a v  a 2  s  .c om*/
       }
     }
   }
}

public class Main{

public static void main(String[] args) {

for(char ch = Character.MIN_VALUE;ch<Character.MAX_VALUE;ch++){

if(Character.DASH_PUNCTUATION == Character.getType(ch)){

String s = String.format ("\\u%04x", (int)ch);

System.out.println(s);/*from ww w . j a v a 2 s .c om*/

}

DECIMAL_DIGIT_NUMBER

DECIMAL_DIGIT_NUMBER – Categoria geral “Nd” na especificação Unicode.

public static final byte DECIMAL_DIGIT_NUMBER – Categoria geral “Nd” na especificação Unicode.

Esse método existe desde a versão 1.1.

Veja também:

Constant Field Values

Fonte: https://docs.oracle.com/en/java/javase/14/docs/api/java.base/java/lang/Character.html

Classes Aninhadas

Character.Subset

Character.UnicodeBlock

Character.UnicodeScript

Campos

BYTES

COMBINING_SPACING_MARK

CONNECTOR_PUNCTUATION

CONTROL

CURRENCY_SYMBOL

DASH_PUNCTUATION

DECIMAL_DIGIT_NUMBER

Separadores

Animation

Linguagens de Programação são Necessárias para se Comunicar com um Computador

Para enviar seu comentário, preencha os campos abaixo:

Deixe um comentário Cancelar resposta

Seja o primeiro a comentar!

Damos valor à sua privacidade

Cookies estritamente necessários

Cookies de desempenho

Cookies de funcionalidade

Cookies de publicidade