sourcecode

영숫자가 아닌 모든 문자를 빈 문자열로 바꾸기

copyscript 2022. 7. 23. 13:55
반응형

영숫자가 아닌 모든 문자를 빈 문자열로 바꾸기

이걸 써보려고 했는데 안 되더라고요.

return value.replaceAll("/[^A-Za-z0-9 ]/", "");

사용하다[^A-Za-z0-9].

주의: 보통 영숫자로 간주되지 않기 때문에 공간을 삭제했습니다.

해라

return value.replaceAll("[^A-Za-z0-9]", "");

또는

return value.replaceAll("[\\W]|_", "");

알아두셔야 합니다.[^a-zA-Z]는, 문자 범위 A~Z/a~z 이외의 문자를 치환합니다.그 말은 그런 특수 캐릭터들을 뜻이죠.é,ß기타 문자 또는 키릴 문자 등이 제거됩니다.

이러한 문자의 치환을 원하지 않는 경우는, 대신에 사전 정의된 문자 클래스를 사용합니다.

 str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");

PS:\p{Alnum}이 효과를 얻을 수 없습니다.동일한 동작으로 동작합니다.[A-Za-z0-9].

return value.replaceAll("[^A-Za-z0-9 ]", "");

이렇게 하면 공백이 그대로 남습니다.그게 네가 원하는 거겠지그렇지 않으면 regex에서 공간을 제거합니다.

다음과 같은 간단한 regex를 사용할 수도 있습니다.

 str = str.replaceAll("\\P{Alnum}", "");

Java 정규 표현식에서는 슬래시를 넣을 필요가 없습니다./또는 Perl 등의 다른 언어와는 달리 regex 주변의 다른 딜리미터를 지정합니다.

솔루션:

value.replaceAll("[^A-Za-z0-9]", "")

설명:

[^abc]캐럿의 경우^는 각 괄호 안의 첫 번째 문자로 나타나며 패턴을 부정합니다.이 패턴은 a, b 또는 c를 제외한 모든 문자와 일치합니다.

키워드를 다음의 2개의 함수로 참조합니다.

  • [(Pattern)] = match(Pattern)
  • [^(Pattern)] = notMatch(Pattern)

게다가 패턴에 대해서:

  • A-Z = all characters included from A to Z

  • a-z = all characters included from a to z

  • 0=9 = all characters included from 0 to 9

따라서 패턴에 포함되지 않은 모든 문자를 대체합니다.

파일명을 작성하기 위해 다음과 같은 방법을 만들었습니다.

public static String safeChar(String input)
{
    char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
    char[] charArray = input.toString().toCharArray();
    StringBuilder result = new StringBuilder();
    for (char c : charArray)
    {
        for (char a : allowed)
        {
            if(c==a) result.append(a);
        }
    }
    return result.toString();
}

독일어 umlaut 등 ASCII 문자 세트에 속하지 않는 영숫자도 사용할 수 있도록 하는 경우는, 다음의 솔루션을 검토해 주세요.

 String value = "your value";

 // this could be placed as a static final constant, so the compiling is only done once
 Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);

 value = pattern.matcher(value).replaceAll("");

UNICODE_CARTER_CLASS 플래그를 사용하면 성능 저하가 발생할 수 있습니다(이 플래그의 javadoc 참조).

Guava를 사용하면 다양한 기준을 쉽게 조합할 수 있습니다.특정 솔루션에 대해 다음을 사용할 수 있습니다.

value = CharMatcher.inRange('0', '9')
        .or(CharMatcher.inRange('a', 'z')
        .or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)

간단한 방법:

public boolean isBlank(String value) {
    return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}

public String normalizeOnlyLettersNumbers(String str) {
    if (!isBlank(str)) {
        return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
    } else {
        return "";
    }
}
public static void main(String[] args) {
    String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";

    System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));

}

출력: ChlamydiasppIgGIgMIgAAbs8006

Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java

Guava의 CharMatcher는 다음과 같은 간결한 솔루션을 제공합니다.

output = CharMatcher.javaLetterOrDigit().retainFrom(input);

언급URL : https://stackoverflow.com/questions/1805518/replacing-all-non-alphanumeric-characters-with-empty-strings

반응형