운영중인 서비스에서 XML Parsing 시 유니코드 에러가 발생하였다.
해당 데이터를 찾아보니 처음 보는 유니코드였다.
해당 유니코드를 확인해보니 <BS\>
, Backspace 였다.
유니코드 값 | 이름 | 형식화된 이름(Format name) |
---|---|---|
\u0009 | Tab | <TAB> |
\u000B | Vertical Tab | <VT> |
\u000C | Form Feed | <FF> |
\u0020 | Space | <SP> |
\u000A | Line Feed | <LF> |
\u000D | Carriage Return | <CR> |
\u0008 | Backspace | <BS> |
\u0009 | Horizontal Tab | <HT> |
\u0022 | Double Quote | " |
\u0027 | Single Quote | ' |
\u005C | Backslash | | |
xmlString = xmlString.replaceAll("[^\\u0009\\u000A\\u000D\\u0020-\\uD7FF\\uE000-\\uFFFD\\u10000-\\u10FFF]+", "");