Scanner vs BufferedReader

lango·2022년 7월 27일
5

자바(Java)

목록 보기
3/4
post-thumbnail

Java로 알고리즘 문제를 푸는 중 Scanner 클래스를 사용했을 때 시간초과가 날 경우 BufferedReader을 사용하여 해결했다.

그런데 Scanner와 BufferedReader에 관해 의문점이 들기 시작했다.

  • 뭐가 어떻게 다르길래 실행시간이 차이가 날까?
  • 무엇을 사용해야 효율적인 코드를 작성할 수 있을까?

이러한 생각을 기억보다는 기록으로 남기고 싶기에 Scanner와 BufferedReader의 역할과 차이점을 알아보려 한다.


Scanner란?

Scanner 클래스는 입력받은 데이터(바이트)를 다양한 타입으로 변환하여 반환하는 클래스이다. 간단하게 기본형과 String 타입을 정규표현식을 사용해 파싱(parse)할 수 있다.

Scanner의 특징

  • java.util 패키지에 속한다. (java.util.Scanner)
  • 공백(띄어쓰기) 및 개행(줄 바꿈)을 기준으로 읽는다.(' ', '\t', '\r', '\n' 등)
  • 원하는 타입으로 읽을 수 있다.
  • 버퍼의 사이즈가 1024byte(1KB) 이다.
  • UnChecked(Runtime) Exception으로 별도로 예외 처리를 명시할 필요가 없다.
  • Thread unsafe 성질을 지니기에 멀티스레드 환경에서 문제가 발생할 수 있다.
  • 데이터를 입력받을 경우 즉시 사용자에게 전송되며 입력받을 때마다 전송되어야 하기에 많은 시간이 소요된다.

BufferedReader란?

데이터를 한번에 읽어와 버퍼에 보관한 후 버퍼에서 데이터를 읽어오는 방식으로 동작하는 클래스이다. 즉 사용자가 입력한 문자 스트림을 읽는 것(read) 라고 한다.

  • 여기서 버퍼(buffer)란?
    데이터를 한 곳에서 다른 한 곳으로 전송하는 동안 일시적으로 해당 데이터를 보관하는 임시 메모리 영역이다. 주로 입출력 속도 향상을 위해 버퍼를 사용한다.
    자바에서는 버퍼를 BufferedReader와 BufferedWriter라는 클래스를 제공하여 다룰 수 있다.

BufferedReader의 특징

  • java.io 패키지에 속한다. (import java.io.BufferedReader)
  • 데이터를 파싱하지 않고 String으로만 읽고 가져온다.
  • 버퍼의 사이즈가 8192byte(8KB)이다.
  • Checked Exception으로 반드시 예외 처리를 명시해야한다.(I/O Exception을 throw하거나 try/catch 해야한다.)
  • Thread safe 성질을 지니기에 멀티스레드 환경에서도 안전하다.
  • 버퍼가 가득차거나 개행문자가 나타나면 버퍼의 내용을 한번에 프로그램으로 전달하기에 Scanner보다 소요되는 시간을 절약할 수 있다.

그럼 먼저 간단하게 Scanner를 작성법을 알아보자.

import java.util.Scanner;
...
Scanner sc = new Scanner(System.in);
String st = sc.nextLine();

위와 같이 System.in을 통해 Scanner 객체를 생성한다.

System.in이란?
사용자로부터 입력을 받기 위한 입력 스트림이다. Scanner 클래스뿐 아니라 다른 입력 클래스들도 System.in을 통해 사용자 입력을 받아야 한다.


다음으로 BufferedReader 작성법도 알아보자.

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.io.IOException;
...
public static void main(String[] args) throws IOException {
  BufferReader br = new BufferedReader(InputStreamReader(System.in));
  String st = br.readLine();

  int a = Integer.parseInt(br.readLine());
  int b = Integer.parseInt(st);
}

위와 같이 BufferedReader는 매개변수로 InputStreamReader를 사용하여 객체를 생성한다.

InputStreamReader 란?
문자 기반의 보조 스트림으로써 바이트 기반 스트림을 문자 기반 스트림으로 연결시켜 주는 역할을 한다.

또한 패키지의 경우 java.io 하위의 BufferedReader, InputStreamReader 와 예외처리를 위한 IOException 를 사용하며 모두 간단히 java.io.* 로 모두 포함할 수 있다.


Scanner와 BufferedReader의 차이점을 비교해보자.

본인은 Scanner는 Parse로써 사용자가 입력한 텍스트를 token 단위로 잘라 특정한 형태로 반환하는 것이며 BufferedReader는 Read로 사용자가 입력한 데이터 자체를 그대로 읽어들이는 것이라고 이해했다.

1. Scanner는 BufferedReader보다 타입에 구애받지 않는다.

  • BufferedReader는 String 형식으로만 읽고 저장하기에 형변환을 위한 추가적인 코드 작성이 불가피한 반면에 Scanner는 원하는 타입으로 읽고 파싱할 수 있다.
  • Scanner의 경우 int, long, short, float, double의 경우 nextInt(),nextLong(),nextShort(),nextFloat(), nextDouble()과 같은 함수들을 사용할 수 있다.
  • 그런데 BufferedReader는 readLine() 함수만을 사용한다.

2. BufferedReader는 Scanner보다 효율적인 메모리 용량을 가진다.

  • BufferedReader의 버퍼 메모리가 8KB로 Scanner의 버퍼 메모리 1KB보다 크기에 많은 입력이 있을 경우 더 효율적이다.
  • 다만, BufferedReader의 경우 일단 큰 메모리를 잡아먹게 된다.

3. BufferedReader는 Scanner보다 안전하다.

  • Scanner는 Thread-unsafe 하기에 멀티스레드 환경에서 안전하지 않지만 BufferedReader는 안전하다.
  • 스레드 간 Scanner는 공유할 수 없지만 BufferedReader는 공유할 수 있다.- 동기화를 지원하는 BufferedReader는 싱글스레드인 Scanner보다 약간 느린데, Scanner의 경우 정규식을 사용하여 입력을 받으므로 BufferedReader가 문자열을 더욱 빠르게 입력받을 수 있다.

4. BufferedReader가 Scanner보다 실행 속도가 빠르다.

  • 백준에서 작성된 입력속도 비교표를 확인해보면 BufferedReader는 0.68585초, Scanner는 4.8448초가 소요되며 둘의 시간차이가 생각보다 크다.

  • 왜 빠를까? 여기선 CPU를 고려해야 하는데 문자가 입력될 때마다 CPU가 하나하나 입출력을 하는 것보다 버퍼에 어느정도 쌓아두고 가득차거나 개행이 일어날 때마다 입출력을 처리하는 것이 훨씬 효율적이다.

속도차이가 얼마나 날까?

그럼 Scanner와 BufferedReader의 예제를 작성해보고 실행속도 차이를 몸소 느껴보자.
간단한 A와 B 두 수의 합을 구하는 백준 1000번 문제를 풀어보았다.

먼저 Scanner를 사용해서 풀어보았다.

import java.util.Scanner;

public class Main{
    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);
        int a = sc.nextInt();
        int b = sc.nextInt();
        int sum = a + b;
        System.out.println(sum);
        sc.close();
    }
}

Scanner 객체를 생성해서 nextInt()함수를 통해 a와 b를 입력받아 합을 구했다.

그리고 BufferedReader로도 풀어보았다.

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.StringTokenizer;

public class Main{
    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        String s = br.readLine();
        StringTokenizer st = new StringTokenizer(s);
        int a = Integer.parseInt(st.nextToken());  
        int b = Integer.parseInt(st.nextToken());
        System.out.println(a+b);
        br.close();       
    }
}

BufferedReader를 객체를 생성하고 한줄 단위로 처리할 수 있는 readLine() 함수를 통해 s에 저장한 뒤 StringTokenizer 객체를 사용하여 a와 b에 공백을 기준으로 나누어 저장한뒤 합을 구했다.

StringTokenizer 란?
문자열을 지정한 구분자로 문자열을 쪼개주는 클래스이다.
그렇게 쪼개어진 문자열을 우리는 토큰(token)이라고 부른다.
java.util.StringTokenizer 라이브러리를 import해야 사용할 수 있다.


Scanner 실행시간

BufferedReader 실행시간

Scanner를 사용했을 경우 212ms, BufferedReader는 124ms로 BufferedReader의 코드길이가 더 김에도 빠른 속도를 보여주었다.

다만 메모리의 경우 Scanner가 17704KB, BufferedReader가 14188KB로 큰 차이는 나지 않았다. 이를 통해 적은 입력값에는 Scanner를 사용해도 무관할 것으로 생각이 들었다.


final..

상황에 따라 Scanner와 BufferedReader를 적절히 사용해야 겠지만 속도 차이가 영향을 주게되는 경우엔 BufferedReader를 사용하여 코드를 작성해야겠다.

원래 입출력과 관련해서 BufferedReader와 세트 메뉴처럼 다루는 BufferedWriter와 Sout에 대해서도 함께 다루고 싶었다.

예를 들어 BufferedReader/BufferedWriter VS Scanner/Sout 별로 비교도 따로 해보고 싶었지만 포스팅이 길어질 것 같아 추후에 다뤄보려 한다.

profile
찍어 먹기보단 부어 먹기를 좋아하는 개발자

2개의 댓글

comment-user-thumbnail
2024년 1월 4일

int값 받는 상황에서 scanner가 더빠를때도 있나요? int.parseint(br.readline)로 72ms였는데 sc.nextint로 68ms로 해결한분 있네요

1개의 답글