Switch IR(LLVM), Pass

안상준·2025년 5월 9일

LLVM

목록 보기
6/12
post-thumbnail

Switch문을 LLVM으로 변환하기

C 코드

#include <stdio.h>
void main() {
    int n;
    scanf("%d", &n);
    switch(n) {
        case 0: printf("0");
        break;
        case 1: printf("1");
        break;
        case 2: printf("2");
        break;
        default:
        printf("default");
        break;        
    }
}

LLVM IR


이를 clang으로 컴파일 하여 .ll 파일을 생성해 주었다.

; ModuleID = 'switch.c'
source_filename = "switch.c"
target datalayout = "e-m:e-p270:32:32-p271:32:32-p272:64:64-i64:64-i128:128-f80:128-n8:16:32:64-S128"
target triple = "x86_64-unknown-linux-gnu"

@.str = private unnamed_addr constant [3 x i8] c"%d\00", align 1
@.str.1 = private unnamed_addr constant [2 x i8] c"0\00", align 1
@.str.2 = private unnamed_addr constant [2 x i8] c"1\00", align 1
@.str.3 = private unnamed_addr constant [2 x i8] c"2\00", align 1
@.str.4 = private unnamed_addr constant [8 x i8] c"default\00", align 1

; Function Attrs: noinline nounwind optnone uwtable
define dso_local void @main() #0 {
  %1 = alloca i32, align 4
  %2 = call i32 (ptr, ...) @__isoc99_scanf(ptr noundef @.str, ptr noundef %1)
  %3 = load i32, ptr %1, align 4
  switch i32 %3, label %10 [
    i32 0, label %4
    i32 1, label %6
    i32 2, label %8
  ]

4:                                                ; preds = %0
  %5 = call i32 (ptr, ...) @printf(ptr noundef @.str.1)
  br label %12

6:                                                ; preds = %0
  %7 = call i32 (ptr, ...) @printf(ptr noundef @.str.2)
  br label %12

8:                                                ; preds = %0
  %9 = call i32 (ptr, ...) @printf(ptr noundef @.str.3)
  br label %12

10:                                               ; preds = %0
  %11 = call i32 (ptr, ...) @printf(ptr noundef @.str.4)
  br label %12

12:                                               ; preds = %10, %8, %6, %4
  ret void
}

declare i32 @__isoc99_scanf(ptr noundef, ...) #1

declare i32 @printf(ptr noundef, ...) #1

attributes #0 = { noinline nounwind optnone uwtable "frame-pointer"="all" "min-legal-vector-width"="0" "no-trapping-math"="true" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+cmov,+cx8,+fxsr,+mmx,+sse,+sse2,+x87" "tune-cpu"="generic" }
attributes #1 = { "frame-pointer"="all" "no-trapping-math"="true" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+cmov,+cx8,+fxsr,+mmx,+sse,+sse2,+x87" "tune-cpu"="generic" }

!llvm.module.flags = !{!0, !1, !2, !3, !4}
!llvm.ident = !{!5}

!0 = !{i32 1, !"wchar_size", i32 4}
!1 = !{i32 8, !"PIC Level", i32 2}
!2 = !{i32 7, !"PIE Level", i32 2}
!3 = !{i32 7, !"uwtable", i32 2}
!4 = !{i32 7, !"frame-pointer", i32 2}
!5 = !{!"clang version 21.0.0git (https://github.com/llvm/llvm-project.git 4d1e4eff5f6c6c62781926b0d31ad155364ffe62)"}

생성된 IR결과이고 하나씩 살펴보자

String

@.str = private unnamed_addr constant [3 x i8] c"%d\00", align 1
@.str.1 = private unnamed_addr constant [2 x i8] c"0\00", align 1
@.str.2 = private unnamed_addr constant [2 x i8] c"1\00", align 1
@.str.3 = private unnamed_addr constant [2 x i8] c"2\00", align 1
@.str.4 = private unnamed_addr constant [8 x i8] c"default\00", align 1

switch에 있는 case문에서 사용하는 printf문 안에 있는 String 값들이 선언돼 있다.

Switch

switch i32 %3, label %10 [
    i32 0, label %4
    i32 1, label %6
    i32 2, label %8
  ]

switch에 있는 %3은 scanf를 통해 값이 정해지는 변수 n이다.
뒤에 label %10은 switch의 default를 의미하여 아래 있는 조건에 해당하지 않으면, 아래 label 10으로 분기하게 된다.

Case

4:                                                ; preds = %0
  %5 = call i32 (ptr, ...) @printf(ptr noundef @.str.1)
  br label %12

6:                                                ; preds = %0
  %7 = call i32 (ptr, ...) @printf(ptr noundef @.str.2)
  br label %12

8:                                                ; preds = %0
  %9 = call i32 (ptr, ...) @printf(ptr noundef @.str.3)
  br label %12

10:                                               ; preds = %0
  %11 = call i32 (ptr, ...) @printf(ptr noundef @.str.4)
  br label %12

switch의 case문이다.
순서대로 case 0~2, default 안에서 실행하는 코드들이 정의돼 있고, 각 case 마지막에는 break 문인 br label %12가 있는 것을 볼 수 있다.

Optimize

현재 실험은 최적화 옵션 없이 진행하였으며, 값을 입력받아 사용하였다.

확인해본 결과 값을 상수로 하고, -Ofast 옵션을 사용하였을때 switch문을 사용하지 않은 것을 볼 수 있었다.
하지만, 상수값을 넣고 최적화 옵션을 사용하지 않으면 이전처럼 switch문을 사용하는 것을 볼 수 있었다.

Result

  • switch문을 중간언어 LLVM으로 바꾸면 switch 명령어를 사용
  • 최적화 옵션을 사용하지 않으면 switch 명령어 사용
  • switch의 조건값이 상수가 아니면 switch 명령어 사용

Pass 작성

Pass를 이용해서 switch문에 case안에서 실행되는 명령어들을 출력해 보았다.

namepsace

namespace {
struct SwitchCasePrinterPass : PassInfoMixin<SwitchCasePrinterPass> {
  PreservedAnalyses run(Function &F, FunctionAnalysisManager &) {
    errs() << "Function: " << F.getName() << "\n";

    for (BasicBlock &BB : F) {
      for (Instruction &I : BB) {
        if (auto *SI = dyn_cast<SwitchInst>(&I)) {
          errs() << "  Found switch on value: " << *SI->getCondition() << "\n";
          
          // 각 case
          for (auto Case : SI->cases()) {
            ConstantInt *Val = Case.getCaseValue();
            BasicBlock *TargetBB = Case.getCaseSuccessor();
            errs() << "    Case " << Val->getSExtValue() << " -> " << TargetBB->getName() << "\n";
            printBlockInstructions(TargetBB);
          }

          // default case
          BasicBlock *DefaultBB = SI->getDefaultDest();
          errs() << "    Default case -> " << DefaultBB->getName() << "\n";
          printBlockInstructions(DefaultBB);
        }
      }
    }

    return PreservedAnalyses::all();
  }

  void printBlockInstructions(BasicBlock *BB) {
    for (Instruction &Inst : *BB) {
      errs() << "      " << Inst << "\n";
    }
  }
};
}

namespace부분을 살펴 보도록 하자
처음에 pass 실행시 함수의 이름이 뜨도록 하였다. 그 다음 함수에 있는 베이직 블럭을 순회하고 각 베이직 블럭에서 명령어 단위로 순회하였다. 만약 명령어 중에 switch가 있으면 switch안에 있는 조건을 가져온다.
먼저 각 case에 있는 명령어들을 출력한다. 그 다음 default case에 있는 명령어를 출력해 주었다.

Script

#!/bin/bash
LLVM_BUILD=~/llvm-project/build
LLVM_PASS=$LLVM_BUILD/lib/DetectSwitchPass.so

INPUT="$1"

EXT="${INPUT##*.}"

if [ "$EXT" == "c" ]; then
  echo "🔄 Converting $INPUT to LLVM IR (.ll)..."
  BASE="${INPUT%.c}"
  clang -S -emit-llvm -O0 -Xclang -disable-O0-optnone "$INPUT" -o "${BASE}.ll"
  INPUT="${BASE}.ll"
fi

echo "🚀 Running DetectSwitchPass on $INPUT..."
$LLVM_BUILD/bin/opt \
  -load-pass-plugin=$LLVM_PASS \
  -passes="detectswitch" \
  -S \
  "$INPUT" \
  -o "${INPUT%.ll}_switch.ll"

기존 script보다 복잡해 진 것을 볼 수 있다. 스크립트 안에서 clang으로 .c파일을 .ll로 컴파일 하는 것을 볼 수 있는데 이렇게 변경한 이유는 뒤에서 설명하도록 하겠다.

optnone

pass를 작성하고 실행했을때 아무것도 뜨지 않는 문제가 있었다.

clang -S -emit-llvm switch.c -o test.ll

이렇게 optimze 옵션 없이 컴파일을 하면, 기본적으로 -O0옵션을 사용한다고 한다. 그렇게 되면 IR에

; Function Attrs: noinline nounwind optnone uwtable

와 같은 문장이 추가가 된다. 각 attribute에 의미가 있지만 문제와 연관된 optnone에 대해서 설명하면 최적화 비활성화를 명시하는 attribute로 디버깅을 위한 optnone 함수는 원칙적으로 분석/최적화 대상에서 제외되기 때문이다.
그렇기 때문에 앞서 위에서 작성한 script를 보면

clang -S -emit-llvm -O0 -Xclang -disable-O0-optnone "$INPUT" -o "${BASE}.ll"

명시적으로 optnone을 제거하여 컴파일 한 것을 볼 수 있다.
명령어가 너무 길어 script로 작성하였다.

Result

작성한 스크립트는 .c 파일을 받아 .ll로 컴파일 하고 pass를 실행한다.
pass 실행 명령어는

llvm_switch switch.c

이렇게 되며 실행 결과

위와 같이 잘 나오는 것을 볼 수 있다.

0개의 댓글