OpenCRISPR-1 궁금점들

코드짜는침팬지·2024년 9월 1일
0

의료공학

목록 보기
8/15

다음은 개인적으로 궁금했던 내용들입니다.

Q1. SpCas9는 자연에서 존재하는 단백질 종류의 하나인건가?
근데 그러면 수십만개의 단백질 데이터는 어떻게 구한거고 None-NGG PAM 서열에서 효율적으로 작동하는건 어떻게 아는건가?

A1. SpCas9는 자연에서 발견된 Streptococcus pyogenes라는 박테리아에서 유래된 단백질입니다. Cas9 단백질은 다양한 박테리아와 고세균에서 발견되며, 그 중에서 SpCas9는 유전자 편집 연구에서 가장 널리 사용되는 변종입니다. SpCas9는 특정 DNA 서열을 절단하는 기능을 가지고 있으며, 특히 NGG PAM 서열을 인식하여 이 위치에서 DNA를 절단할 수 있습니다.

수십만 개의 단백질 데이터는 어떻게 구했는가?

  • 수십만 개의 단백질 데이터는 주로 다양한 박테리아와 고세균에서 발견된 CRISPR-Cas 시스템에서 유래한 것입니다. 이러한 데이터는 대규모의 생물정보학적 데이터베이스에서 추출되었습니다.
  • 예를 들어, NCBI, UniProt, CRISPR-Cas 아틀라스 등 다양한 데이터베이스에서 CRISPR-Cas 관련 단백질 서열을 수집할 수 있습니다. 이러한 데이터베이스는 연구자들이 게놈 시퀀싱을 통해 발견한 다양한 생물체에서 유래된 단백질 서열을 포함하고 있습니다.
  • 연구팀은 이러한 데이터베이스에서 238,917개의 Cas9 서열을 포함하여 다양한 CRISPR-Cas 단백질 서열을 수집하고, 이를 바탕으로 딥러닝 모델을 훈련시켰습니다. 이는 Cas9뿐만 아니라, 다른 종류의 CRISPR 관련 단백질들도 포함되어 있을 수 있습니다.

None-NGG PAM 서열에서 효율적으로 작동하는 것을 어떻게 아는가?

  • PAM(Protospacer Adjacent Motif) 서열은 Cas 단백질이 DNA를 인식하고 절단할 때 필요한 짧은 DNA 서열입니다. SpCas9은 주로 NGG PAM 서열을 인식하여 DNA를 절단합니다.
  • None-NGG PAM 서열에서 Cas9 유사 단백질이 효율적으로 작동하는지를 확인하기 위해, 연구팀은 실험적으로 테스트를 진행합니다. 이 과정에서 다음과 같은 단계가 포함됩니다:
  1. 다양한 PAM 서열을 포함한 DNA 타겟 준비:

    • 연구팀은 실험에서 다양한 PAM 서열을 포함한 DNA 부위를 준비합니다. 이는 NGG PAM뿐만 아니라, 비-NGG PAM(NNG, NAG, NTG 등)을 포함한 타겟 서열을 의미합니다.
  2. Cas9 변종의 테스트:

    • 연구팀은 여러 Cas9 변종 또는 새롭게 설계된 Cas9 유사 단백질이 다양한 PAM 서열에서 얼마나 효율적으로 DNA를 절단하는지 평가합니다.
    • 이 과정에서 in vitro 실험(시험관 내 실험) 또는 in vivo 실험(생체 내 실험)을 통해 각 변종의 활성을 테스트합니다. 실험 결과를 통해 각 Cas9 변종이 특정 PAM 서열에서 얼마나 잘 작동하는지를 알 수 있습니다.
  3. NGS(차세대 시퀀싱) 및 데이터 분석:

    • 편집된 DNA 서열을 분석하기 위해 NGS(차세대 시퀀싱) 기술을 사용합니다. 이를 통해 Cas9 변종이 특정 PAM 서열에서 얼마나 정확하게 작동했는지를 확인할 수 있습니다.
    • 결과적으로, 특정 Cas9 변종이 비-NGG PAM 서열에서 높은 활성을 나타내는지를 데이터로 분석할 수 있습니다.
  4. 유전자 편집 효율성 평가:

    • 실험을 통해 얻은 데이터를 기반으로, 각 Cas9 변종의 효율성과 특이성을 평가합니다. 특정 Cas9 변종이 비-NGG PAM 서열에서 높은 효율성을 나타내면, 그 변종이 비-NGG PAM 서열에서도 효율적으로 작동하는 것으로 결론을 내릴 수 있습니다.
  • SpCas9는 자연에서 존재하는 단백질 중 하나로, 특정 PAM 서열(NGG)을 인식하여 DNA를 절단합니다. 연구팀은 다양한 생물정보학적 데이터베이스에서 수집한 수십만 개의 단백질 서열 데이터를 바탕으로 Cas9 유사 단백질을 설계하고, 이를 테스트했습니다.
  • None-NGG PAM 서열에서 Cas9 유사 단백질이 효율적으로 작동하는지는 실험적으로 확인됩니다. 연구팀은 다양한 PAM 서열을 타겟으로 하는 DNA를 준비하고, 여러 Cas9 변종이 이들 PAM 서열에서 얼마나 잘 작동하는지를 평가하여 결과를 도출했습니다.

Q2. 자연계에는 수많은 박테리아가 존재하며, 이들 중 일부는 CRISPR-Cas 시스템을 가지고 있으며 Cas9은 CRISPR-Cas 시스템에 속하는 단백질(뉴클레아제)중 하나이다. Cas9은 다른 단백질 시스템들과 비교했을 때 더욱 효율적인 유전자 편집이 가능하다. 근데 Cas9 서열이라는게 그냥 박테리아의 유전자 구조중 하나인건가? Cas9만 존재하면 유전자 편집은 할 수 없는건가?

A2 네, 정확합니다. Cas9CRISPR-Cas 시스템의 일부로, 박테리아의 유전자 구조 중 하나인 단백질(뉴클레아제)입니다. 하지만 Cas9만으로는 유전자 편집을 수행할 수 없습니다. Cas9이 유전자 편집을 수행하려면 다른 구성 요소와 함께 작동해야 합니다. 아래에서 Cas9 서열과 유전자 편집의 핵심 요소들을 설명하겠습니다.

1. Cas9 서열

  • Cas9 서열Cas9 단백질을 암호화하는 유전자 서열을 의미합니다. 이는 박테리아의 유전체에 존재하며, 특정 단백질(이 경우 Cas9)을 생성하는 데 필요한 정보를 포함하고 있습니다.
  • Cas9은 뉴클레아제로서 DNA를 절단하는 기능을 가지고 있습니다. 이는 박테리아가 바이러스 DNA를 절단하여 자신의 유전체를 보호하는 데 사용됩니다.

2. CRISPR-Cas 시스템

  • CRISPR-Cas 시스템은 박테리아가 외부 침입자(예: 바이러스)에 대응하기 위해 진화시킨 유전자 방어 메커니즘입니다. 이 시스템은 Cas 단백질CRISPR 배열이라는 두 가지 주요 구성 요소로 이루어져 있습니다.
  • Cas9은 이 시스템에서 DNA 절단을 담당하는 뉴클레아제입니다.

3. Cas9 단백질의 역할

  • Cas9 단백질은 특정 DNA 서열을 인식하고 절단할 수 있는 효소입니다. 하지만 Cas9이 효율적으로 작동하려면 가이드 RNA (gRNA)라는 분자와 결합해야 합니다.
  • 가이드 RNA(gRNA)는 Cas9이 정확한 DNA 타겟을 찾고 결합할 수 있도록 유도하는 역할을 합니다. gRNA는 Cas9과 결합하여 특정 타겟 DNA 서열을 인식하게 합니다.

4. 유전자 편집에 필요한 요소들

  • Cas9 단백질: DNA를 절단하는 뉴클레아제입니다.
  • 가이드 RNA (gRNA): Cas9이 특정 DNA 서열을 타겟팅하도록 유도합니다. gRNA는 두 부분으로 구성됩니다:
    • crRNA: 타겟 DNA와 상보적인 서열을 가지고 있으며, 타겟 위치를 지정합니다.
    • tracrRNA: crRNA와 결합하여 Cas9과 상호작용합니다.
  • PAM 서열(Protospacer Adjacent Motif): Cas9이 DNA를 절단하기 위해 필요로 하는 짧은 DNA 서열입니다. 예를 들어, SpCas9은 NGG라는 PAM 서열을 인식합니다.

5. Cas9만으로 유전자 편집이 불가능한 이유

  • Cas9 단백질만으로는 특정 DNA 서열을 인식할 수 없습니다. Cas9은 gRNA와 결합해야만 특정 DNA 타겟을 인식하고 절단할 수 있습니다.
  • 또한, PAM 서열이 타겟 DNA에 존재해야 Cas9이 해당 위치를 인식하고 절단할 수 있습니다. PAM 서열이 없다면 Cas9은 타겟 DNA를 절단하지 못합니다.

요약

  • Cas9 서열은 박테리아의 유전체에 존재하는 유전자 서열로, Cas9 단백질을 암호화합니다.
  • Cas9만으로는 유전자 편집을 수행할 수 없으며, Cas9이 유전자 편집을 수행하기 위해서는 가이드 RNA(gRNA)와 함께 작동해야 합니다.
  • CRISPR-Cas 시스템은 Cas9과 gRNA, 그리고 PAM 서열이 함께 작동하여 특정 DNA 서열을 인식하고 절단할 수 있게 해줍니다.

따라서, 유전자 편집을 위해서는 Cas9뿐만 아니라 gRNAPAM 서열이 모두 필요합니다. 이들이 함께 작동하여 Cas9이 목표로 하는 특정 유전자 위치에서 DNA를 절단하고 편집할 수 있게 됩니다.

Q3. Cas9,gRNA,pam 서열만 있으면 유전자 가위를 만들 수 있는건가?

비유를 통해 Cas9 시스템을 설명해 보겠습니다. Cas9을 유전자 편집을 위한 정밀 공구로 생각할 수 있습니다. 이 공구가 정확히 작동하기 위해서는 다양한 부품이 함께 작동해야 합니다. 이 부품들을 각각 설명하자면 다음과 같습니다:

비유: 정밀한 자물쇠 열기 작업

  • Cas9 단백질: 만능 자물쇠 해제 도구

    • Cas9은 자물쇠를 열 수 있는 만능 도구입니다. 그러나 이 도구는 단독으로는 자물쇠를 열 수 없습니다. 어떤 자물쇠를 열어야 하는지 알려주는 정보가 필요합니다.
  • gRNA(가이드 RNA): 자물쇠의 설계도

    • 가이드 RNA(gRNA)는 자물쇠를 정확히 어떻게 열 수 있는지를 알려주는 설계도입니다. 이 설계도에는 자물쇠를 여는 방법(어떤 DNA 서열을 타겟으로 삼아야 하는지)이 명시되어 있습니다.
    • gRNA는 crRNAtracrRNA로 구성됩니다. 이 둘은 함께 Cas9에 결합하여 특정 자물쇠(DNA 서열)를 찾아내는 역할을 합니다.
      • crRNA: 설계도의 핵심 부분으로, 어떤 자물쇠(특정 DNA 서열)를 열어야 하는지를 지정합니다.
      • tracrRNA: 설계도를 결합하고 해석하는 부품으로, Cas9 도구가 이 설계도(crRNA)를 읽고 이해할 수 있게 합니다.
  • PAM 서열: 자물쇠의 고유한 열쇠 구멍

    • PAM 서열은 자물쇠에 있는 고유한 열쇠 구멍입니다. 이 구멍이 있어야 Cas9이 자물쇠에 정확하게 맞춰질 수 있습니다. 만약 이 구멍(PAM 서열)이 자물쇠에 없다면, Cas9 도구는 자물쇠를 제대로 열 수 없습니다.
    • 예를 들어, SpCas9은 NGG라는 고유한 구멍(PAM 서열)을 인식하여 정확하게 자물쇠를 해제할 수 있습니다.

결론:

비유를 통해 이해하면, Cas9은 자물쇠를 열 수 있는 만능 도구이지만, 어떤 자물쇠를 열어야 하는지(gRNA)와 자물쇠에 특정 구멍(PAM 서열)이 있어야 이 도구가 제대로 작동할 수 있습니다.

가장 효율적인 Cas9 시스템을 만들기 위해:

  • Cas9 단백질은 자물쇠를 열 수 있는 도구입니다.
  • gRNA(crRNA + tracrRNA)는 이 도구가 어떤 자물쇠를 열어야 하는지를 알려주는 설계도입니다.
  • PAM 서열은 자물쇠에 있어야 하는 고유한 열쇠 구멍입니다.

이 모든 요소가 함께 작동할 때, Cas9 단백질은 특정 DNA 서열을 정확하게 인식하고 편집할 수 있는 가장 효율적인 유전자 편집 도구가 됩니다. 만약 이 중 하나라도 없다면, Cas9은 원하는 대로 유전자 편집을 수행할 수 없게 됩니다.

Q4. 이 네가지만 있으면 되면 왜 이걸 AAV에 못넣음?

좋은 질문입니다! AAV(Adeno-Associated Virus)는 유전자 치료에서 유전자를 세포로 전달하는 데 자주 사용되는 바이러스 벡터입니다. 하지만 AAV에는 몇 가지 제한 사항이 있습니다. 특히, 크기와 관련된 제한이 중요합니다.

AAV의 크기 제한

  • AAV의 유전자 탑재 용량: AAV는 최대 약 4.7kb(킬로베이스)의 유전자를 운반할 수 있는 용량을 가지고 있습니다. 이 크기 제한은 AAV가 안전하게 작동할 수 있는 범위를 결정합니다.

Cas9 시스템의 크기

  • SpCas9의 크기: SpCas9 단백질을 암호화하는 유전자 서열은 약 4.2kb 정도의 크기를 가지고 있습니다. 이 유전자 서열만으로도 AAV의 용량을 거의 다 차지합니다.
  • gRNA의 크기: gRNA(crRNA + tracrRNA 또는 sgRNA)는 상대적으로 짧지만, SpCas9 유전자와 함께 AAV에 넣으면 AAV의 용량 한도를 초과할 수 있습니다.
  • PAM 서열: PAM 서열 자체는 짧지만, 이 서열을 인식하는 Cas9과 gRNA를 포함하여 전체 시스템이 작동하려면 추가적인 요소들이 필요합니다.

문제점

  1. 크기 초과: SpCas9 유전자와 gRNA, 그리고 필요한 프로모터(유전자의 발현을 조절하는 서열)를 합치면 AAV의 용량 제한인 4.7kb를 초과하게 됩니다.
  2. 완전한 시스템 전달 어려움: AAV는 단일 벡터로 Cas9과 gRNA를 함께 전달하기에 용량이 부족할 수 있습니다. 따라서, SpCas9 시스템 전체를 AAV에 넣으려면 매우 제한적인 크기 최적화가 필요합니다.

해결 방안

이 문제를 해결하기 위해 몇 가지 전략이 개발되었습니다:

  1. 작은 Cas9 변종 사용: SaCas9(Staphylococcus aureus Cas9)과 같은 더 작은 크기의 Cas9 단백질을 사용하는 방법이 있습니다. SaCas9은 약 3.2kb로 SpCas9보다 작기 때문에 AAV에 gRNA와 함께 넣을 수 있습니다.
  2. 듀얼 AAV 시스템: Cas9과 gRNA를 각각 다른 AAV 벡터에 넣고, 두 개의 벡터를 세포에 동시에 전달하는 방법도 있습니다. 이렇게 하면 각 AAV 벡터의 용량 제한을 피할 수 있습니다.
  3. 최적화된 유전자 서열: 코돈 최적화 등과 같은 방법을 사용하여 Cas9과 gRNA의 서열을 압축해 AAV에 탑재할 수 있도록 최적화할 수도 있습니다.

AAV의 크기 제한 때문에 Cas9 시스템 전체를 AAV에 탑재하기 어려운 것입니다. 그러나 작은 Cas9 변종을 사용하거나 듀얼 AAV 시스템을 사용하는 등 다양한 방법을 통해 이 문제를 해결하려는 시도가 이루어지고 있습니다. 이와 같은 방법들을 통해 Cas9 시스템을 유전자 치료에서 더욱 효과적으로 사용할 수 있게 됩니다.

Q5. 논문을 정리하면 Open-CRISPR1은 딥러닝으로 개발된 새로운 Cas9 변종이다. 그럼 용량은 얼마야 얼마나 효율적인건지

A5. 네, 맞습니다. Open-CRISPR1은 딥러닝 기반의 접근법을 통해 개발된 새로운 Cas9 변종입니다. 이 변종은 자연에서 발견된 Cas9 단백질과는 달리, 인공지능(딥러닝) 모델을 사용하여 설계된 것입니다. Open-CRISPR1은 Cas9 변종 중 하나로서, 기존의 Cas9 단백질에 비해 특정한 기능적 특성과 효율성을 향상시키기 위해 만들어졌습니다.

1. Open-CRISPR1의 용량

  • Open-CRISPR1의 정확한 유전자 서열 길이는 논문에서 제공된 정보에 따라 달라질 수 있지만, 일반적으로 Cas9 변종의 경우 유전자 서열이 약 3.2kb에서 4.2kb 정도의 크기를 가지고 있습니다.
  • 논문에서 언급된 Open-CRISPR1의 경우, 길이는 약 1,380 아미노산(aa)로, 이는 약 4.1kb의 유전자 크기에 해당합니다. 이 크기는 SpCas9과 비슷하거나 약간 작은 편입니다.

2. Open-CRISPR1의 효율성

  • Open-CRISPR1은 기존의 SpCas9과 비교했을 때, 유전자 편집 효율이 높은 것으로 보고되었습니다. 실험 결과에 따르면, Open-CRISPR1은 SpCas9과 유사한 수준의 온타겟(정확한 타겟 위치) 편집 효율을 보여주면서도, 오프타겟(의도하지 않은 위치) 효과가 현저히 낮은 것으로 나타났습니다.
  • 구체적으로, 오프타겟 편집의 경우, Open-CRISPR1은 SpCas9보다 95% 낮은 편집율을 보여주었으며, 이는 높은 특이성과 효율성을 의미합니다.
  • 또한, Open-CRISPR1은 다양한 PAM 서열을 인식할 수 있는 능력을 가지고 있어, 더 유연한 유전자 편집이 가능할 수 있습니다. 이 점에서, SpCas9에 비해 더 넓은 범위의 유전자 타겟팅이 가능할 것으로 예상됩니다.

3. 응용 가능성

  • Open-CRISPR1은 특히 염기 편집(Base Editing)에서 높은 효율성을 보였습니다. 염기 편집은 DNA 이중 가닥을 절단하지 않고 특정 염기를 변환하는 기술인데, Open-CRISPR1은 이 과정에서 SpCas9과 유사한 성능을 보이면서도 더 높은 특이성을 나타냈습니다.
  • Open-CRISPR1의 특성상, AAV 벡터에 포함하기 위해선 크기 최적화가 필요할 수 있지만, 높은 효율성과 낮은 오프타겟 효과 때문에 유전자 치료와 같은 응용 분야에서 매우 유용할 수 있습니다.

결론

  • Open-CRISPR1은 딥러닝을 통해 설계된 새로운 Cas9 변종으로, 기존의 SpCas9과 비교해도 높은 유전자 편집 효율성을 보입니다.
  • 용량 면에서는 약 4.1kb의 크기로 SpCas9과 유사하며, 이는 AAV와 같은 벡터에 탑재하기 위해 최적화가 필요할 수 있지만, 여전히 매우 효율적입니다.
  • 효율성 면에서는 온타겟 편집에서 SpCas9과 유사하거나 더 높은 성능을 보이며, 오프타겟 효과가 크게 줄어들어 더욱 특이적이고 안전한 유전자 편집을 가능하게 합니다.

Q6. Open-CRISPR1은 다양한 PAM 서열을 인식할 수 있는 능력을 가지고 있어, 더 유연한 유전자 편집이 가능할 수 있습니다. 이 점에서, SpCas9에 비해 더 넓은 범위의 유전자 타겟팅이 가능할 것으로 예상됩니다
기존 CRISPR 시스템은 다양한 PAM 서열의 인식이 불가능했는가?
A6. 기존의 CRISPR-Cas9 시스템은 특정 PAM(Protospacer Adjacent Motif) 서열을 인식해야만 DNA를 절단할 수 있습니다. SpCas9(Streptococcus pyogenes Cas9)은 가장 널리 사용되는 Cas9 변종이며, NGG라는 특정한 PAM 서열을 필요로 합니다. 이 NGG 서열은 DNA 상에서 Cas9이 인식할 수 있는 위치를 결정하는 중요한 요소입니다.

기존 CRISPR 시스템의 한계

  • PAM 서열의 제한성: SpCas9과 같은 기존 CRISPR-Cas9 시스템은 NGG PAM 서열을 인식해야만 DNA를 절단할 수 있습니다. 이는 유전자 편집을 수행할 수 있는 대상 DNA 서열이 제한된다는 것을 의미합니다.
    • 예를 들어, 유전자가 NGG PAM 서열을 포함하지 않는 경우, SpCas9은 그 위치에서 DNA를 절단할 수 없게 됩니다. 이로 인해 편집할 수 있는 유전자 위치가 제한되며, 특정 유전자를 표적으로 삼기 어려울 수 있습니다.
  • PAM 서열의 다양성 부족: SpCas9의 NGG PAM 서열 인식 특성 때문에, 유전자 편집 타겟 위치가 특정 PAM 서열에 의해 제한될 수 있습니다. 일부 Cas9 변종은 다른 PAM 서열을 인식할 수 있지만, 여전히 특정 서열에 대한 의존성이 강합니다.

Open-CRISPR1의 개선점

  • 다양한 PAM 서열 인식: Open-CRISPR1은 딥러닝을 통해 설계된 변종으로, 다양한 PAM 서열을 인식할 수 있는 능력을 가지고 있습니다. 이는 특정한 PAM 서열에만 의존하지 않고, 더 많은 종류의 DNA 서열을 타겟팅할 수 있다는 장점을 제공합니다.
    • 이로 인해, Open-CRISPR1은 NGG 외에도 다양한 PAM 서열을 인식하여 유전자 편집이 가능하게 하며, 기존의 SpCas9 시스템보다 더 넓은 범위에서 유전자 편집을 수행할 수 있습니다.
  • 유전자 타겟팅의 유연성 증가: PAM 서열 인식의 다양성 덕분에 Open-CRISPR1은 기존의 SpCas9에 비해 유전자 타겟팅의 유연성이 크게 향상됩니다. 이는 특정 유전자 서열이 NGG PAM 서열을 포함하지 않아도, 다른 인식 가능한 PAM 서열을 통해 유전자 편집이 가능하다는 것을 의미합니다.

결론

기존의 CRISPR-Cas9 시스템은 특정 PAM 서열(NGG)에 의존하기 때문에 유전자 편집의 타겟 범위가 제한될 수 있었습니다. Open-CRISPR1은 다양한 PAM 서열을 인식할 수 있도록 설계되어, 이 제한을 극복하고 더 넓은 범위의 유전자 타겟팅을 가능하게 합니다. 이로 인해 유전자 편집의 적용 범위가 크게 확장될 수 있으며, 보다 유연하고 정밀한 유전자 편집이 가능해질 것입니다.

profile
학과 꼴찌 공대 호소인

0개의 댓글

관련 채용 정보