Making PCG File

박신영·2024년 7월 12일

GPT

목록 보기
1/2

🖇Idea 큰 틀 잡기

  • 총 19454개의 gene dataset -> 한번에 돌리기 어렵다고 판단

    • 얼마나, 몇개의 gene씩 맡길 경우에 거짓된 정보를 뱉는지 검증(reference)
    • 몇번의 dataset을 검증 후, 나중 dataset은 검증없이 merge하기 위함
  • 100개정도의 gene을 잡아서 나눠서 돌려, csv 파일을 만든 후 python으로 merge하기로 결정!!!


🖇첫 100개 dataset 표로 만들기

  • 2~101번까지의 csv gene 파일 (pcg2-101.csv) 생성

  • Chat gpt(4version_유료)에게 영어로 질문
    - pcg2-101 파일을 함께 보냄

With this gene file, I want to see the relationship between a list of 100 genes and the diseases Carcinoma Pancreatic Ductal. Specifically, I want to know if each gene has an up-regulation or down-regulation relationship with these diseases. Additionally, I would like references for each relationship, preferably provided as PMIDs or DOIs.

Furthermore, I am interested in the context of these relationships. By context, I mean specific nuances such as if the relationship differs between animals and humans, if it varies based on the location within the cell (e.g., cytoplasm vs. nucleus), or if intermediate genes affect the relationship. If such contextual information exists, please include it as well. If there is no such information, it is okay not to mention it. Please provide references for this contextual information separately.

Please organize this information in a clear and concise table format.

  • 제일 첫번째 gene에 대한 답변만을 출력해줬음

❔ MT-ND1 답변 내용

Roles of MT-ND1 in Cancer
→ MT-ND1의 m.3571insC 돌연변이는 항암 및 항전이적 효과 유발
→ 글리오토마 조건 하에서 암의 발생과 변이가 도움을 줌
Mitochondrial fusion exploits a therapeutic vulnerability of pancreatic cancer
→ 미토콘드리아 융합이 미토페이지를 촉진해서 췌장암 세포에 과다한 미토콘드리아를 제거함

✔ 평가
  - cancer type 애트리뷰트 부재
  - 바로 표로 주어지지 않고 하나의 gene에 대해서만 세부사항 출력
  - 무료 GPT로 이 gene을 돌려본 결과, 나오지 않았던 context까지 자세히 알려줌
  - 표의 PMID를 거짓된 정보로 알려줌 (남서부 미국 화재위험 어쩌고 나무고리 어쩌고..)


✔ 내용 정리
  - 미토콘드리아 융합과정에서 산화적 인산화가 감소, 종양 성장 억제
  - 인간 세포주와 쥐 모델에서는 일관된 결과

✔ 평가
  - 두번째 정보가 잘 이해되지 않아서 어떤 context와 관련있는지 재질문 함
  - 관련있는 정보만을 뱉어내지 않고 위의 모든 context를 다른 말로 풀어서 답변해줌
  - 표를 다시 그려주면서 PMID와 contextual information을 바꿈
      🤬 그러나 이번 PMID도 이상한 내용(간손상 어쩌고 Apoptosis 어쩌고)

  • PMID 수정을 요구 & 아까의 두번째 사이트를 가져옴

❔ 다른 gene에 대해서도 질문

      답변 내용


The FDA-Approved Anthelmintic Pyrvinium Pamoate Inhibits Pancreatic Cancer Cells in Nutrient-Depleted Conditions by Targeting the Mitochondria
→ Pyrvinium pamoate(PP)와 같은 약리학적 제제로 MT-ND2를 하향조절하면 미토콘드리아 경로 억제가 되고 이는 췌장암 성장 감소시킴
Mitochondrial fusion exploits a therapeutic vulnerability of pancreatic cancer
→ 이전 gene의 PMID와 동일

✔ 평가
  - 얘는 전부 옳게 나왔음을 확인했다
  - context를 너무 자세히 알려주는 게 문제인듯하다 더 간단하게 줄여야할듯
  - context에 집중을 덜하면 PMID에 오류가 줄어들지 않을까?
  - 표에 더 치중할 수 있는 쿼리를 짜야할 것 같다.


Chat GPT가 너무 멍청한 것 같은데... 거짓말도 너무 잘하고...
검증을 모든 데이터 전부 다 해야할 것 같은 정확도인데 사용이 가능할지 의문이 든다...


  • context를 너무 자세히 알려주는게 문제인듯하다. 조금 더 줄여야할것 같음
  • 좀더 context를 간결하게 표로만 나타내 주어도 충분하다고 말해야할 것 같다
  • context에 집중을 덜하면 PMID를 오류없이 찾아낼 수 있지 않을까?
  • MESH term 관련된 공부를 좀 더 해야할 것 같음
  • MESH tree의 숫자를 포함해서.. 질병을 간소화?시키는 질문을 해야하지 않을까 하는 생각이 듦.
  • context information은 나중에 어떻게 비교할건지..??에 대한 의문이 듦 (gene card와 비교??)
  • gene card와 비교할 방법을... 잘 찾아야할거같다..
profile
기술블로그

0개의 댓글