[SK shiedlus Rookies 23]Python(6-2)_24.10.22

박소민·2024년 11월 4일

Python

목록 보기
16/23
  • 통화별 데이터 세트 (html로 구성)
<tr>
  <td class="tit">
    <a href="/marketindex/exchangeDetail.naver?marketindexCd=FX_USDKRW" target="_parent" onclick="parent.clickcr(this, 'exl.exlist', 'FX_USDKRW', '1', event);">
    미국 USD
  </a></td>
  <td class="sale">1,381.10</td>
  <td>1,405.26</td>
  <td>1,356.94</td>
  <td>1,394.60</td>
  <td>1,367.60</td>
  <td>1.000</td>
</tr>

🔽 [[ 구조 ]] 🔽

tr 밑에 td 7개 세팅 ➕ td는 데이터 1개씩 의미
  • <참고>
  1. 표(게시판) 구성요소 = table tag
  2. 데이터 1개= tr로 묘사
  3. 컬럼(colgroup)= td로 구성 =데이터 1개씩 의미
  4. css selector 특정 방법
    • 의사결정 셀렉터- 사용처
      -table > tr > td
      -ul/ol > li
<< 표현 방법>>
- 요소명:표현
  < 표현 >
  1. first, last, odd, even 
  2. gt(), lt(),
  3. eq(), nth-child() | nth-of-type()

ex) td:first (요소명:표현) ➜ ∴ 통화명
	td:nth-of-type(3) ➜ ∴ 1,405.26


↪️ first 첫째 / last 막내 / odd 홀수번째 / even 짝수번째 / gt 큰값 
   / lt 작은값 / eq 동일값 

Ex > 통화 데이터별로 개별 데이터 추출 (타겟: 미국 USD)
통화코드 : 통화명에 걸려있는 링크 값에 뒤에서부터 6번째의 3글자

시간, 은행(공급자), 회차 추출


Ex-0 > 타겟 사이트 선정

                               🔽🔽🔽

Ex-1 > 타겟 추출하기

<< 요구사항 >>
#front_soup를 이용하여, css selector 표현을 활용하여 다음 정보를 추출하시오
#시간        : 2024.10.22 14:05
#정보제공업체 : 하나은행
#회차        : 기준 고시회차 273회

최종 데이터 병합

통화 정보 추출

                            ➕➕➕

"시간, 은행, 회차" 정보 추출

                           🔽🔽🔽


📚 < 마무리 정리 >
1. df 변환
2. 데이터베이스 저장
3. 파이썬파일 구성
4. 스케줄러 등록

  • 시작시간, 끝시간, 반복시간 => 사이트 체크후 전략수립

0개의 댓글