'미니프로젝트2'주차 둘 째날

이름뭐라하지·2021년 12월 7일
0

2021.12.07

오늘

아침에 댓글에 관련된 api를 만들고 테스트해봤다. 로그인이 됐는지 확인하는 과정이 필요할테지만 일단 그부분은 제외하고 데이터를 받아서 crud가 잘 되는지만 보았다.

그리고 사이트를 크롤링했다. 많은 실패 끝에 성공했다... 배우긴 했지만 제대로 알지 못 한다는 걸 다시 깨달았다. 주요 실패 원인은 크롤링할 부분의 태그를 잘못찾았기 때문이다.

let image = $(tag).find("p.image a img").attr("src");

cheerio의 find는 html selector를 문자열로 받아 해당하는 태그를 반환하는데, 난 selector로 가져오지 않고 개발자도구에서 보이는대로 따라쳤기 때문에 안된 것 같다.
근데 팀원분은 크롤링을 다른 사이트로 시도하셨는데 selector를 써도 안 되더라. 같이 봤지만 해결법을 찾지 못 했다. 동적 사이트는 다른 방법이 필요한 것 같다고 하셨다. 이 부분을 알아봐야겠다.
계속 실패 하고 있을 때 프론트엔드 팀원분들도 많이 도와주려 하셨다. 다른 조는 Selenium이라는 걸 쓴다는 것도 알려주셨다. 이것도 알아봐야 겠다. 어쩌면 동적 사이트를 크롤링하는 방법이 이거일지도.

오후 6시에 협력사 채용 세션이 있었다. 이번 협력사는 휴멜로로 독보적인 기술이 강점이라고 소개해 주셨는데 정말 신기했다. ai가 감정이 있는듯 억양을 살려 말하고 다른사람의 목소리와 말투도 흉내냈다. 여러국의 언어로도 특정인물의 목소리와 억양을 살려냈다. 영화나 드라마를 수출할 때 이 기술을 사용하면 실제 연기한 배우가 외국어를 하는 것처럼 연출할 수 있다는 모양이다.

profile
뱃사공1 노질 중

0개의 댓글