pandas는 통상적으로 pd로 import 한다수치해석적 함수가 많은 numpy는 통상 np로 import 한다pandas의 데이터형을 구성하는 기본은 Series이다pandas에서 가장 많이 사용되는 데이터형은 DataFrame이다(= index와 columns를
주피터 노트북에서... "markdown 문서작업" 하기 : esc + M키입력창 왼쪽 마우스로 클릭(초록색->파란색) ---> esc키 + m키 누르기(마크다운) ---> 위에 셀 추가 하기 : esc + A키 아래에 셀 추가 하기 : 마우스로 좌측 끝 클릭 + B키
표준 정규분포에서 샘플링한 난수 생성하기np.random.randn(6,4) 해석 6행 4열의 형태로 난수를 생성해줘 df = pd.DataFrame(data, index, columns) 해석 지정한 data와 index와 colmns에 따라 데이터 프레임을 만들어줘
업로드중..
pandas) date_range간격을 일(day) 간격으로 지정할 수 있음날짜, 시간의 데이터를 생성시작 날짜를 지정할 수 있음pandas) data frame반복문에서 반복되는 인자는 index와 각 칼럼의 나머지 내용이 반환됨data frame을 행 단위로 한 줄
참고 seborn 활용 예제(1) boxplotBox Plot 해석하기Median 중심으로 아래 위 상자가 각각 전체 데이터의 25%씩 총 50%를 가진다상자 전체 길이를 IQR(Inter Quatile Range)라고 한다 IQR의 1.5배 이상 벗어나면 점으로 별도
folium 예제 1. folium 연동, 위도/경도 입력 2. 경로를 변수에 저장 3. tile 디자인 선택 4. 지도에 마커 생성  분석 시, Beautiful Soup만으로 해결할 수 없는 경우접근할 웹 주소를 알 수 없을 때자바스크립트를 사용하는 웹페이지의 경우웹 브라우저로 접근하지 않으면 안될 때(클릭, 혹은 로그인이 필수일 때)Selen
관련 문서https://www.selenium.dev/documentation/https://selenium-python.readthedocs.io/api.html< 웹 드라이버 연결 및 기본 조작 >< 스크롤 기본 조작 >참고 XPATH
Regular Expression 기초
f