0. 대회 설명 대회 : https://www.kaggle.com/c/titanic 주제 : predicts which passengers survived the trainanic shipwreck 문제 정의 : 어떤 특징의 승객이 살아남을 확률이 높을 것인가
사실 Kaggle 이라는 데이터 분석 사이트를 접하게 된지는 조금 되었습니다. 2018년도에 전공 수업에서 프로젝트에 사용할 수 있는 데이터 셋을 구할 수 있는 사이트 중 하나로 Kaggle을 소개받게 되었습니다. 그 때, 처음 접했던 kaggle 대회가 가장 유명했던
이번 시간에는 Sequence 데이터의 개념과 특징 그리고 Sequence 데이터를 처리하기 위한 알고리즘인 RNN, Recurrent Neural Networks에 대해서 배우게 됩니다. RNN 알고리즘의 역전파 방법인 BPTT와 기울기 소실 문제에 대해서도 다루게
앞서 Day 12 에서 이미지 처리를 위해 효과적인 Convolutional Neural Networks, CNN의 기본적인 개념 대해서 간단히 알아보았습니다. 이번 시간에는 CNN 연산 방법과 연산에서 작용되는 hyperparameter가 기능들에 대해서 알아보겠습니
그래프 구조 기반 데이터에서 최근 딥러닝의 발전은 추천 시스템 성능에서 SOTA의 성능을 보이고 있습니다만, 여전히 수백만개의 아이템과 수백만명의 유저를 활용해서 실제 모델을 배포하는 것은 도전 과제로 남아 있다고 합니다.그래프 구조와 노드 feature informa
Week03 - DL Basic [Day 12] - 최적화 1. Optimization 1) Optimization의 기본 용어 Generalization 보통 딥러닝에서는 Generalization, 일반화 성능을 높이는 것을 목적으로 합니다. 사실 머신
조건부확률 개념에서 연장되는 개념인 베이즈 정리와 인과관계 추론에 대해 알아보겠습니다. 베이즈 정리는 데이터가 새로 추가되었을 때, 새로운 정보를 받아들이는 방식에 대한 기반이 되므로 머신러닝에 사용되는 예측 모형의 방법론으로 굉장히 많이 사용되는 개념입니다. 특히 베
python 시각화 라이브러리인 matplotlib 과 seaborn 에 대한 내용은 추후에 보다 자세하게 다룰 예정입니다..!데이터 분석을 위한 방법 중 하나로 데이터 시각화가 있습니다.기존 데이터를 시각화함으로써 데이터 자체에서 볼 수 없었던 특징과 인사이트를 추론
pandas에는 데이터 연산 및 집계를 위해 제공하는 다양한 함수가 있습니다.다양한 함수를 실제로 적용해보면서 실습하는 것도 중요하지만 pandas 공식 홈페이지에서 제공하는 해당 함수의 소스코드와 원리를 보면서 보다 깊이 이해하는 것도 중요하다고 생각합니다.group
panel data 의 줄임말인 pandas는 python의 데이터 처리의 가장 기본적이며 표준 라이브러리입니다.pandas는 python에서 일종의 엑셀과 같은 역할을 하며, 데이터를 전처리하거나 통계 처리 시 많이 활용하는 피벗 테이블 등의 다양한 기능을 사용할 수
경사하강법은 딥러닝에서 가장 기본적면서도 중요한 학습 방법입니다. 경사하강법을 이해하기 위해서는 먼저 미분에 대해서 먼저 이해하여야 합니다.미분은 변수의 움직임에 따른 함수값의 변화를 측정하기 위한 도구로 최적화에서 제일 많이 사용하는 기법입니다. 미분에서는 극한의 개
numpy는 python에서 진행되는 모든 데이터 분석과 AI 엔지니어링에 있어 가장 기초적이며 필수적으로 사용되는 패키지입니다. Numerical Python의 약자로, 일반적으로 과학 계산에서 많이 사용하는 선형대수의 계산식을 python에서 구현할 수 있도록 도와
이번 강의에서는 프로그램을 보다 견고하게 만들어주는 예외 처리와 파일 다루기에 대해서 배웁니다.개발 시, 다양한 상황에서 예상치 못한 오류가 발생합니다. 이를 해결하고 방지하기 위해서 사전에 오류가 발생할 수 있는 예외를 포괄적으로 지정해서 대비하게 됩니다. 또 프로그
📄 Neural Collaborative Filtering(2017, Xiangnan He) 0. 포스팅 개요 ABSTRACT 논문이 발제된 2017년에는 딥러닝이 음성 인식, 컴퓨터 비전 그리고 자연어 처리와 같은 분야에서 다양한 성공적인 결과를 낳았지만, 추
이번 강의에서는 객체 지향 프로그래밍 언어, Object Oriented Programming(OOP)에 대해서 배웁니다. OOP는 프로그래밍 언어를 배우는 데 있어서 매우 중요한 개념입니다. python도 OOP 형태로 구성되어 있기도 하지만, python 이외의 언
이번 강의에서는 python에 존재하는 자료구조에 대해 배웁니다. 자료구조란 데이터를 저장할 때, 데이터에 특징에 따라 효율적으로 저장하기 위한 데이터의 저장 및 표현 방식을 의미합니다. 자료구조에 따라 데이터를 저장하는 방식과 표현 및 특징이 다르기 때문에 상황에 따
이번 강의에서는 프로그래밍에서 가장 기초적으로 알아야 할 변수에 대해서 배웁니다. 변수와 함께 해당 변수가 물리적으로 저장되는 메모리에 대해서도 다루게 됩니다. 마지막으로, 한 번에 여러 개의 변수를 함께 저장해서 화면에 표시하거나 필요한 연산을 수행하게 하는 List
OS, operating System은 운영체제라고 하며, 우리의 프로그램이 동작할 수 있는 구동 환경을 의미합니다. 보통 컴퓨터를 구성하는 요소를 크게 '소포트웨어'와 '하드웨어'로 구분할 수 있습니다. 여기서 '하드웨어'는 모니터, 마우스, CPU 등과 같은 물리적
해당 강의 정리는 본인이 작성한 내용으로 다른 주차의 강의 정리를 보고 싶으신 분은 투빅스 GNN 스터디를 참고해주시면 감사하겠습니다.작성자 : 오진석Introduction of Network EvolutionMacroscopic Evolution of Networks
해당 강의 정리는 본인이 작성한 내용으로 다른 주차의 강의 정리를 보고 싶으신 분은 투빅스 GNN 스터디를 참고해주시면 감사하겠습니다.작성자 : 오진석Motifs and Structural Roles in NetworksSubgraphs, Motifs, and Grap