tf.py_function과 @tf.function의 차이가 궁금해졌다."@tf. function turns python code into a series of TensorFlow graph nodes. tf. py_function wraps an existing py
object detection에서 사용하는 loss function(L1, L2 norm)이 실제로 모델의 성능 측정 지표인 IoU를 개선하는 것과 강한 상관간계가 있지 않다!https://giou.stanford.edu/딥러닝 Quantizationfloat
cardinaltiy라는 단어가 CNN에서 쓰인다.CSPNet 논문에 나오길래 무슨 뜻인가 봤는데("In ResNeXt 39, Xie et al. first demonstrate that cardinality can be more effective than the di
tf-idfNLP 전처리 과정을 살피다가 다시 한 번 지나치게 된 개념이다.https://wikidocs.net/31698이해한 바에 따르면, 어떤 단어가 정말 많이 등장해도 실제로 많은 문서(혹은 샘플)에 등장하는지를 따져서 그 단어의 중요도를 측정하고 가중
assert, raise로 오류 일으키는 법https://ltlkodae.tistory.com/17assert는 debugging할 때 쓰면 좋고, raise는 실제 사용자에게 알려줄 때 사용하면 좋단다.(이유는 assert는 \_\_debug\_\_=Fals
iof는 무엇일까?https://github.com/open-mmlab/mmdetection/issues/393intersection over foreground 라고 한다.the ratio of intersection over foreground, which
np.asarray()np.ndarray 만드는 건 똑같은데 np.array()랑 뭐가 다를까?https://supermemi.tistory.com/66보면, np.array()로 만들 경우 dtype이 같든 말든 그냥 복사를 하는데, np.asarray()는
TFRecordhttps://www.tensorflow.org/tutorials/load_data/tfrecord일단 binary 레코드로 뭔가 TF 학습에 효율적이게끔 데이터를 저장하는 포맷이라고 생각하면 될 듯하고,tf.train.Example이라는 게 바
grey scale 이미지의 경우 픽셀 강도0(흰색) ~ 255(검은색)?https://codetorial.net/tensorflow/mnist_classification.htmlcmap='binary'는 일반적인 것과 다르다.컬러맵의 설정에 따라 값에 따라
tarfile 모듈인데, 뭔가 여러 개의 파일을 합쳐서 하나로 만들고, 또 그것을 풀어주고 해주는 모듈인 것 같다.자세한 설명은 documentation도 있지만,https://wikidocs.net/121785 <- 이게 더 직관적으로 이해하기 쉬운 것
Face Detection 관련 손실함수뭐 종류가 많다.대부분 feature vector로 인물의 얼굴 이미지를 최종 변환해서 vector들 간 유사도나 거리 등을 비교하는 것 같다.서버로 이미지를 보내서 처리하는 방식은 네트워크 비용 + 서버 비용 + 인터넷 속도의
각자의 지식이 어느 정도인지 파악 필요(아니면 누군가는 아는 것을 계속 설명하게 됨)아무것도 안 본 상태에서 '같이 하면서 모르면 서로 알아가자!'는 사실 힘든 듯.(차라리 혼자서 코드 이해하고 나중에 모이는 게 나은 듯)Redesigned skip connection
오늘의 학습 리스트 What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis Scene Text Recognition 관련한 모델들의 데이터셋 variance로 제
Custom Data Generator를 Keras로 만드는 부분이 나온다.보면 파일 형태로 있는 데이터들을 glob 라이브러리를 통해서 전부 filename들을 긁어오고(image, label) 형태로 for loop 및 zip을 통해 묶어준다.중요한 건 그 데이터를
np.empty()np.zeros()와 비슷한데, 얘는 value를 할당하지 않고 그냥 구조(?)만 만들어놓는단다.(그렇다고 실행했을 때 값이 없는 건 아님. 나중에 제대로된 값 할당 가능)https://numpy.org/doc/stable/reference/
tf.math.greater_equal()은 ReLU 같은 게 아니라 boolean 값을 리턴하는 함수이다.ReLU 같이 하려면 tf.math.maximum(0, y)tensorflow는 boolean indexing이 안되는 것 같다. 해보려니까 뭔가 차원만 더 늘어
좌표 표현 방법한 이미지의 좌표 표현 방법에 따라 bounding box 그릴 때 작성하는 값들의 순서가 달라진다.예를 들어 (높이, 너비)로 이미지의 크기 표현 방법이 확정되면 좌표 표기는 (x, y)가 된다.그러나 (너비, 높이)로 순서가 바뀌면 좌표 표기도 (y,
슬라이딩 윈도우를 convolutionally 하는 것과 아닌 것의 차이일반적으로 했을 때는 윈도우 사이즈 하나에 대한 이미지 내 특정 영역을 크롭하고 conv_net에 넣어서 해당 영역에 대한 object가 있을 확률 및 bbox 계산 -> 이것을 슬라이딩 하듯이 여
오늘의 학습 리스트 cv2.findContours(이미지, 모드, ) 이미지 안에 있는 contour들을 전부 찾아낸단다. 어떻게 하는 건가 궁금해서 찾아봤더니, 더 복잡하고 많은 개념들이 있다.(알고나면 쉬움) 공식 Documentation Mediu
ds.shuffle().batch().prefetch() 가 된 데이터셋은 un-shuffle이 안되나 보다...다시 ds.shuffle(reshuffle_each_iteration=False)를 해도 계속 상태가 바뀐다.원래 shuffle을 한번 적용시키면 바뀌지 않