전체 글
스타트업 6년차 Computer Vision 엔지니어. 논문 리뷰 및 코딩 삽질 등을 공유하고 있습니다. Pose Estimation을 주로 하고 있어요. LinkedIn : https://www.linkedin.com/in/wooil-jang-7b2853193/
-
Human Pose Estimation은 다양한 분야에 사용되고 있는데 대표적인 분야들을 살펴보면 다음과 같습니다. 1. Person Re-ID : 쿼리로 오는 두 사람의 이미지가 같은 사람인지를 판단하는 방법 2. High-fidelity rendering : VR 장비를 서로 끼고, 상대방의 얼굴이 내 앞에 3D로 렌더링되는 것 3. Human action recognition : 비디오가 들어왔을 때, 포즈 추정하고, 어떤 행동을 하는지 추정하는 방법 4. Motion Transfer : 하나의 비디오, 하나의 사진 -> 사진에 있는 사람이 비디오에 있는 모션처럼 움직이도록 5. Human image manipulation : 옷의 색, texture, 머리색 등을 변경 in the wild : 스..
2D/3D Human Pose Estimation의 어려움Human Pose Estimation은 다양한 분야에 사용되고 있는데 대표적인 분야들을 살펴보면 다음과 같습니다. 1. Person Re-ID : 쿼리로 오는 두 사람의 이미지가 같은 사람인지를 판단하는 방법 2. High-fidelity rendering : VR 장비를 서로 끼고, 상대방의 얼굴이 내 앞에 3D로 렌더링되는 것 3. Human action recognition : 비디오가 들어왔을 때, 포즈 추정하고, 어떤 행동을 하는지 추정하는 방법 4. Motion Transfer : 하나의 비디오, 하나의 사진 -> 사진에 있는 사람이 비디오에 있는 모션처럼 움직이도록 5. Human image manipulation : 옷의 색, texture, 머리색 등을 변경 in the wild : 스..
2022.05.20 -
핸즈온 머신러닝(handsonml) 소스 실행 중 위와 같은 에러가 발생해서 해결했다. from scipy.stats import reciprocal from sklearn.model_selection import RandomizedSearchCV param_distribs = { "n_hidden": [0, 1, 2, 3], "n_neurons": np.arange(1, 100) .tolist(), "lr": reciprocal(3e-4, 3e-2) .rvs(1000).tolist(), } rnd_search_cv = RandomizedSearchCV(keras_reg, param_distribs, n_iter=10, cv=3, verbose=2) rnd_search_cv.fit(X_train, y_t..
learning_rate is not a legal parameter핸즈온 머신러닝(handsonml) 소스 실행 중 위와 같은 에러가 발생해서 해결했다. from scipy.stats import reciprocal from sklearn.model_selection import RandomizedSearchCV param_distribs = { "n_hidden": [0, 1, 2, 3], "n_neurons": np.arange(1, 100) .tolist(), "lr": reciprocal(3e-4, 3e-2) .rvs(1000).tolist(), } rnd_search_cv = RandomizedSearchCV(keras_reg, param_distribs, n_iter=10, cv=3, verbose=2) rnd_search_cv.fit(X_train, y_t..
2022.04.20 -
2018년에 나온 Depth Estimation 분야 논문으로 Encoder-Decoder 구조로 이루어진 모델입니다. Contributions transfer learning(전이 학습) 기반으로 깊이 추정 정확도/품질 향상 학습 더 빨리 진행되도록 loss 함수 개선 깊이 추정 일반화 성능 평가를 위한 합성된 실내 장면 데이터를 테스트셋으로 제안 관련 연구 multi-view : multi-view에서는 CNN을 이용한 stereo 재구성 방법이 최근 제안되었다. 이 논문에서는 단일 이미지 깊이 추정의 성능 향상에 초점을 맞춰서 진행하고 있다. transfer learning : 이미지 분류를 위해 설계된 모델을 인코더에 전이 학습으로 사용함 Encoder-Decoder : 이미지 segmentati..
High Quality Monocular Depth Estimation via Transfer Learning(DenseDepth) 논문리뷰2018년에 나온 Depth Estimation 분야 논문으로 Encoder-Decoder 구조로 이루어진 모델입니다. Contributions transfer learning(전이 학습) 기반으로 깊이 추정 정확도/품질 향상 학습 더 빨리 진행되도록 loss 함수 개선 깊이 추정 일반화 성능 평가를 위한 합성된 실내 장면 데이터를 테스트셋으로 제안 관련 연구 multi-view : multi-view에서는 CNN을 이용한 stereo 재구성 방법이 최근 제안되었다. 이 논문에서는 단일 이미지 깊이 추정의 성능 향상에 초점을 맞춰서 진행하고 있다. transfer learning : 이미지 분류를 위해 설계된 모델을 인코더에 전이 학습으로 사용함 Encoder-Decoder : 이미지 segmentati..
2022.04.14 -
Overfitting은 학습 데이터의 잡음 양에 비해 모델이 너무 복잡할 때 발생할 수 있다. 지나치게 학습데이터에 맞게 최적화된 형태이다. Overfitting의 해결 방법 - 파라미터 수가 더 적은 모델을 선택한다. - 학습 데이터에 있는 불필요한 특성을 제거하거나, 특성 수를 줄인다. - 모델에 제약(regularization)을 추가해서 단순화시킨다. (ex. 특정 모델 파라미터의 값이 0이 되도록 해서 곡선 -> 직선으로 만드는 방법 / 또는 파라미터 값의 범위에 제한을 둬서 좀 더 단순화할 수도 있다. / 학습 알고리즘의 하이퍼파라미터 조정을 통해 제한을 줄 수 있음 ) - 학습 데이터를 더 많이 수집한다. - 학습데이터의 noise를 줄인다. (이상치 제거, 오류 데이터 수정) Underfi..
Overfitting(과대적합), Underfitting(과소적합) 해결 방법Overfitting은 학습 데이터의 잡음 양에 비해 모델이 너무 복잡할 때 발생할 수 있다. 지나치게 학습데이터에 맞게 최적화된 형태이다. Overfitting의 해결 방법 - 파라미터 수가 더 적은 모델을 선택한다. - 학습 데이터에 있는 불필요한 특성을 제거하거나, 특성 수를 줄인다. - 모델에 제약(regularization)을 추가해서 단순화시킨다. (ex. 특정 모델 파라미터의 값이 0이 되도록 해서 곡선 -> 직선으로 만드는 방법 / 또는 파라미터 값의 범위에 제한을 둬서 좀 더 단순화할 수도 있다. / 학습 알고리즘의 하이퍼파라미터 조정을 통해 제한을 줄 수 있음 ) - 학습 데이터를 더 많이 수집한다. - 학습데이터의 noise를 줄인다. (이상치 제거, 오류 데이터 수정) Underfi..
2022.04.07 -
모델의 구조가 정말로 중요할까? 그동안의 SOTA 논문들을 보면, Skip-Connection, Transformer, Graph Convolution 또는 시공간 통합형 구조와 같은 네트워크 구조의 변형을 통해 성능 향상을 시킨 경우가 많다. 또는 여러 모델의 결과를 합쳐서 사용하는 앙상블 방법도 대회에서 성능 향상을 위해 많이 사용되고 있다. 그렇지만 앙상블은 여러 모델이 합쳐진 만큼 컴퓨팅 비용이 더 많이 들어가고, 같은 자원이라면 추론 속도는 더 늦어질 수밖에 없다. 이들의 개념 모두 좋은 걸 알겠지만 이게 딥러닝에서 절대적으로 중요한 것인가에 대한 의문점을 해결해준 논문이 아닌가 싶다. 이 논문은 경량화에 관해 다루고 있는데, 기존의 복잡한 모델이 가진 지식을 좀 더 단순화된 모델에 전달하는 것..
Distilling the Knowledge in a Neural Network모델의 구조가 정말로 중요할까? 그동안의 SOTA 논문들을 보면, Skip-Connection, Transformer, Graph Convolution 또는 시공간 통합형 구조와 같은 네트워크 구조의 변형을 통해 성능 향상을 시킨 경우가 많다. 또는 여러 모델의 결과를 합쳐서 사용하는 앙상블 방법도 대회에서 성능 향상을 위해 많이 사용되고 있다. 그렇지만 앙상블은 여러 모델이 합쳐진 만큼 컴퓨팅 비용이 더 많이 들어가고, 같은 자원이라면 추론 속도는 더 늦어질 수밖에 없다. 이들의 개념 모두 좋은 걸 알겠지만 이게 딥러닝에서 절대적으로 중요한 것인가에 대한 의문점을 해결해준 논문이 아닌가 싶다. 이 논문은 경량화에 관해 다루고 있는데, 기존의 복잡한 모델이 가진 지식을 좀 더 단순화된 모델에 전달하는 것..
2022.04.01 -
dribble - 좋은 디자인 샘플들이 많이 올라와있고, 앱스토어 스크린샷은 사이즈랑 텍스트, 아이폰 프레임 이미지와 위치 정도만 신경쓰면 되므로 샘플들을 참조하는 것도 좋을 것 같습니다. - 프레임 이미지는 무료 Mockup 템플릿에서 따와서 사용 : https://uxplanet.org/36-free-iphone-mockups-sketch-249b4a0db965 36 Free iPhone Mockups for 2022 [Sketch] — February 2022 А compilation of iPhone mockups in Sketch for 2022. uxplanet.org https://dribbble.com/tags/app_store_screenshots App Store Screenshots..
iOS 앱스토어 스크린샷 이미지 준비하는법dribble - 좋은 디자인 샘플들이 많이 올라와있고, 앱스토어 스크린샷은 사이즈랑 텍스트, 아이폰 프레임 이미지와 위치 정도만 신경쓰면 되므로 샘플들을 참조하는 것도 좋을 것 같습니다. - 프레임 이미지는 무료 Mockup 템플릿에서 따와서 사용 : https://uxplanet.org/36-free-iphone-mockups-sketch-249b4a0db965 36 Free iPhone Mockups for 2022 [Sketch] — February 2022 А compilation of iPhone mockups in Sketch for 2022. uxplanet.org https://dribbble.com/tags/app_store_screenshots App Store Screenshots..
2022.03.31