전체 글
스타트업 6년차 Computer Vision 엔지니어. 논문 리뷰 및 코딩 삽질 등을 공유하고 있습니다. Pose Estimation을 주로 하고 있어요. LinkedIn : https://www.linkedin.com/in/wooil-jang-7b2853193/
-
microsoft에서 낸 transformer 기반의 mesh reconstruction 논문입니다. https://www.youtube.com/watch?v=feCWifOxBi0 발표 영상을 같이 보시면 좋을 것 같아 공유드립니다. 1. Introduction SMPL과 같은 parametric 모델을 사용하고 그 모델의 paramter를 학습하는 모델 : 많이 사용되고, 좋은 성과가 나타나고 있지만, 결국 그 모델에 의존하기 때문에 Pose와 shape 표현이 어느 정도 제한되어 있다. parametric 모델을 사용하지 않는 경우 : graph convolution neural network을 이용해서 인접한 점들의 상호작용을 모델링하거나, 1D heatmap으로 vertex 좌표를 regress한..
End-to-End Human Pose and Mesh Reconstruction with Transformersmicrosoft에서 낸 transformer 기반의 mesh reconstruction 논문입니다. https://www.youtube.com/watch?v=feCWifOxBi0 발표 영상을 같이 보시면 좋을 것 같아 공유드립니다. 1. Introduction SMPL과 같은 parametric 모델을 사용하고 그 모델의 paramter를 학습하는 모델 : 많이 사용되고, 좋은 성과가 나타나고 있지만, 결국 그 모델에 의존하기 때문에 Pose와 shape 표현이 어느 정도 제한되어 있다. parametric 모델을 사용하지 않는 경우 : graph convolution neural network을 이용해서 인접한 점들의 상호작용을 모델링하거나, 1D heatmap으로 vertex 좌표를 regress한..
2021.09.04 -
https://paperswithcode.com/sota/weakly-supervised-3d-human-pose-estimation-on Weakly supervised 3d human pose estimation SOTA 발표영상과 함께 보시면 좋을 것 같아 공유합니다. https://www.youtube.com/watch?v=rfpw90_3IDQ 1. Introduction 기존 augmentation 방식 : 위의 이미지에서 보여지는 기존 연구들의 pose augmentation 방식은 이미지를 crop하거나 중간에 다른 object를 합성하는 방식을 사용하고 있습니다. (하지만 이 케이스의 경우 2D pose를 3D pose로 lifting하는 거라 다른 방식의 사용이 가능하고, 이 논문에서는 ..
PoseAughttps://paperswithcode.com/sota/weakly-supervised-3d-human-pose-estimation-on Weakly supervised 3d human pose estimation SOTA 발표영상과 함께 보시면 좋을 것 같아 공유합니다. https://www.youtube.com/watch?v=rfpw90_3IDQ 1. Introduction 기존 augmentation 방식 : 위의 이미지에서 보여지는 기존 연구들의 pose augmentation 방식은 이미지를 crop하거나 중간에 다른 object를 합성하는 방식을 사용하고 있습니다. (하지만 이 케이스의 경우 2D pose를 3D pose로 lifting하는 거라 다른 방식의 사용이 가능하고, 이 논문에서는 ..
2021.08.26 -
정규식을 이용해서 문자열에서 특정 문자로 시작하고, 특정 문자로 끝나는 단어를 찾을 수 있습니다. 예시 : w로 시작하고, t로 끝나는 단어 찾기 import re s = 'hello what up woww wowwl wont want' pattern = r'\bw\w*a\b' re.findall(pattern, s) 예상대로 위의 코드는 "['what', 'wont', 'want']"를 출력하게 됩니다. 정규식에 사용된 부분들의 의미는 다음과 같습니다. \b : 단어의 첫 부분 w : 문자 'w' \w* : 0글자 이상의 한 단어 a : 문자 'a' \b : 단어의 끝 부분 만약 정규식으로 처리하기 너무 복잡한 케이스라고 한다면, 그냥 split 하고 조건문으로 처리하는 게 나을수도 있습니다. [x f..
Python 정규식 - 특정 문자로 시작하고 끝나는 단어 찾기정규식을 이용해서 문자열에서 특정 문자로 시작하고, 특정 문자로 끝나는 단어를 찾을 수 있습니다. 예시 : w로 시작하고, t로 끝나는 단어 찾기 import re s = 'hello what up woww wowwl wont want' pattern = r'\bw\w*a\b' re.findall(pattern, s) 예상대로 위의 코드는 "['what', 'wont', 'want']"를 출력하게 됩니다. 정규식에 사용된 부분들의 의미는 다음과 같습니다. \b : 단어의 첫 부분 w : 문자 'w' \w* : 0글자 이상의 한 단어 a : 문자 'a' \b : 단어의 끝 부분 만약 정규식으로 처리하기 너무 복잡한 케이스라고 한다면, 그냥 split 하고 조건문으로 처리하는 게 나을수도 있습니다. [x f..
2021.08.13 -
딥러닝 논문을 보다보면 ablation study 섹션이 종종 등장하곤 합니다. 이 용어는 해당 논문에서 제안한 내용이 모델에 어떤 영향을 미치는지 확인하고자 할 때, 그 내용(요소)을 포함한 모델과 그렇지 않은 모델을 비교하는 것을 말합니다. 이를 통해 시스템의 인과관계를 단순하지만 명확하게 알아볼 수 있기 때문입니다. 참고자료 : https://fintecuriosity-11.tistory.com/73
논문 용어 "ablation study"딥러닝 논문을 보다보면 ablation study 섹션이 종종 등장하곤 합니다. 이 용어는 해당 논문에서 제안한 내용이 모델에 어떤 영향을 미치는지 확인하고자 할 때, 그 내용(요소)을 포함한 모델과 그렇지 않은 모델을 비교하는 것을 말합니다. 이를 통해 시스템의 인과관계를 단순하지만 명확하게 알아볼 수 있기 때문입니다. 참고자료 : https://fintecuriosity-11.tistory.com/73
2021.08.09 -
2020년 8월에 나온 3D pose estimation 논문인 "Monocular, One-stage, Regression of Multiple 3D People" 논문을 살펴보도록 하겠습니다. 발표영상과 함께 보시면 좋을 것 같아 공유합니다. https://www.youtube.com/watch?v=thPQvC3arts 현 시점(2021/08/05) 기준 3DPW 데이터셋에서 2위, 소스가 오픈된 것 중에서는 1위를 기록하고 있는 논문입니다. Introduction 최근에는 monocular 상태에서의 3D pose 및 shape 추정이 사람 1명이 있는 영상/이미지에서 많은 발전이 이뤄졌다. 하지만 일반적인 영상에서 봤을 때 여러 사람이나 환경들로 인한 폐색이 발생했을 때에 취약한 문제가 있다. 기..
Monocular, One-stage, Regression of Multiple 3D People2020년 8월에 나온 3D pose estimation 논문인 "Monocular, One-stage, Regression of Multiple 3D People" 논문을 살펴보도록 하겠습니다. 발표영상과 함께 보시면 좋을 것 같아 공유합니다. https://www.youtube.com/watch?v=thPQvC3arts 현 시점(2021/08/05) 기준 3DPW 데이터셋에서 2위, 소스가 오픈된 것 중에서는 1위를 기록하고 있는 논문입니다. Introduction 최근에는 monocular 상태에서의 3D pose 및 shape 추정이 사람 1명이 있는 영상/이미지에서 많은 발전이 이뤄졌다. 하지만 일반적인 영상에서 봤을 때 여러 사람이나 환경들로 인한 폐색이 발생했을 때에 취약한 문제가 있다. 기..
2021.08.06 -
FLOPS(Floating point Operations Per Second)는 컴퓨터의 성능을 수치로 나타낼 때 주로 사용되는 단위이다. (출처 : 위키백과) 가끔 논문 확인 시 성능 지표로 FLOPs가 나오는 경우가 있어서 정리해봤습니다. 만약 동일한 성능을 내는 모델이라면 FLOPs가 더 낮은 게 연산량이 적다는 의미이니 속도가 더 빠르다 또는 상대적으로 실행 환경 사양이 덜해도 돌릴 수 있다라고 봐도 될 것 같습니다.
논문 용어 "FLOPs" 뜻FLOPS(Floating point Operations Per Second)는 컴퓨터의 성능을 수치로 나타낼 때 주로 사용되는 단위이다. (출처 : 위키백과) 가끔 논문 확인 시 성능 지표로 FLOPs가 나오는 경우가 있어서 정리해봤습니다. 만약 동일한 성능을 내는 모델이라면 FLOPs가 더 낮은 게 연산량이 적다는 의미이니 속도가 더 빠르다 또는 상대적으로 실행 환경 사양이 덜해도 돌릴 수 있다라고 봐도 될 것 같습니다.
2021.08.05