이 논문은 이미지에서 인식된 obeject(차량)의 실제 bounding box를 중심/크기/각도로 나누어 정보를 얻어 구할 수 있게 하는 모델을 제안하고 있다. 하나의 이미지에서 차량의 실제 정보를 얻을 수 있는(3D object detection) one-stage architecture를 제안하였으며, 중심/크기/각도로 분리하여 구하는 방식(multi-step disentanglement approach)을 제안하였다. Backbone - DLA(Deep Layer Aggregation)-34 수정해서 사용 - 모든 hierarchical aggregation을 DCN(Deformable Convolutional Networks)으로 대체 hierarchical aggregation은 같은 계층의 ..
이 논문은 unsupervised한 방법으로 image depth를 구하는 모델을 학습시키는 방법이다. 학습에는 sequential한 이미지가 필요하고, 각 이미지의 pose를 이용해 한 이미지의 point들을 다른 이미지로 projection하고, projection된 위치의 점과 Intensity를 비교해 loss를 구한다. 여기서 pose도 model output이므로 gt없이 loss 계산이 가능해진다. Overview 조금 더 구체적으로 살펴보면 다음과 같은 단계로 나누어 생각해 볼 수 있다. 1. $t$에서의 이미지 $I_{t}$를 depth CNN에 통과시켜 Depthmap $\hat{D_{t}}(p)$를 구한다.(Depth map은 모든 이미지 픽셀에 대한 depth를 가지고 있다.) 2...
선택분류는 몇 가지 선택지가 주어지고 그 가운데 하나를 고르는 문제이다. object detection도 여러 물체 중 어떤 것인지 분류한다는 점에서 선택분류라고 할 수 있다. 이진분류에서는 시그모이드가 주요한 기준이었다면 선택분류에서는 소프트맥스가 사용된다. 소프트맥스는 시그모이드의 확장이라 할 수 있다. 소프트맥스 함수 소프트맥스 함수는 로짓값 벡터를 확률 분포 벡터로 변환해주는 비선형 함수이다. 일반식을 구하면 아래와 같다. $$ y_{i} = \frac{e^{x_{i}}}{e^{x_{1}}+\cdots +e^{x_{n}}} $$ 하지만 이 식은 코드를 통한 계산 과정에서 오류를 일으킬 수 있으므로 아래와 같이 변형된 식을 사용한다. $$ y_{i} = \frac{e^{x_{i} - x_{k}}}{..
- 디지털신호처리
- depth
- Depth estimation
- AI
- Gan
- design pattern
- OS
- mode collapse
- Raspberry Pi
- Operating System
- 신호처리
- controllable GAN
- depthmap
- TRACKING
- 운영체제
- 3d object detection
- pcb
- Deep learning
- ML Pipeline
- Building Basic GAN
- DSP
- image
- MLOps
- ML
- Generative Model
- conditional GAN
- machine learning
- feature
- deeplearning
- 딥러닝
- Total
- Today
- Yesterday
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |