목록인공지능 (38)
운동하는 공대생

1. Intro 컴퓨터 비전과 딥러닝 책의 3장 내용을 정리한 내용입니다. 3장에서는 이미지, 영상 데이터를 어떻게 데이터화시키는지를 설명하는 장이다. 이미지나 영상 데이터는 고차원은 다분광, 초분광 같은 영상들도 있지만 보통 RGB로 구성된 영상으로 예시를 많이 진행했다. 2. 이진 영상 2.1 이진화 이진화란 maxtrix 형식으로 표현된 데이터에서 임곗값 T를 기준으로 T 보다 크면 1 적으면 0 이런 식으로 데이터를 단순히 이진화시킨다. 2.2 오츄 알고리즘 전체 이미지에서 적정한 임곗값을 먼저 계산하여 임곗값을 정한다. 2.3 연결 요소 connected component labeling 이라고도 하며 근처에 있는 같은 데이터를 연결 지어서 분류해 주는 방식이다. 2.4 모 폴로지 영상을 변환하..

1. Intro 이전에 GNN 에 대하여 글을 작성을 하였었지만 이번에는 GNN 을 이용한 가장 대표적인 모델인 GCN 에 대하여 이야기를 해보겠습니다. GCN - Graph Convolution Network는 이름에서 처럼 Graph 에 대한 데이터를 convolution 작업을 통해서 데이터를 모델에 전달하는 방식입니다. 2. Related Work 2.1 Graph 이전에도 이야기를 했지만 그래프 데이터의 구조는 기본적으로 노드(node) 와 간선(edge)들로 이루어져 있다. 그리고 이 노드들 간의 관계를 나타내는 방식이 Adjacency matrix(입접행렬)로 표현하면 노드가 간선으로 연결되어 있다면 1 아니면 0 으로 표시가 된다. 그리고 추가적으로 노드들의 정보 즉 데이터에 대한 부분은 ..

논문 - https://arxiv.org/abs/2211.05778 InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions Compared to the great progress of large-scale vision transformers (ViTs) in recent years, large-scale models based on convolutional neural networks (CNNs) are still in an early state. This work presents a new large-scale CNN-based foundation model, termed arxiv.org 1. In..

논문 - https://arxiv.org/abs/1706.05587v3 Rethinking Atrous Convolution for Semantic Image Segmentation In this work, we revisit atrous convolution, a powerful tool to explicitly adjust filter's field-of-view as well as control the resolution of feature responses computed by Deep Convolutional Neural Networks, in the application of semantic image segmentatio arxiv.org 1. Intro 기존의 컨볼루션 기반의 모델들은 지역..

https://arxiv.org/abs/1406.4729v4 Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition Existing deep convolutional neural networks (CNNs) require a fixed-size (e.g., 224x224) input image. This requirement is "artificial" and may reduce the recognition accuracy for the images or sub-images of an arbitrary size/scale. In this work, we equip th arxiv.org 1 Intro 논문에서 제시한 문제..

1. Background Theories 1.1 Graph representation learning GNN 은 우리가 일상적으로 접하는 데이터중에서 데이터 간의 복잡한 관계를 표현하기에 위해서 등장한 이론이다. 예를 들어 소셜 네트워크, 웹 페이지 및 분자 구조 등이 그래프로 표현될 수 있다. GNN은 이러한 그래프 데이터를 분석하여 패턴, 상호 관계 및 특성을 발견하는 데 사용된다. 모델은 데이터 간의 관계를 이해하고 활용하는 데 사용되며 데이터 간의 상호작용까지도 그룹화가 가능해진다. 1.2 What is a graph? GNN에서 설명하는 그래프의 구조랑 노드(node)와 간선(edge)을 관계도를 말하는 자료구조를 말한다. 논문에서는 그래프를 G 그리고 그 안에 노드를 V 그리고 간선을 E라고 ..