'컴퓨터공학/그 외 모델들' 카테고리의 글 목록

Kolmogorov-Arnold Networks

Kolmogorov-Arnold Networks(KANs)은 2024년에 등장한 신경망 아키텍처로, 기존의 딥러닝 모델들이 '블랙 박스'로 불리며 그 내부 작동 방식을 이해하기 어려운 문제를 해결하고자 고안되었다. 이 모델은 Kolmogorov-Arnold 정리를 기반으로 개발되었으며, 이를 통해 다변수 함수를 여러 개의 단순한 함수로 분해해 표현할 수 있다.KAN의 주요 특징Kolmogorov-Arnold 정리: 이 정리는 모든 다변수 함수를 단순한 일변수 함수들의 합으로 나타낼 수 있다는 수학적 이론이다. 이를 신경망에 적용하면, 기존의 다층 퍼셉트론(MLP)과는 다른 방식으로 데이터를 처리하고 학습할 수 있다. KAN은 이 정리를 활용해 복잡한 문제를 더욱 효율적으로 해결하는 구조를 가지며, 특히..

컴퓨터공학/그 외 모델들 2024.10.19

스파이크 신경망(Spiking Neural Networks, SNNs)

스파이크 신경망(Spiking Neural Networks, SNNs)은 생물학적으로 더욱 현실적인 방식으로 뇌의 신경 활동을 모사하는 신경망 모델이다. 기존의 인공신경망(ANN)이나 딥러닝 모델보다 더 뇌에 가깝게 동작하는 방식으로, 뉴런이 특정 임계값을 넘을 때만 활동 신호(스파이크)를 발화하는 것을 특징으로 한다.스파이크 신경망의 주요 특징뉴런 모델:SNN에서는 뉴런이 일정한 활성화 함수로 출력을 연속적으로 계산하는 대신, 이벤트 기반으로 작동한다. 뉴런은 입력 신호가 누적되어 특정 임계값(threshold)에 도달할 때까지 기다리며, 임계값을 넘는 순간에만 "스파이크"를 발화한다.대표적인 뉴런 모델로는 LIF(Leaky Integrate-and-Fire)와 Izhikevich 뉴런 모델 등이 있다..

컴퓨터공학/그 외 모델들 2024.09.22

자기조직화지도(SOM, Self-Organizing Map)

자기조직화지도(SOM, Self-Organizing Map)는 인공신경망(Artificial Neural Network)의 한 종류로, 비지도 학습을 통해 입력 데이터를 시각적으로 표현하고, 그 데이터의 특성에 따라 유사한 패턴을 그룹화하는 데 사용된다. 이 기법은 주로 데이터의 차원을 축소하거나, 데이터를 클러스터링할 때 활용된다. 이를 처음 제안한 사람은 핀란드의 코호넨(Teuvo Kohonen) 교수이며, SOM을 '코호넨 지도(Kohonen Map)'라고 부르기도 한다.논문: Self-Organized Formation of Topologically Correct Feature Maps 주요 특징 및 원리:비지도 학습: SOM은 입력 데이터에 대한 레이블이 없을 때 사용된다. 즉, 지도 학습처럼 ..

컴퓨터공학/그 외 모델들 2024.09.12

RAG (Retrieval-Augmented Generation)

RAG(Retrieval-Augmented Generation) 모델은 Facebook AI Research (FAIR)에서 2020년에 처음 제안했다. Facebook AI 팀은 생성 기반 모델의 한계를 보완하기 위해, 외부 데이터를 실시간으로 검색하고 이를 바탕으로 더욱 정확한 답변을 생성할 수 있도록 하기 위해 RAG를 개발했다. 이 연구는 특히 GPT-3와 같은 대형 언어 모델들이 훈련된 데이터에 의존해 답변을 생성하는 방식을 개선하고자 했다.FAIR 팀이 발표한 논문에서는 RAG의 구조와 효율성을 설명하며, RAG가 대규모 언어 모델이 직면하는 몇 가지 문제(예: 최신 정보에 대한 접근 부족, 고정된 지식 문제)를 해결할 수 있는 방법으로 제안되었다. RAG는 인공지능 모델, 특히 자연어 처리(..

컴퓨터공학/그 외 모델들 2024.09.10

Stable Diffusion 모델

Stable Diffusion은 Autoencoder에 기초하여 발전된 이미지 생성 및 변형을 위한 딥러닝 기반 모델로, 특히 텍스트로부터 이미지를 생성하는 데 강점을 가지고 있다. 이 모델은 2022년에 Stability AI와 같은 연구 기관들에 의해 개발되었으며, 오픈소스 형태로 공개되어 많은 개발자들이 접근하고 활용할 수 있다.Stable Diffusion 모델의 핵심 아이디어는 디퓨전 프로세스(Diffusion Process)를 활용하여 점진적으로 이미지를 생성하는 것이다. 이 과정에서 모델은 노이즈가 섞인 이미지에서 노이즈를 제거하며 점차 선명한 이미지를 만들어낸다. 이 방법은 이미지 생성을 위한 매우 강력한 접근 방식으로, 특히 고해상도 이미지와 복잡한 장면을 생성할 때 효과적이다.주요 특징..

컴퓨터공학/그 외 모델들 2024.08.30

변분 오토인코더(Variational Autoencoder, VAE)

변분 오토인코더(Variational Autoencoder, VAE)는 Autoencoder의 변형 중 하나로, 데이터의 잠재 공간(latent space)에서 확률 분포를 학습하여 새로운 데이터를 생성하는 데 중점을 둔다. VAE는 기본 Autoencoder와는 달리, 입력 데이터의 잠재 변수를 확률 분포로 간주하고, 이를 통해 생성 모델의 기능을 수행한다. VAE의 주요 개념과 구조를 이해하기 위해서는 몇 가지 핵심 요소를 살펴볼 필요가 있다.1. 잠재 공간(Latent Space)VAE에서 입력 데이터는 잠재 공간에 매핑된다. 이 잠재 공간은 저차원 공간으로, 데이터를 구성하는 중요한 특징들을 압축하여 표현한다.일반적인 Autoencoder에서는 잠재 벡터가 고정된 값으로 변환되지만, VAE에서는 ..

컴퓨터공학/그 외 모델들 2024.08.30

Autoencoder

Autoencoder는 인공 신경망의 일종으로, 데이터의 차원 축소와 특징 추출에 주로 사용된다. 간단히 말해, Autoencoder는 입력 데이터를 압축한 후 다시 원래의 형태로 복원하는 과정을 통해 데이터의 중요한 특징을 학습한다. Autoencoder는 다음과 같은 두 가지 주요 부분으로 구성된다.1. 인코더(Encoder)인코더는 입력 데이터를 저차원 잠재 공간(latent space)으로 압축하는 역할을 한다. 입력 데이터가 인코더를 거치면서 점점 더 작은 차원의 벡터로 변환되며, 이 과정에서 데이터의 중요한 특징만을 추출하게 된다. 이때, 네트워크의 마지막 은닉층에서는 입력 데이터보다 훨씬 적은 수의 뉴런을 가지는 저차원 벡터, 즉 잠재 벡터(latent vector)가 만들어진다.2. 디코더..

컴퓨터공학/그 외 모델들 2024.08.30

GNN(Graph Neural Network)

GNN(Graph Neural Network)은 딥러닝에서 그래프 데이터를 처리하는 모델로, 그래프 기반 딥러닝 모델의 범주에 속한다. GNN은 특히 비정형 데이터(unstructured data)에서 노드, 엣지, 그래프 구조를 학습하는 데 사용된다. 이를 통해 그래프의 구조적 정보와 노드 간의 관계를 모델링하고 학습할 수 있다.GNN의 개요그래프 데이터 처리: GNN은 그래프 데이터를 처리하기 위해 개발된 모델로, 그래프는 노드(정점)와 엣지(간선)로 구성된다. 이러한 그래프 구조는 소셜 네트워크, 분자 구조, 지식 그래프, 추천 시스템, 교통 네트워크 등 다양한 분야에서 자연스럽게 나타난다.학습 대상:노드 분류(Node Classification): 그래프 내의 개별 노드의 레이블을 예측하는 작업이..

컴퓨터공학/그 외 모델들 2024.08.28

airoot의 인공지능 이야기

컴퓨터공학/그 외 모델들 8

티스토리툴바