Super Kawaii Cute Cat Kaoani 치킨고양이짱아 공부일지
728x90

전체 글 152

다익스트라 알고리즘(Dijkstra Algorithm)

다익스트라 알고리즘은 음의 가중치가 없는 그래프에서, 한 vertex에서 모든 vertex들까지의(one-to-all) 최단거리를 구하는 알고리즘이다.그럼 알고리즘의 내용을 살펴보자. 설명에서d[N]:  출발 vertex -> N 까지 계산된 최단거리S: 방문한 노드들의 집합Q: 방문하지 않은 노드들의 집합를 의미한다.아래와 같은 네트워크에서 A->F까지의 최단 거리 계산을 목표로 하는 상황이라고 가정하자.1. 다익스트라 알고리즘은 아직 확인되지 않은 거리를 모두 무한(infinity)로 설정한다.최단거리 update출발지로부터 출발지까지의 거리는 무조건 0이기 때문에 d[A] = 0으로 설정한다.d[나머지 node]= infinity로 설정이되어있는데 실제로 무한이라는 의미는 아니고, 아직 확인되지 않..

수업정리 2024.10.03

SVM(State-Vector Machine)이란?

SVM은 지도 학습 알고리즘으로, 주로 분류(classification) 문제에 사용됩니다. SVM은 기존의 분류방법들과 기본원리가 크게 다르다.신경망을 포함하여 기존의 방법들은 분류 '오류율을 최소화'하려는 목적으로 설계되었다.하지만 SVM은 한 발짝 더 나아가 두 부류 사이에 존재하는 '여백을 최대화'하려는 목적으로 설계되었다.좀 더 구체적으로 SVM에 대해 알아보자. SVM의 목표는분류 문제에서 데이터를 최대한 분리하는 최적의 초평면(hyperplane)을 찾는 것이다.이 초평면은 두 개의 클래스 사이의 마진을 최대화하는 것을 목표로 한다.마진은, 초평면과 가장 가까운 데이터 포인트(서포트 벡터) 간의 거리를 의미한다.SVM은 기본적으로 선형 분류 문제에 사용되지만, 커널 트릭(kernel tric..

direction vector, up vector가 주어졌을 때, viewing matrix 구하는 방법

한 점으로부터 물체를 바라보는 direction vector, up vector가 주어졌을 때, viewing matrix를 어떻게 구할 수 있을까?viewing matrix란?일단, viewing matrix가 무엇인지부터 알아보자. viewing matrix M_v는 world space 상의 좌표인 p_w를 camera space상의 좌표인 p_v로 바꿔주는 matrix이다. (즉, p_v = M_v @ p_w가 성립하는 matrix이다.) 어떠한 방식으로 구할 수 있을까?object space 상의 좌표를 world space상의 좌표로 바꿔주기 위해p_w = (object space를 world space상에서 표현한 matrix) @ p_o가 성립했던 것을 떠올리면,p_w = (camera s..

KCGS 2024 학회 후기

작년에 이어서 작성하는 KCGS 2024 학회 후기! 작년에는 제주도에서 했는데 이번엔 경주에서 했당 이번에는 내가 발표해야해서 그런지 마냥 즐겁진 않았다는..😅다같이 모여서 ktx를 타구 경주역에 갔당 이렇게 보니까 새삼 사람 많아진거 실감나구만ㅎ하이~~난 이런거 꼭 찍어줘야해서 이름표 빨리 들어라하고 찍음ㅋㅋ다들 말 잘들어줘서 고맙습니당🥹첫날에는 여름학교 강의 열심히 듣구 웰컴파티를 했다...근데 작년에도 그렇구 웰컴파티 음식 웰케 적죠.. 우리 진짜 많이 먹는데ㅠ라는 서운함을 가진것도 잠깐...담날 점심 너무 맛있었다발표 열심히 듣구ㅎㅎ또 내가 기다렸던 클로 발표 이번엔 설립자 분이 발표하셨는데 역시나 멋있었당명함도 받구...궁금한거 연락해도 된다고 하셨는데 일단 연구 잘하는게 우선이라 생각해서 메..

일상 2024.08.20

VQ-VAE 이해하기

VAE에 대해선 다들 알고 있을 것이다. 내가 작성했던 아래의 포스트에서도 VAE에 대한 설명을 제공하고 있다.https://chickencat-jjanga.tistory.com/3 VAE 설명들어가기에 앞서 * AE와 VAE는 이름이 유사하지만, 수학적으로는 아무런 관련이 없음 * VAE는 Generative model임! * Generative model? training data가 주어졌을 때 이 data가 sampling 된 분포와 같은 분포에서 새로chickencat-jjanga.tistory.comVAE를 간단하게 복습해보자면, VAE(Variational Autoencoder)는 데이터를 잠재 공간(latent space)으로 압축한 후 다시 복원하는 방법론을 제공한다. VAE는 잠재 공간을..

Forking Workflow 정리

연구실 홈페이지 관리자가 되었는데,,,git에 익숙하지 않아 업데이트 할 때마다 찾아보려니 너무 귀찮아서ㅎㅎ내가 보려고 정리하는 글...CASE1) 내가 업데이트하고자 할 때1. 공식 저장소의 update를 fork로 생성한 본인 계정의 저장소에 반영하기$ git pull upstream master2. branch 생성# develop 이라는 이름의 branch를 생성한다.$ git checkout -b developSwitched to a new branch 'develop'# 이제 2개의 브랜치가 존재한다.$ git branch* develop master3. 수정 작업 후 add, commit, push주의사항 push 진행시에 branch 이름을 명시해주어야 한다# develop 브랜치의 수정..

기타/git 2024.08.01

EmoTalk: Speech-Driven Emotional Disentanglement for 3D face Animation 논문리뷰(2) - Introduction 다시 쓰기

첫번째 문단speech-driven facial animation은 여러 분야에서 관심을 받고 있으며, 상업적으로 사용하기 위해 보통 사전에 작성된 script에 의해 facial expression을 제어하는데 이는 시간과 돈이 많이 든다. 이러한 문제에 딥러닝을 이용하면1) high quality의 animation을 만들 수 있을 뿐만 아니라2) 비용을 훨씬 절감할 수 있다.  두번째 문단하지만 current method는 facial expression에서 emotion으로 인한 variation을 무시하고 있는데, emotion은 굉장히 중요한 표현적 요소이기 때문에 facial animation에서 이가 없게 되면 불쾌한 골짜기를 유발할 수 있다. 그런데 emotional information..

EmoTalk: Speech-Driven Emotional Disentanglement for 3D face Animation 논문리뷰(1) - framework 정리

https://ziqiaopeng.github.io/emotalk/ EmoTalkSpeech-driven 3D face animation aims to generate realistic facial expressions that match the speech content and emotion. However, existing methods often neglect emotional facial expressions or fail to disentangle them from speech content. To address this iziqiaopeng.github.ioSpeech-driven 3D face animation aims to generate realistic facial expressions..

[논문 리뷰] Taming Diffusion Probabilistic Models for Character Control

SIGGRAPH 2024에 발표된 해당 논문의 코드를 사용하려고 한다. 그 전에 모델의 동작에 대해 확실하게 이해할 필요가 있어서 그 내용에 대해 정리하고자 한다.3.1 Motion Diffusion ModelMotion Diffsuion Model은 diffusion probabilistic model을 통해 모션 데이터를 생성하며,확산 과정과 디노이징 과정으로 나뉘는데확산과정에서는 초기 모션 데이터에 노이즈를 점진적으로 추가하고디노이징 과정에서는 신경망을 사용하여 노이즈를 역으로 제거하게 된다.3.2 Conditional Autoregressive Motion Diffusion Model본 논문에서 사용하는 구조는 Motion Diffusion Model을 확장한 Conditional Autoregr..

728x90
728x90