소리란?소리는 물체의 진동이 매질(공기, 물, 고체 등)을 통해 전달되며, 에너지가 이동하면서 발생합니다. 예를 들어, 목소리는 성대의 진동으로 공기 분자가 압축과 팽창을 반복하며 전달됩니다.이때 소리는 파형(Waveform)으로 시각화할 수 있습니다. 이는 시간에 따른 공기압 변화를 나타내며, 주요 특성으로 주파수(Frequency)와 진폭(Amplitude)가 있습니다. 주파수는 음의 높이를, 진폭은 소리의 크기를 결정합니다.Y축은 진폭(Amplitude) , X축은 시간(Time) 입니다.주기와 주파수의 개념 및 관계 Period (주기): 주기는 반복적인 파동이나 진동에서 특정 지점에서 같은 상태가 다시 나타날 때까지 걸리는 시간을 의미합니다. 단위는 초(s)로 표현됩니다. 예를 들어, 진동이 1..
Contents
RNN(recurrent neural network)RNN(Recurrent Neural Network)은 시계열 데이터를 처리하기 위해 고안된 모델로 아래 그림에서와 같이 이전 시각(계층)의 출력 값(은닉 값)이 다음 시각(계층)으로 전파되어 즉, 과거 정보를 계승하여 시계열 데이터에 대응하는 신경망입니다. RNN의 문제점장기 의존성 문제RNN의 은닉층에서 과거의 정보와 현재의 input이 합쳐지면서 진행되는데 이때 과거의 정보가 마지막까지 전달 되지 않는 문제를 장기 의존성 문제라고 합니다.아래의 수식처럼 현재의 입력과 과거의 정보를 더해 활성화 함수 탄젠트를 취해주는데, 함수는 값이 -1에서 1사이에 위치하게 됩니다.문제는 역전파를 통한 가중치 업데이트 과정에서 반복적으로 기울기에 곱해지 보면 점점..
개요LLM 서비스 준비로 인해 NLP의 기본 개념인 토큰화, 임베딩에 대해서 학습한 내용을 정리 하였습니다. 토큰화의 개념tokenization (토큰화)텍스트 데이터를 컴퓨터가 처리할 수 있도록 변환하는 과정문장이나 문서를 모델이 처리할 수 있는 작은 단위(토큰)로 분할하는 과정토큰화 주요 종류N-gram: 연속된 n개의 아이템을 하나의 토큰으로 취급합니다. 이는 텍스트 내에서 아이템의 연속성을 포착하는 데 유용합니다.Character: 개별 문자를 독립적인 토큰으로 취급합니다. 이 방법은 언어의 구조적 특성을 덜 고려하며, 매우 세밀한 수준의 분석이 가능합니다.Word: 공백이나 구두점 등을 기준으로 분리된 ‘단어’를 토큰으로 사용합니다. 가장 일반적이고 직관적인 방법입니다.Morpheme: 형태소 ..
글또를 시작하며학교를 졸업하기 직전인 2021년 글또 6기부터 참여하며 약 3년의 시간이 흘렀습니다. 이 기간 동안 내가 더 나은 사람이 되었는지 되돌아보면, 무엇보다 생각하는 방식이 많이 바뀌었다고 느낍니다. 특히 업무를 바라보는 관점과 대하는 태도에서 큰 변화가 있었습니다. 이번 글에서는 이러한 생각의 전환을 이끈 경험들에 대해 이야기해보려 합니다.생각의 전환이 된 계기첫 번째 회사2021년 12월, 저는 헬스케어 도메인의 스타트업에 취업했습니다. 이곳에서 뇌혈관의 정량적 데이터를 측정하고 분석하는 의료기기를 개발하고 연구하는 업무를 맡았습니다. 주된 업무는 의료 데이터를 분석하고, 통계를 통해 나온 결과를 보고하며, Computer Vision 기술을 활용해 세그멘테이션 알고리즘을 개선하는 것이었습..
이 글은 이전 글인 “파이썬의 숨겨진 심장박동, 레퍼런스 카운팅”을 보고오시면 더 쉽게 이해하실 수 있습니다. Global Interpreter Lock (GIL)의 역할 Global Interpreter Lock(GIL)은 파이썬 객체에 대한 접근을 보호하는 뮤텍스로, 여러 스레드가 동시에 파이썬 바이트코드를 실행하는 것을 방지합니다. GIL은 경쟁 상태를 방지하고 스레드 안전성을 보장합니다. 위의 글의 내용은 파이썬 위키에서 발췌한 내용입니다. 이는 파이썬 멀티 스레드 환경에서는 동일한 메모리 공간(힙 메모리)를 통해 자원을 공유하기 때문에 각각의 스레드가 이러한 자원을 동시에 사용하고자 할 때 경쟁 상태(Race Condition)를 예방하고 스레드의 안정성을 보장하기 위해 고안된 파이썬 만의 기법..