[ML] 코사인 유사도

728x90

두 벡터의 방향이 완전히 같을 경우 1, 90º의 각을 이룰 경우 0, 180º로 완전히 반대 방향인 경우 -1의 값을 갖습니다. 이 때 벡터의 크기는 값에 아무런 영향을 미치치 않습니다.

텍스트 매칭에 적용될 경우, A,B의 벡터로는 일반적으로 해당 문서에서의 단어 빈도(TF-IDF)가 사용됩니다. 코사인 유사도는 문서들간의 유사도를 비교할 때 문서의 길이를 정규화하는 방법의 하나라고 볼 수 있습니다.

정보 검색의 경우, 문서의 단어 빈도(TF-IDF 가중치)가 음의 값이 되는 것이 불가능하므로 두 문서 사이의 코사인 유사도는 0에서 1까지의 값으로 표현됩니다.

코사인 유사도 - 위키백과, 우리 모두의 백과사전

코사인 유사도(― 類似度, 영어: cosine similarity)는 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간의 유사한 정도를 의미한다. 각도가 0°일 때의 코사인값은 1이며, 다른 모든

ko.wikipedia.org

[ML] 과적합(Overfitting)을 막는 방법들 (0)	2022.02.23
[ML] pytorch로 다층 퍼셉트론 구현하여 손글씨 분류 (0)	2022.02.22
[ML] 인공신경망 비선형 활성화함수 (Activation Function) (0)	2022.02.22
[ML] 다층 퍼셉트론 구현으로 XOR 문제 해결하기 (0)	2022.02.22
[ML] 단층 퍼셉트론으로 XOR 문제 구현하기 (0)	2022.02.18

IT Worker