6요소 유사도 분석 로직 상세
역할: 상표법 제34조 제1항 제7호 기준으로 두 상표의 유사 여부를 6가지 요소로 정량 분석합니다. 선행조사(TM-3)와 감시(W3)가 동일 함수를 공유합니다.
칭호(phonetic): 한글 — 음운규칙 적용 후 자모 시퀀스 분해, 가중 편집거리(같은 조음점: 비용 0.3). 영문 — Metaphone + Jaro-Winkler.
외관-텍스트(visual_text): Levenshtein(0.4) + Jaro-Winkler(0.3) + Bigram Jaccard(0.3). 소문자+공백 제거 후 계산.
외관-이미지(visual_image): DINOv3 ViT-B/16 Siamese fine-tuned. ACLF loss로 학습. CLS 토큰(30%) + 196-Patch MaxSim(70%). 양쪽 이미지 필요.
관념-텍스트(conceptual_text): BM-K/KoSimCSE-roberta-multitask (STS 85.77) 임베딩 코사인 유사도. emb_sim>=0.50이면 LLM 보조(선택적).
관념-이미지(conceptual_image): google/siglip2-base-patch16-384 크로스모달. 이미지→텍스트, 텍스트→이미지, 이미지→이미지 3가지 시나리오 평균.
상품(goods): 유사군코드 완전 교집합(1.0), 상위 5자리 교집합(0.5), 미교차(0.0). 부분 교차 시 TF-IDF char n-gram 텍스트 보강.
가중치: word(칭호 30%, 외관텍스트 20%, 상품 20%), figure(외관이미지 45%, 관념이미지 25%, 상품 20%), combined(고르게 10~20%).
90후588 보정: 5개 하위요소 중 하나 >=0.85이고 상품 >=0.50이면 combined = max(combined, 해당요소 * 0.9).