MARKET - 판매기술목록

제목 인공지능 지식처리 소프트웨어 등록일 2016.10.06 10:33
글쓴이 관리자 조회 895

출원(등록)번호

10-2014-0050883(10-1536520)

대표청구항

토픽을 추출하는 서버에 있어서,

분류 정보에 따라서 구성된 분류별 문서 집합으로부터 명사를 추출한 후 불용어를 제거하는 텍스트 전처리부;

상기 불용어가 제거된 명사에 대해 가중치를 계산하여 상기 분류별 문서 집합을 대표하는 단어인 핵심어를 추출하는 핵심어 추출부;

상기 추출된 핵심어에 대해 가중치를 계산하여 상기 핵심어들을 관련 단어들로 군집화한 군집의 중심 단어인 시드를 선정하는 시드 선정부;

상기 선정된 시드를 중심으로 상기 시드와 동일한 문장에서 출현한 핵심어를 하나의 군집으로 구성하는 초기 군집화부;

상기 구성된 군집들 중 유사한 군집들을 병합하여 분류별 토픽 집합을 추출하는 군집 병합부를 포함하는 것을 특징으로 하는 토픽 추출 서버.

패밀리 해외특허현황

     PCT/KR2014/006955

유사 선행기술 존재 여부 및 차이점

       

      noname01.jpg

 

기존 기술대비 특장점

2.1 종래기술의 문제점

- 이와 관련된 종래기술들은 비교적 데이터 획득이 용이한 소셜 네트워크 서비스를 이용하여 수행되고 있음

- 특히 최근에는 페이스북을 이용한 연구들이 활발히 수행되고 있음. 그러나 이와 같은 페이스북 기반 기존 연구들은 친구 수, 사진 업로드 수 등 기존 연구들에서 이미 입증된 단순한 통계 기반의 변수들을 토대로 개인 성향을 예측함으로 인하여 페이스북의 구조적 특성을 충분히 활용하지 못하고 있다는 한계점 내포

 

2.2 본 기술의 특장점

- 페이스북의 오픈 그래프(Open Graph) 구조를 이용하여 사용자 행동 변수를 체계적으로 추출하는 방법, 친구관계 및 이동경로를 분석함으로써 친한 친구를 판별하고, 사용자의 활동성을 측정하는 방법, 선형모델에 적합한 형태로 변수들을 정규화하는 방법, 그리고 이와 같이 상향식(Bottom-up) 접근 방법으로 추출된 다양한 행동 변수들로부터 최적의 변수 집합(Attribute Subset)을 선택하는 방법을 제안

- 실험결과에 따르면 본 발명이 종래 기술에서 제안한 변수들만 이용한 경우보다 실제값과 예측값 간 상관성(Correlation Coefficient)에 있어서 더 우수한 성능을 지니는 것으로 나타남