어휘의미망(U-WIN)을 이용한 한국어 복합명사 의미 분석 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-27
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

현재까지 대부분의 한국어처리시스템에서는 복합명사 분석을 위해 많은 명사복합명사를 사전에 등재하여 처리하였다. 그러나 복합명사를 모두 사전에 등재하는 것은 한계가 있으므로 ...

현재까지 대부분의 한국어처리시스템에서는 복합명사 분석을 위해 많은 명사와 복합명사를 사전에 등재하여 처리하였다. 그러나 복합명사를 모두 사전에 등재하는 것은 한계가 있으므로 명사 간의 관계 또는 명사와 접사의 관계, 동형이의어 접미사의 의미 분석 등을 통해서 미등재 복합명사를 분석할 필요가 있다.
의미 분석 대상인 복합명사는 구성하는 단위명사가 동형이의어인 경우로, 본 논문에서는 한국어 어휘의미망(U-WIN)을 이용한 복합명사 의미 분석 방법을 제안한다. 어휘의미망은 다양한 관계(상·하·동위, 동의, 유의, 부분/전체, 관련 등)를 바탕으로 어휘들이 의미적으로 연결되어있기 때문에 이러한 관계 정보를 활용하면 자료 부족 문제를 보완할 수 있다. 그리고 어휘의미망의 개념적 거리(Conceptual Distance), 개념적 밀도(Conceptual Density), 정보량(Information Content) 등을 통해 어휘 간의 유사도를 확보 가능하기 때문에, 이를 어휘 간의 의미적인 결합여부를 판단하는 데 활용할 수 있다. 본 논문에서는 어휘의미망의 이러한 장점을 활용하였다.
기존의 어휘의미망을 이용한 어휘의 의미 분석 방법은 문장 또는 문맥 등의 외적 어휘 정보들을 이용해 의미 분석하는 방법이었다. 하지만, 복합명사는 둘 이상의 단어가 결합된 형태이기 때문에, 구성명사와 구성명사 간의 의미결합 여부 같은 내적 정보를 이용한 의미 분석도 가능하다. 그래서 본 논문에서는 복합명사의 내적 정보만을 이용하여 의미 분석을 시도해 보았다.
복합명사의 의미 분석에서 복합명사의 구성명사 간의 의미적 관계뿐만 아니라 위치적 관계도 중요한 의미 분석 요소로 작용한다. 어두 또는 어미에 자주 사용되는 명사, 서로 이웃하여 출현하는 명사, 이웃하더라도 해당 단어의 앞 또는 뒤 중 한 방향에서만 출현하는 명사 등의 정보가 위치와 관계된 정보로 볼 수 있다. 본 논문에서는 이러한 정보를 반영하여 실험을 진행하였다.
접미파생명사의 동형이의어 접미사 의미 분석을 위해 형태 의미 주석 세종 말뭉치에서 동형이의어 접미사를 포함한 33,104개의 접미파생명사를 대상으로 실험하였다. 실험을 위해 먼저 동형이의어 접미사를 의미 태깅하였으며, 동형이의어 접미사 앞의 어근을 추출하여 U-WIN의 노드에 매핑시켰다. 또한 동형이의어 접미사와 결합되는 U-WIN 상의 노드들에 대해 거리 가중치를 부여하여 이를 동형이의어 접미사 의미 분석에 사용하였다. 동형이의어 접미사 49종 중 세종말뭉치에 나타난 35개의 동형이의어 접미사를 대상으로 실험한 결과 91.01%의 정확률을 보였다.
합성명사 의미 분석을 위해 표준국어대사전에서 추출한 27,761개의 합성명사를 대상으로 실험하였다. 실험을 위해 세종 말뭉치에서 추출한 방향별 bigram 단위의 학습데이터를 두 집합으로 구축하고, U-WIN을 통해 학습데이터를 확장하여 자료 부족 문제를 일부 해결한다. 그리고 미등록 합성명사를 위해 U-WIN을 통한 상위탐색 방법을 이용해 가중치를 확보한 후 의미 분석에 사용한다. 실험한 결과 합성명사의 의미 분석은 86.20%의 정확률을 보였다. 그리고 위치 정보를 고려하지 않은 기존의 유사도 추출 기법과의 실험결과를 비교했을 때 본 논문의 방법이 정확률에서 9.6% 더 높은 성능을 보였다.

韩语论文韩语论文网站
免费论文题目: