서 론
우제목(Artiodactyla)은 포유동물강(Mammalia)에 포함 된 분류군 중 하나로 짝수 개의 발굽을 갖는 동물을 칭한다. 우제목은 전 세계적으로 매우 다양한 서식 조건과 광범위한 서식 면적을 갖는 포유류이며, 총 10개 과(family), 80개 속(genus)이 포함되어 있고, 약 210개 종이 파악되어 있다 (Encyclopedia of Life; http://eol.org). 흔히 우제류라고 불 리는 우제목에는 소, 돼지, 염소, 양과 같이 가축으로 사육되 는 종들이 포함되어 있어 인간의 경제 활동과 밀접한 관계 를 맺고 있기도 하다.
국내에는 인간 생활 주변뿐만 아니라 야생 생태계에 걸쳐 우제목 여러 종이 존재하는데, “국가생물종 목록 (https://species.nibr.go.kr)”에서는 국내 야생 우제목에 총 4과, 6속, 7종이 포함되어 있는 것으로 파악되고 있다. 최 근 들어 야생 우제목 동물들은 민가에 내려와 농작물과 사람에게 미치는 피해 및 로드킬의 증가로 사회적 관심을 받고 있다. 2009년 한 해 야생동물에 의한 농작물 총 피해 액 중 60% 이상이 멧돼지(Sus scrofa; 41.7%)와 고라니 (Hydropotes inermis; 19.9%)에 의한 것이었다(Ministry of Environment, 2010). 한국도로공사에서 2011년부터 2015년까지 실시한 모니터링에서는 고라니의 로드킬은 연평균 1,995건으로 전체 로드킬 발생 횟수의 87.2%를 차지하였다(Choi, 2016). 또한 국내 우제목 중 대륙사슴 (Cervus nippon), 사향노루(Moschus moschiferus), 산양 (Naemorhedus caudatus)은 인간에 의한 서식지 파괴와 약 재, 향료 등의 이용을 위한 남획으로 개체수가 급감하였으 며(Ahn, 2013), 현재는 멸종위기 1급으로 지정되어 보호받 고 있다(Ministry of Environment, 2012).
인간과의 갈등과 일부 종의 개체수 감소로 우제목의 관 리와 보전에 대한 관심이 증가함에도 불구하고, 이들의 넓 은 서식 분포, 한반도의 지형적인 특성 등에 의해 국내 연 구는 미흡한 실정이다(Park and Lee, 2013; Ministry of Environment 2014). 우제목에 대한 연구 자료 부족은 효율 적인 개체군 조절 및 서식지 관리를 어렵게 하고 합리적인 정책 수립을 제한할 것으로 판단되지만, 우제목에 대한 연 구 동향 분석이 이루어지지 않아 실질적인 문제점을 파악하 기 어렵다.
특정 분야의 연구동향 분석은 해당 분야의 연구 성과들이 사회 문제 해결을 위한 새로운 관점을 제공하고, 문제 해결 방향 설정에 있어 우선순위를 파악하는데 도움을 준다(Neff and Corley, 2009;Ko and Eo, 2017). 최근 발전하고 있는 빅데이터 기술과 함께 텍스트마이닝 및 동시출현단어 분석 은 연구 동향 분석을 위한 기술로써 활용되고 있다(Ko and Eo, 2017). 이 두 가지 분석 기술은 연구 주제를 파악함에 있어 연구자 주관이 개입되는 것을 최소화시킬 수 있다는 장점이 있다(Kim and Song, 2014). 본 연구에서는 텍스트 마이닝과 동시출현단어 분석 기법을 활용하여 우제목과 관 련된 연구 주제 분류와 정량화에 객관성을 높이고자 한다. 또한 한국, 중국, 일본 세 국가의 우제목 관련 연구 동향을 동시에 살펴봄으로써 우제목 연구에 있어 국가 간의 차이를 분석하고, 이를 통해 기존 국내 연구의 부족한 부분과 향후 필요한 점을 살펴보았다.
연구방법
1. 한국, 중국, 일본 국가별 우제목 종 목록 파악
우제목 연구 동향 파악에 앞서 한국, 중국, 일본의 우제 목 종 목록 파악을 위해 문헌 조사를 실시하였다. 한국의 우제목 종은 환경부 국립생물자원관에서 제공하는 국가생 물종 목록(https://species.nibr.go.kr)에서 확인하였다. 중국 은 Groves(2016)가 정리한 우제목 종 목록을 확인하였으며, 일본은 Motokawa et al.(2006)이 제시한 우제목 종 목록을 확인하였다.
2. 우제목 종 연구 논문 서지 정보 수집
우제목 연구 논문들의 서지 정보를 수집하기 위해, Web of Science(https://app.webofknowledge.com)의 SCIE database에서 한중일 각 국가별 우제목 관련 논문을 검색하 였다. 각 국가의 영명과 우제목 종의 학명을 동시에 검색하 였다(e.g. “Korea” and “Hydropotes inermis”). 검색 범주는 “subject”로 하였으며, 검색된 자료들 중 “article”에 해당하 는 자료만 선택하였다. 국가 간 동시에 검색된 자료는 각 국가별 분류가 불가능한 것으로 판단하여 이후 분석에서 제외하였다. 최종적으로 선택된 자료들의 서지 정보를 텍스 트 형식(.txt)으로 추출하였다.
3. 텍스트마이닝 및 동시출현단어분석
한중일 우제목 관련 연구 논문 서지 정보에 대한 텍스트 마이닝과 동시출현단어 분석에는 VOSviewer v1.6.5(Van Eck and Waltman, 2010)를 사용하였다. 텍스트마이닝에 는 논문 서지 정보들 중 제목과 요약(title and abstract)을 활용하였다. 단어 수 산출 방식은 오직 출현 논문 수만을 집계하는 “binary counting”을 선택하였다. 전체 서지 정보 에서 10편 이상의 논문에서 출현하는 단어들만을 이후의 분석을 위하여 선택하였다. 또한 단어군(cluster) 형성에 있 어 논문 검색에서 활용한 단어들에 의한 편이가 발생하는 것을 방지하기 위해, 검색 핵심어(keyword)로 활용된 국가 명과 우제목 학명을 제외하였다. 이후 동시출현단어 분석 을 통해 단어들간의 연관 관계를 측정하고, 측정된 연관 정 도를 통해 단어들을 군집화(clustering)하였다. 단어군의 군 집 세분화 정도를 나타내는 “clustering resolution”은 단어 군의 수가 가장 안정적으로 유지되는 구간 중 최대값으로 결정하였다.
4. 국가별 연구주제 비교 분석
VOSviewer를 통한 텍스트마이닝과 동시출현단어 분석 결과를 활용하여 사후 분석을 실시하였다. 각 단어군에 포 함된 단어들을 살펴보며 각 단어군이 나타내는 주제를 결정 하였다. 또한 국가별, 연도별 각 단어군에 포함되는 단어 수를 구하기에 앞서, 국가별, 연도별 단어군의 단어 수를 전체 단어군별 단어 수로 나누어 보정하였다. 이후 국가별 출현 단어 수 대비 단어군에 포함되는 보정된 단어 수 비율 을 통해 국가별 단어군 비율을 산출하였다. 또한 국가별 단 어군 분포의 균일성을 알아보기 위해, 산출된 국가별 단어 군 비율을 활용하여 국가별 균등도(evenness; Pielou, 1969) 를 측정하였다. 또한 연도에 따른 국가별 각 단어군의 보정 된 단어수 변화를 알아보기 위해 SAS 9.4(SAS Institute, USA)를 통한 회귀 분석을 실시하였다.
결과 및 고찰
1. 국가별 우제목 관련 연구 논문 서지 정보 수집 결과
국가별 문헌자료와 온라인 DB를 통해 파악한 우제목 종 수는 한국이 Capreolus pygargus, Cervus elaphus, Cervus Nippon, Hydropotes inermis, Moschus moschiferus, Naemorhedus caudatus, Sus scrofa의 7종이었으며, 중국은 Bos gaurus, Bos mutus, Budorcas taxicolor, Camelus ferus, Capra sibirica 등 총 58종, 일본은 Capricornis crispus, Cervus Nippon, Sus scrofa 3종이었다. 국가별 우 제목 관련 연구 논문 검색 결과, 한국 70편, 중국 195편, 일본 400편으로 총 665편이 검색되었다. 한국은 우제목 관 련 연구 논문 수에 있어서 중국의 논문 수에 절반에도 미치 지 못하였으며, 일본보다 많은 종 수에도 불구하고 1/5 이하 의 적은 논문 수를 나타냈다. 종별 평균 논문 수에서도 한국 은 10편으로 중국의 3.4편에 비해 많지만, 일본의 133.3편 에 비해 적었다.
연도별 연구 논문 수는 한중일 모두 시간이 경과함에 따 라 유의하게 증가하였다(Figure 1). 한국의 우제목 연구 논 문 수는 매년 평균 0.68편 정도로 증가하였는데, 이는 중국 의 0.66편과 비슷한 수준이지만, 일본의 1.22편에 비해서는 절반 수준에 불과하였다.
2. 텍스트마이닝과 동시출현단어분석 결과
검색된 논문들에 대한 텍스트마이닝 결과, 10편 이상 논문 에 걸쳐 출현한 단어 수는 총 199개로 나타났다. 이후 실시된 동시출현단어분석 결과, clustering resolution 0.99에서 가 장 안정된 3개의 단어군(cluster)을 형성하였다(Figure 2).
각 단어군에 속하는 단어들을 살펴보면 다음과 같다 (Table 1). 단어군1은 “effect”, “forest”, “change”, “winter”, “season” 등 총 93개의 단어들이 나타나, “서식 환경/생태”의 주제를 나타내는 것으로 판단되었다. 단어군2는 “sample”, “infection”, “prefecture”, “gene”, “prevalence” 등 총 71개 의 단어들이 나타나, “질병”의 주제를 나타내는 것으로 판 단되었다. 단어군3는 “sequence”, “haplotype”, “genetic diversity”, “mitochondrial DNA”, “lineage” 등 총 35개 단 어들이 나타나, “보전유전학/분자생태”의 주제를 나타내는 것으로 판단되었다.
3. 국가별 연구주제 비교 분석 결과
국가별 각 단어군에 해당되는 단어들의 비율(%)은 다음 과 같다(Figure 3). 한국은 단어군2 69%, 단어군3 18%, 단 어군1 13% 순이었다. 중국은 단어군1 43%, 단어군3 33%, 단어군2 24% 순이었다. 일본은 단어군1 47%, 단어군2 37%, 단어군3 16% 순이었다. 국가별 각 단어군의 단어 비 율을 통해 산출한 균등도(evenness)는 한국이 0.75으로 중 국 0.98, 일본 0.93에 비해 낮은 수치를 나타냈다. 한국은 우제목 연구가 “질병”(단어군2, 69%)과 관련되어 편중되어 있으며, 세 국가 중 연구 주제의 균일한 정도가 가장 낮은 것으로 나타났다. 한편, 중국과 일본은 “서식 환경/생태”와 관련된 단어군1의 비율이 가장 높은 것과는 달리, 한국은 가장 낮은 비율을 보였다.
국가별로 연도에 따른 각 단어군의 보정된 단어 수를 살 펴 본 결과(Figure 4), 한국은 단어군1(β=0.09, P<0.01)과 단어군2(β=0.48, P<0.01)가 연도에 따른 유의한 증가를 나 타냈다. 중국과 일본은 3개 단어군 모두 연도에 따른 유의한 증가를 나타냈다. 한국은 단어군2가 시간 경과에 따라 0.48 개씩 단어수가 증가하여 단어군1과 단어군3이 0.09개씩 증 가한 것에 비해 5배 이상 컸다. 중국은 3개 단어군의 단어 수가 약 0.2개씩 증가하여 비슷한 수준이었다. 일본은 단어 군1과 단어군2의 단어가 약 0.5개씩 증가하여 비슷한 반면, 단어군3은 0.19개씩 증가하여 가장 작았다.
한국의 우제목 관련 연구는 “질병” 관련 주제로 편향되어 있으며, 시간 경과와 함께 편향의 정도가 더욱 심해지고 있 는 것으로 보인다. 이와 달리 중국은 가장 고르게 연구가 이루어졌으며, 시간이 경과와 함께 모든 주제가 동일하게 증가하였다. 일본은 “보전유전학/분자생태” 관련 주제가 비 교적 적으나, 한국과 달리 시간 경과에 따라 지속적으로 증 가하였다.
4. 종합 고찰
한국은 중국, 일본과 달리 우제목에서 발생하는 질병과 관련된 연구가 주로 수행되는 것으로 보여진다. “질병” 주제와 관련도가 높은 국내 연구 논문들은 톡소포자충 (Toxoplasma gondii), 바베스열원충(Babesia microti), 결핵 균(Mycobacterium tuberculosis) 등과 같이 가축, 반려동물 뿐만 아니라 인간에게도 전염이 될 수 있는 인수공통 질병 들을 주로 다루고 있다. 인간의 생명 및 안전에 직접적으로 영향을 미칠 수 있는 주제를 주로 연구하는 것은 타당하다 고 판단된다. 그러나 “질병”이라는 하나의 주제에만 편중된 연구는 문제가 있을 수 있다. 실제 “질병” 관련된 국내 우제 목 연구들에서는 숙주(host)로써 기능하는 야생동물의 생태 적 기초 정보가 부족하기 때문에 질병의 방제 및 발병 예측, 역학 조사 등에 어려움이 있음을 지적하고 있다(Seong et al., 2015;Hong et al., 2017; Chae et al, 2017).
한국에서 상대적으로 비율이 낮은 단어군 1과 3은 서식 환경, 행동, 개체군유전 특성, 보전, 분자생태 등을 아우르는 우제목 관련 생태 연구로 묶일 수 있을 것으로 보인다. 서식 환경 특성, 행동 특성, 식이 습성 등을 파악하는 것은 야생동 물의 개체군 관리 및 보전을 위해 기본적으로 이루어져야 한다(Morrison et al., 2012). 분자생태 연구는 생물이 갖는 분자 수준에서의 특성을 활용한 생태 연구로써, 야생 생물 의 개체군 또는 군집 수준의 다양성, 개체군 변화 및 이동, 개체 식별, 번식 습성 확인 등 다양한 생태정보를 제공하며, 야생동물의 개체군 관리 및 보전에 활용가능하다(DeYoung and Honeycutt, 2005;Allan and Max, 2010).
생태 연구와 관련된 단어군 1, 3의 비율이 낮은 것은 우제 목에 대한 생태 연구 부족과 관련 있다. 우제목을 포함한 국내 포유동물의 학술정보는 전문 연구인력 부족과 현장 연구의 어려움 등에 의해 생물학적 특성, 분포 현황, 생태학 적 기초자료가 부족하다(Oh et al., 2012; Park and Lee, 2014;Ko and Eo, 2017). 기초적인 생태정보 없이 수립되는 야생동물 관리 방안은 실제 효과가 미미하거나 예측할 수 없는 악영향을 초래할 수 있다. 이러한 점을 고려하여 국내 에서도 기초적인 생태정보에 중점을 두고 우제목 연구를 증가시켜 나가야 할 것이다.
본 연구는 텍스트마이닝과 동시출현단어분석을 통해 한 국, 중국, 일본의 우제목 연구 주제를 정량적이고 객관적으 로 판단하여 비교하였다. 국가별 비교를 위해서는 동일한 검색 조건과 서지 정보 양식이 필요하기 때문에 ‘web of science’라는 저명한 연구 문헌 데이터베이스를 활용하였 다. 그러나 ‘web of science’는 SCI(E)급의 학술지만을 다루 고 있기 때문에, 각 국가별 우제목 관련 연구 문헌이 모두 포함되어 있지 않다. 최근에 들어 국외 SCI급 학술지의 영 향력 증가와 통신 기술의 발달로 국외 학술지 투고가 쉬어 짐에 따라, 연구 규모와 성과의 중요성이 클수록 국외 SCI 급 저널에 투고하려는 경향이 강해지고 있다. 따라서 SCI급 과 비SCI급 학술지의 연구 논문의 연구 주제와 내용에 차이 가 있을 것으로 판단 되며, 본 연구 결과에서 제시한 한중일 우제목 연구 논문의 연구 주제 차이를 해석함에 있어 이 점을 반드시 인지해야 할 것이다. 본 연구에서는 비록 비 SCI급 학술지(논문 또는 보고서)를 포함하지 않았지만 3개 국가를 대상으로 모두 SCI급 학술지를 비교했기 때문에 상 대적인 비교가 가능했다. 그러나 비SCI급 학술지 논문의 연구 규모와 파급력이 상대적으로 떨어진다고 하더라도 국 가별 연구 역량에 절대적으로 필요한 기초자료가 될 것이 며, 이 현황을 파악하고 분석하는 것은 매우 중요할 것이다. 향후 비SCI(E)급 학술지의 연구 논문으로 범위를 넓혀 텍스 트마이닝과 동시출현단어분석을 실시한다면 국가별 우제 목 관련 연구 현황을 더 명확히 살펴볼 수 있을 것으로 생각 한다.