서 론
남북한 접경지역은 한국전쟁 후 60여 년 간 인간의 접근 이 통제되어, 여러 멸종위기종을 포함한 많은 야생동식물이 서식・분포하고 있는 생물다양성의 보고이다. 이에 정부는 남북한 분단이라는 정치적 상황이 만들어낸 특이한 생태계 를 보호하기 위해 DMZ를 국가 4대 핵심 생태축의 하나로 지정하여 보존하고 있고, 현재도 DMZ 세계생태 평화공원 조성이나 UNESCO 생물권 보전지역(UNESCO Biosphere Reserve)과 같은 보호지역을 추가로 지정하려 노력하고 있다.
남북한 접경지역 보호에 적합한 보호지역 중 하나로 세계 자연보전연맹(IUCN, International Union for Conservation of Nature)이 제안한 중요생물다양성지역(key biodiversity areas: KBAs)이 있다. KBAs는 중요 조류 및 생물다양성 지역(important bird and biodiversity area) 개념을 확대하 여 전 지구적으로 절멸 위기에 처한 멸종위기종이나 생태 계, 지리적 분포가 제한된 종이나 생태계를 보전하기 위해 지정하는 보호지역으로(IUCN, 2016), IUCN은 KBAs를 2004년 처음 도입하기로 결의하였고, 2016년에는 KBAs의 구체적 지정 기준을 확정・발표하였다. 2014년 기준으로 전 세계에 13,000개소가 넘는 KBAs가 지정되어 있고, 국내에 도 40여 개소의 중요 조류 서식지(important bird and biodiversity areas: IBAs)가 KBAs로 지정되어 있다(Korea National Arboretum, 2017).
남북한 접경지역에 분포하는 멸종위기종 중 금강초롱꽃 (Hanabusaya asiatica)은 한반도 중동부에서만 제한적으 로 분포하는 우리나라 고유종으로, 분포 범위가 좁고 개 체수가 적어 자생지 보호가 시급한 종이다(Korea National Arboretum, 2017). 금강초롱꽃은 초롱꽃과(Campanulaceae) 에 속하는 다년생 초본으로 해발 550m~1,500m의 북사면 에 상층수목의 피도가 높은 곳에 주로 생육한다(Jang et al., 2010). 금강초롱꽃은 17,229km²의 지역에서 2,400여 개체 정도만 자생하고 있어, IUCN 적색 목록(IUCN red list)에 멸종위기(EN)종으로 지정되어 있다(Kim et al., 2016).
금강초롱꽃 자생지를 KBA로 지정하여 보호하기 위해 서는 우선 이 종의 정확한 자생지를 파악하여야 한다. 하지 만 금강초롱꽃 자생지는 대부분 현장조사가 불가능한 남북 한 접경지역에 위치하여 자생지의 정확한 분포를 파악할 수 없는 실정이다(Korea National Arboretum, 2017). 생물 종 분포 모형(species distribution model)을 통해 금강초롱 꽃 자생지 분포를 추정해 볼 수 있지만, 대부분의 생물종 분포 모형이 출현-부재 데이터(presence-absence data)를 필요로 하기 때문에, 남북한 접경지역 내 분포를 추정하는 데 적합하지 않다. 여기서 출현-부재 데이터란 일정 기준에 따라 조사 지점을 정한 다음 조사자가 조사 지점을 방문하 여 그 지점에 해당 종이 자생하고 있는지 또는 그렇지 않은 지를 체계적으로 기론한 데이터를 뜻한다. 하지만 남북한 접경지역과 같이 현장 접근이 불가능한 지역에서는 출현- 부재 데이터를 얻기 힘들기 때문에 대신 접근 가능한 지역 을 방문하여 조사하다가 해당 종이 발견되면 그 위치를 표 시한 데이터, 즉 부재 지점에 대한 정보없이 출현 지점만 기록한 데이터(presence-only data) 형식으로 자생지 정보 를 기록할 수밖에 없다(Phillips et al., 2009; Elith et al., 2011).
생물종 분포 모형에서 특정 지점에 생물종이 부재하는 지에 대한 정보가 중요한데, 이는 부재 지점 없이 출현 지 점 정보만 있는 데이터는 표본을 편향적으로(unbiasedly) 추출한 것이기 때문이다. 베이즈 정리(Bayes theorem) 에 따르면 특정 지점 x에서 y종이 출현할 사후확률 이 된다. 여기서 을 알려면 , 즉 연구 대상 지 내 종 y의 서식 밀도를 알아야 하나, 출현 지점만 기록 한 데이터는 종이 출현한 위치 정보만 편향적으로 제공하 기 때문에, 그 종의 정확한 분포 밀도를 추정할 수 없다 (Phillips et al., 2009; Elith et al., 2011).
Maximum entropy(MaxEnt) 모형을 활용하면 출현지점 자료만 가지고 생물종의 분포를 추정할 수 있다. MaxEnt 모형은 알려진 정보와 알려지지 않은 정보가 있을 때, 알려 진 정보는 충족시키는 제약 하에서, 알려지지 않은 정보는 정보 entropy가 가장 큰 상태가 되도록 연구 대상지 내 모 든 지점에 대한 미지의 확률분포 를 추정하는 방법이 다(Phillips et al., 2006; Seo et al., 2008; Elith et al., 2011). 본 연구에서는 이와 같은 MaxEnt 모형의 특성을 활용하여 체계적인 현장 조사가 불가능한 남북한 접경지 역에 생육하는 금강초롱꽃 자생지 분포를 추정하고, 이를 바탕으로 금강초롱꽃 자생지 보호를 위한 KBA를 구획하 였다.
연구방법
1. MaxEnt 모형
MaxEnt는 연구자가 연구 대상 생물종의 출현 위치 표본 을 입력해주면 컴퓨터 스스로 출현 위치의 환경 특성을 학습 하여, 대상종의 출현 여부를 모르는 지점의 출현 확률을 추정 하는 기계학습(machine learning) 방법의 하나이다(Phillips et al., 2006; 2008; Seo et al., 2008). MaxEnt 확률분포 는 연구 대상종이 특정 지점 x 에서 생물종이 서식지 적합도를 연구 대상지 전체에 대한 확률 분포로 나타낸 것으 로, 확률분포 정의에 따라 이다. MaxEnt 확률분 포는 n개 환경변수(environmental variables) 또는 특성 (features)으로 구성된 벡터 와 각 변수에 대한 가중치 벡터 로 정의되는 식 (2)와 같 은 Gibbs 분포를 갖는다.
여기서 는 의 합이 1이 되도록 하는 정규화 상 수이다. 가중치 벡터 는 대상종이 실제 발견된 m개 표본 지점에서의 로그우도(likelihood)가 최대가 되도록 하는 값 으로 결정한다. 즉,
여기에 MaxEnt가 특정 표본에 과적합(overfitting)되지 않 도록 정규화 상수(regularization parameter) 만큼의 오차 를 허용하도록 식 (3)를 변형하면
이 된다. MaxEnt 모형의 결과값은 연구 대상종이 특정 지점 x에서 발견될 정도에 관한 확률 분포이므로, MaxEnt 모형 결과값을 cloglog(complementary log-log) 변환하여 각 지 점별 금강초롱의 출현 확률을 추정할 수 있다(Phillips et al., 2017). MaxEnt 모형은 Jaynes(1957)가 처음 제안하였 고, 생물종 분포 모형(Seo et al., 2008; Kim et al., 2015) 뿐 아니라 패턴 인식(Keysers et al., 2002), 자동번역 (Berger et al., 1996) 등 다양한 기계학습 분야에서 널리 활용되고 있다.
2. 연구대상지
본 연구는 금강초롱꽃의 분포지로 알려진 남북한 접경지 역 일대 중 접경지원 지원 특별법 시행령 제2조에서 정한 접경지역 시군구 중 도서지역을 제외한 지역을 연구 대상지 로 설정하였다(Figure 1). 연구 대상지는 행정구역 상 경기 도 김포시와 파주시, 연천군, 고양시, 양주시, 동두천시, 포 천시, 강원도 철원군, 화천군, 양구군, 인제군, 고성군, 춘천 시 전역을 포함한다. 행정구역상 북한 지역은 본 연구의 대 상지에서 제외하였는데, 이는 북한 지역 금강초롱 출현 지 점을 알지 못해 남한의 데이터만으로 MaxEnt 모형을 학습 시킬 경우, MaxEnt 예측값이 북한 주민의 땔감 채취와 경작 지 개간에 따른 산림 훼손이나 북한군의 군사작전 등 북한 고유의 인문환경 특성을 반영하지 못할 수 있기 때문이다. 연구 대상지 전체 넓이는 9,259km²이다.
현장조사는 2016년과 2017년에 걸쳐 조사하였다. DMZ 와 민통선지역은 국립DMZ자생식물원에서 계절별로 진행 하였다. DMZ 조사는 철책을 따라 걸으며 진행하였고, 민통 선지역은 민간인 출입이 쉽지 않고 지뢰가 많은 대상지 특 성상 접근이 가능한 지역을 중심으로 진행하였다. 민통선 이남지역은 고산지대에 분포하는 금강초롱꽃의 특성을 고 려하여 포천, 설악산, 오대산 등에서 집중적으로 진행하였 다. 현장조사시 대상지의 위치, 생육환경, 서식지 특성, 미세 지형 등을 기록하였으며 사진으로 기록하였다.
3. 금강초롱꽃 중요생물다양성보호지역 설정 절차
MaxEnt 모형이 금강초롱꽃 분포지를 추정하려면, MaxEnt 모형이 금강초롱꽃 분포지의 환경특성을 학습할 수 있도록 실제 출현한 지점과 그 지점의 환경특성을 입력해 주어야 한다. 본 연구에서는 2016년 국립DMZ자생식물원 조사 자 료와 2016 ~ 2017년 자체 조사를 통해 수집한 38개 금강초 롱꽃 출현 지점과 기후, 지형, 식생 등 11개 환경변수를 활 용하여 MaxEnt 모형을 학습하였다(Korea National Arboretum, 2017)(Figure 1, Table 1). MaxEnt 모형은 생성 모형 (generative model)의 하나로, 생성 모형은 분류 모형 (discriminative model)에 비해 본 연구처럼 학습 데이터가 적은 경우에도 상대적으로 우수한 예측 성능을 보이는 것으 로 알려져 있다(Ng and Jordan, 2001). MaxEnt 모형은 금 강초롱꽃이 실제 출현한 지점의 환경특성과 출현 여부를 모르는 연구 대상지 내 나머지 지점의 환경특성을 비교하여 연구 대상지 내 모든 지점의 금강초롱꽃 출현 확률을 추정 한다. 따라서 MaxEnt 모형에 입력하는 환경변수는 연구 대 상지 내 모든 지점에 대하여 측정된 변수여야 하나, 연구 대상지 특성상 보안 문제로 정부에서 데이터를 공개하지 않을 뿐 아니라 현장조사 또한 불가능하여 활용할 수 있는 환경변수는 매우 제한적이다. 이에 본 연구에서는 위성영상 을 분석하여 획득한 지형과 식생 데이터, 전세계 지상 관측 소에서 측정한 데이터를 공간보간(spatial interpolation)하 여 추정한 기후 데이터 등 활용가능한 11개 환경변수를 활용 하여 MaxEnt모형을 학습하였다(Korea National Arboretum, 2017).
연구대상지의 기후특성은 WorldClim 2 데이터를 통해 측정하였다. WorldClim 2 데이터는 지상 기상관측소에서 측정한 1970년부터 2000년까지 30년 간 평균한 기후평년 값을 thin-plate spines법을 통해 전지구에 걸쳐 30초(중위 도 지역에서 약 1km²)의 공간해상도로 공간보간한 래스터 데이터(raster data)로(Fick and Hijmans, 2017), 본 연구에 서는 이 중 금강초롱꽃의 생장에 영향을 미칠 것으로 예상 되는 최한월(1월) 평균기온, 최난월(8월) 평균기온, 생장기 (4 ~ 10월) 평균기온, 연평균강수량, 생장기(4 ~ 10월) 평균 강수량 데이터를 환경변수로 추출하였다.
지형 관련 환경변수는 Global Digital Elevation Model (GDEM) 2.0 데이터를 활용하여 측정하였다. GDEM은 일 본 Ministry of Economy, Trade, and Industry(METI)와 미 국 National Aeronautics and Space Administration(NASA) 이 공동 개발・운영 중인 Advanced Spaceborne Thermal Emission and Reflection Radiometer(ASTER) 위성센서로 촬영한 stereo 영상을 입체 사진측량기법을 통해 분석하여 전지구의 표고를 측정한 래스터 데이터로(Tachikawa et al., 2011), 원 데이터는 30m의 공간해상도를 가지고 있으나, 본 연구에서는 WorldClim 2 데이터의 공간해상도에 맞춰 30초의 공간해상도를 갖도록 재표본(resample)하였다. 본 연구에서는 GDEM 표고 데이터와 이를 통해 분석한 경사 도, 연간 일조량, 생장기(4~10월) 일조량 데이터를 환경변 수로 MaxEnt 모형에 입력하였다. 일조량은 ArcGIS 10.4의 solar radiation tool을 이용하여 계산하였다.
연구대상지의 식생 현황은 미국 Unites States Geological Survey(USGS)의 위성영상인 Landsat Operational Land Imager(OLI) Level 2 surface reflectance 데이터로부터 식 생지수를 계산하여 측정하였다. 본 연구에서는 가장 널리 사 용되는 식생지수인 NDVI(normalized difference vegetation index)와 SAVI(soil adjusted vegetation index)를 이용하였다 (Jensen, 2007). SAVI의 내부 파라미터인 canopy background adjustment factor값은 0.5로 설정하였다(Huete, 1988). GDEM 데이터와 마찬가지로 Landsat OLI 영상도 30m의 공간해상도로 촬영되었으나, 본 연구에서는 WorldClim 2 데이터의 공간해상도에 맞춰 30초각(arc seconds)으로 재표 본하였다.
MaxEnt 모형의 예측 적합도는 ROC(receiver operating characteristic) 곡선의 AUC(area under curve)로 평가하였 다. AUC란 임의의 임계확률에 따라 MaxEnt 모형의 결과 값인 출현확률을 출현과 부재로 나눴을 때, 실제 금강초롱 꽃이 출현한 지점에 금강초롱꽃이 출현할 것이라고 예측 한 비율(true positive rate)이 출현하지 않을 것이라 잘못 예측한 비율(false positive rate)에 비해 많은 정도를 일련 의 임계확률에 대해 계산한 값으로, 0.5에서 1사이에 값을 갖는다. 여기서 계산된 AUC가 0.5이면 MaxEnt 모형의 예측값이 무작위란 뜻이고, 1에 가까울수록 모형의 예측 정확도가 높다는 뜻이다(Phillips et al., 2006). 모형 적합 도는 앞서 언급한 과적합 문제에 의해 과도하게 높게 평가 될 수 있기 때문에, 5겹 교차검증(5-fold cross validation) 을 통해 평균 AUC값을 산정하였다. 또한 개별 환경변수 의 영향은 환경변수를 하나씩 제외하고 MaxEnt 모형을 분석해보고 이를 전체 변수를 포함하여 분석한 모형과 비 교해보는 jackknife 방법을 통해 평가하였다(Phillips et al., 2006).
MaxEnt 모형의 최종 결과값은 분석 대상종이 해당 지점 에 출현할 확률로 해석할 수 있다. 따라서 본 연구에서는 위의 데이터를 바탕으로 MaxEnt 모형의 최종 결과값이 0.5 이상인 지역을 금강초롱 자생가능지로 추출하였다. IUCN (2016)의 KBA 설정 기준에 따르면 KBA 경계는 기존에 설정된 타 보호지역과의 관계 등 보호지역 관리의 실무적인 측면을 고려하여 설정하여야 한다. 따라서 본 연 구에서는 MaxEnt 모형이 도출한 금강초롱꽃 자생가능지 와 기존 보호지역을 중첩하여 보고, 금강초롱꽃 분포가능 지가 기존 보호지역과 중첩되는 지역의 경우, 기존 보호지 역 경계를 따라 KBA 후보지 경계를 설정하였다. 본 연구 에서는 MaxEnt 모형 분석을 위해 Phillips et al.(2017)이 생물종 분포 지역 예측 위해 개발한 MaxEnt software for modeling species niches and distributions(Version 3.4.1) 을 활용하였다.
결과 및 고찰
1. MaxEnt 모형 적합도
Figure 2는 MaxEnt 모형이 도출한 금강초롱꽃 출현확률 을 나타낸 그림이다. 5겹 교차검증 결과, MaxEnt 모형의 AUC값의 평균은 0.947로 매우 높았고, 기존 초본식물 자생 지에 대한 MaxEnt 분석 문헌의 AUC와 비슷한 수준이었다. 모형을 적용한 예측정확도와 비슷한 수준이었다. 예를 들어 모데미풀(Megaleranthis saniculifolia)에 대한 MaxEnt 분 석 결과 AUC가 0.97이었고(Lee et al., 2012), 실망초 (Conyza bonariensis)에 대한 분석 결과 AUC는 0.95였으 며(Lee et al., 2015)은 이었으며, 단풍잎돼지풀(Ambrosia trifida)을 대상으로 한 분석 결과 AUC는 0.86이었다(Park et al., 2017). MaxEnt 모형 학습을 위한 38개 금강초롱꽃 실제 출현지점 중 8개를 제외한 30개 지점의 금강초롱꽃 출현 확률이 0.5 이상으로 옳게 분류되어 예측정확도가 78.9%에 이르는 것으로 분석되었다(Figure 2). 이 결과를 볼 때 MaxEnt 모형이 금강초롱꽃 분포지 예측에 적합한 것으로 판단된다.
2. 금강초롱꽃 KBA 후보지 선정 결과
MaxEnt 모형 분석 결과, 금강초롱 출현 확률이 0.5 이상 인 금강초롱꽃 자생가능지는 778km²로 전체 연구대상지의 5.7%를 차지하였다(Figure 3). 주요 금강초롱꽃 자생가능 지는 강원도 고성군과 양양군과 인제군 일원의 향로봉-건봉 산 천연보고구역 일대와 설악산 일대, 인제군과 양구군 일 원의 대암산 일대, 인제군 방태산 일대, 인제군 백암산 일대, 양구군 백석산 일대, 화천군 제안산-해산 일대, 화천 수리봉 일대, 화천군과 철원군 대성산-복주산-두류산-광덕산 일대, 화천군 화악산 일대였다. 본 연구의 대상지는 아니나 강릉 시와 평창군 일대의 오대산 일원과 북한지역 금강산 일원도 금강초롱 출현확률이 0.5 이상으로 나타나 금강초롱꽃이 자 생 가능한 지역인 것으로 분석되었다.
MaxEnt 모형이 추정한 금강초롱꽃 자생가능지는 대부분 타 보호지역으로 지정되어 있었으나, 화천군과 철원군 대성 산-복주산-두류산-광덕산 일대와 강원도 인제군의 방태산 일대, 인제군 매봉산 일대는 보호지역으로 지정되어 있지 않았다. 따라서 이 세 지역은 MaxEnt 모형이 추정한 금강초 롱꽃 자생가능지를 KBA 후보지로 설정하였고, 이 세 지역 을 제외한 지역은 기존 보호지역 경계를 따라 KBA 후보지 경계를 설정하였다(Figure 4). 연구 대상지 내 KBA 후보지 의 전체 넓이는 1,321km²이었다.
3. 금강초롱꽃 출현에 영향을 미치는 환경 요인
38개 금강초롱꽃 서식지의 환경특성을 보면 금강초롱꽃 은 한반도 내 같은 위도에 비해 서늘하고(평균 연평균 기온 19.8°C) 강수량 많은(평균 연강수량 1330mm) 고지대(평균 해발 973m)를 선호하는 것을 확인할 수 있다(Table 2). 또 한 경사가 상대적으로 급하면서(평균 경사 43.0%) 일조량 은 많고(평균 연간 일조량 1283KWH/m²) 주변 식생이 풍부 한(평균 NDVI 0.85) 장소를 선호하였다.
MaxEnt 모형의 개별 환경변수에 대한 jackknife 검증 결 과, 11개 환경변수 중 표고와 연평균 강수량, 생장기 평균 강수량, 최한월 평균 기온이 금강초롱꽃 출현 확률에 영향 을 미치는 것으로 분석되었다. 모든 환경변수를 포함한 모 형과 검증 대상 변수를 제외한 모형의 gain(모형 적합도의 척도)를 비교한 결과, 위의 네 변수의 모형 적합도에 대한 기여도가 높았고, 나머지 7개 변수의 기여도는 미미하였다 (Figure 5). 금강초롱꽃 분포지가 표고와 최한월 평균 기온 에 영향을 받는다는 본 연구의 결과는 금강초롱꽃이 고산지 역 서늘한 지역에 주로 생육한다는 것을 보여주는 결과로, 금강초롱꽃이 해발 900m 이상의 북사면에 상층수목에 의 해 차광이 이루어진 곳에 주로 생육한다는 기존 연구(Jang et al., 2010)의 결과와 일치한다.
하지만 본 연구에서는 연간 일조량이나 생장기 일조량, 주변 식생의 영향이 없는 것으로 나타나, 분포지가 위치한 사면의 향과 상층수목에 의한 차광이 금강초롱꽃 생육에 중요한 환경 요인이라는 Jang et al.(2010)의 결과와 상반 되는 결과를 보였다. 이 차이는 Jang et al.(2010)이 주로 서식지 현장에서 측정한 미소 규모(micro-scale) 데이터를 가지고 분석한 반면, 본 연구는 셀 크기 30초(약 1km)인 저해상도 데이터를 가지고 분석하였기 때문으로 판단된 다. 사면의 향이나 상층수목에 의한 차광 정도가 금강초롱 꽃 생육에 미치는 영향을 분석하기 위해서는 출현지점에 서 측정한 미소 규모의 환경 특성과 지형도, 토양도와 같은 데이터가 필요하나, 저해상도 데이터의 사용은 현장 조사 가 불가능한 본 연구 대상지의 특성상 필연적 한계라 할 수 있다.
4. 결론
MaxEnt 모형을 통해 남북한 접경지역 내 금강초롱꽃 자 생가능지를 예측해 본 결과, 출현 확률 0.5를 넘는 금강초롱 꽃 자생가능지는 778km²로 분석되었다. 본 연구에서는 이 결과에 기지정된 보호지역을 고려하여 총 1,321km²의 지역 을 KBA 후보지로 최종 제시하였다. MaxEnt 모형의 모형 적합도 분석 결과, MaxEnt 모형이 남북한 접경지역 금강초 롱꽃 출현지역을 비교적 정확하게 예측하는 것으로 나타나, MaxEnt 모형이 향후 이 지역 멸종위기종 서식지 분석에 다양하게 활용될 수 있을 것으로 기대된다. 또한 MaxEnt 모형 분석 결과에 따르면 금강초롱꽃은 고도가 높은 서늘한 지역을 선호하는 것으로 나타났는데, 이 결과는 향후 남북 한 통일이나 기후변화와 같은 시나리오에 대비한 금강초롱 꽃 보존 계획 수립의 기초자료로 활용될 수 있을 것으로 기대된다.