banner
홈페이지 / 소식 / 히말라야의 고대 게놈은 티베트인과 티베트인의 유전적 역사를 조명합니다
소식

히말라야의 고대 게놈은 티베트인과 티베트인의 유전적 역사를 조명합니다

Aug 05, 2023Aug 05, 2023

Nature Communications 13권, 기사 번호: 1203(2022) 이 기사 인용

17,000회 액세스

6 인용

46 알트메트릭

측정항목 세부정보

현재의 티베트인들은 유전적으로나 문화적으로 티베트 고원의 고지대 환경에 적응해 왔지만 그들의 기원에 대한 근본적인 질문은 아직 풀리지 않은 채로 남아 있습니다. 최근의 고고학 및 유전학 연구에 따르면 지난 4만년 이내에 고원에 초기 개체군이 존재했고, 이어서 지난 1만년 이내에 후속 그룹이 도착했습니다. 여기에서 우리는 네팔의 티베트 고원 남쪽 가장자리에 있는 고지대에 있는 33명의 고대인에 대한 새로운 게놈 전체 데이터를 얻었습니다. 우리는 그들이 현재의 티베트인과 가장 밀접하게 관련되어 있음을 보여줍니다. 이들의 조상은 대부분 티베트 고원 북동쪽 가장자리에 있는 후기 신석기 인구와 관련된 집단에서 유래했지만, 뚜렷하고 깊은 구석기 시대 유라시아 조상의 소수 유전적 구성요소도 품고 있습니다. 이웃 티베트인과는 대조적으로, 현재 고원의 남쪽과 동쪽 가장자리를 따라 중간 고도에 살고 있는 비티베트인 티베트-버마어 사용자들은 뚜렷한 유전적 역사를 반영하는 유전적 계통을 형성합니다. 마지막으로, 고대와 현재의 산악인을 비교하면 고지대 적응 대립유전자의 지속적인 긍정적 선택이 확인됩니다.

티베트 고원은 저압 상태, 거친 지형, 추운 기온, 상대적으로 낮은 생물학적 생산성을 특징으로 합니다. 이러한 제약에도 불구하고 티베트 민족은 이러한 환경에 성공적으로 적응했으며 수천 년 동안 고원에서 살아왔습니다1. 이러한 도전적인 저산소 환경에 대한 그들의 유전적, 문화적 적응을 이해하는 것은 고고학적, 인류학적, 유전적, 생리학적으로 큰 관심을 불러일으킵니다2. 완전히 그렇게 하기 위해서는 근원 인구와 고원으로의 초기 이동, 영구 고원 인구의 확립 시기, 조상 유전자 풀의 확립을 포함하여 현재 티베트 인구의 기원에 관한 많은 근본적인 질문에 대답해야 합니다. 지금의 티베트인들에게.

고원으로의 초기 인구 이동과 관련된 고고학적 데이터는 드물지만, 티베트 고원의 북동쪽 끝 가장자리에 있는 바이시야 카르스트 동굴 유적지(해발 3,280m)에는 데니소바인 관련 민족이 16만에서 6만 사이에 존재했음을 시사합니다. 몇 년 전(캬)3,4,5. 중앙 고원에 있는 Nywa Devu 유적지(4600masl)의 날짜는 현대인이 30~40kya 사이에 존재했음을 시사합니다6. 이들 유적지 중 어느 것이 고원에 인간의 영구적인 정착을 반영하는지 여부는 알려져 있지 않습니다. Meyer et al.7은 7.4~12.7kya 사이의 수렵 채집인들이 추상(4270masl)의 중앙 고원을 처음으로 영구적으로 점거했다고 제안합니다. 대조적으로, Chen et al.8과 다른 사람들은 3600년경에 보리 기반 농업이 도래하기 전까지는 중앙 고원에 영구적인 인구가 존재할 수 없었다고 주장했습니다. 후자 모델은 일반적으로 고원의 북동쪽 가장자리를 따라 낮은 고도(<2500masl)에서 이주한 사람들에 의해 농업이 고원에 도입되었다고 추정합니다. 이들 이민자들은 현재 티베트인의 유전자 풀에 실질적으로 기여한 것으로 제안되었습니다9.

그러나 현재 티베트인의 더 복잡하고 다양한 기원에 대한 증거도 유전 데이터를 통해 뒷받침됩니다. 조밀하게 샘플링된 단일 부모 마커는 대부분 홀로세 초기 이후 북동 아시아에 존재했던 혈통으로 추적될 수 있지만 깊은 유라시아 혈통에서 유래한 미토콘드리아 M16 및 Y 염색체 D-M174와 같은 오래된 하플로그룹도 현재 유일하게 존재합니다. -일 티베트인10,11,12. 티베트 유전자 풀에 대한 고대 구석기 시대의 기여에 대한 아이디어도 전체 게놈 서열 데이터를 기반으로 제안되었습니다. 현재의 티베트인 게놈을 고대 시베리아인 및 고대 호미닌의 게놈과 비교하는 연구는 고원의 초기 민족으로 추정되는 고대 조상과 비고대 조상의 혼합에서 기여를 추론했습니다13. 이 제안은 데니소바인 유사 개체군에서 현재의 티베트 유전자 풀로 유입된 EPAS1(내피 PAS 도메인 단백질 1) 유전자좌에서 일배체형을 발견한 것과 일치하며, 이는 고지대 환경에서 선택적인 이점을 제공합니다14,15,16 ,17.

+4.4 SEM, standard error measure). The same pattern is also observed for present-day Nepalese Sherpa/Tibetans (>+2.7 SEM), while lowland East Asian populations are symmetrically related to Chokhopani and Lubrak (Supplementary Data 7). Using qpWave, we formally compared the two topologies ((Lubrak, aMMD), Chokhopani) and ((Chokopani, aMMD), Lubrak). We show that Suila, Rhirhi, Mebrak, and Samdzong are cladal to Lubrak (i.e., the former topology holds) within the limits of our resolution (p > 0.192), and Kyang only slightly differentiates from Lubrak (p = 0.027; Supplementary Table 1). In contrast, modeling the aMMD groups as a sister group of Chokhopani uniformly failed and thus the latter of the two topologies can be rejected (p < 1.38 × 10−4). A combination of Lubrak with a minor contribution from a South Asian group (e.g., Pulliyar) adequately fits all four groups, with an estimated South Asian ancestry contribution of only 1.9–5.1% (p > 0.179; Supplementary Table 2). For Chokhopani, neither Lubrak + South Asian nor Lubrak + Naxi/Yi/Naga fits (p < 3.67 × 10−4); however, Suila + Naxi/Yi/Naga fits with a substantial lowlander contribution (31–40%; Supplementary Table 3). We also detect a significant signal of admixture in Chokhopani using DATES, which infers an admixture time in Chokhopani of 46 ± 11 generations before the time of Chokhopani, placing it at ca. 1500-2800 BCE (for mean ± 2 SEM; Supplementary Fig. 6). This implies gene flow must have occurred between Chokhopani and the ancestors of these low/middle altitude populations prior to 800 BCE, and plausibly before 1500 BCE./p>0.1%) on screening for further analysis. Of these, 25 samples (21 individuals) were selected for a custom in-solution capture using oligonucleotide probes matching 50 K manually selected target sites with functional significance (‘50K’, see assay design description below). To ensure sufficient genome-wide coverage of ancestry informative markers for ancestry analysis across the entire sample set, we performed an in-solution capture for ~1.2 million informative nuclear SNPs (‘1240K’)22,60 on all 47 well-preserved samples. However, to improve the library complexity of the 43 samples initially processed at OU, we first generated new double-stranded, double-indexed libraries for these samples at the MPI-SHH using the method described for the Lubrak samples. We applied the 1240K capture to all 47 samples, and sequenced them on an Illumina HiSeq 4000 using 1 × 75 chemistry and Illumina NextSeq 500 using 2 × 75 bp chemistry until we achieved sufficient coverage on the captured SNPs or depleted library complexity (Supplementary Data 1). After removing three samples that failed our quality control criteria (C2 for low coverage, M3490 and U2 for 4% and 9% mitochondrial contamination, respectively), 44/47 samples (33 individuals) were included in our analysis. Finally, 15 samples (13 individuals) were selected for whole genome deep sequencing (WGS). Seven of these samples were sequenced at Macrogen, Inc. using an Illumina HiSeq X10 with 2 × 75 bp chemistry, and 9 (including one sample overlapping with the U of Chicago samples) were sequenced at the MPI-SHH using an Illumina HiSeq4000 with 1 × 75 bp chemistry (Supplementary Data 1); WGS samples sequenced at the MPI-SHH were subjected to UDG-half treatment61. These data were then combined with 7 previously published deeply sequenced aMMD genomes (individuals C1, M63, M344, S10, S35, S40, and S41; excluding M240 for its outlier position in PCA) for subsequent analysis, resulting in a total of 20 individuals with whole genomes sequenced to a depth of 0.1-6.6x. In total, genome-wide (‘1240K’) ancestry data was generated for 33 individuals, functional SNP (‘50K’) data was generated for 21 individuals, and whole genome data was analyzed for a total of 20 individuals, resulting in 38 individuals in the final dataset (which includes individuals from this study and the previous study21)./p> 2, where the scores are calculated by 5 cM block jackknifing. We also prefer topologies with positive internal branch lengths. Note that the procedure above is greedy in that a different order from which these populations were added can lead to a different final topology. We repeated our graph searching procedure by replacing Tianyuan with two Hoabinhian hunter-gatherers in southeast Asia ("McColl_SEA_GR1"; La368 and Ma911; Supplementary Data 5). We then tried adding archaic hominin (Altai Neanderthal and Denisovan) or Ust-Ishim into our five-population skeleton. Lastly, we tried adding a group merged from 2 Eneolithic Botai, Tyumen_HG and Sosonivoy_HG, hoping this group could tease out whether the deep lineage shows more East or West Eurasian affinity./p>