거의 완전한 인간 유전체 내 복합 유전 변이
Complex genetic variation in nearly complete human genomes
Glennis A. Logsdon, Peter Ebert, Peter A. Audano 외 5인·Nature·발표 2025.07· 81 인용
최근 1년 80회 인용· 떠오르는 연구
한국어 핵심 요약
판게놈 참조체를 구축하고 복합 구조 변이의 범위를 이해하려면 다양한 완전 인간 유전체 세트가 필수적입니다. 본 연구는 65개의 다양한 인간 유전체를 시퀀싱하고 130개의 일배체형 해상도 어셈블리(중간 연속성 130Mb)를 구축하여, 기존 어셈블리 갭의 92%를 해소하고 염색체의 39%에서 텔로미어-투-텔로미어 상태에 도달했습니다.
주요 조직 적합성 복합체(MHC), SMN1/SMN2, NBPF8, AMY1/AMY2를 포함한 복합 유전자좌의 완전한 서열 연속성을 확인하고, 1,852개의 복합 구조 변이를 완전히 해결했습니다. 또한 1,246개의 인간 동원체를 완전히 어셈블리하고 검증했습니다. 알파 위성 고차 반복 서열 배열 길이에서 최대 30배의 변이를 발견하고, 알파 위성 고차 반복 서열 배열로의 이동성 요소 삽입 패턴을 특성화했습니다.
대부분의 동원체가 단일 동원체 부착 부위를 예측하지만, 후성유전학적 분석은 동원체의 7%에서 두 개의 저메틸화 영역이 존재함을 시사합니다. 본 데이터를 드래프트 판게놈 참조체와 결합하면 단일 염기 서열 데이터의 유전자형 분석 정확도가 크게 향상되어, 전체 유전체 추론 품질 값이 중간 45에 도달했습니다.
이 접근 방식을 통해 개인당 26,115개의 구조 변이가 검출되었으며, 이는 질병 연관성 연구에 활용 가능한 구조 변이의 수를 크게 증가시켰습니다.
섹션 미리보기
연구 배경
인간 판게놈 참조체 구축과 복합 구조 변이 이해를 위해 다양한 완전 인간 유전체 데이터가 요구됩니다. 기존 유전체 어셈블리에는 많은 갭이 존재하여 유전체 전체의 복잡한 변이를 파악하는 데 한계가 있었습니다.
핵심 발견
65개 유전체 시퀀싱을 통해 기존 어셈블리 갭의 92%를 해소하고, 복합 유전자좌 및 1,852개의 복합 구조 변이를 완전히 해결했습니다. 또한 1,246개의 인간 동원체를 어셈블리하고, 알파 위성 반복 서열의 길이 변이와 이동성 요소 삽입 패턴을 규명했습니다.
관련 생물학 논문
카무카무 유망 유전자형의 수확량 및 특성 평가
2026·229
생물 침입: 분포, 장기 동향 및 데이터 격차
2025·43
농업 미생물군 활용의 잠재력과 과제
2025·40
기후, 토양, 미생물: 경작지 유기물 분해
2025·38