생물정보공학engineering _기말 질병과 이와 관련된 유전자 report
본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

생물정보공학engineering _기말 질병과 이와 관련된 유전자 report에 대한 보고서 자료입니다.

목차

1. 관심질병 소개 및 관련된 유전적 특징
2. 유전자 찾기
3. SNP
4. 유전자 예측
5. 단백질 서열 상동성 조사
6. 요약

본문내용

k
GeneID
Genescan
Fgenesh
exon 1
5001 - 5975
5094 - 5465
5594 - 5975
5094 - 5975
exon 2
9206 - 9369
9206 - 9369
9206 - 9369
9206 - 9369
exon 3
10158 - 10241
10158 - 10241
10158 - 10241
exon 4
14257 - 14359
14257 - 14359
14257 - 14359
14257 - 14359
exon 5
14443 - 14576
14789 - 14924
14789 - 14924
exon 6
15259 - 15370
15473 - 15591
15473 - 15531
exon 7
15746 - 15954
15746 - 15954
15746 - 15954
15746 - 15954
exon 8
16681 - 16876
16681 - 16843
16681 - 16876
16681 - 16876
exon 9
17386 - 17462
17386 - 17462
17386 - 17462
17386 - 17462
exon 10
17587 - 17719
17587 - 17740
17587 - 17740
17587 - 17740
exon 11
17797 - 18002
17797 - 18002
17797 - 18002
17797 - 18002
exon 12
18139 - 18200
18139 - 18200
18139 - 18200
18139 - 18200
exon 13
18455 - 18563
18455 - 18563
18455 - 18563
18455 - 18563
exon 14
18876 - 18992
18876 - 18992
18876 - 18992
18876 - 18992
exon 15
19092 - 19169
19092 - 19169
19092 - 19169
19315 - 19454
exon 16
19315 - 19454
19315 - 19454
19315 - 19454
19773 - 19909
exon 17
19773 - 20371
19773 - 19909
19773 - 19909
poly A
20214 - 20219
20214
☞ 표에 나온 것처럼 GeneID는 exon 3, 5, 6이 제대로 예측되지 않았고, Fgenesh가 가장 정확하게 잘 예측된 것으로 나타난다.
5. 단백질 서열 상동성 조사
1) BLAST
: 가장 높은 상동성을 가진 타종으로는 1915점을 가진 Pan paniscus(침팬지)로 99%의 identity를 나타냄을 알 수 있다. E값 또한 0으로 결과가 false positive일 확률도 거의 없음이 확인되었다. 아래의 그림에서 보여지듯이 전체 서열 중에서 빨간색으로 나타낸 conserved한 서열은 4개이며, 파란색으로 나타낸 query sequence와는 다른 아미노산으로 치환됐거나 생물학적 유사성이 없는 region이 2개임을 알 수 있다.
<그림 8 : 두 서열 간에 conserved한 서열과 일치되지 않는 서열의 위치 >
2) FASTA
: FASTA는 기본적으로 BLAST와는 다르게 두 서열간에 match되는 서열부위들을 가장 유사성을 높이도록 랜덤하게 배열함으로써 score를 매기게 되는데, 이로 인해 아미노산배열을 하되 두 서열간의 match만 중점적으로 보는 것이 아니라 서열이 달라도 특정기능을 나타내는 도메인 찾아내는데 유용한 program이다. FASTA결과 Mouse에서 가장 높은 score가 부여되었으며, E값 또한 0으로 아주 낮게 예측되어 유의적인 data로 예상된다. 아래 그림은 서열이 유사한 domain이 어디에 위치해 있는지를 나타내는 그림이다. 그중 유사성이 높은 한 domain인 ATPase_AAA_core에 대해 알아보았다.
<그림 9 : mouse에서 나타나는 서열이 유사한 domain의 위치>
☞ 먼저 human의 PEX6 유전자의 이 서열영역과 mouse의 PEX6 유전자에서 나타나는 이 domain영역(740 871 : 741 842) 간의 서열 유사성이 얼마나 되는지 알아보았다. 아래에는 query와 mouse 아미노산 sequece간의 상동성을 보여주는 그림을 첨부하였다.
☞ 그림에서 빨간색으로 표시된 박스가 바로 두 서열간에 중첩되는 아미노산 서열 부위인데 low complex reigion에 해당되어 상동성 검사에서 제외되는 부분인 791번에서 798번 아미노산 영역인 araraaa와 851번에서 862번까지의 아미노산 부위인 rpdlldapllrp를 제외하면 전체적인 아미노산 sequence는 거의 동일 함을 알 수 있다.
※ ATPase AAA score 도메인에 관한 간략한 설명
: 간략한 설명으로는 AAA ATPase는 세포주기조절, 단백질분해, 세포소기관의 생합성과 세포내 수송에 관여하는 많은 수의 large protein들을 형성하며, 그들 중 일부는 샤페론, 단백질분해효소의 subunit으로서 작용한다. 또한 DNA helicase나 전사조절인자로서도 역할을 한다.
6. 요약
☞ PEX6는 6번 chromosome의 p arm 21.1에 위치하며, 많은 수의 다양한 세포활성에 관여하는 ATPase를 암호화하는 유전자이다. 총 22371 bp의 염기와 980개의 아미노산으로 구성되어 있으며 17개의 exone과 16개의 intron이 존재하는데 Fgenesh에서 가장 정확하게 잘 예측되었으며, CDS의 위치까지 예측되었다. 이 유전자에서 나타나는 rs1123187 SNP는 missense로 mRNA 2909번째 위치에 존재하는 C가 A로 바뀜으로써 amino acid sequence가 proline에서 glutamine으로 바뀌게 된다. 상동성 검사로는 BLAST에서는 침팬지와 가장 서열 유사성이 높은 것으로 나타났으며 FASTA에서는 mouse와 가장 유사하였는데 그중 740번째에서 872번째 아미노산 영역인 ATPase AAA core domain에서 가장 서열 유사성이 높은 것으로 나타났다. ATPase AAA 도메인의 기능은 세포주기조절, 세포내 수송에 관여하는 단백질을 합성하며, 전사조절인자로도 작용을 하는 것으로 알려져 있다.
  • 가격6,300
  • 페이지수13페이지
  • 등록일2015.11.10
  • 저작시기2015.6
  • 파일형식한글(hwp)
  • 자료번호#986638
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니