지식나눔

NCBI blastp 결과값들의 의미...

첨부파일


현제 2개의 protein간의 homology 정도를 수치화하여 비교를 하기위해 blastp의 2개 sequence 비교를 하여(첨부파일 data01) 결과값들을 얻었습니다(첨부파일 data02,03). 하지만, Max score, Total score, Query coverage, E value 값들이 일관성이 없어서 어떤 수치를 기준으로 비교할지 막막해 졌습니다. 그냥 결과가 두 sequence가 몇% 유사한지와 해당 값에 대한 신뢰성만을 보여주면 좋을텐데, blast결과값의 의미를 정확히 파악하지 못하여 문제가 생기게 되네요. "두 개의 서열만을" 비교했을때 나타나는 각 결과값들의 정확한 의미를 알고 싶고, 어떤 값을 사용하면 될지 조언 부탁 드립니다. 또는 protein homology 비교를 위해 주로 사용하는 다른 방법이 있다면 그것도 알고싶구요... 아래는 제가 이해한(또는 의문이 드는) 용어 부분입니다. ================================================================ Max score: 두 개의 서열에서 일치율이 높은 부분들을 조각내서 결과의Alignments 쪽에(그림에는 뺐음) 나타내는데, 그 중에 bit score가 가장 큰 것을 반올림 해서 표시하더군요. Total score: Max score의 bit score 총합값을 반올림. Query coverage: Total score에 기준하여 산출한다고 하는데, 어떤식으로 계산되는지 모르겠네요. ㅎ. 아마 제가 사용해야 할 값이 이값같은데 맞는지...? E value: 우연히 나올 수 있는 값(오류값이 나올 확율?) 정도로 생각하고 있는데, 보통 몇 정도 이하값이 나와야 신빙성이 있는지 의문...
  • NCBI
  • blast
  • homology
지식의 출발은 질문, 모든 지식의 완성은 답변! 
각 분야 한인연구자와 현업 전문가분들의 답변을 기다립니다.
답변 0