Como determinar o conteúdo gc de uma sequência de dna

O teor de citosina de guanina, ou teor de gc, de uma sequência de DNA indica a porcentagem de pares de base nucleotídicos, onde a guanina é ligada à citosina. O DNA com um maior conteúdo GC será mais difícil de separar.

Passos

Método 1 de 2:
À mão
  1. Imagem intitulada 7114843 1
1. Traçar através da sequência e contagem o número de nucleotídeos citosina (c) ou guanina (g).
  • Imagem intitulada 7114843 2
    2. Divida o número de nucleotídeos citosina e guanina pelo número total de pares de base na sequência.
  • Método 2 de 2:
    Programaticamente (Python 2)
    1. Imagem intitulada 7114843 3
    1. Crie ou aceite um arquivo de entrada. Este artigo pressupõe que a entrada está em FASTA Formato, com uma única sequência por arquivo.
  • Imagem intitulada 7114843 4
    2. Leia no arquivo. Para Fasta Format:


  • Descarte a primeira linha do arquivo.
  • Remova todas as novas linhas restantes e outros espaços em branco à direita.
  • Def init (sequência): com Abrir (ARGV [1]) como entrada: Sequence = "".juntar ([linha.Strip () para linha na entrada.Readlines () [1:]]) Seqüência de retorno
  • Imagem intitulada 7114843 5
    3. Crie um contador. Iterar através dos dados e incrementar o seu balcão enquanto encontra qualquer nucleótidos de guanina ou citosina.
  • 4
    def Gccontent (sequência): gccount = 0Para letra em seqüência: se letra == "G" ou letra == "C": Gccount + = 1Return gccount
  • Imagem intitulada 7114843 6
    5. Divida a contagem do GC pelo comprimento total da sequência e produza o resultado em formato percentual.
  • 6
    def Main (): script, entrada = argvesquência = ""Seqüência = init (sequência) impressão "%.2f" % (float (gccontent (sequência)) / len (sequência))

    Pontas

    Se você está calculando o conteúdo GC à mão, certifique-se de verificar novamente! Pode ser fácil de erradicar, especialmente se você estiver analisando uma longa sequência no papel.
    Compartilhe na rede social:
    Semelhante