Como determinar o conteúdo gc de uma sequência de dna
O teor de citosina de guanina, ou teor de gc, de uma sequência de DNA indica a porcentagem de pares de base nucleotídicos, onde a guanina é ligada à citosina. O DNA com um maior conteúdo GC será mais difícil de separar.
Passos
Método 1 de 2:
À mão1. Traçar através da sequência e contagem o número de nucleotídeos citosina (c) ou guanina (g).

2. Divida o número de nucleotídeos citosina e guanina pelo número total de pares de base na sequência.
Método 2 de 2:
Programaticamente (Python 2)1. Crie ou aceite um arquivo de entrada. Este artigo pressupõe que a entrada está em FASTA Formato, com uma única sequência por arquivo.

2. Leia no arquivo. Para Fasta Format:
Def init (sequência): com Abrir (ARGV [1]) como entrada: Sequence = "".juntar ([linha.Strip () para linha na entrada.Readlines () [1:]]) Seqüência de retorno

3. Crie um contador. Iterar através dos dados e incrementar o seu balcão enquanto encontra qualquer nucleótidos de guanina ou citosina.
4
def Gccontent (sequência): gccount = 0Para letra em seqüência: se letra == "G" ou letra == "C": Gccount + = 1Return gccount

5. Divida a contagem do GC pelo comprimento total da sequência e produza o resultado em formato percentual.
6
def Main (): script, entrada = argvesquência = ""Seqüência = init (sequência) impressão "%.2f" % (float (gccontent (sequência)) / len (sequência))
Pontas
Se você está calculando o conteúdo GC à mão, certifique-se de verificar novamente! Pode ser fácil de erradicar, especialmente se você estiver analisando uma longa sequência no papel.
Compartilhe na rede social: