A definição e propósito de um compilador

Dados globais, arte conceitual

ANDRZEJ WOJCICKI / Getty Images





UMA compilador é um programa que traduz legível por humanos Código fonte em código de máquina executável por computador. Para fazer isso com sucesso, o código legível por humanos deve estar em conformidade com o sintaxe regras de qualquer linguagem de programação em que está escrito. O compilador é apenas um programa e não pode corrigir seu código para você. Se você cometer um erro, terá que corrigir a sintaxe ou não compilará.

O que acontece quando você compila o código?

A complexidade de um compilador depende da sintaxe da linguagem e da quantidade de abstração essa linguagem de programação fornece. Um compilador C é muito mais simples do que um compilador para C++ ou C#.



Análise Lexical

Ao compilar, o compilador primeiro lê um fluxo de caracteres de um arquivo de código-fonte e gera um fluxo de tokens léxicos. Por exemplo, o código C++:

|_+_||_+_|

podem ser analisados ​​como estes tokens:



  • digite 'int'
  • variável 'C'
  • é igual a
  • colchete esquerdo
  • variável 'A'
  • vezes
  • variável 'B'
  • colchete direito
  • mais
  • literal '10'

Análise sintática

A saída léxica vai para a parte do analisador sintático do compilador, que usa as regras da gramática para decidir se a entrada é válida ou não. A não ser que variáveis A e B foram declarados anteriormente e estavam no escopo, o compilador pode dizer:

  • 'A' : identificador não declarado.

Se eles foram declarados, mas não inicializados. o compilador emite um aviso:

  • variável local 'A' usada sem ser inicializada.

Você nunca deve ignorar os avisos do compilador. Eles podem quebrar seu código de maneiras estranhas e inesperadas. Sempre corrija os avisos do compilador.

Uma passagem ou duas?

Algumas linguagens de programação são escritas para que um compilador possa ler o código-fonte apenas uma vez e gerar o código de máquina. Pascal é uma dessas linguagens. Muitos compiladores requerem pelo menos duas passagens. Às vezes, é por causa de declarações antecipadas de funções ou aulas.



Em C++, uma classe pode ser declarada, mas não definida até mais tarde. O compilador não consegue descobrir quanta memória a classe precisa até compilar o corpo da classe. Ele deve reler o código-fonte antes de gerar o código de máquina correto.

Gerando Código de Máquina

Supondo que o compilador complete com sucesso as análises léxicas e sintáticas, o estágio final é gerar o código de máquina. Este é um processo complicado, especialmente com CPUs modernas.



A velocidade do compilado executável o código deve ser o mais rápido possível e pode variar enormemente de acordo com a qualidade do código gerado e quanta otimização foi solicitada.

A maioria dos compiladores permite que você especifique a quantidade de otimização – normalmente conhecida por compilações de depuração rápidas e otimização completa para o código lançado.



A geração de código é desafiadora

O escritor do compilador enfrenta desafios ao escrever um gerador de código. Muitos processadores aceleram o processamento usando

Se todas as instruções dentro de um código ciclo pode ser realizada no CPU cache, então esse loop é executado muito mais rápido do que quando a CPU precisa buscar instruções da RAM principal. O cache da CPU é um bloco de memória embutido no chip da CPU que é acessado muito mais rapidamente do que os dados na RAM principal.



Caches e Filas

A maioria das CPUs tem uma fila de pré-busca onde a CPU lê as instruções no cache antes de executá-las. Se ocorrer uma ramificação condicional, a CPU precisa recarregar a fila. O código deve ser gerado para minimizar isso.

Muitas CPUs têm partes separadas para:

  • Aritmética inteira (números inteiros)
  • Aritmética de ponto flutuante (números fracionários)

Essas operações geralmente podem ser executadas em paralelo para aumentar a velocidade.

Os compiladores geralmente geram código de máquina em arquivos de objeto que são então vinculado juntos por um programa de ligação.