A notação para a convolução de e é . Ela é definida como a integral do produto de uma das funções por uma cópia deslocada e invertida da outra; a função resultante depende do valor do deslocamento. Se x for a variável independente e u, o deslocamento, a fórmula pode ser escrita como:[1][2]
Note-se que h(x) depende de f(x) e de g(x) mas, para calcular h(x1), não basta conhecer f(x1) e g(x1); é preciso conhecer os valores de f(x) e de g(x) em todo o intervalo -∞ < x < ∞.[1]
Por razões históricas, a expressão de definição da convolução frequentemente refere-se a variáveis físicas relacionadas com o tempo, na forma seguinte:
Mas a expressão (1a) é preferível, por ser mais genérica. Atualmente, a convolução encontra muitas aplicações em matemática pura e processamento de dados. Além disso, mesmo em física e engenharia, a convolução nem sempre se aplica a fenômenos que variam no tempo; existem casos de aplicação a variações no espaço.[1]
Nem todo par de funções f(x), g(x) pode sofrer convolução. Em alguns casos, a integral não pode ser calculada. As condições de existência (ou seja, de integrabilidade) da convolução são discutidas mais abaixo.
Convolução discreta
Existe ainda uma definição de convolução para funções de domínio discreto, dada por
Onde f e g são sequências de tamanho n e a fórmula fornece o valor do k-ésimo elemento do resultado. Deve-se notar que o tamanho de h é 2n-1, isto é, k varia de 0 a 2n-1 na fórmula acima.
As sequências f e g não precisam necessariamente ter o mesmo tamanho, supondo f com n elementos e g com m elementos, o tamanho de k será dado por n+m-1.
A convolução discreta pode ser escrita em forma matricial:
onde f é um operador matricial que transforma o vetor (ou matriz-coluna) g em outro vetor (ou matriz-coluna) h, conforme abaixo:
Note-se que g deve receber elementos nulos de modo a ficar com 2n-1 linhas, o mesmo tamanho de h. f será uma matriz de (2n-1) x (2n-1) elementos.[nota 2] Devido à presença desses n-1 zeros anexados a g, os valores nas n-1 colunas mais à direita de f não influem no resultado, e podem por conseguinte ser também zerados. Assim, pode-se escrever (2b) alternativamente como
onde g não recebe elementos nulos extras e f é uma matriz de (2n-1) x (n-1) elementos.[nota 2]
Note-se também que a convolução definida pela expressão (2b) não é comutativa. Nos casos de aplicação em que se prefere essa expressão em detrimento da (2b), isso não constitui um problema. Na verdade, em tais casos f e g desempenham papéis diferentes e seria contra-intuitivo invertê-los.[1]
Em muitas aplicações práticas as sequências são grandes o suficiente para considerá-las como se fossem infinitas, isto é, como contendo um número infinito de zeros no início e no final. Seguindo-se essa convenção, não é preciso preocupar-se com o fato de as sequências f, g e h terem tamanhos díspares.[1] Nesses casos, a fórmula da convolução discreta pode ser escrita na forma alternativa[2][3][4]
Essa expressão é mais geral e mais útil para a demonstração de teoremas. Se for usada, evidentemente pode acontecer de o valor de k-j ser negativo. Isso ocorre porque, uma vez que as sequências são tornadas infinitas, a origem k=0 passa a ser arbitrária.[1]
Essa expressão é a única admissível se as duas sequências f e g forem naturalmente infinitas. Por exemplo, se forem representações em série de Laurent de duas funções complexas f(s) e g(s).[4]
A convolução como uma integral indefinida
Uma expressão alternativa para a definição de convolução contínua para funções f(x) e g(x) definidas no intervalo [0,∞][nota 3] é a seguinte:
que é a equivalente contínua de (2c), assim como (1a) é a equivalente contínua de (2a).[5]
Convolução cíclica
Se f e g são funções periódicas com período τ, a informação útil existente no intervalo -∞ < x < ∞ aparece toda em qualquer intervalo de tamanho τ; os valores em outros intervalos são apenas replicações daquele. Nesse caso, é suficiente computar a convolução dentro desse intervalo menor, o que é frequentemente menos trabalhoso, principalmente quando se trata da convolução discreta. Assim, define-se a convolução cíclica (ou convolução circular), na sua variante contínua, de f e g como
onde a é arbitrário. Como as funções são periódicas, e o resultado também, é mais natural escrever[6]
com a substituição da variável linear x pela variável angular θ. Quanto à convolução cíclica discreta, é dada por
onde H é a função passo de Heaviside (ou degrau unitário), e n é o período da sequência. O termo n·H(j - k) aparece para manter o argumento de g(k) dentro da faixa [0,n-1], sem o que a computação não pode ser feita.[6] É comum na literatura, no entanto, a sua omissão, uma vez que, devido ao fato de g(k) ser periódica com período n, g(k-j), para k<j, pode ser substituído por g(k-j+n).[3][6]
Alguns autores, como, por exemplo, Oppenheim (1983), adotam o termo convolução linear para designar a convolução discreta, para evidenciar as diferenças entre esta e a convolução cíclica e evitar confusão entre as duas. A convolução cíclica demanda interpretação e exibe propriedades diferentes; para mais detalhes, ver abaixo.
Da mesma forma que (2d) corresponde a (2a) para a convolução cíclica discreta, a equação (2b) permanece válida neste caso, com g, h e h conforme abaixo:
Neste verbete, j, k, m e n denotam números inteiros. a e b são constantes reais. c é uma constante complexa. u, v, w, x, y e z denotam variáveis reais. s denota uma variável complexa. t e τ denotam o tempo em exemplos de aplicações físicas. ε denota uma grandeza infinitesimal. θ e φ denotam ângulos.
Interpretações
O exame direto da integral de definição deixa claro que a convolução é uma medida da área subentendida pelo produto da função f(x) com uma cópia invertida no tempo de g(x), em função da distância relativo entre elas. Algumas interpretações possíveis são mencionadas abaixo.
Como cálculo de uma média móvel ponderada
Para se adquirir uma boa visão intuitiva da convolução, pode-se entender que ela consiste no cálculo do valor médio da função g(x). Trata-se de uma média ponderada com pesos dados por f(x). A inversão de g(x) não altera nada na interpretação, pois x não tem significado físico. Inverte-se g(x) apenas por conveniência, uma vez que sem isso a operação não seria comutativa (ver mais abaixo[1]).
A figura abaixo ilustra um caso. A variável t representa o tempo, como ocorre em várias aplicações de física. A área de superposição de f(τ) e g(t - τ), em amarelo, é nula para |t - τ| > 1 e atinge um máximo de 1 em (t - τ) = 0, isto é, quando t = τ.
Como medição de uma grandeza física
Fisicamente, essa operação poderia ser encarada como o resultado da aplicação de um instrumento de medida cuja resposta fosse dada por f(x) a um fenômeno físico expresso pela função g(x). A convolução, nesse caso, daria o resultado da medição. Quanto mais constante e compacta for f(x) (ou seja, quanto mais preciso for o instrumento), mais o resultado final (a medição) será similar a g(x) (o fenômeno observado).[1]
A figura abaixo ilustra um exemplo. Novamente a variável t representa o tempo. O instrumento apresenta uma resposta com decaimento exponencial, um caso bastante comum. É fácil ver que um instrumento perfeito teria que ter uma resposta f(t) = δ(t), onde δ(t) é o Delta de Dirac ou impulso unitário: a área subentendida por f(t) é 0 para -∞ < t < ε, e muda bruscamente para 1 para t > ε. Dessa forma, h(t) = 0 para -∞ < t < ε e g(t) para t > ε.[nota 4]
Como a operação de convolução é comutativa (ver mais abaixo, fica claro também que, se o sinal aplicado g(t) = δ(t), o resultado h(t) será idêntico a f(t), que foi definido como a resposta do instrumento. Assim, uma maneira direta de levantar a função resposta de um instrumento é aplicar um impulso unitário na sua entrada e medir a saída.[1][7]
Como o produto de dois polinômios
A convolução discreta nada mais é que o produto de Cauchy de dois polinômios f e g, de ordem n-1. Se f = f0 + f1x + f2x2 + … fn-1xn-1 e g = g0 + g1x + g2x2 + … gn-1xn-1, o produto será uma sequência h = h0 + h1x + h2x2 + … h2n-2x2n-2, com:
h0 = f0g0
h1 = f0g1 + f1g0
h2 = f0g2 + f1g1 + f2g0
e assim por diante. Ou seja,
que é idêntica à expressão (2a), a menos da notação usada.[1]
Produto de duas sequências
O resultado acima mostra que a convolução discreta pode ser usada para calcular o produto de quaisquer sequências f e g, mesmo que uma ou ambas sejam infinitas ou semi-infinitas. Nesse contexto, n é o número de termos da maior entre elas. Em um exemplo possível de aplicação, g é um conjunto de amostras de um sinal e f representa um processamento aplicado a g.
Nesse exemplo, podem-se identificar casos especiais da sequência f:
f = {1} funciona como uma "sequência identidade" (ou "unitária"), pois f*g = g;
outras sequências com a mesma propriedade são {1, 0}, {1, 0, 0} e inclusive a sequência infinita {… 0, 0, 1, 0, 0 …};
f = {1, -1} gera a primeira diferença finita de g, pois hk = gk - gk-1;
(com m termos) gera a média móvel de g para uma janela de largura m;
f = {1, 1, 1 …} (semi-infinita) funciona como a "sequência inversa" de {1, -1}, ou seja, f * {1, -1} = {1, 0, 0 …};[1]
f = { … 0, 0, 0, 1, 1, 1 , 0, 0, 0 …} (infinita) e outras similares provocam o efeito de embaçamento em imagens.
Como uma integral indefinida
Uma função escrita como integral indefinida na forma
pode ser escrita na forma alternativa de uma integral imprópria
onde H(x) é a função de passo de Heaviside (ou degrau unitário). Isso acontece porque a função H(x - u) é nula para qualquer valor de u > x, e igual a 1 para -∞ < u < x.
é óbvio que a expressão da integral é uma convolução f(x) * H(x). Assim, pode-se escrever:
para qualquer função f(x), contanto que a convolução possa ser calculada.[8]
Como maneira de expressar uma sequência
Como a convolução possui um significado físico claro, muitas vezes prefere-se expressar o resultado de um problema resolvido através de métodos numéricos como uma convolução discreta, em lugar de expressá-lo como uma sequência de valores pura e simples ou mesmo como uma transformada discreta de Fourier.[9]
Propriedades
Tanto a convolução contínua quanto a discreta exibem as seguintes propriedades:
Note-se que o uso da transformada discreta de Fourier implica o uso da convolução cíclica, uma vez que as funções devem ser periódicas. n é o período de f e de g, e aparece como um fator de escalamento na própria definição da transformação.[6]
Comportamento dos momentos de ordem 0 a 2
A área (momento de ordem 0) da convolução é igual ao produto das áreas das funções originais f(x) e g(x):
A abcissa do centro de massa (momento de ordem 1) da convolução é igual à soma das abcissas dos centros de massa das funções originais f(x) e g(x). Se adotarmos a notação para a abcissa do centro de massa da função f(x), podemos escrever
que é a definição de centro de massa. A propriedade pode ser escrita, então
A variância (momento central de ordem 2) da convolução é igual à soma das variâncias das funções originais f(x) e g(x). Se adotarmos a notação σf para a variãncia da função f(x), podemos escrever
que é a definição de variância. A propriedade pode ser escrita, então
Essas propriedades podem ajudar a verificar rapidamente a correção de um cálculo de convolução contínua ou discreta.[12]
onde é o período de amostragem. Essa regra deve-se ao fato de que as operações de derivação, integração e translação podem ser realizadas através da convolução, como mostrado nas expressões (3p), (1f) e (3l), respectivamente. O primeiro operador é chamado operador de diferença adiantada, e o segundo, operador de diferença atrasada.[14]
Convoluções com a função de Heaviside
A convolução apresenta as seguintes propriedades interessantes relacionadas com a função de Heaviside:
A convolução cíclica é bastante diferente da convolução discreta. A convolução (linear) discreta de duas sequências de n elementos é uma sequência de 2n elementos; A convolução cíclica de duas sequências de período n, e portanto com n elementos cada, em contraste, é uma sequência com o mesmo período, e, portanto, o mesmo número n de elementos.[6]
Cálculo de convoluções
Uma convolução pode ser calculada diretamente das expressões de definição (1a), (2a), (2c), (1d) e (2d). Para exemplos, ver o anexo.
Convoluções também podem ser calculadas indiretamente, lançando-se mão do teorema da convolução. A partir da expressão (3g), por exemplo, pode-se escrever
e assim calcular a convolução de duas sequências a partir de suas transformadas de Fourier. Pode-se também usar outras transformadas para isso, como a transformada de Hartley.[15] Para exemplos, ver o anexo.
Condições de existência da convolução
A integral imprópria (1a), que define a convolução, não converge para qualquer par de funções. Por exemplo, se f(x) = g(x) = cos(x), a convolução não pode ser calculada. São condições suficientes (mas não necessárias) para a existência da convolução de duas funções f(x) e g(x):[10]
f(x) e g(x) devem ser absolutamente integráveis no intervalo [-∞, 0], isto é, a integral do módulo da função nesse intervalo precisa convergir;
f(x) e g(x) devem ser absolutamente integráveis no intervalo [0, ∞];
f(x) ou g(x) deve ser absolutamente integrável no intervalo [-∞, ∞].
Em estatística, a função de densidade de probabilidade da soma de duas variáveis aleatórias e é dada pela convolução das respectivas funções de densidade de probabilidade (ver acima).
A passagem de um sinal luminoso g(t) por um material transparente real pode ser expresso pela convolução de g com a função que descreve a resposta do material, f. Já se viu (ver acima) que f pode ser levantada experimentalmente aplicando-se um pulso luminoso suficientemente intenso e curto para ser representado pelo Delta de Dirac δ(t) e medindo-se o sinal de saída, h(t). Os efeitos observados experimentalmente de alisamento (ing. "smoothing") e embaçamento (ing. "blurring") podem ser explicados matematicamente a partir das propriedades da convolução.
Chama-se alisamento ao fato de o resultado h(t) da convolução f(t) * g(t) ser sempre uma função mais suave do que os componentes f(t) e g(t). Formalmente, define-se o 'grau de suavidade n de uma função qualquer pela ausência de impulsos em suas derivadas. Por exemplo, o Delta de Dirac é uma função impulsiva, portanto seu grau de suavidade é 0; a função retangular não é impulsiva, mas sua derivada é, portanto seu grau de suavidade é 1. Se chamarmos nf , ng e nh ao grau de suavidade de f, g e h, respectivamente, pode-se demonstrar que nh = nf + ng.
Chama-se embaçamento ao fato de o resultado h(t) da convolução f(t) * g(t) ser sempre uma função mais dispersa ao longo do eixo das abcissas do que os componentes f(t) e g(t). A dispersão, como se sabe, é medida pela variância, e a expressão (3j) mostra que a variância de h(t) será sempre maior que a de f(t) e a de g(t), individualmente.
O efeito combinado desses dois fenômenos é uma perda de definição do sinal original g(t). Operações inversas ao alisamento e ao embaçamento, chamadas de anti-alisamento (ing. "sharpening") e anti-embaçamento (ing. "deblurring"), são frequentemente usadas para restaurar a qualidade do sinal original. Tais operações dependem da deconvolução, tratada mais abaixo.[16]
Filtro de média móvel
Muitas vezes, o alisamento mencionado no item acima não é um efeito indesejável, e sim algo que se busca deliberadamente. Uma situação típica é a presença de um tipo específico de ruído no sinal, que provoca o aparecimento de flutuações de alta amplitude, curta duração e ocorrência aleatória; um exemplo é a ocorrência de um dia atípico dentro de um conjunto de medições meteorológicas abrangendo um período anual. Essas flutuações precisam ser removidas, para não comprometer a qualidade da informação transportada por g(t).
O filtro de média móvel é um tipo comum de filtro digital, que pode ser descrito por meio da convolução da maneira seguinte:[16]
Aplicações em Estatística
Teorema do Limite Central
O Teorema do limite central é importante em estatística e pode ser enunciado de diversas maneiras equivalentes. Uma delas utiliza a convolucão: se f1(x), f2(x), f3(x) … fn(x) são funções densidade de probabilidade de cada um dos n conjuntos de amostras da mesma variável x,
Ainda em estatística, pode-se demonstrar que, sendo X e Y duas variáveis aleatórias contínuas e independentes, e PX(R) e PY(R) denotando a respectiva probabilidade de possuírem o valor R, a probabilidade de que X + Y = Z será dada por[17]
Expressão de funções como convoluções
Uma função qualquer f(x) pode ser expressa como uma convolução de duas outras funções, g(x) e h(x), com g(x) composta por uma soma de impulsos unitários e h(x), por um pulso triangular ou de ordem superior. A técnica envolve sucessivas diferenciações de f(x) de forma a expressar uma derivada de ordem superior por meio de um trem de impulsos, que será então a função g(x).
Se f(x) for uma função linear em trechos, como na figura ao lado, com f(x) = 0 para |x| > 5, então f(x) será contínua em todo o intervalo [-∞,∞] e, nos pontos onde a abcissa é -5 e 5, a derivada f'(x) será impulsiva. Pode-se escrever:
f"(x) pode, então, ser expressa como um trem de impulsos f"(x) = 2δ2(-5) - δ(-5) + 2δ(-3) - 3δ(0) + 3δ(3) + δ2(5) + δ(5). Se escrevermos h(x) como o trem de impulsos h(x) = f"(x) e g(x) como a função triangular tri(x)
e f(x) = h(x) * g(x).
Se a função a ser expressa for melhor aproximada por meio de arcos de parábola, em lugar de segmentos de reta, pode-se empregar g(x) como o pulso parabólico
As expressão (1) define a convolução em um espaço euclideano bidimensional, com apenas uma variável independente (na convenção usada, x). Pode-se generalizar a definição de forma a contemplar espaços com mais dimensões. A chamada convolução bidimensional é dada pela expressão
e possui propriedades similares às da convolução unidimensional, valendo inclusive o teorema da convolução. As expressões para convolução com mais variáveis independentes é obtida de forma similar.[13]
Novas propriedades, que não se aplicam para a convolução unidimensional, aparecem nos espaços multidimensionais.
Rotação
Se uma das funções gira no espaço de um ângulo θ, o resultado gira da mesma forma. Podemos escrever:
Se
e
então
Deformação
Se uma das funções sofre uma deformação numa direção, o resultado sofre uma deformação similar, mas numa direção perpendicular. Podemos escrever:
Se
e
então
Convolução fracionária
A convolução fracionária é definida pela expressão
onde a é um número real entre 0 e 1. Ela se reduz à convolução usual quando a = 1 e se anula quando a = 0.[13]
Uma definição alternativa usa um ângulo α em lugar da variável linear a
↑Essa restrição de intervalo não constitui nenhuma perda de generalidade, na prática, uma vez que a escolha da origem x=0 é arbitrária.
↑Mais exatamente, nos pontos tk onde g(t) for descontínua, h(t) será o limite de ½ (f(tk - ε) + f(tk + ε)) quando ε → 0.
↑Os valores dos parâmetros a e b dependem de qual convenção for usada para definição da distribuição normal.
Referências
↑ abcdefghijklmnopqBracewell, R. - The Fourier Transform And Its Applications, 3rd. Edition, New York: McGraw-Hill, 2000, Cap. 3, pp. 24-54,ISBN 978-0-1381-4757-0
↑ abcdefOppenheim, Willsky e Young - Signals and Systems, Englewood Cliffs: Prentice Hall, 1983, Cap. 3, pp. 69-159, ISBN 978-0-1380-9731-8