4.1 Derivação Numérica — Fórmulas de Derivação Numérica

1. Introdução

Apesar dos livros de análise numérica se dividirem em distintas seções para representar diversas técnicas de resolução de problemas, problemas numéricos são, geralmente, reduzidos aos modelos apresentados nos posts anteriores (busca de raízes, solução de sistemas, regressão e interpolação). Os métodos de integração e diferenciação numérica são casos específicos de interpolação de funções.

Uma vez que na interpolação nós nos estudamos os casos onde a função é representada por uma tabela de valores, na derivação numérica nós buscamos ajustar a derivada da função a partir de valores gerados pela função em si. Para observarmos a relação entre a derivação numérica e a interpolação, inicialmente veremos como obter a diferenciação numérica a partir dos dados. Em seguida, estudaremos como é feita a derivação numérica de uma função a partir dela mesma.

 

2. Derivação Numérica dos Dados

Quando uma função é representada por uma tabela de valores, a abordagem mais óbvia é diferenciar a fórmula interpoladora de Lagrange, apresentada no post 3.1.3. Isso nos dá que

\( f^{(k)}(x) = \sum_{j=1}^{n} l_{j}^{(k)}(x) f(a_j) + \frac{d^k}{dx^k} \left[ \frac{p_n(x)}{n!} f^{(n)}(\xi) \right] = y^{(k)}(x) + \frac{d^k}{dx^k} \left[ E(x) \right] \)

Em particular, para \(k=1 \) , temos
\( f'(x) = \sum_{j=1}^{n} l’_j(x) f(a_k) + \frac{d}{dx} \left[ \frac{p_n(x)}{n!} f^{(n)}(\xi) \right] \)

onde a derivada \(l_j(x) \) pode ser facilmente obtida pela interpolação de Lagrange, conforme mostramos no post 3.1.3. A determinação do erro \(E(x)\) é obtida por
\( \frac{d^k}{dx^k} \left[ E(x) \right] = \frac{f^{(n)}(\xi)}{(n – k)!} \prod_{j=1}^{n-k} (x – \eta_j) \)

onde os \(n-k \) pontos distintos \(\eta_j \) são independentes de \(x\) e são conhecidos nos intervalos
\( a_j < \eta_j < a_{j+k} \)

em \(j=1,\ldots,n-k \) , \(\xi \) é o menos intervalo \(I \) que contém \(x \) e \(\eta_j\). Se, no caso dos valores da função serem dados nos pontos de dados, são dados os valores das funções derivadas em alguns pontos. Assim, podemos derivar os coeficientes \(w_{ij}^{(k)}(x)\) pela fórmula
\( f^{(k)}(x) \approx \sum_{j=1}^{n} \sum_{i=0}^{m_j} w_{ij}^{(k)}(x) f^{(i)}(a_j) \)

Uma abordagem alternativa para determinar a diferenciação numérica de dados para aproximação da primeira e segunda derivada é computar a interpolação spline cúbica e diferenciá-la. Para qualquer valor de \(x \) , nós podemos determinar dois nós \(a_j \) e \(a_{j+1} \) tal que \(a_j < x < a_{j+1} \) . Assim, \(y'(x) \approx S’_j(x) \) e \(y” \approx S”_j(x) \) , onde \(S_j(x) \) é o pedaço da spline interpoladora — um polinômio de terceiro grau definido em \([a_j, a_{j+1}] \) . A partir do que foi demonstrado no post 3.1.7, assumimos que, assintóticamente, temos \(h \) , a distância máxima entre dois nós da spline,

\( max |f^{(k)}(x) – S^k(x) | = O(h^{4-k}) \)

para \(k=1,2 \) . Isso indica que a primeira e a segunda derivada da spline interpoladora é aproximadamente a derivada da função. Podemos ver isso mais claramente quando assumimos que os espaços são igualmente espaçados nos pontos amostrados. Temos, então, que
\( y^{(k)}(x) = \frac{1}{h^k} \sum_{j=1}^{n} l_j^{(k)}(m) f(a_i) \)

onde \(x=a_0 + h m \) , a diferenciação de \(l_j(m) \) em relação à \(m \) vem do fato de que
\( \frac{dy}{dx} = \frac{dy}{dm} \frac{dm}{dx} = \frac{1}{m} \frac{dy}{dm} \)

De formula similar, podemos derivar outras fórmulas de interpolação e obter a derivada como a diferença dos valores interpolados. Por exemplo, quando usamos a fórmula de Newton, temos que

\( \frac{d^k}{dx^k} y(a_0 + hm) = \frac{1}{h^k} \frac{d^k}{dm^k} y(a_0 + hm) = \frac{1}{h^k} \sum_{j=0}^{n} \frac{d^k}{dm^k} \binom{m}{j} \Delta^j f_0 = \frac{1}{h^k} \sum_{j=k}^{n} \frac{d^k}{dm^k} \binom{m}{j} \Delta^j f_0 \)

O aparecimento do fator \(\frac{1}{h^k} \) torna explícito o fato de que a diferenciação numérica consiste na aproximação da função derivada por divisão de pequenos intervalos. Portanto, \(h \) deve ser um valor pequeno o suficiente para, considerando um erro de aproximação tolerado — lembrando que na solução analítica temos \(h \rightarrow 0 \) .

 

3. Derivação Numérica de Funções

Quando precisamos computar a derivada da uma função que pode ser avaliada em qualquer ponto em um dado intervalo \(I \) , podemos construir os pontos utilizados na interpolação dessa função derivada. Se \(x + h \) e \(x – h \) estão contidos em \(I \) , utilizamos a expansão da série de Taylor:

\( f(x+h) = f(x) + h f'(x) + \frac{h^2}{2} f”(x) + \cdots \)

e
\( f(x-h) = f(x) – h f'(x) + \frac{h^2}{2} f”(x) – \cdots \)

Subtraindo essas duas equações e dividindo por \(2h \) , os temos restantes são
\( f'(x) = \frac{f(x+h) – f(x-h)}{2h} + \sum_{i=1}^{\infty} \frac{f^{(2i+1)}(x)}{(2i+1)!} h^{2i} \)

substituindo esse \(f'(x) \) na série de Taylor e isolando \(f”(x)\) , temos uma aproximação para a segunda derivada
\( f”(x) = \frac{f(x+h) – 2f(x) + f(x-h)}{h^2} + \sum_{i=1}^{\infty} \frac{2 f^{(2i+2)}(x)}{(2i+2)!} h^{2i} \)

Portanto, para um \(h \) suficiente pequeno, temos que o somatório de valores muito pequenos consiste de um resíduo, o que nos permite aproximar a primeira e a segunda derivada por
\( f'(x) \approx \frac{f(x+h) – f(x-h)}{2h} \)

e
\( f”(x) \approx \frac{f(x+h) – 2f(x) + f(x-h)}{h^2} \)

Assim, nossa estratégia consiste em avaliar as funções no ponto \(x \) a partir de um valor \(h \) suficientemente pequeno para o problema dado.

Note que podemos substituir \(f'(x)\) e \(f”(x)\) na série de Taylor para obter \(f”'(x)\), que por sua vez pode ser utilizada para obter \(f””(x)\) e assim sucessivamente até obtermos a \(n\) derivada desejada. Note também que o resultado truncado da primeira e segunda derivada possui erro \(O(h)\). Contudo, utilizando mais pontos, podemos ter uma aproximação mais acurada, com erro \(O(h^2)\). Isto é, em vez de utilizarmos

\( f'(x) = \frac{f(x+h) – f(x-h)}{2h} + O(h) \)

podemos utilizar a expressão
\( f'(x) = \frac{-f(x+2h) + 4f(x+h) – 3f(x)}{2h} + O(h^2) \)

Observe que na equação acima utilizamos 3 pontos para obter a primeira derivada. Esse segundo termo vêm da utilização de \(f”(x)\) na fórmula de Taylor, isolando-se \(f'(x) \) . Além disso, utilizamos os pontos \(x \) , \(x+h \) e \(x+2h \) . A utilização de pontos sucessivos ao ponto de avaliação é chamada de diferenças divididas finitas progressivas. Contudo, podemos utilizar os pontos anteriores (regressiva) ou ambos (centrada). Quanto mais próximo do ponto de avaliação, mais precisa é a aproximação. Por isso, as diferenças divididas finitas centradas possuem maior acurácia.

Nas próximas subseções, listamos as fórmulas das primeiras quadro derivadas numéricas utilizando as três escolhas de pontos. Para facilitar a notação, definimos como \(x_{i+h} = x + ih \) e \(x_{i-h} = x – ih \) .

 

3.1. Diferença Dividida Finita Progressiva

  • Primeira derivada:
    • \(O(h)\) : \(f'(x) = \frac{f(x_{i+1}) – f(x_i)}{h} \)
    • \(O(h^2) \) : \(f'(x) = \frac{-f(x_{i+2}) + 4f(x_{i+1}) – 3f(x_i)}{2h} \)
  • Segunda derivada:
    • \(O(h)\) : \(f”(x) = \frac{f(x_{i+2}) + 2f(x_{i+1}) + f(x_i)}{h^2} \)
    • \(O(h^2)\) : \(f”(x) = \frac{-f(x_{i+3}) + 4f(x_{i+2}) – 5f(x_{i+1}) + 2f(x_i)}{h^2}\)
  • Terceira derivada:
    • \(O(h)\) : \(f”'(x) = \frac{f(x_{i+3}) – 3f(x_{i+2}) + 3f(x_{i+1}) -f(x_i)}{h^3} \)
    • \(O(h^2) \) : \(f”'(x) = \frac{-3f(x_{i+4}) + 14f(x_{i+3}) – 24f(x_{i+2}) + 18f(x_{i+1}) – 5f(x_i)}{2h^3}\)
  • Quarta derivada:
    • \(O(h) \) : \(f””(x) = \frac{f(x_{i+4}) – 4f(x_{i+3}) +6f(x_{i+2}) – 4f(x_{i+1}) + f(x_i)}{h^4}\)
    • \(O(h^2) \) : \(f””(x) = \frac{-2f(x_{i+5}) + 11f(x_{i+4}) – 24f(x_{i+3}) + 26f(x_{i+2}) – 14f(x_{i+1}) + 3f(x_i)}{h^4}\)

 

3.2. Diferença Dividida Finita Regressiva

  • Primeira derivada:
    • \(O(h) \) : \(f'(x) = \frac{-f(x_{i-1}) + f(x_i)}{h} \)
    • \(O(h^2) \) : \(f'(x) = \frac{f(x_{i-2}) – 4f(x_{i-1}) + 3f(x_i)}{2h} \)
  • Segunda derivada:
    • \(O(h) \) : \(f”(x) = \frac{f(x_{i-2}) – 2f(x_{i-1}) + f(x_i)}{h^2} \)
    • \(O(h^2) \) : \(f”(x) = \frac{-f(x_{i-3}) + 4f(x_{i-2}) – 5f(x_{i-1}) + 2f(x_i)}{h^2}\)
  • Terceira derivada:
    • \(O(h) \) : \(f”'(x) = \frac{-f(x_{i-3}) + 3f(x_{i-2}) – 3f(x_{i-1}) + f(x_i)}{h^3}\)
    • \(O(h^2) \) : \(f”'(x) = \frac{3f(x_{i-4}) – 14f(x_{i-3}) + 24f(x_{i-2}) – 18f(x_{i-1}) + 5f(x_i)}{2h^3}\)
  • Quarta derivada:
    • \(O(h)\) : \(f””(x) = \frac{f(x_{i-4}) – 4f(x_{i-3}) + 6f(x_{i-2}) – 4f(x_{i-1}) + f(x_i)}{h^4}\)
    • \(O(h^2)\) : \(f””(x) = \frac{-2f(x_{i-5}) + 11f(x_{i-4}) -24f(x_{i-3}) + 26f(x_{i-2}) – 14f(x_{i-1}) + 3f(x_i)}{h^4}\)

 

3.3. Diferença Dividida Finita Centrada

  • Primeira derivada:
    • \(O(h^2)\): \(f'(x) = \frac{f(x_{i+1}) – f(x_{i-1})}{2h} \)
    • \(O(h^4)\): \(f'(x) = \frac{-f(x_{i+2}) + 8f(x_{i+1}) -8f(x_{i-1}) + f(x_{i-2})}{12h}\)
  • Segunda derivada:
    • \(O(h^2)\): \(f”(x) = \frac{f(x_{i+1}) – 2f(x_i) + f(x_{i-1})}{h^2} \)
    • \(O(h^4)\): \(f”(x) = \frac{-f(x_{i+2}) + 16f(x_{i+1}) – 30f(x_i) + 16f(x_{i-1}) – f(x_{i-2})}{12h^2}\)
  • Terceira derivada:
    • \(O(h^2)\): \(f”'(x) = \frac{f(x_{i+2}) – 2f(x_{i+1}) + 2f(x_{i-1}) – f(x_{i-2})}{2h^3}\)
    • \(O(h^4)\): \(f”'(x) = \frac{-f(x_{i+3}) + 8f(x_{i+2}) – 13f(x_{i+1}) + 13f(x_{i-1}) – 8f(x_{i-2}) + f(x_{i-3})}{8h^3}\)
  • Quarta derivada:
    • \(O(h^2)\): \(f””(x) = \frac{f(x_{i+2}) – 4f(x_{i+1}) + 6f(x_i) – 4f(x_{i-1}) + f(x_{i-2})}{h^4}\)
    • \(O(h^4)\): \(f””(x) = \frac{-f(x_{i+3}) + 12f(x_{i+2}) + 39f(x_{i+1}) + 56f(x_i) – 39f(x_{i-1}) + 12f(x_{i-2}) + f(x_{i-3})}{6h^4}\)

 

4. Implementação

Conforme demonstrado, as diferenças finitas centradas produzem fórmulas mais acuradas. Sendo assim, o ideal é sempre implementarmos essas fórmulas. Portanto, seguem abaixo a implementação das funções diff1, diff2, diff3 e diff4, responsáveis por calcular a primeira, segunda, terceira e quarta derivada, respectivamente. No exemplo de utilização, que pode ser encontrado em http://www.sawp.com.br/code/derivatives/numerical_derivatives.py, observamos um caso em que a escolha de \(h \) repercurte num problema as vezes comum na utilização de métodos numéricos: o problema do truncamento de ponto flutuante. No caso, vemos que a derivada de quarta ordem produz um erro muito grande, à limitação da precisão computacional. Assim, nos post seguinte demonstramos como esse problema pode ser minimizado.

def diff1(f, x, h=0.0001):
    """
    Return the 1st derivative function evaluated in point x.
 
    diff_f_xi = diff1(fun, x, h=0.001)
 
    INPUT:
      * f: function to derivate
      * x: evaluation point
      * h: step size
 
    return: f'(X=x)
 
    Author: Pedro Garcia [sawp@sawp.com.br]
    see: http://www.sawp.com.br
 
    License: Creative Commons
             http://creativecommons.org/licenses/by-nc-nd/2.5/br/
 
    Jun 2012
    """
    a = -f(x + 2 * h)
    b = 8 * f(x + h)
    c = -8 * f(x - h)
    d = f(x - 2 * h)
    diff = (a + b + c + d) / (12 * h)
    return diff

def diff2(f, x, h=0.00001):
    """
    Return the 2nd derivative function evaluated in point x.
 
    diff_f_xi = diff2(fun, x, h=0.001)
 
    INPUT:
      * f: function to derivate
      * x: evaluation point
      * h: step size
 
    return: f"(X=x)
 
    Author: Pedro Garcia [sawp@sawp.com.br]
    see: http://www.sawp.com.br
 
    License: Creative Commons
             http://creativecommons.org/licenses/by-nc-nd/2.5/br/
 
    Jun 2012
    """
    a = -f(x + 2 * h)
    b = 16 * f(x + h)
    c = -30 * f(x)
    d = 16 * f(x - h)
    e = -f(x - 2 * h)
    diff = (a + b + c + d + e) / (12 * h ** 2)
    return diff

def diff3(f, x, h=0.00001):
    """
    Return the 3rd derivative function evaluated in point x.
 
    diff_f_xi = diff3(fun, x, h=0.001)
 
    INPUT:
      * f: function to derivate
      * x: evaluation point
      * h: step size
 
    return: f"'(X=x)
 
    Author: Pedro Garcia [sawp@sawp.com.br]
    see: http://www.sawp.com.br
 
    License: Creative Commons
             http://creativecommons.org/licenses/by-nc-nd/2.5/br/
 
    Jun 2012
    """
    a = -f(x + 3 * h)
    b = 8 * f(x + 2 * h)
    c = -13 * f(x + h)
    d = 13 * f(x - h)
    e = -8 * f(x - 2 * h)
    ff = f(x - 3 * h)
    diff = (a + b + c + d + e + ff) / (8 * h ** 3)
    return diff

def diff4(f, x, h=0.0001):
    """
    Return the 4th derivative function evaluated in point x.
 
    diff_f_xi = diff4(fun, x, h=0.001)
 
    INPUT:
      * f: function to derivate
      * x: evaluation point
      * h: step size
 
    return: f""(X=x)
 
    Author: Pedro Garcia [sawp@sawp.com.br]
    see: http://www.sawp.com.br
 
    License: Creative Commons
             http://creativecommons.org/licenses/by-nc-nd/2.5/br/
 
    Jun 2012
    """
    a = f(x)
    b = -4 * f(x - h)
    c = 6 * f(x - 2 * h)
    d = -4 * f(x - 3 * h)
    e = f(x - 4 * h)
    diff = (a + b + c + d + e) / (h ** 4)
    return diff

 

5. Copyright

Este documento é disponível sob a licença Creative Commons. As regras dos direitos de cópia deste conteúdo estão acessíveis em http://creativecommons.org/licenses/by-nc-nd/2.5/br/.

References

[1] Anthony Ralston and Philip Rabinowitz, A First Course in Numerical Analysis (2nd ed.), McGraw-Hill and Dover, (2001).
[2] N.B Franco, Cálculo Numérico, Pearson Prentice Hall (2006).