UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO …sistemabu.udesc.br/pergamumweb/vinculos/000019/0000197c.pdf · parcial para a obtenção do grau de Licenciatura em Matemática

UNIVERSIDADE DO ESTADO DE SANTA CATARINA

CENTRO DE CIÊNCIAS TECNOLÓGICAS - CCT

CURSO DE LICENCIATURA EM MATEMÁTICA

GEOVANE AUGUSTO HAVEROTH

AS VÁRIAS FACES DA DERIVADA

JOINVILLE - SC

2013-06-17

GEOVANE AUGUSTO HAVEROTH

AS VÁRIAS FACES DA DERIVADA

Trabalho de Graduação apresentado ao Cursode Licenciatura em Matemática do Centrode Ciências Tecnológicas, da Universidadedo Estado de Santa Catarina, como requisitoparcial para a obtenção do grau de Licenciaturaem Matemática.

Orientador: Prof. Dr. Rogério de AguiarCo-Orientadora: Prof. Dra. Elisandra Bar deFigueiredo

JOINVILLE - SC

2013

H387a

Haveroth, Geovane AugustoAs Várias Faces da Derivada / Geovane Augusto Haveroth.

- 2013.108 p.: il

Bibliogra�a: f. 105Trabalho de Conclusão de Curso (Graduação) - Universi-

dade do Estado de Santa Catarina, Centro de Ciências Tec-nológicas, Curso de Licenciatura em Matemática. Joinville,2013.

Orientador: Rogério de AguiarCo-orientadora: Elisandra Bar de Figueiredo

1. História da Tangente. 2. Derivada. 3. Diferencial. 4.Derivada em Espaços Normados.I. Aguiar, Rogério. II. Figueiredo, Elisandra. III. Universi-dade do Estado de Santa Catarina - Curso de Licenciaturaem Matemática. IV. As Várias Faces da Derivada.

CDD: 515.33

Aos que me apoiaram.

AGRADECIMENTOS

Agradeço a minha mãe, dona Erna e irmãos, Adari, Adorli e Edelci por terem me

aguentado durante vários e vários anos, principalmente àquela que me concebeu e tornou

isso possível.

Agradeço os professores por nos conduzir durante esta etapa da graduação, em

especial aos professores Elisandra e Rogério.

Agradeço minha garota Thais, por me fazer esquecer dos problemas que a vida e

que a matemática proporciona.

E a Deus, por proporcionar condições para que eu adquirisse as competências ne-

cessárias para ultrapassar esta etapa da vida.

A Matemática apresenta invenções tão sutisque poderão servir não só para satisfazer oscuriosos como, também para auxiliar as artes epoupar trabalho aos homens.

René Descartes

RESUMO

HAVEROTH, Geovane Augusto. As várias faces da derivada. 2013. 107 p.. Trabalhode Conclusão de Curso (Graduação em Licenciatura em Matemática) - Universidade doEstado de Santa Catarina, Joinville, 2013.

Por meio de um estudo histórico tendo como ponto de partida Euclides da Grécia antiga,destacamos de modo sistemático os principais responsáveis pela evolução dos métodosutilizados na obtenção das tangentes às curvas. Antes do século XVII, tais métodoseram complexos e demandavam muito esforço, mas com o amadurecimento do conceito delimite, Newton e Leibniz desenvolveram de maneira totalmente independente o que conhe-cemos hoje por cálculo diferencial. Iniciaremos com métodos geométricos para obtençãodas tangentes e apresentaremos sua relação com a derivada de funções de uma variávelreal, expondo as notações, os principais resultados e algumas aplicações utilizando osdiferenciais. Em seguida apresentamos o cálculo diferencial de várias variáveis, cuja moti-vação é determinar os planos tangentes às imagens das funções num determinado ponto,permitindo-nos o acesso a um novo conjunto de ferramentas para o tratamento destasfunções. Para �nalizar, introduziremos as derivadas em espaços normados de�nindo aderivada de Fréchet e a de Gâteaux.

Palavras-chave: História da tangente, Derivada, Diferencial, Derivada em espaços nor-mados.

ABSTRACT

HAVEROTH, Geovane Augusto. The many faces of the derivative. 2013. 107 p..Work of Course Conclusion (Graduate Degree in Mathematics) - Santa Catarina StateUniversity, 2013.

Through a historical study having as starting point Euclid in ancient Greece, we highlightin a sistematic way the main responsible for the evolution the methods used to obtainthe tangents to the curves. Before the seventeenth century, such methods were complexand required a lot of e�ort, but with the maturation of the concept of limit, Newton andLeibniz developed in a way entirely independent what we know today by di�erential calcu-lus. We begin with geometric methods to obtain the tangents and we present its relationwith the derivative of functions of real variable, showing the notations, the main resultsand some applications using di�erentials. Then we introduce the di�erential calculus ofseveral variables, whose motivation is to determine the tangent planes to the images ofthe functions at a certain point, allowing us access to a new set of tools for handling thesefunctions. Finally, we introduce the derivatives in normed spaces by setting the derivativeof Fréchet and Gâteaux.

Key-words: History of the tangent, Derivative, Di�erential, Derivative in normed spaces.

LISTA DE ILUSTRAÇÕES

1.1 Espiral de Arquimedes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.2 Comparação entre ângulos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3 Tangente à curva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.4 Obra de Descartes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.5 Primeiro método de Descartes. . . . . . . . . . . . . . . . . . . . . . . . . . . 191.6 Primeiro método de Descartes na curva y =

√2x + 3. . . . . . . . . . . . . . . 20

1.7 Terceiro método de Descartes. . . . . . . . . . . . . . . . . . . . . . . . . . . 211.8 Subtangente a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.9 Tangente à parábola. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.10 Folium de Descartes para a = 1. . . . . . . . . . . . . . . . . . . . . . . . . . 261.11 Curva para o método geral de Fermat . . . . . . . . . . . . . . . . . . . . . . 271.12 Máximos e Mínimos na determinação das tangentes. . . . . . . . . . . . . . . . 281.13 Método de Newton. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.1 Tangente ao círculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.2 Método dinâmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.3 Aproximação linear. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.4 Função modular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.5 Tangente vertical. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.6 Ponto cuspidal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.7 Função quadrática. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492.8 Função descontínua. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.9 Função cúbica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522.10 Pontos de máximos e mínimos. . . . . . . . . . . . . . . . . . . . . . . . . . . 522.11 Representação do Teorema de Rolle. . . . . . . . . . . . . . . . . . . . . . . . 542.12 Contrução do teorema do valor médio. . . . . . . . . . . . . . . . . . . . . . . 552.13 A diferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.1 Aproximação linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.2 Representação geométrica da hélice. . . . . . . . . . . . . . . . . . . . . . . . 633.3 Vetor derivada em R3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.4 Aproximação por uma aplicação linear em R3. . . . . . . . . . . . . . . . . . . 703.5 Translação paralela do subespaço V . . . . . . . . . . . . . . . . . . . . . . . . 713.6 Plano tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.7 Derivada direcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.8 Aproximação pelo diferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . 783.9 Grá�co de f(x, y). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 803.10 Representação grá�ca do conjunto aberto. . . . . . . . . . . . . . . . . . . . . 86

SUMÁRIO

INTRODUÇÃO 12

1 TANGENTES NO PRÉ-CÁLCULO 141.1 EUCLIDES, ARQUIMEDES E APOLÔNIO . . . . . . . . . . . . . . . . . 141.2 DESCARTES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.2.1 Métodos de Descartes . . . . . . . . . . . . . . . . . . . . . . . . . . 191.3 FERMAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.4 CONTEMPORÂNEOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281.5 BARROW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291.6 NEWTON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.6.1 Fluente e Fluxão . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.7 LEIBNIZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2 DERIVADA EM R 372.1 DA TANGENTE À DERIVADA EM R . . . . . . . . . . . . . . . . . . . . 372.2 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.3 A DIFERENCIAL EM R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3 CÁLCULO DIFERENCIAL DE VÁRIAS VARIÁVEIS 613.1 CURVAS EM Rm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623.2 DERIVADAS DIRECIONAIS E O DIFERENCIAL . . . . . . . . . . . . . 703.3 REGRA DA CADEIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4 INTRODUÇÃO À DERIVADA EM ESPAÇOS NORMADOS 944.1 CONCEITOS INICIAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.2 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3 EXEMPLOS DA DERIVADA DE FRÉCHET . . . . . . . . . . . . . . . . 99

CONCLUSÃO 103

REFERÊNCIAS 105

APÊNDICE 107APÊNDICE A - De�nições e Teoremas Necessários . . . . . . . . . . . . . . . . 107

INTRODUÇÃO

O cálculo diferencial é uma das ferramentas mais aplicáveis no ramo da matemática

e foi por esta razão que nos dedicamos a este trabalho, cujo objetivo é apontar os principais

responsáveis pelo desenvolvimento da derivada partindo dos problemas em de�nir retas

tangentes às curvas e tendo como ponto de chegada as derivadas em espaços normados.

Começaremos realizando um estudo histórico sobre os principais colaboradores

para o surgimento do cálculo diferencial, tendo como ponto de partida a obtenção de

retas tangentes na Grécia antiga com Euclides, Arquimedes e Apolônio. Na obra intitu-

lada Os elementos de Euclides (300 A.C), o geômetra de Alexandria já havia de�nido a

tangente à circunferência como sendo a reta que toca o círculo de modo que não o corta

ao ser prolongada. A utilização das retas tangentes nessa etapa do desenvolvimento se

restringia à construção da quadratura (Cálculo de áreas) de círculos. Por muitos sécu-

los a construção da tangente �cou estacionada, ressurgindo com os franceses Descartes e

Fermat. Já no século XVII dois eminentes matemáticos, Newton e Leibniz de uma forma

quase simultânea e independente, descobrem um método geral para a resolução de pro-

blemas associados ao problema da tangente a uma dada curva, hoje conhecido por cálculo

diferencial.

No segundo capítulo apresentaremos as mais diversas notações e operações utili-

zadas para as derivadas, alguns resultados relevantes ao conteúdo, como o Teorema de

Rolle e o Teorema do Valor Médio e a diferencial, utilizada para estimar valores. Resumi-

damente, a ideia do cálculo diferencial baseia-se em aproximar funções não lineares pelas

lineares. No cálculo de apenas uma variável este conceito �ca bem claro. Segundo Tho-

mas (2009), se interpretarmos a razão incremental como o coe�ciente angular da secante,

então a derivada nos dará o coe�ciente angular da reta tangente à curva no ponto.

O capítulo seguinte tratará das derivadas de funções de várias variáveis, cuja mo-

tivação não se dá mais no problema de de�nir reta tangente, mas sim em determinar o

plano tangente à imagem da função em um determinado ponto. Desta forma, teremos um

novo arsenal de ferramentas para o tratamento dessas funções, como derivadas direcionais,

derivadas parciais, matriz derivada etc. Finalizaremos este terceiro capítulo apresentando

exemplos práticos que abrangem a maioria do conteúdo trabalhado.

O quarto e último capítulo fará uma breve introdução aos conceitos de derivada

em espaços normados, tendo como ponto central a de�nição de Fréchet e a de Gâteaux.

12

Para um melhor entendimento desses conceitos, serão apresentados alguns exemplos e

�nalizaremos com uma interessante aplicação da derivada de Fréchet para a solução de

um problema de mínimos quadrados.

13

Capítulo 1

TANGENTES NO PRÉ-CÁLCULO

1.1 EUCLIDES, ARQUIMEDES E APOLÔNIO

Euclides1 teve seus pensamentos �orescidos em Alexandria. Sua principal obra

intitula-se Os Elementos e nele incorpora-se todo conhecimento matemático acumulado

em seu tempo, com exceção das cônicas e da geometria esférica. O geômetra de Alexandria

apresentou este material de uma forma sistemática num conjunto de treze livros.

Carvalho (1919), comenta que a circunferência é a única curva mencionada em

Os Elementos logo no terceiro livro, sendo objeto de estudo de diversos matemáticos

das escolas anteriores, portanto, antes mesmo de Euclides, já havia a necessidade de

considerar suas tangentes. A De�nição de Tangente ao Círculo expressa em Euclides

(2009), apresenta-se a seguir:

De�nição 1.1.1 Uma reta que, tocando o círculo e, sendo prolongada, não o corta, é

dita ser tangente ao círculo.

De acordo com Encyclopedia (2008), Bryson2, citado na Epístola XIII de Platão,

pode ter sido um aluno de Sócrates, na Grécia antiga. O mesmo fez contribuições no que

se refere à quadratura do círculo, porém, não conseguiria traçar o polígono circunscrito

ao círculo sem a noção de tangente à circunferência. Temos portanto, um antecessor de

Euclides que já explorava tangentes.

A teoria das seções cônicas não é encontrada nos Elementos, porém Pappus3, tra-

tando das cônicas de Apolônio4, atribuiu a Euclides, um tratado sobre Seções Cônicas

em quatro livros que teriam formado o fundamento dos quatro primeiros livros da obra

de Apolônio que continham teoremas sobre eixos, diâmetros, tangentes e assíntotas. De

1Euclides de Alexandria. Em grego antigo E′νκλειδηζ. 300 A.C. Em Os Elementos grande parte dosteoremas é demonstrada por Reductio ad absurdum ou Redução ao absurdo, que Euclides introduziu nasciências exatas.

2Bryson de Heraclea. 450 A.C.3Pappus de Alexandria. 300 A.C.4Apolônio de Perga. Em latim, Apollonius. 225 A.C.

14

acordo com Carvalho (1919), Arquimedes5, em suas obras, as supõe conhecidas por Apolô-

nio, no entanto, o tratado de Euclides não sobreviveu, perdendo-se com o passar dos anos.

Tratando-se de determinações in�nitesimais, Eudoxo6 promoveu uma grande con-

tribuição com seu trabalho de quadratura usando seu método, cujos matemáticos do século

XVII denominaram de método da exaustão7. O trabalho de Eudoxo também se baseou

em antigas ideias de aproximação da área do círculo por polígonos inscritos com número

crescente de lados, promovido por Atífon8.

Se quisermos demonstrar que uma quantidade de A é igual a outra quan-

tidade de B, tomamos uma terceira C de modo que a diferença A − Cpossa diminuir tanto nós quisermos, isto é, que se possa esgotar (Charles,

l.c) o que dá o nome do método. Devemos considerar primeiro C > Ae depois C < A. Se depois da comparação de C com B resultar um

absurdo, �cará provado, como pretendíamos, que A é igual a B. (CAR-

VALHO, 1919, p.3).

Euclides, utilizando-se desta técnica, demonstrou que as áreas dos círculos estão

entre si como os quadrados dos seus diâmetros.

Arquimedes é considerado por muitos historiadores, como um dos maiores mate-

máticos de todos os tempos, pois foi quem melhor proveito tirou do método da exaustão,

sendo que, a custas de demonstrações por exaustão que o geômetra calculou áreas de

superfícies e volumes de muitos corpos e também determinou a tangente à espiral.

No livro Tratado das Espirais, que de acordo com Carvalho (1919), é composto

de 28 proposições, Arquimedes estuda a curva que chamamos de espiral de Arquimedes

ilustrada na Figura 1.1. Neste tratado não consta nenhuma de�nição de tangente, o

que mostra que Arquimedes estendeu à espiral a De�nição 1.1.1 que Euclides dera para

circunferência e demonstra na Proposição 13 de seu tratado que a tangente à curva a toca

unicamente num ponto.

Figura 1.1: Espiral de Arquimedes.

Fonte: Produção do próprio autor.

5Arquimedes de Siracusa. Em latim, Archimedes. 225 A.C.6Eudoxo de Cnido (Atual Turquia). Em latim Eudoxus. 370 A.C.7Método da exaustão: consiste no método que determina a área de uma �gura inserindo uma sequência

de polígonos dentro dela, cuja soma das áreas converge para área desejada.8Atífon de Atenas. Em latim Antiphon. 430 A.C.

15

Conforme Carvalho (1919), as Proposições 16 e 17 do tratado de Arquimedes

referem-se a grandeza dos ângulos que a tangente num ponto faz com o raio vetor deste

ponto, mostrando que são diferentes e portanto um será agudo e outro obtuso. Vamos

exempli�car esta situação no Exemplo 1.1.2.

Exemplo 1.1.2 Seja a Espiral de Arquimedes dada por r(θ) = 1 + θ, com θ ∈ [0, 2π].

Com o auxílio do software Geogebra9 construímos uma reta tangente qualquer e

seu respectivo raio vetor, o resultado segue na Figura 1.2 ilustrando as Proposições acima

citadas.

Figura 1.2: Comparação entre ângulos.

Fonte: Produção do próprio autor

Percebe-se que, de fato, temos os ângulos diferentes, isto é, um ângulo obtuso e

um agudo.

Logo após termos discutido sobre Euclides e Arquimedes vamos nos ater a Apolô-

nio, conhecido como �O grande geômetra� (GARBI, 2010, p. 99) por conta de seu traba-

lho com seções cônicas. Este trabalho é composto de oito livros, contendo mais de 480

proposições, rigorosamente demonstradas, sobre a elipse, a hipérbole e a parábola como

também, diversas propriedades relativas a centros, diâmetros, tangentes etc. Algumas

destas demonstrações foram obtidas por meio de construções geométricas. Os quatro pri-

meiros livros foram, conforme dito anteriormente, atribuídos a Euclides e são encontrados

em grego. Já o quinto, sexto e sétimo, de acordo com Carvalho (1919), são conhecidos

talvez de traduções árabes e o oitavo reconstituído mediante referências de Pappus de

Alexandria.

Vamos explorar, através de construção geométrica e com o auxílio de Carvalho

(1919), uma destas proposições do trabalho do geômetra de Perga. No que diz respeito

à tangentes, Apolônio começa a demonstrar (Livro I, proposição 17) que a paralela AC

às ordenadas respectivas, tiradas pelo extremo A de um diâmetro, é tangente à curva,

pois se não fosse, cortaria em um ponto B e a reta AB devia ser dividida ao meio pelo

9Geogebra: aplicativo de matemática dinâmica que combina conceitos de geometria e álgebra.

16

diâmetro, o que é absurdo. A Figura 1.3 abaixo representa o que foi dito, sendo que a

curva, neste caso, é uma cirfunferência.

Figura 1.3: Tangente à curva.


Durante muito tempo não houve mais contribuições signi�cativas neste ramo da

matemática, porém no século XVII renasce este problema antigo de obtenções de tangentes

como veremos nas seções a seguir.

1.2 DESCARTES

Descartes10, um dos gigantes na arte da Matemática, nasceu em La Haye, Touraine

e foi �um dos homens mais in�uentes na revolução matemática� (SMITH, 1923, p.371,

tradução nossa). De acordo com Garbi (2010), desde muito cedo Descartes procurou o

conhecimento e aos oito anos foi enviado ao colégio jesuíta de La Flèche, permanecendo até

seus dezesseis anos de idade. Foi nesta escola que Descartes conheceu e se tornou amigo

de Mersenne11. Ao deixar o colégio, Descartes dirigiu-se à Paris para dar continuidade

aos seus estudos. Reencontrando-se com Mersenne, interessou-se pela Geometria e teve

contato com os maiores matemáticos da época. Apesar da matemática ser sua paixão,

Descartes graduou-se em leis.

O Rumo de sua vida mudou bruscamente em 1617, quando integrou-se ao exército

holandês, permanecendo até 1621, quando se deu conta através de um �sonho traumático

(...) da inutilidade daquilo que vinha fazendo� (GARBI, 2010, p. 188). Mersenne,

nesta época havia virado um grande escritor ciêntí�co e correspondia-se com os maiores

matemáticos da Europa.

Ao mudar para a Holanda, Descartes encontrou tranquilidade para botar no papel

as ideias que brotaram em sua mente anos antes. Nos quatro primeiros anos dedicou-se ao

10René Descartes. 1596-1650.11Marin Mersenne. 1588-1648. O padre Mersenne teve grande in�uência no desenvolvimento da

Matemática do século XVII, pois lutou bravamente contra o isolamento dos matemáticos da época,incentivando-os a explorarem suas ideias.

17

estudo da Filoso�a e posteriormente Biologia, Física e Cosmologia. Logo após, Descartes

elaborou um método para estudo da ciência, lógica e racional. Concebeu, então, um

método e o expôs em seu trabalho �Discours de la Méthode pour bien conduire la Raison

e chercher la Vérité dans les Sciences� (Figura 1.4). Esta obra contêm três apêndices,

são eles: Les Météores(Meteoros), La Dioptrique (Dióptrica) que estuda a refração da luz

e o último La Géométrie (Geometria), �um pequeno livro de mão de apenas uma centena

de páginas�(SMITH, 1923, p. 375, tradução nossa) mostrou que a geometria poderia ser

estudada por meio da Álgebra. La Géométrie (Geometria), foi sua única obra matemática

publicada e de acordo com Garbi (2010), o imortalizou e valeu-lhe a reputação de criador

da Geometria Analítica. Garbi (2010) a�rma que, o que Descartes fez nesta obra foi

mostrar que a Álgebra já havia evoluido de tal forma que poderia ser utilizada como

ferramenta para o estudo da Geometria.

Figura 1.4: Obra de Descartes.

Fonte: Consciência.

Garbi (2010), também a�rma que em sua obra intitulada Geometria publicada em

1637, Descartes não escondeu que seu trabalho era de difícil compreensão e enviou uma

carta à Mersenne dizendo:

Nada omiti, a não ser propositadamente. Previ que certas pessoas, que

se vangloriam se tudo saber, certamente não deixariam de a�rmar que eu

nada teria escrito além daquilo que já lhes era de antemão conhecido, se

para elas eu me houvesse tornado su�cientemente compreensível(GARBI,

2010, p.192).

Através de uma edição para torná-lo mais digerível, foi que Newton tomou conhe-

cimento de tal obra, nela foram apresentadas três formas de obtenção de tangentes às

curvas. Vamos descrever e explorar a primeira e a terceira forma, apresentando exemplos

destas. Não apresentaremos o segundo método por ter um processo muito semelhante ao

terceiro.

18

1.2.1 Métodos de Descartes

O método para determinar a tangente, de acordo com Pires (2004), recorre a uma

curva auxiliar conhecida, como, por exemplo, a circunferência. Esta curva auxiliar deve

interceptar a curva original em dois pontos distintos, sendo um deles o ponto onde deve-se

determinar a tangente. O segundo ponto deve fazer-se coincidir com o primeiro. Assim,

a curva auxiliar passa a ser tangente à curva no ponto (raiz dupla da equação). O centro

da circunferência e o ponto de tangência de�nem a normal à curva, facilitando a obtenção

da reta tangente.

Primeiro Método

Vamos obter a tangente pelo primeiro método de Descartes.

Seja f(x, y) = 0 uma curva e M um ponto qualquer sobre esta curva. Pretende-

mos traçar uma tangente a esta curva no ponto M . Consideremos uma curva auxiliar

conhecida, no caso a circunferência de centro N e raio NM que corta a curva no ponto

M1 conforme indicado na Figura 1.5, onde AP = x, PM = y, MN = s, AN = v.

Figura 1.5: Primeiro método de Descartes.


Este método de acordo com Pires (2004) consiste basicamente em encontrar a posi-

ção de N quando o segmentoMN é normal a curva f(x, y) = 0 no pontoM . Se a posição

de N for aproximada, então a circunferência (curva auxiliar) com mesmo centro cortará

num outro ponto M1, próximo a M , que Descartes obriga a coincidir com M usando um

processo posteriormente denominado por método dos coe�cientes indeterminados.

De acordo com a Figura 1.5, a equação da circunferência deslocada (curva auxiliar)

é equacionada por:

s2 = y2 + (x− v)2 (1.2.1)

reescrevendo tem-se,

y =√s2 − v2 + 2vx− x2

19

A curva, portanto assume, no ponto M(x, y) a seguinte forma,

f(x,√s2 − v2 + 2vx− x2) = 0 (1.2.2)

O método de Descartes consiste em forçar a equação a ter uma raíz de multiplicidade dois

para obter um único ponto de interseção que garantirá a reta normal emM . Vamos a um

exemplo prático.

Exemplo 1.2.2 Determine a reta normal à curva y =√

2x+ 3 quando a abscissa for

x = 3.

Para satisfazer a condição de Descartes, a curva auxiliar será tangente à curva

f(x, y) = 0 em apenas um ponto. O conhecimento da curva auxiliar nesta posição nos

permite determinar a reta normal ao ponto M .

A função y =√

2x+ 3 pode ser escrita da seguinte forma,

y2 − 2x− 3 = 0.

Figura 1.6: Primeiro método de Descartes na curva y =√

2x + 3.


Utilizando-se da curva auxiliar, Equação (1.2.1), e com s e v sendo MN e AN

respectivamente, conforme Figura 1.6. Escrevemos,

−s2 + (x− v)2 + 2x+ 3 = 0.

Descartes impõe a existência de uma raiz dupla a, logo

−s2 + (x− v)2 + 2x+ 3 = (x− a)2

x2 + x(−2v + 2) − s2 + v2 + 3 = x2 − 2xa+ a2

20

então pela igualdade de polinômios,

{2v − 2 = 2a

s2 − v2 − 3 = −a2

v = a+ 1

s =√

−a2 + (a+ 1)2 + 3

Atribuindo a = 3 como o ponto de abscissa onde queremos determinar a reta normal,

obtemos v = 4 e s =√

10. Então, tem-se os pontos M = (3, 3) e N = (4, 0) cuja reta

normal é y = −3x+12. Com as ferramentas atuais podemos veri�car facilmente a solução.

Derivando a função e aplicando no ponto correspondente x = 3 obtemos:

y′(x) =1√

2x+ 3

y′(3) =1

3. Sabemos que este valor é o coe�ciente da reta tangente, então para a normal

obtemos a mesma solução que pelo método de Descartes.

Veja também a obtenção da tangente à conchoide de Nicomedes por este mesmo

método na obra de Carvalho (1919, p.21-22).

Terceiro Método

O terceiro método é um processo formalmente idêntico ao segundo método que não

foi apresentado neste trabalho. A reta secante é traçada usando como referência o ponto

de tangência. Para determinar a reta tangente basta coincidir o segundo ponto com o

primeiro. Consideremos a Figura 1.7 abaixo.

Figura 1.7: Terceiro método de Descartes.


De acordo com Pires (2004), neste processo é dada a abscissa do ponto de contato

N e a tangente será a posição da secante TNN1 quando N1 se coincidir com N pela curva.

21

De�nimos AI = x, NI = y, TI = a, II1 = e, N1I1 = h e f(x, y) = 0 uma curva qualquer.

Por semelhança de triângulos temos:

a

a+ e=y

h

então,

h = y(1 +

e

a

).

Este método de Descartes �cará mais claro por meio de um exemplo.

Exemplo 1.2.3 Dada a curva y3 = mx , queremos localizar a tangente num ponto P de

coordenadas (x, y).

Fazendo f(x+ e, y

(1 +

e

a

))= 0 e aplicando o método:

y3(1 +

e

a

)3

−m(x+ e) = 0

y3

(1 +

3e

a+

3e2

a2+e3

a3

)−mx−me = 0

podemos desprezar as potências de e de grau ≥ 2 pois trata-se de valores muito pequenos

e uma vez que y3 = mx e e são quantidades diferentes de zero, resulta:

3y3

a= m ⇔ a =

3y3

m⇔ a = 3x

Tanto Descartes quanto Fermat, utilizam a subtangente a como meio para se obter

a reta tangente. A subtangente é a projeção sobre o eixo das coordenadas, do segmento

de reta compreendido entre a interseção da reta tangente com o eixo e o ponto de contato

com a curva, pontos estes que determinam a reta tangente (Figura 1.8).

Figura 1.8: Subtangente a.


22

Conforme Carvalho (1919), estes métodos só poderiam ser utilizados no seu tempo

para curvas cujas equações sejam redutíveis à forma inteira, caso contrário seria impos-

sível aplicar o método dos coe�cientes indeterminados que �Descartes descreve como um

processo válido para a determinação de quantidades desconhecidas que satisfazem certas

condições� (PIRES, 2004, p.41), nem efetuar o desenvolvimento de

f(x+ e, y

(1 +

e

a

))= 0.

1.3 FERMAT

Durante a mesma época de Descartes outro grande Francês conhecido como Fer-

mat12, o Príncipe dos Amadores , �dedicou seu excepcional talento ao estudo amadorístico

da Matemática, e nela deixou sua marca de gênio� (GARBI, 2010, p.194). Sem qualquer

estudo formal nas ciências exatas, mas com grande talento, ele foi uma peça fundamental

na evolução da Matemática do século XVII.

Segundo Garbi (2010), Fermat nasceu em Beaumont de Lomagne e foi educado

a dar maior relevância a Literatura, Latim e Grego. Assim como fez Descartes, Fermat

graduou-se em leis e com isso exerceu as funções de magistrado no parlamento da cidade

de Toulouse, onde obtinha um bom rendimento e tomava pouco de seu tempo. O tempo

livre foi dedicado ao estudo da Matemática por simples satisfação, os feitos que obtinha

eram comunicados por correspondências com os maiores matemáticos da época: Marin

Mersenne, René Descartes, John Wallis, Roberval13, Blaise Pascal e Christian Huygens.

Fermat dominava o Grego antigo e através de Papus, teve conhecimento do tra-

tado de lugares geométricos planos, de Apolônio, que estava parcialmente perdido. Fermat

dispôs-se a reconstruí-lo e enquanto o fazia descobriu como associar equações indetermi-

nadas a linhas geométricas, ou seja, a ideia principal da Geometria Analítica.

Os gregos já haviam de�nido tangente (De�nição 1.1.1), �embora válida para cir-

funferência e elipse é inaceitável no caso geral�(GARBI, 2010, p.197) e Fermat resolveu

pesquisar este antigo problema com suas técnicas analíticas.

Em uma correspondência à Mersenne, Pierre Fermat relata dois problemas envol-

vendo máximos para os quais obtivera a solução. Questionado sobre o processo utilizado,

Fermat divulga seu método de obtenção de máximos e mínimos como também sua aplica-

ção na determinação da tangente às curvas. Tal método foi alvo de críticas pelos amigos

de Mersenne, entre eles destaca-se Descartes, que conforme a seção anterior, apresentava

outro método de obtenção de tangentes às curvas aproximando dois pontos sobre esta.

Vejamos a seguir o método de Fermat para determinar os máximos e mínimos de

uma função dada.

12Pierre de Fermat. 1601-1665.13Gilles Personne de Roberval 1602-1675. Matemático e físico que se correspondia com Mersenne.

23

Para determinar os máximos e mínimos de uma função, Fermat considerava que

se, para um valor da variável x a expressão f(x) é um valor máximo/mínimo para valores

próximo de x, ou seja, x + e ou x − e, a variação de f(x) é relativamente menor que e,

sendo este um valor pequeno. Portanto, se igualarmos14 as expressões f(x) e f(x + e)

eliminaremos os termos comuns, como também as potências de e igual ou superior a 2,

em seguida dividiremos por e, sendo e = 0, obtemos então o valor ou os valores de x onde

a expressão f(x) é máxima ou mínima.

Segundo uma carta a ROBERVAL de 22 de setembro de 1636, este mé-

todo havia sido descoberto sete anos antes, mas só em Janeiro de 1638

é que, por intermédio de MERSENNE que recebera de CARCAVY nos

�ns de 1637 (Bulletin Sciences Math.,1918 ), ele viera às mãos de DES-

CARTES (CARVALHO, 1919, p.28).

De acordo com Carvalho (1919), Fermat não demonstrou a regra anterior, pois

devia ser fundamentada num teorema de Kepler. �Este método foi baseado numa ideia

de Kepler, inserta na sua obra intitulada Nova steriometria doloriom vinariorum, em

1615.�(PIRES, 2004, p.22).

Aplicaremos o método utilizando o exemplo apresentado no trabalho de Pires

(2004), cujo enunciado segue abaixo.

Exemplo 1.3.1 Determinar as dimensões do retângulo de perímetro 2a que apresenta

área máxima.

Aplicando o método de Fermat à expressão que traduz a área do retângulo que

devemos maximizar.

f(x) = x(a− x)

Obtemos a igualdade

x(a− x) = (x+ e)(a− x− e)

2ex = ea− e2

Logo a resultante é:

x =a

2.

O primeiro método das tangentes de Fermat baseia-se na regra acima descrita.

Sejam (x, y) as coordenadas do ponto B da parábola x = y2 e (x − e, y1) as do ponto

B1 na proximidade de B (Figura 1.9). Considere o problema de determinar a tangente à

parábola no ponto B, de acordo com Carvalho (1919) temos:

14Na realidade Fermat não iguala a princípio as duas expressões. Compara-as por adégalité o que querdizer que só considera o sinal igual quando faz tender e para zero.

24

Figura 1.9: Tangente à parábola.

Fonte: CARVALHO (1919, p.29), editado pelo autor.

Observe que

y12 = (x− e)

y12y2 = (x− e)y2

y12x = (x− e)y2

y12

x− e=

y2

x

Assim,

y2

y12

=x

x− e

como OI > y1 então

y2

OI2 <

x

x− e. (1.3.1)

Mas, por semelhança de triângulos

y

OI=CE

IE

tomando CE = a

y

OI=CE

IE=

a

a− e

Substituindo em (1.3.1) virá

a2

(a− e)2 <x

x− e

a2(x− e) < x(a2 − 2ae+ e2)

a2x− a2e < a2x− 2xae+ e2x

25

e aplicando a regra, temos por adégalité

a = 2x,

que determina a subtangente.

Fermat a�rma que seu método pode ser aplicado a qualquer curva e que nunca

falha. Ainda de acordo com o mesmo autor, Fermat começa a exposição do seu método

a�rmando que ele é uma consequência da sua teoria de máximos e mínimos, porém não

nos deixa claro quais são os máximos e mínimos que devemos procurar.

Descartes errou ao pensar que a distância de E ao ponto de tangência era o máximo

das distâncias de E aos pontos da curva, com isso tentou provar que a regra de Fermat

não era verídica. Além disso, Descartes também não conseguira, por meio deste método,

determinar as tangentes à elipse e a hipérbole, pois as via como parábolas.

Sentindo as dores de Fermat, Roberval juntamente com Pascal15 mostraram à Des-

cartes que ele deveria aplicar a regra de Fermat utilizando as propriedades especí�cas de

cada curva e a�rmaram que Fermat tratou o problema com tangentes independentemente

dos máximos e mínimos. Em uma carta de Descartes à Mersenne, esta opinião foi du-

ramente criticada. Para explicar a eliminação dos termos que tivessem e como fator,

descobriu o segundo e o terceiro método das tangentes, apresentado na seção anterior.

Fermat determinou, através de um manuscrito, a tangente à elipse pelo mesmo método,

utilizando-se das propriedades desta curva expressa pela equação y2 = qx(2a−x). O mé-

todo a que nos referimos exige que a curva tenha equação da forma y = f(x) e Descartes,

para mostrar que o método não era tão geral como Fermat supunha, em 18 de janeiro de

1638 propôs a construção das tangentes ao folium16.

Figura 1.10: Folium de Descartes para a = 1.

Fonte: Produção do próprio Autor.

Conforme Carvalho (1919), em uma carta datada de 20 de julho de 1638 entregue

15Blaise Pascal. 1623-1662.16Folium de Descartes é uma curva de�nida pela equação x3 + y3 − 3ayx = 0 para a > 0 cuja assíntota

é x + y + a = 0 (Figura 1.10)

26

por Mersenne à Descartes, Fermat apresentou a solução deste problema por outro método

geral, que em uma linguagem mais moderna se resume da seguinte forma:

Considere a Figura 1.11 abaixo,

Figura 1.11: Curva para o método geral de Fermat


Seja CA uma curva dada cuja equação é f(x, y) = 0 e (x, y) as coordenadas de um

dos seus pontos A.

Por um ponto E da tangente, que supomos já construída, tiremos a reta EF

paralela a BA e seja BF = e, BD = a.

Como o pontoE não pertence à curva, por triângulos semelhantes, EF = y

(a− e

a

)

será diferente de FI, mas, se �zermos tender e para zero, o ponto F no limite confunde-se

com o ponto B e devemos ter

f(x− e, y

(1 − e

a

))= 0. (1.3.2)

Carvalho (1919) a�rma que Fermat chega a uma equação análoga a obtida por

Descartes e por um caminho idêntico, ele chega à equação tratando o problema por meios

in�nitamente pequenos, substituindo os elementos da curva pelos segmentos correspon-

dentes da tangente.

Este trabalho foi alvo de críticas por Descartes, pois considerava este muito di-

ferente do primeiro e não envolvia a investigação de máximos e mínimos de qualquer

quantidade. Supunha também que Fermat só encontrou este método depois de ter co-

nhecimento de suas descobertas. Há indícios que Fermat nunca vira a descoberta de

Descartes, portanto descobrira seu método independentemente das invenções de Descar-

tes. �Fermat utilizou este método para a parábola, para a cissoide, para à conchoide dos

antigos, para a cicloide e para o folium(...).�(CARVALHO, 1919, p.34).

O leitor poderá encontrar exemplos da determinação da tangente ao folium, à

cicloide, à quadratriz e à oval de Fermat em Carvalho (1919, p.34-38).

Numa carta dirigida por Fermat a Descartes em julho de 1638, apresenta-se uma

nova maneira de aplicar seu método de máximos e mínimos à determinação das tangentes.

27

Não devemos, diz Fermat, procurar o máximo da distância AB, pois que

isso conduzir-nos-ia a um valor in�nito, mas devemos buscar um ponto

O, de modo que a distância AO seja mínima, porque a perpendicular

à reta AO assim determinada é a tangente em A como é fácil demons-

trar.(CARVALHO, 1919, p.41).

De acordo com a citação acima, vamos buscar o ponto O de forma que a distância

AB seja mínima. Para tal, utilizaremos a Figura 1.12 como auxílio.

Suponhamos que a perpendicular a AO não seja tangente em A, e considere AE a

tangente. Baixemos de O a perpendicular OE que encontra a curva no ponto D.

Como a curva deve estar toda para o lado da tangente OD < OE e como OE é

perpendicular a AB por construção, também temos que OE < OA, portanto OD < OA,

temos portanto uma contradição.

Figura 1.12: Máximos e Mínimos na determinação das tangentes.


Fermat se contenta com esta demonstração, porém, mais tarde, Barrow mostrou

que a distância OA pode ser até um máximo.

Observa-se nos métodos de Fermat uma certa �habilidade� em trabalhar com quan-

tidades in�nitesimais e realizar aproximações. Grandiosas conquistas para a matemática,

que serviram de inspiração às conquistas de Newton e Leibiniz. Além das tangentes, Fer-

mat interessou-se também por quadraturas (cálculo de áreas), comprimento de curvas e

centros de gravidade. Pires(2004), descreve Fermat como um dos matemáticos que mais

se aproximou da descoberta do cálculo in�nitesimal antes de Newton.

1.4 CONTEMPORÂNEOS

Outros grandes matemáticos também deram suas contribuições, entre eles podemos

citar Roberval, Torricelli e Pascal. Roberval intermediou os feitos de Fermat e Descar-

tes e foi o primeiro que generalizou o método de obtenção de tangente, �e considerou a

28

tangente como a direção, em cada ponto, do movimento resultante.�(CARVALHO, 1919,

p.51). Torricelli teve sua participação ao reinventar o método fundado na composição

das velocidades, Carvalho (1919), comenta ainda que, Torricelli foi discípulo de Galileu

Galilei e Blaise Pascal acabou tornando-se o porta-voz de Fermat.

1.5 BARROW

Os trabalhos de Descartes, Fermat e Roberval passaram para a Inglaterra, onde

matemáticos importantes, em posse desses trabalhos, deram grandes contribuições no

avanço do cálculo in�nitesimal. Entre esses matemáticos destaca-se Barrow, que na época

lecionava geometria na Universidade de Cambridge e foi professor de Newton. Como

Roberval, Barrow �imagina as linhas descritas por pontos animados de vários movimentos,

considerando, quase sempre, aqueles que hoje se exprimem pelas leis�(CARVALHO, 1919,

p.61), leis descritas como

x = ϕ(t), y = at,

podendo assim, representar as coordenadas a partir do tempo t.

Barrow descreve a tangente a uma curva como reta que toca a curva sem cortá-la

e tem seus pontos no exterior a curva, exceto o ponto de contato.

1.6 NEWTON

Issac Newton nasceu em 1642, em tempos de rebelião, numa pequena vila, na

costa da Inglaterra e de acordo com Smith (1923), era uma criança pequena e frágil.

Aos 12 anos foi matriculado no colégio de Grantham e em sua própria declaração a�rma

ter sido extremamente desatento aos seus estudos, classi�cando-se entre os piores alunos

da escola. Mais tarde começou a desenvolver capacidades intelectuais consideráveis, em

1660 foi colocado no colégio Trinity College em Cambridge, onde fora aluno de Isaac

Barrow e a quem sucedeu como professor aos 27 anos. Em 1664 estudou séries in�nitas

mostrando que a regra para expandir (a+ b)n era válida para todos os valores de n.

No ano seguinte começou a trabalhar em cálculo diferencial que denominou, na época,

como a teoria de �uxões, utilizando-se desta teoria para determinar a tangente e o raio

de curvatura em qualquer ponto de uma curva. Posteriormente trabalhou em diversas

teorias. Começou a investigar a teoria da gravidade aplicando o método das �uxões para

estudar as equações que exprimiam fenômenos físicos. Em seu trabalho intitulado Optics

(1704), de acordo com Pires (2004), são publicados alguns trabalhos, dispersos, referente

a �uxões e quadratura de curvas como também o uso das séries in�nitas no tratamento

desses problemas.

Tornou-se diretor da casa da moeda britânica e foi eleito presidente da Royal

29

Society17, lugar que ocupou até seu falecimento. �Em 1713, foi nomeado Cavaleiro18

pela rainha Ana, tornando-se assim, detentor do título honorí�co de Sir Isaac Newton.�

(PIRES, 2004, p.45).

De acordo com Smith (1923), Newton sempre hesitou em publicar suas descobertas,

como no caso da sua principal obra intitulada Newton's Principia : the mathematical

principles of natural philosophy, que teve início em 1685, porém, publicada somente em

1687, sob pressão de seu amigo astrônomo Halley19.

Em sua vida, Newton continuou o estudo que Galileu havia dado início sobre

a origem e a natureza dos movimentos. �A ideia física de curva devida a Galileu e a

decomposição da velocidade em duas componentes, de natureza algo difusa, defendida

por Roberval são percebidas por Newton.�(PIRES, 2004, p.44).

Sir Isaac Newton morreu em março de 1727, com 85 anos e foi enterrado na Abadia

de Westminster, com honras de estado.

Pires (2004), a�rma que em anexo ao seu trabalho entitulado Óptics (1704), foram

publicados alguns trabalhos, dispersos, referentes a �uxões e a quadratura de curvas

como também o uso das séries in�nitas no tratamento destes problemas. Os manuscritos

Methodus Di�erencialis e De Analysi per Equaciones Numero Terminorum, publicados

sete anos depois, são dois resumos sobre o tratamento e aplicação de séries ao cálculo

diferencial que, anos antes, já teria comunicado a Barrow, Collins20 e a Leibniz em 1676,

por intermédio de cartas. Estes trabalhos realizados por Newton em 1666, estão na origem

da descoberta do cálculo diferencial como veremos a seguir.

1.6.1 Fluente e Fluxão

De acordo com Carvalho (2007), as ideias de Newton baseavam-se na geração

de curvas por movimentos, acabando por denominar o espaço percorrido de �uente e a

velocidade ou celeridades do móvel de �uxão, que de acordo com Pires (2004), apresentava

uma ideia cinemática de curva, o mesmo acontecendo para superfícies e sólidos. Estas

ideias citadas acima constituiram a base para o que Newton denominou de Method of

Fluxions.21

Para descrever a natureza das curvas Newton utilizou qualquer movimento local

como fosse movimento acelerado ou retardado.17Royal Society ou The Royal Society of London for the Improvement of Natural Knowledge é uma

instituição destinada à promoção do conhecimento cientí�co, fundada em 28 de novembro de 1660.18Cavaleiro: título concedido como homenagem ou recompensa por serviços prestados, conferida geral-

mente pelo monarca.19Edmund Halley. 1646-1719. Matemático e astrônomo britânico conhecido por ser o descobridor do

cometa Halley em 1696.20John Collins. 1624-1683. Matemático de Oxford, teve um papel junto aos ingleses muito semelhante

ao de Mersenne com matemáticos continentais.21Method of Fluxions foi o último trabalho de Newton, apenas publicado em 1736, o conteúdo foi

percebido mais tarde quando o conceito de limite �cou claramente de�nido.

30

Newton associou uma curva à trajetória possível de um móvel através de

relações matemáticas entre variáveis (os �uentes) que pudessem sofrer pe-

quenas variações de velocidades ou celeridades (as �uxões)(...).(PIRES,

2004, pg. 52).

Vejamos as notações que, de acordo com Pires (2004), foram as mais utilizadas.a, b, c, ... Constantes.

x, y, z, ... Variáveis (�uentes).

p ou x Velocidade associada a x (�uxão).

q ou y Velocidade associada a y (�uxão).

o Quantidade muito pequena, geralmente associada ao tempo.

p.o ou x.o(q.o ou y.o) Momento de �uxão x(y), ou seja, acréscimo da variável x(y).

Vamos descrever o método utilizando a Figura 1.13 exposta no trabalho de Pires

(2004).

Figura 1.13: Método de Newton.

Fonte: PIRES (2004, p.48), editado pelo autor.

Seja ACK uma curva qualquer. Consideremos V T como sendo a tangente a curva

no ponto C com abscissa B, V B como sendo a subtangente, c como o ponto sobre a curva

correspondente a C depois de sujeitado a �uxão xo, Cc é a corda que une os dois pontos

e BC e bc são paralelos, assim como CE e AB.

Analisando a secante à curva no ponto C e num ponto próximo deste, pretendemos

veri�car as condições em que podemos localizar a tangente à curva no ponto C.

Se deslocarmos de BC para bc iremos provocar um aumento Bb (�uxão xo) na

abscissa AB (�uente), um aumento Ec (�uxão yo) na ordenada BC (�uente), como

também um acréscimo Cc (�uxão so) na curva AC.

Veri�camos que ∆CET é semelhante a ∆V BC e com isso,

BC

V B=ET

CE.

31

Esta constante de proporcionalidade foi denominada por Newton de Prime Ra-

tio of Nascents Arguments (Primeira razão dos primeiros argumentos). Para pequenos

acréscimos de x podemos considerar ∆CET semelhante a ∆CEc.

Seguindo o raciocínio de Pires (2004), temos que se traçarmos Cc e �zermos bc

tender para BC, o ponto c irá se aproximar de C. A secante Cc vai coincidir com a

tangente e o ∆CEc vai de aproximar do ∆CET . Com esta argumentação, podemos

concluir então queEc

CE=yo

xo. (1.6.1)

A igualdade da Equação (1.6.1) é classi�cada por Newton de Ultimate Ratio of

evanescents parts e que na posição limite, é igual aET

CEchamada de Prime Ratio of

nascents arguments.

De acordo com Carvalho (2007), Newton encontrou uma relação entre as quanti-

dades in�nitamente pequenas de �uentes com as suas respectivas �uxões. Ele percebeu

que os �uentes x, y, z, ... poderiam ser expressos respectivamente por x.o, y.o, z.o, ..., mos-

trando que estas estão relacionadas com as suas �uxões x, y, z, .... Estes momentos de

�uxão x.o, y.o, z.o, ... das quantidades �uentes x, y, z, ..., são seus incrementos in�nita-

mente pequenos e para um intervalo in�nitamente pequeno, teremos x + xo e y + yo,

atualmente entendidos por x+ ∆x e y + ∆y.

Basicamente, o método de Newton consiste em provocar um acréscimo nas �uentes

em um determinado intervalo de tempo o. Substituí-lo na equação e desprezar todos os

termos cujas potências de o são maiores ou iguais a 2, então subtrair a equação principal e

em seguida dividir a resultante por o. Notamos aqui um procedimento similar ao utilizado

por Fermat.

Abaixo segue um exemplo prático explorado no trabalho de Carvalho (2007).

Exemplo 1.6.2 Seja a curva de equação x3 − ax2 + axy− y3 = 0 em um intervalo curto

de tempo, determine a relação entre as �uxões.

Podemos substituir x por x+ xo e y por y + yo, onde teremos:

(x+ xo)3 − a(x+ xo)2 + a(x+ xo)(y + yo) − (y + yo)3 = 0

expandindo e subtraindo-o pela equação inicial dada, teremos:

3x2xo+ 3xx2o2 + x3o3 + 2axxo− ax2o2 − axyo+ ayxo+ axyo2 − 3y2yo− 3yy2o2 = 0.

Dividimos tudo pelo tempo in�nitamente pequeno o,

3x2x+ 3xx2o+ x3o2 + 2axx− ax2o− axy + ayx+ axyo− 3y2y − 3yy2o = 0

32

os fatores que contém o são insigni�cantes e portanto podemos desprezá-los, restando

apenas:

3x2x+ 2axx− axy + ayx− 3y2y = 0 (1.6.2)

Na matemática contemporânea temos a seguinte notação para a Equação (1.6.2),

que é resultado da derivação implícita:

3x2dx

dt+ 2ax

dx

dt− ax

dy

dt+ ay

dx

dt− 3y2dy

dt= 0. (1.6.3)

Caso o leitor tenha interesse poderá veri�car um exemplo em que Pires (2004, p.50)

utiliza um sistema de equações para dar continuidade ao método.

(...) Newton, para diferenciar (ou integrar) expressões desconhecidas,

usava variáveis auxiliares das quais conhecia as respectivas �uxões. A

manipulação algébrica permitia-lhe obter a respectiva �uxão ou �uente

e consequentemente obter resultados que uma vez tabelados e organiza-

dos podiam sugerir uma lei de formação que se revelaria profunda na

generalização de resultados.(PIRES, 2004, p. 53).

Pires (2004), ainda a�rma que Newton utizando-se de �uxões conhecidas e de uma

notação mais leve, apresentou exemplos de um método, hoje conhecido, como método da

substituição do cálculo diferencial e integral.

Utilizando-se de diferenciais, expôs o método, hoje conhecido, por Newton-Raphson,

cujo processo permite uma aproximação, tanto quanto se queira, das raízes de uma equa-

ção. Também utilizou o método das �uxões para o cálculo do declive da tangente a uma

curva C num ponto dado.

Vamos explorar este problema da tangente com um exemplo prático.

Exemplo 1.6.3 Considere uma curva C representada pela equação y = 2x23 . Determine

a reta tangente a esta curva em x = 1 utilizando o método das �uxões.

Queremos determinar a tangente à curva no ponto (1, 2), para tal vamos reescrever

esta equação como y3 − 8x2 = 0. Precisamos agora, atribuir acréscimos às variáveis x e

y, para isto, vamos considerar:

x = x+ xo

y = y + yo

Substituindo estes acréscimos na curva y3 − 8x2 = 0 obtemos,

(y + yo)3 − 8(x+ xo)2 = 0.

33

Expandindo e subtraindo a equação original, como também desprezando os temos que

contenham o com grau maior ou igual a 2, teremos:

y2yo+ 2y2yo− 16xxo = 0

dividindo ambos os lados por o,

3y2y = 16xx.

Logo a expressão que representa o declive num ponto genérico da curva é dada por:

y

x=

16x

3y2=

4

3√x. (1.6.4)

Assim, se x = 1, o declive da tangente no ponto (1, 2) é4

3e a reta tangente é dada por

f(x) =4x+ 2

3.

O estudo do declive de curvas permitiu que Newton determinasse pontos impor-

tantes desta. De acordo com Pires (2004), em 1665, Newton refere-se a esses pontos como

sendo aqueles no qual a variação da respectiva �uxão é nula, isto é, onde a tangente é

horizontal. Esses pontos são muito importantes, pois, ao estudar a vizinhança podemos

determinar os máximos e mínimos de uma dada curva, bastando igualar a respectiva

�uxão a zero.

Após se aprofundar nos estudos de Descartes, Newton aplicou a álgebra aos es-

tudos de geometria, utilizou-se também das suas técnicas para diversas aplicações, como

o cálculo da curvatura. Conforme Carvalho (2007), realizou ainda, demonstrações de

como calcular a quadratura de regiões sob curvas utilizando uma série in�nita de termos

(problema inverso à tangente), a qual não abordaremos neste trabalho.

1.7 LEIBNIZ

Gottfried Wilhelm von Leibniz nasceu na Alemanha em 1646. De acordo com

Smith (1923), Leibniz demonstrou muita facilidade com a matemática e antes dos 20

anos já havia lido os mais importantes tratados. Foi o único matemático puro, de ponta,

produzido na Alemanha durante o século XVII. Obteve o grau de Bacharel em leis na

Universidade de Leipzig, aos 21 anos alcançou o título de doutor pela Universidade Al-

torf, seguiu com a carreira diplomática e por intermédio de suas viajens, a serviço do

estado alemão, tomou conhecimento dos matemáticos renomados da Holanda, França e

Inglaterra.

Em 1673, de acordo com Pires (2004), a política o levou a Londres, onde candidatou-

se a membro da Royal Society e apresentando uma máquina de calcular ainda incompleta,

obtivera êxito apesar de críticas. Neste mesmo ano, Smith (1925) a�rma que, provavel-

34

mente Leibniz se reuniu com estudiosos que estavam cientes das descobertas de Newton,

inclusive Barrow, com quem ele mantivera correspondências, �Ele parece ter começado a

pensar sobre o assunto em 1673, alguns anos depois que Newton havia explicado o cálculo

�uxional a seus alunos.� (SMITH, 1923, p. 417).

Devido a morte do último de seus protetores, o arcebispo Eleitor de Mainz, Pires

(2004), a�rma ainda que, Leibniz regressou a Paris, onde começou o período em que

mais se aprofundou em seus conhecimentos matemáticos. �Através de Huygens, teve

conhecimento de alguns estudos de Pascal, Fabri, James Gregory, Grégoire de S. Vincent,

Descartes e Sluze, fundamentais para o desenvolvimento do seu trabalho.�(PIRES, 2004,

p.76).

Neste período Leibniz trabalhou, de acordo com Smith (1925), nos problemas de

tangentes e quadraturas, desenvolvendo uma notação que era original e ao mesmo tempo

era, geralmente, mais adequada do que a de Newton. Pires (2004) comenta que tal notação

viria a ser universalmente aceita e também sua principal marca no ramo da matemática.

Leibniz, de acordo com Pires (2004), trocou correspondência com Newton por

intermédio de seu secretário Oldenburg da Royal Society, e por este, �cou sabendo de que

Newton e Gregory estavam em posse de um método para o tratamento de diferenciais. Tais

correspondências começaram a �car defasadas ao longo do tempo por desentendimentos

sobre a prioridade da descoberta do cálculo.

Não há mais dúvidas de que Leibniz desenvolveu seu cálculo de forma

totalmente independente, e que ele e Newton têm direito a crédito por

suas respectivas descobertas. As duas linhas de abordagem foram ra-

dicalmente diferentes, embora as respectivas teorias conseguiram resul-

tados que eram praticamente idênticos.(SMITH, 1923, p.418, tradução

nossa).

Smith (1923) ainda a�rma que Leibniz podia ter sabido o que Newton estava

fazendo e com isso manteve essa linha de trabalho, também sabia das contribuições feitas

por Barrow, na forma do �triângulo diferencial�, contudo ele foi muito original nas suas

realizações. Pires (2004) a�rma que Leibniz encontrou o �triângulo diferencial� utilizado

por Barrow no estudo da obra de Pascal Traité des sinus du quart de cercle.

Ao longo da história vimos que muitos matemáticos se preocuparam em de�nir

tangentes e em como determiná-las, pois elas podem conter diversos signi�cados, algumas

estão descritas na citação abaixo.

Em óptica, a tangente determinava o ângulo no qual o raio de luz pene-

traria numa lente curva. Em mecânica, a tangente determinava a direção

do movimento de um corpo em qualquer ponto ao longo de seu percurso.

Em geometria, as tangentes a duas curvas num ponto de interseção de-

terminavam o ângulo em que as curvas se cortavam(...). (THOMAS,

2009, p. 132).

35

No capítulo seguinte, iremos realizar uma síntese entre o embasamento histórico

referente a obtenção de tangentes e a sua conexão com o cálculo diferencial. Então,

poderemos nos aprofundar neste conceito amparado por diversos Teoremas que iremos

expor neste trabalho. A partir daqui, nossa abordagem para o cálculo diferencial será a

abordagem moderna, seguindo a linha de pensamentos de Edwards (1973).

36

Capítulo 2

DERIVADA EM R

No capítulo anterior vimos que desde a antiguidade vários matemáticos trabalha-

ram no problema de de�nir retas tangentes às curvas para os mais variados �ns e para

determiná-la demandava muito esforço. Com o passar do tempo, diversos matemáticos se

empenharam em determinar métodos mais gerais e e�cazes abrangendo uma maior gama

de curvas, de fato, é natural pensar que procuravam o aperfeiçoamento dos métodos e

na obtenção das tangentes não foi diferente. Começaremos este capítulo de�nindo reta

tangente, explorando-a tanto na construção quanto nas suas particularidades, para então

relacioná-la com a derivada. Nosso objetivo neste capítulo é apresentar as mais diversas

notações utilizadas, alguns resultados e algumas aplicações das derivadas de funções de

uma variável real da forma f : R → R.

2.1 DA TANGENTE À DERIVADA EM R

Para círculos, Euclides já havia de�nido tangente em sua obra Os Elementos con-

forme De�nição 1.1.1 exposta no capítulo anterior. De acordo com Thomas (2009), a

tangente ao círculo é apresentada pela De�nição 2.1.1, ilustrada pela Figura 2.1.

De�nição 2.1.1 Uma reta L será tangente a um círculo em um ponto P se L passar por

P perpendicularmente ao raio em P .

Figura 2.1: Tangente ao círculo.


37

O mesmo autor a�rma que a de�nição anterior não serve para curvas mais gerais.

Então, para de�nirmos tangência para o caso geral, vamos utilizar o que ele descreve

como método dinâmico, tal método considera o comportamento das secantes que cortam

a curva C em P e pontos próximos Q. A Figura 2.2 expõe a ideia do método que estamos

nos referindo.

Figura 2.2: Método dinâmico.

Fonte: (THOMAS, 2009, p.130), editado pelo autor.

O método dinâmico citado anteriormente segue as três etapas seguintes:

1. Calcula-se o coe�ciente angular da reta formada por PQ;

2. Investiga-se o limite do coe�ciente angular de PQ quando Q tende a P ao longo de

C;

3. Se o limite existir, o tomamos como o coe�ciente angular da reta tangente no ponto

P em C.

Seguindo o trabalho de Thomas (2009), usaremos o mesmo processo acima para

determinar a tangente à curva y = f(x) num ponto P = (a, f(a)). Queremos calcular o

coe�ciente angular da secante PQ, sendo Q = (a+ h, f(a+ h)) (Figura 2.3). Veri�camos

o limite formado pela secante quando h tende a 0, se o limite existir o tomaremos como

coe�ciente angular da reta tangente. Através deste raciocínio, as de�nições de coe�ciente

angular e da tangente à curva �cam claras e bem de�nidas, conforme veremos a seguir.

38

Figura 2.3: Aproximação linear.


De�nição 2.1.2 O coe�ciente angular da reta tangente à curva y = f(x) num ponto

P = (a, f(a)) é o número m dado por

m = limh→0

f(a+ h) − f(a)

h

desde que este limite exista.

De�nição 2.1.3 A reta tangente à curva y = f(x) no ponto P = (a, f(a)) é a reta que

passa por este ponto e tem o coe�ciente angular m descrito na De�nição 2.1.2.

Para realizar a síntese da conexão entre a reta tangente e a derivada será necessário

de�nir este objeto em questão. De acordo com Netto (1977), para determinar a derivada

devemos considerar uma curva y = f(x) e um ponto a em que a função seja contínua,

de modo que a diferença f(a + h) − f(a) tem limite zero quando h tende a 0. A relação

entre o acréscimo da função e o acréscimo da variável, denomina-se relação incremental

de f(x) no ponto a e é dada por:

f(a+ h) − f(a)

h. (2.1.1)

Uma vez que já dispomos da relação incremental podemos de�nir a derivada de

funções de uma variável real no ponto a.

De�nição 2.1.4 A função f(x) é derivável no ponto a se existir e for �nito o limite da

relação incremental (2.1.1) quando h → 0 e se representa por f ′(a). Assim, por de�nição:

f ′(a) = limh→0

f(a+ h) − f(a)

h(2.1.2)

supondo a existência de tal limite.

39

De forma equivalente a De�nição 2.1.4, alguns autores utilizam

f ′(a) = limx→a

f(x) − f(a)

x− a= lim

∆x→0

f(a+ ∆x) − f(a)

∆x.

Quando a relação incremental vista anteriormente tem por limite ±∞ denotada

por f ′(a) = ±∞, dizemos que a derivada não existe neste ponto.

O conceito de derivada foi instituido, em �ns do século XVII, por LEIBI-

NIZ e por NEWTON, devendo-se ao primeiro o uso da palavra derivada.

LEIBNIZ partiu do problema geométrico das tangentes e NEWTON de

uma noção cinemática, denominando a derivada de �uxão e a função de

�uente.(NETTO, 1977, P.109).

Segundo Thomas (2009), se interpretarmos a razão incremental como um coe�ci-

ente angular da secante, então a derivada nos dará o coe�ciente angular da tangente à

curva no ponto a. Edwards (1973), a�rma que a ideia principal do cálculo diferencial é

aproximar funções não lineares pelas lineares e esta está bem clara no cálculo diferencial

de apenas uma variável. Se a função f(x) é diferenciável no ponto a, então a reta tangente

em P = (a, f(a)) é dada pela equação:

y = f(a) + f ′(a)(x− a),

isto é, podemos escrever a reta tangente em termos da derivada no ponto a, linearizando

a função naquele ponto conforme o autor a�rmou.

Conforme mencionado de De�nição 2.1.4, f ′(a) corresponde ao coe�ciente angular

da reta tangente à curva naquele ponto, mas no entanto esse não é o único signi�cado. A

derivada também é utilizada para obter a taxa de variação instantânea de uma função.

Podemos interpretar a relação incremental (Equação (2.1.1)), conforme Thomas (2009),

como sendo a taxa de variação média da função f(x) no intervalo [a, a + h], cujo limite

quando h → 0 será considerado a taxa com que a função f(x) varia em a. Com esta

argumentação de�nimos taxa de variação instantânea da seguinte forma:

De�nição 2.1.5 A taxa de variação instantânea da função f(x) em a é a derivada:

f ′(a) = limh→0

f(a+ h) − f(a)

h


Segundo Thomas (2009), vamos supor que o movimento de um corpo possa ser

descrito por uma função s = f(t), sendo s o deslocamento em função do tempo t. Assim,

∆s = f(t + ∆t) − f(t) será o deslocamento do corpo no intervalo [t, t + ∆t] e a sua

40

velocidade média será a relação incremental∆s

∆t. Se �zermos ∆t tender a zero iremos

obter a velocidade instantânea do corpo no instante t.

De�nição 2.1.6 A velocidade instantânea é a derivada da posição em relação ao tempo.

Se a posição de um corpo no instante t é s = f(t), então sua velocidade no instante t é

v(t) = lim∆→0

f(t+ ∆t) − f(t)

∆t


Se derivarmos a velocidade em função do tempo iremos obter a aceleração ins-

tantânea no ponto, podemos adiantar que a aceleração é a segunda derivada da função

deslocamento em relação ao tempo. A derivada poderá signi�car as mais variadas taxas

instantâneas, dependendo do contexto no qual se trabalha.

Até o momento vimos a derivada aplicada num ponto, queremos agora generalizar

este conceito e de�nir uma função derivada. Considerando o limite em cada um dos pontos

do domínio da função, segundo Thomas (2009), a de�nição seguinte nos dá esta função

derivada.

De�nição 2.1.7 A derivada de uma função f(x) em relação à variável x é a função

f ′(x) cujo valor é

f ′(x) = limh→0

f(x+ h) − f(x)

h

desde que o limite exista.

Segundo o mesmo autor, f(x) é dita derivável caso a função f ′(x) exista para

todos os pontos x do domínio, se a função apresentar diferenciabilidade no ponto x, então

diremos que f(x) é derivável em x.

Antes de continuarmos expondo as de�nições referentes à derivada, será de grande

importância apresentarmos suas notações. Thomas (2009) relata que há diversas formas

de representação das derivadas de funções y = f(x) em que x é a variável independente e

y a dependente. Veja a seguir algumas das variações mais comuns na notação de derivada:

lim∆x→0

∆y

∆x= f ′(x) = y′ =

dy

dx=df

dx=

d

dxf(x) = D(f)(x) = Dxf(x).

Os caracteresd

dxe D chamam-se operadores de derivação e designam a operação

de derivação. Para indicarmos o valor de uma derivada em um número especí�co x = a

utiliza-se uma das seguintes notações:

f ′(a) =dy

dx

∣∣∣∣x=a

=df

dx

∣∣∣∣x=a

=d

dxf(x)

∣∣∣∣x=a

41

A notação f ′(x) para a derivada de f(x) é devida a José Luís LA-

GRANGE (1736-1813). Representa-se, ainda, a derivada de y = f(x)

por uma das notações seguintes:dy

dxatribuída a LEIBNIZ, Dxf(x) a

CAUCHY e Df(x) a L.F.A. ARBOGAST (1759-1803). A notação y,proposta por NEWTON, �cou em desuso durante muito tempo; atual-

mente está sendo utilizada em Mecânica. (NETTO, 1977, p.109).

Após termos visto as variações na notação de derivada, vamos dar continuidade às

de�nições. A próxima de�nição que veremos trabalha com a derivabilidade de f(x) em

um intervalo.

De�nição 2.1.8 Uma função y = f(x) será derivável num intervalo I aberto, �nito ou

in�nito, se a função conter uma derivada em cada ponto do intervalo. A função y = f(x)

será derivável num intervalo fechado [a, b] se for derivável no interior (a, b) e se existirem

os limites abaixo nas extremidades.

f ′+(a) = lim

h→o+

f(a+ h) − f(a)

h(2.1.3)

f ′−(b) = lim

h→o−

f(b+ h) − f(b)

h

f ′+(a) é chamada de derivada à direita em a e f ′

−(b) de derivada à esquerda em b.

De acordo com as propriedades de limite, �uma função terá uma derivada em um

ponto se, e somente se, tiver derivadas à direita e à esquerda nesse ponto e se essas

derivadas laterais forem iguais.� (THOMAS, 2009, p.150).

Veri�caremos a derivabilidade de uma função através de um dos exemplos discuti-

dos em Thomas (2009).

Exemplo 2.1.9 Mostre que a função f(x) = |x| não contém derivada no ponto x = 0.

Figura 2.4: Função modular.


42

Vamos aplicar as derivadas laterais em x = 0.

Derivada à direita de x = 0:

f ′+(0) = lim

h→0+

|0 + h| − |0|h

= limh→0+

|h|h

= limh→0+

h

h= 1

e derivada à esquerda de x = 0:

f ′−(0) = lim

h→0−

|0 + h| − |0|h

= limh→0−

|h|h

= limh→0−

−hh

= −1.

Temos que f ′+(0) = f ′

−(0) e portanto não há derivada em x = 0.

Explorando a derivabilidade das funções, percebemos que ela está intimamente

ligada ao que Thomas (2009), descreve como suavidade do grá�co da f(x). Se a função

apresentar um bico, como, por exemplo, a função modular (Figura 2.4), conclui-se que

não há derivada em P , pois as derivadas laterais são distintas, também quando a relação

incremental, vista anteriormente, tem por limite ±∞ no ponto, implicando na verticali-

dade da reta tangente (Figura 2.5), ou no que chamamos de Ponto cuspidal (Figura 2.6),

quando o coe�ciente angular de PQ tende a +∞ de um lado e −∞ do outro e por último,

como veremos a seguir no Teorema 2.1.10, quando houver descontinuidade.

Figura 2.5: Tangente vertical.

Fonte: (THOMAS,2009, p.151), editado

pelo autor.

Figura 2.6: Ponto cuspidal.

Fonte: (THOMAS, 2009, p.151), editado

pelo autor.

O Teorema a seguir faz uma conexão entre derivabilidade e continuidade.

Teorema 2.1.10 Se f tem uma derivada em x = a, então f é contínua em x = a.

Demonstração: Por hipótese sabemos que f ′(a) existe, isto é

f ′(a) = limh→0

f(a+ h) − f(a)

h.

43

Queremos mostrar que limx→a

f(x) = f(a). Chamamos h = x− a com h → 0 e mostraremos

que limh→0

f(a+ h) = f(a). Seja h = 0, então

f(a+ h) = f(a+ h) + f(a) − f(a)

= f(a) +f(a+ h) − f(a)

h.h

Aplicando o limite em ambos os lados para h → 0.

limh→0

f(a+ h) = limh→0

f(a) + limh→0

f(a+ h) − f(a)

h. limh→0

h

= f(a) + f ′(a).0

= f(a)

Portanto, limh→0

f(a+ h) = f(a).

A recíproca deste teorema é falsa, um contra-exemplo é a função modular (Figura

2.4) vista no Exemplo 2.1.9, neste caso a função é contínua, porém não é derivável no

ponto x = 0.

Para continuarmos expondo os teoremas será necessário uma série de regras que nos

servirão de base para realizarmos as operações mais diversas com as funções derivadas.

A seguir, descreveremos um conjunto de regras descritas nas obras de Netto (1910) e

Thomas (2009).

i Derivada de constante. Se uma função f(x) = c é constante num intervalo, então

f ′(x) = 0.

Demonstração: Seja f(x) = c com c ∈ R, temos que f(x+ h) = c e portanto:

f ′(x) = limh→0

f(x+ h) − f(x)

h= lim

h→0

c− c

h= 0.

A função constante f(x) = c é representada por uma reta paralela ao eixo das

abscissas, logo o coe�ciente angular da reta é igual a zero.

ii Produto por uma constante. Se f(x) é uma função derivável e c ∈ R uma

constante, então

[cf(x)]′ = cf ′(x).

Demonstração: Aplicamos a de�nição para a função h(x) = cf(x), sabemos que

44

h(x+ h) = cf(x+ h) bastando substituir

[cf(x)]′ = limh→0

cf(x+ h) − cf(x)

h

= c limh→0

f(x+ h) − f(x)

h= cf ′(x).

Esta regra nos mostra que quando uma função derivável é multiplicada por uma

constante c, então a derivada dessa função também é multiplicada por c.

iii Derivada da soma e da subtração. Se f(x) e g(x) são funções deriváveis, então

(f(x) ± g(x))′ = f ′(x) ± g′(x).

isto é, a soma e a subtração são deriváveis em qualquer ponto onde ambas sejam

deriváveis.

Demonstração: Vamos mostrar a igualdade acima para a soma, analogamente

segue para a subtração. Aplicando a de�nição de derivada para h(x) = f(x)+ g(x),

temos que:

(f(x) + g(x))′ = limh→0

[f(x+ h) + g(x+ h)] − [f(x) + g(x)]

h

= limh→0

[f(x+ h) − f(x)

h+g(x+ h) − g(x)

h

]

= limh→0

f(x+ h) − f(x)

h+ lim

h→0

g(x+ h) − g(x)

h= f ′(x) + g′(x).

Esta regra nos ajuda nos mais diversos cálculos de derivação, já que há diversas

funções que contém somas, como por exemplo, os polinômios.

iv Derivada do produto. Se f(x) e g(x) são funções deriváveis, então

[f(x)g(x)]′ = f(x)g′(x) + g(x)f ′(x).

ou seja, o produto f(x)g(x) também é derivável.

45

Demonstração: Utilizaremos a de�nição para h(x) = f(x)g(x).

h′(x) = limh→0

f(x+ h)g(x+ h) − f(x)g(x)

h

= limh→0

f(x+ h)g(x+ h) − f(x)g(x) + [f(x+ h)g(x) − f(x+ h)g(x)]

h

= limh→0

f(x+ h)

[g(x+ h) − g(x)

h

]+ g(x)

[f(x+ h) − f(x)

h

]

= limh→0

f(x+ h) limh→0

[g(x+ h) − g(x)

h

]+ g(x) lim

h→0

[f(x+ h) − f(x)

h

]

= f(x)g′(x) + g(x)f ′(x).

v Derivada do quociente. Sejam f(x) e g(x) = 0 funções deriváveis, então

[f(x)

g(x)

]′=g(x)f ′(x) − f(x)g′(x)

[g(x)]2.

Vamos ocultar a prova desta regra, pois assemelha-se muito às provas anteriores,

bastando aplicar a de�nição.

vi Potenciação para inteiros positivos. Se f(x) = xn com n ∈ Z∗+, então

f ′(x) = nxn−1.

Demonstração: Seja a função f(x) = xn e f(x + h) = (x+ h)n, como n ∈ Z∗+

podemos expandir (x+ h)n pelo teorema binomial de Newton. Assim,

f ′(x) = limh→0

f(x+ h) − f(x)

h

= limh→0

(x+ h)n − xn

h

= limh→0

[xn + nxn−1h+ n(n−1)

2xn−2h2 + · · · + nxhn−1 + hn

]− xn

h

= limh→0

nxn−1h+ n(n−1)2

xn−2h2 + · · · + nxhn−1 + hn

h

= limh→0

[nxn−1 +

n(n− 1)

2xn−2h+ · · · + nxhn−2 + hn−1

]

= nxn−1

Repare que se aplicarmos essa regra para n = 1 teremos o caso particular da derivada

de variável livre, isto é, se uma função é igual a própria variável livre, sua derivada

46

é igual a 1. Geometricamente, a função f(x) = x é representada pela bissetriz, cuja

reta tem coe�ciente angular de tg(π

4

)= 1.

vii Potenciação para inteiros negativos. Se n ∈ Z∗−, então

(xn)′ = nxn−1.

Demonstração: Sabe-se que n ∈ Z∗−, então tomamos n = −m, logo m ∈ Z∗

+

e xn = x−m =1

xm. Para demonstrar esta regra é necessário utilizar a regra do

quociente com as funções f(x) = 1 e g(x) = xm, cujas derivadas são respectivamente

f ′(x) = 0 e g′(x) = mxm−1, portanto

[f(x)

g(x)

]′=

g(x)f ′(x) − f(x)g′(x)

[g(x)]2

=xm.0 − 1.mxm−1

x2m

=0 −mxm−1

x2m

= −mx−(m+1)

= nxn−1.

viii Derivada da função composta (Regra da Cadeia). Seja f(x) e g(x) funções

deriváveis, então a derivada de uma função composta (f ◦ g)(x) = f(g(x)) é dada

por

(f ◦ g)′(x) = f ′(g(x)).g′(x),

se f(u) é derivável em u = g(x) e g(x) é derivável em x.

Demonstração: Vamos utilizar a de�nição de derivada para mostrar a regra em

questão:

[f(g(x))]′ = limh→0

f(g(x+ h)) − f(g(x))

h

= limh→0

f(g(x+ h)) − f(g(x))

h.

[g(x+ h) − g(x)

g(x+ h) − g(x)

]

= limh→0

f(g(x+ h)) − f(g(x))

g(x+ h) − g(x). limh→0

g(x+ h) − g(x)

h

= limh→0

f(g(x+ h)) − f(g(x))

g(x+ h) − g(x).g′(x)

47

chamamos a = g(x) e z = g(x+ h), quando h → 0 tem-se z → a. Assim,

[f(g(x))]′ = limz→a

f(z) − f(a)

z − a.g′(x)

= f ′(a).g′(x)

= f ′(g(x)).g′(x)

Portanto, mostramos que de fato (f ◦ g)′(x) = f ′(g(x)).g′(x).

ix Derivada implícita. Sempre que uma função possa ser escrita da forma y = f(x),

dizemos que y é uma função explícita de x, pois isolamos a variável dependente de

um lado e a expressão do outro. Caso não seja possível isolar, ou não a explicitamos,

dizemos que é uma função implícita. O Método da derivação implícita consiste em

derivar os dois lados da equação em relação a variável x, usando a regra da cadeia,

e depois determinar y′ na equação resultante através de manipulações algébricas.

Exemplo 2.1.11 Determine a derivada em função de x das funções y = 3x2 + 5 e

y − 3x2 − 5 = 0.

Percebemos que a primeira função está na forma explícita, pois podemos escreve-la

da forma y = f(x). Assim, a derivada é y′ = 6x. Agora reparemos a segunda

função, ela está na forma implícita, isto é, f(x, y) = 0. Derivando-a em ambos os

lados obtemos y′ − 6x = 0 e isolando y′ obtemos y′ = 6x.

Conforme havíamos comentado, a aceleração instantânea é representada pela se-

gunda derivada do deslocamento em função do tempo, ela é dita derivada de segunda

ordem. De acordo com Netto (1977), vamos supor uma função derivável f(x) no intervalo

I e em todo ponto de I considere f ′(x) uma derivada �nita, a derivada de f ′(x) num ponto

a ∈ I, quando existe, seja �nita ou in�nita é dita segunda derivada de f(x), representada

por f ′′(x). Se f ′′(x) é �nita em todos os pontos do intervalo I, f ′′(x) será uma função

de�nida no intervalo I e a derivada de f ′′(x) num ponto b ∈ I, quando existe, seja �nita

ou in�nita, é chamada de terceira derivada de f(x) e denota-se por f ′′′(x), e assim segue

sucessivamente as derivadas de ordem superior. Vale salientar que a partir da derivada

de quarta ordem denota-se por f (n)(x) a n-ésima derivada de f(x), também encontramos

as derivadas sucessivas de uma função y = f(x) com as seguintes notações:

Dy,D2y,D3y, · · · , Dny oudy

dx,d2y

dx2, · · · , d

ny

dxn.

2.2 RESULTADOS

Nesta seção apresentaremos os resultados mais interessantes, do nosso ponto de

vista, do cálculo diferencial de uma variável real. Aquele estudante que desejar um maior

48

aprofundamento, sugerimos os livros de Edwards (1994) e Lima (2008).

Edwards (1994), a�rma que em muitos problemas é necessário encontrar os valores

máximos e mínimos que uma grandeza poderá atingir.

De�nição 2.2.1 Seja f : [a, b] → R uma função. Se c está no intervalo fechado [a, b],

então f(c) é chamado mínimo de f(x) em [a, b] se f(c) ≤ f(x) para todo x ∈ [a, b].

Analogamente, se d ∈ [a, b], então f(d) é chamado máximo de f(x) em [a, b] se f(d) ≥f(x) para todo x ∈ [a, b]. Se f(c) é um mínimo, então o ponto c ∈ [a, b] é chamado de

ponto mínimo da função f . Analogamente, se f(d) é um ponto de máximo, então o ponto

d ∈ [a, b] é chamado de ponto máximo da função f .

Desta forma, se f(c) é o mínimo e f(d) é o máximo de f(x) em [a, b], então

f(c) ≤ f(x) ≤ f(d), ∀x ∈ [a, b].

Exemplo 2.2.2 Seja f : [−1, 2] → R a função de�nida por f(x) = x2 (Figura 2.7).

Determine c, d ∈ [−1, 2] tais que satisfaçam a De�nição 2.2.1.

Figura 2.7: Função quadrática.


Tome c = 0 e d = 2. Assim,

f(c) = 0 ≤ f(x) ≤ f(2) = 4, ∀x ∈ [−1, 2].

O Teorema a seguir nos garante a existência do valor máximo e do mínimo, sob a

hipótese da função f ser contínua num intervalo fechado.

Teorema 2.2.3 (Teorema de Weierstrass) Se a função f é contínua no intervalo fe-

chado [a, b], então existem c, d ∈ [a, b] tais que

f(c) ≤ f(x) ≤ f(d), ∀x ∈ [a, b].

49

Demonstração: A demonstração este Teorema encontra-se no Apêndice A.

A hipótese de que f seja uma função contínua num intervalo fechado [a, b] é uma

condição essencial nesse Teorema. Consideremos os dois exemplos seguintes, onde o pri-

meiro falha na hipótese do intervalo fechado e o segundo falha a continuidade na função.

Exemplo 2.2.4 Seja a função contínua f(x) = x de�nida no intervalo aberto (a, b).

Não há como determinar os valores de máximo e mínimo no intervalo aberto (a, b), pois

dado c ∈ (a, b) vai existir k ∈ (a, b) com k < c tal que f(k) < f(c). A explicação é análoga

para o caso de valor máximo.

Exemplo 2.2.5 Considere a função descontínua f(x) =1

xse x = 0 e f(0) = 0 no

intervalo [−1, 1], conforme Figura 2.8.

Figura 2.8: Função descontínua.


Novamente não há como determinar os valores de máximos e mínimos, pois dado

c ∈ [−1, 1], sempre haverá k ∈ [−1, 1] tal que f(k) < f(c). A explicação é análoga para o

caso de valor máximo.

Através desse resultado, sabemos que se f é uma função contínua, então haverá

valores máximo e mínimos no intervalo fechado [a, b]. Agora, queremos determinar a

localização de tais valores, para tal, vamos determinar os máximos e mínimos locais.

De�nição 2.2.6 Dizemos que f(c) é um máximo local da função f se f(x) ≤ f(c) para

todo x su�cientemente próximo de c. Se esta desigualdade é válida para todo x que esteja

simultaneamente no domínio de f e em algum intervalo contendo c, então f(c) é um

máximo local de f . Analogamente, dizemos que f(c) é um mínimo local de f se f(x) ≥f(c) para todo x su�cientemente próximo de c.

50

Geometricamente, um máximo local é um ponto tal que nenhum outro ponto na

vizinhança está em posição mais alta, e um mínimo local é um ponto tal que nenhum

outro ponto na vizinhança está em posição mais baixa. Um extremo local é um mínimo

local ou um máximo local.

Teorema 2.2.7 (Máximos e Mínimos Locais) Se f é diferenciável em c, está de�-

nida em um intervalo aberto contendo c e se f(c) é um máximo local ou mínimo local de

f , então f ′(c) = 0.

Demonstração: Suponhamos que f(c) seja um máximo local de f . Pela hipótese de

que f ′(c) existe temos que os limites laterais (Equação (2.1.3)) existem e são iguais a

f ′(c).

Se h > 0, então

f(c+ h) − f(c)

h≤ 0,

pois f(c) ≥ f(c + h) para todos os valores positivos pequenos de h. Assim, por uma

versão unilateral do Teorema do confronto para limites (Apêndice A), esta igualdade se

mantém ao fazermos h tender a zero. Obtemos assim,

f ′(c) = limh→0+

f(c+ h) − f(c)

h≤ lim

h→0+0 = 0.

Analogamente, para h < 0 temos

f(c+ h) − f(c)

h≥ 0,

Portanto,

f ′(c) = limh→0−

f(c+ h) − f(c)

h≥ lim

h→0−0 = 0.

Como f ′(c) ≤ 0 e f ′(c) ≥ 0, concluímos que f ′(c) = 0.

A recíproca desse Teorema é falsa, ou seja, o fato de que f ′(c) = 0 não é su�ciente

para que f(c) seja um extremo local. Um contra-exemplo é a função f(x) = x3. Sua

derivada f ′(x) = 3x2 é zero em x = 0, no entanto veri�camos pelo grá�co (Figura 2.9) de

que f(0) não é extremo local de f .

51

Figura 2.9: Função cúbica.


Quanto aos problemas de otimização, nem sempre estamos interessados nos extre-

mos locais, mas nos máximos e mínimos globais, ou absolutos atingidos por uma função

contínua.

De�nição 2.2.8 Se f é uma função com domínio D, dizemos que f(c) é o máximo

absoluto (mínimo absoluto), ou máximo global (mínimo global), de f em D, se f(c) ≥ f(x)

(f(c) ≤ f(x)) para todo x ∈ D.

Ou seja, f(c) é o maior (menor) valor de f em D.

Consideremos a Figura 2.10 com o objetivo de ilustrar os pontos de máximos/mínimos

locais e absolutos, conforme discutimos até o momento.

Figura 2.10: Pontos de máximos e mínimos.

Fonte: Produção do próprio autor

De�nição 2.2.9 O valor c no domínio de f é dito ponto crítico de f se f ′(c) = 0 ou se

f ′(c) não existe.

O Teorema a seguir nos diz que o máximo ou mínimo absoluto da função f no

intervalo fechado [a, b] ocorre ou em uma das extremidades, ou em um ponto crítico de f .

52

Teorema 2.2.10 (Máximos e Mínimos Absolutos) Suponhamos que f(c) seja o má-

ximo absoluto (ou mínimo absoluto) da função contínua f no intervalo fechado [a, b].

Então, c ou é ponto crítico de f , ou é um dos extremos a ou b.

Demonstração: Se c não é um dos pontos extremos de [a, b], então f(c) é um extremo

local de f no intervalo aberto (a, b). Assim, o Teorema 2.2.7 implica f ′(c) = 0, desde que

f seja diferenciável em c.

Exemplo 2.2.11 Determine os valores de máximos e mínimos absolutos da função dife-

renciável

f(x) =3

5(30x− x2)

no intervalo fechado [0, 30].

A derivada da função f é

f ′(x) =3

5(30 − 2x),

que é zero em x = 15. Incluindo as extremidades, nossa relação de valores para os quais

o x pode resultar em extremos de f consiste em 0, 15 e 30. Assim,

f(0) = 0,

f(15) = 135,

f(30) = 0.

Portanto, o valor de máximo de f(x) é 135 e mínimo de f(x) é 0.

De�nição 2.2.12 A função f é crescente no intervalo I = (a, b) se

f(x1) < f(x2)

para todos os pares de números x1, x2 ∈ I tais que x1 < x2. A função é decrescente em I

se

f(x1) > f(x2)

para todos os pares de números x1, x2 ∈ I tais que x1 < x2.

Ou seja, f será crescente em I se os valores de f(x) crescem quando x cresce e f será

decrescente em I se os valores de f(x) decrescem quando x cresce.

O signi�cado do sinal da derivada de uma função é de grande importância. De

fato, f(x) é crescente em um intervalo onde f ′(x) > 0 e descrescente onde f ′(x) < 0.

53

Geometricamente, onde f ′(x) > 0, o grá�co de y = f(x) sobe ao ser percorrido da

esquerda para a direita. Onde f ′(x) < 0, o grá�co desce.

Embora intuitivo, não podemos tomar como verídico o sinal da derivada estar li-

gado diretamente ao crescimento ou decrescimento da função. Para prová-lo, necessitamos

apresentar o Teorema do Valor Médio . Daremos primeiramente um resultado preliminar,

que nos servirá de base para a prova do Teorema do Valor Médio.

Teorema 2.2.13 (Teorema de Rolle) Se f é uma função contínua em [a, b], derivável

em (a, b) e f(a) = f(b), então existe c ∈ (a, b) tal que f ′(c) = 0.

Figura 2.11: Representação do Teorema de Rolle.


Demonstração: Se f for constante em [a, b], então f ′(c) = 0 para todo c ∈ (a, b). Logo,

suponha que f não é constante em [a, b]. Como f é contínua, por hipótese, pelo Teorema

2.2.3, temos que f assume máximo e mínimo absoluto em [a, b]. Sejam c1, c2 ∈ [a, b] tais

que

f(c1) ≤ f(x) ≤ f(c2), ∀x ∈ [a, b].

Como f(a) = f(b) e f não é uma função constante, então c1 ∈ (a, b) ou c2 ∈ (a, b). Logo

pelo Teorema 2.2.10, c1 ou c2 é ponto crítico e como f é difereciável em (a, b) obtém-se

que f ′(c1) = 0 ou f ′(c2) = 0. Portanto tome c = c1 ou c = c2.

Agora, estamos em condições de enunciar e demonstrar o Teorema do Valor Médio.

Teorema 2.2.14 (Teorema do valor médio) Seja a função f contínua no intervalo

fechado [a, b] e diferenciável no intervalo aberto (a, b). Então, haverá pelo menos um

ponto c ∈ (a, b) tal que

f ′(c) =f(b) − f(a)

b− a.

54

Demonstração: Considere a Figura 2.12 como auxílio para construirmos a demonstra-

ção.

Figura 2.12: Contrução do teorema do valor médio.

Fonte: THOMAS (2009), editado pelo Autor.

Seja y = f(x) uma curva dada e sobre ela traçamos uma reta g(x) através dos

pontos A e B. A reta g(x) tem como equação

g(x) = f(a) +f(b) − f(a)

b− a(x− a).

Seja h(x) a função dada pela diferença vertical entre os grá�cos f(x) e g(x), logo

h(x) = f(x) − g(x) (2.2.1)

= f(x) − f(a) − f(b) − f(a)

b− a(x− a)

A função h(x) satisfaz as hipóteses do Teorema de Rolle no intervalo [a, b]. É

contínua em [a, b], derivável em (a, b) e h(a) = h(b) = 0. Portanto, a derivada de h(x) é

nula em algum ponto de (a, b). Seja c ∈ (a, b) o ponto obtido pelo Teorema de Rolle, isto

é h′(c) = 0. Derivando ambos os lados da Equação (2.2.1) temos

h′(x) = f ′(x) − g′(x)

h′(x) = f ′(x) − f(b) − f(a)

b− a.

55

Aplicando em x = c, obtemos

h′(c) = f ′(c) − f(b) − f(a)

b− a

0 = f ′(c) − f(b) − f(a)

b− a

f ′(c) =f(b) − f(a)

b− a

e com isto provamos o Teorema.

Apresentamos a seguir algumas consequências diretas deste Teorema.

Corolário 2.2.15 Se f ′(x) = 0 para todo x ∈ (a, b), então f é uma função constante em

[a, b]. Em outras palavras, existe uma constante C tal que f(x) = C para algum x ∈ (a, b).

Demonstração: Apliquemos o Teorema do Valor Médio à função f no intervalo [a, x],

onde x é um número �xo, porém arbitrário do intervalo (a, b]. Obtemos

f(x) − f(a) = f ′(c)(x− a) (2.2.2)

para algum número c entre a e x. Como f ′(x) é sempre zero em (a, b), temos que f ′(c) = 0.

Assim, f(x) − f(a) = 0 e f(x) = f(a).

Essa última equação vale para todo x ∈ [a, b]. Portanto, f(x) = f(a) para todo

x ∈ [a, b], isto é, f(x) tem o valor �xo C = f(a).

Este Corolário costuma ser aplicado sob uma forma equivalente, como enunciamos

a seguir.

Corolário 2.2.16 Se f ′(x) = g′(x) em cada ponto de x de um intervalo aberto (a, b),

então existe uma constante C tal que f(x) = g(x) + C para qualquer x ∈ (a, b). Ou seja,

f(x) − g(x) é uma constante em (a, b).

Demonstração: Para cada x ∈ (a, b), a derivada da função diferença h(x) = f(x)−g(x)será dada por

h′(x) = f ′(x) − g′(x) = 0.

De acordo com o Corolário 2.2.15 h(x) = C. Portanto f(x) − g(x) = C em (a, b), então

f(x) = g(x) + C.

Exemplo 2.2.17 Seja f ′(x) = 2 cos(x) e f(0) = 5, determine a função f(x).

Sabemos que uma função explícita com derivada 2 cos(x) é

g(x) = 2 sin(x).

56

Logo, o Corolário 2.2.16 implica que existe uma constante C tal que

f(x) = g(x) + C = 2 sin(x) + C

em qualquer intervalo dado [a, b] que contenha o zero. Podemos determinar C fazendo

x = 0

f(0) = 2 sin(0) + C

5 = 2.0 + C

de modo que C = 5. Assim, a função f é

f(x) = 2 sin(x) + 5.

A consequência do Teorema do Valor Médio a seguir, veri�ca as observações sobre

funções crescentes e decrescentes que comentamos no início desta seção.

Corolário 2.2.18 Se f ′(x) > 0 para todo x em (a, b), então f é uma função crescente

em [a, b]. Se f ′(x) < 0 para todo x em (a, b), então f é uma função decrescente em [a, b].

Demonstração: Suponhamos que f ′(x) > 0 para todo x em (a, b). Devemos mostrar

que, se m e n forem pontos de [a, b], com m < n, então f(m) < f(n). Aplicamos o

Teorema do Valor Médio a f , porém no intervalo fechado [m,n] pois, [m,n] está contido

em [a, b], logo f satisfaz as hipóteses do Teorema do Valor Médio tanto em [m,n] quanto

em [a, b]. O resultado é que

f(n) − f(m) = f ′(c)(n−m)

para algum número c ∈ (m,n). Como m < n e como por hipótese, f ′(c) > 0, segue que

f(n) − f(m) > 0

Ou seja, f(m) < f(n) como queríamos provar. Analogamente prova-se o caso em que

f ′(x) < 0.

Finalizamos esta seção salientando que não abordamos todos os Teoremas referen-

tes às derivadas em R, realizando uma comparação bem grosseira, o que aqui apresentamos

foi apenas a ponta de um grande iceberg. Caso o leitor queira se aprofundar em demais

resultados aconselhamos a leitura dos trabalhos de Lima (2008) e Edwards (1994).

57

2.3 A DIFERENCIAL EM R

De acordo com Edwards (1994), as vezes necessitamos de uma estimativa rápida

da variação f(x) resultante de uma dada variação de x, tal estimativa é dada por dife-

renciais que é outra aplicação da derivada. Por exemplo, podemos utilizar diferenciais

para determinar o problema da variação do alcance de um projétil quando o ângulo de

lançamento passa de α para β (sendo β próximo a α).

Primeiramente, admitimos que a alteração na variável independente seja o incre-

mento ∆x gerado na variação de x para x + ∆x. A variação do valor de y = f(x) é o

incremento ∆y obtido através da subtração

∆y = f(x+ ∆x) − f(x).

Queremos aproximar ∆y usando a aproximação linear que está relacionada com os diferen-

ciais. Utilizaremos a Figura 2.13 como auxílio para discutirmos a interpretação geométrica

dos diferenciais.

Figura 2.13: A diferencial.


Comparemos o incremento efetivo ∆y com a alteração que ocorreria no valor de y,

se este variasse à taxa �xa f ′(x) enquanto o valor da variável independente se deslocasse

de x para x+ ∆x. Essa variação em y é a diferencial

dy = f ′(x)∆x. (2.3.1)

Como podemos ver na Figura 2.13, dy é a variação da altura de um ponto que

se move ao longo da reta tangente. Vamos admitir x �xo, então pela Equação (2.3.1) a

diferencial dy é uma função linear do incremento ∆x. Edwards (1994) a�rma que, por esta

razão dy é chamado de aproximação linear do incremento ∆y. Assim, podemos aproximar

58

f(x+ ∆x) substituindo ∆y por dy.

f(x+ ∆x) = y + ∆y ≈ y + dy.

Como y = f(x) e dy = f ′(x)∆x, teremos a aproximação linear

f(x+ ∆x) ≈ f(x) + f ′(x)∆x. (2.3.2)

De fato, quando ∆x é pequeno, dy = f ′(x)∆x será uma boa aproximação para ∆y.

Vamos substituir x por a na Equação (2.3.2) obtendo a seguinte aproximação

f(a+ ∆x) ≈ f(a) + f ′(a)∆x, (2.3.3)

assim, como ∆x = x− a, x = a+ ∆x temos,

f(x) ≈ f(a) + f ′(a)(x− a).

O lado direito desta equação é uma função linear de x, chamado de aproximação linear

da função f na vizinhança do ponto x = a.

Como o próprio nome já diz, a aproximação linear gera um pequeno erro que é

determinado pelo cálculo da diferença entre a variação real e a estimativa diferencial, ou

seja,

Erro = ∆y − dy

= [f(a+ ∆x) − f(a)] − f ′(a)∆x

=

[f(a+ ∆x) − f(a)

∆x− f ′(a)

]∆x

= ϵ∆x

quando ∆x → 0, a relação incrementalf(a+ ∆x) − f(a)

∆xse aproxima de f ′(a) tornando

ϵ um valor muito pequeno, isso é, quando ∆x é pequeno, o erro ϵ∆x é menor ainda.

Exemplo 2.3.1 Calcule o valor aproximado de 3√

64.5.

Consideremos a função f(x) = 3√x e utilizando a Equação(2.3.3) temos que a aproximação

diferencial será dada por:

f(a+ ∆x) ≈ f(a) + f ′(a)∆x

≈ 3√a+

1

33√a2

∆x

59

Assumindo a = 64 e ∆x = 0.5 segue que

3√

64.5 ≈ 3√

64 +1

33√

642(0.5)

≈ 4 + 0.01041 = 4.01041

O valor calculado diretamente é 3√

64.5 = 4.01038. Assim a diferença entre os dois resul-

tados é da casa de 10−4.

Exemplo 2.3.2 O raio de uma esfera mede 9cm. Sabendo que o erro desta medida pode

ser de 0.05cm para mais, calcule, utilizando diferenciais, um valor aproximado para o erro

máximo no cálculo do volume desta esfera causado pelo erro de medida do raio.

O volume de uma esfera é representada pela expressão

V =4πr3

3

assim, o aumento estimado do volume é

dV = v′(r)dr

= 4πr2dr

onde dV e dr são respectivamente a diferencial do aumento do volume e o acréscimo do

raio. Logo,

dV = 4π(9)2(0.05) = 50.894cm3.

O volume da esfera com r = 9cm e com r = 9.05cm são dados respectivamente por V1 e

V2.

V1 =4(9)3π

3= 3053.628cm3

V2 =4(9.05)3π

3= 3104.805cm3

Portanto, o erro exato é ∆V = V2 − V1 = 51.177cm3 ≈ 50.894cm3 = dV .

Resumidamente, neste capítulo exploramos a ligação entre a reta tangente e a

derivada em R, apresentamos Teoremas referentes às derivadas e a aproximação linear

via diferenciais. Não foi possível explorar todo o conteúdo devido a sua amplitude, aos

leitores interessados recomendamos a leitura da obra de Lima (2008) e Edwards (1994).

No próximo capítulo iremos trabalhar com as derivadas de várias variáveis apresentando

as propriedades e suas devidas aplicações.

60

Capítulo 3

CÁLCULO DIFERENCIAL DE

VÁRIAS VARIÁVEIS

Vimos que uma ideia do cálculo diferencial baseia-se em aproximar funções não

lineares pelas lineares conforme discutido no capítulo anterior. No cálculo de apenas uma

variável real este conceito �ca bem claro, bastando considerar uma função f : R → Rdiferenciável no ponto a, logo a reta tangente ao grá�co y = f(x) no ponto (a, f(a)) será

y − f(a) = f ′(a)(x− a). (3.0.1)

Edwards (1973) descreve que o lado direito da Equação (3.0.1) é uma função linear de

x − a. Então, podemos considerá-la como uma aproximação linear para a variação de

f(x) − f(a) no valor entre a e x.

Contemos com o auxílio da Figura 3.1 para rede�nir, por conveniência, algumas

variáveis que utilizamos no capítulo anterior, adotando as seguintes relações: ∆fa(h) =

f(a+ h) − f(a), dfa(h) = f ′(a)h e h = x− a.

Figura 3.1: Aproximação linear

Fonte: EDWARDS (1973, p.56), editado pelo autor.

61

De acordo com Edwards (1973), a função linear dfa : R → R de�nida por dfa(h) =

f ′(a)h é chamada de diferencial de f em a, ela é a função linear dfa : R → R cuja matriz

(1 × 1) é a derivada f ′(a) de f em a, não referenciada anteriomente por ser uma matriz

unitária. Assim, se h for pequeno, a variação linear dfa(h) será uma boa aproximação da

variação efetiva ∆fa(h), de modo que

limh→0

∆fa(h) − dfa(h)

h= 0.

Resumidamente falando, veremos neste capítulo que a aplicação f : Rn → Rm será

por de�nição diferenciável em a se, e somente se, próximo ao ponto a houver uma apro-

priada aproximação linear dfa : Rn → Rm. Nesse caso, dfa será chamada de diferencial

de f em a e a sua matriz (m × n) será chamada de derivada de f em a, �preservando

assim a relação acima entre o diferencial (uma função linear) e a derivada (as matri-

zes).�(EDWARDS, 1973, p.57, tradução nossa). A motivação para explorarmos o cálculo

diferencial de várias variáveis não se dá mais no problema em de�nir reta tangente como

nos ocupamos até o momento, mas sim em determinar o plano tangente à imagem das fun-

ções em um determinado ponto, permitindo-nos acesso a um novo conjunto de ferramentas

para o tratamento destas funções. O plano tangente que estamos nos referimos não serve

apenas para funções de duas variáveis, aqui generalizamos este conceito e trabalhamos na

verdade com hiperplanos, que são planos em diferentes dimensões.

Para prosseguirmos com o nosso estudo será necessário de�nir a aplicação que nos

servirá de pilar neste capítulo de funções de várias variáveis.

De�nição 3.0.3 Uma aplicação vetorial de várias variáveis f : D ⊂ Rn → Rm, é uma

aplicação que associa cada vetor v ∈ D a um único vetor f(v) em Rm.

3.1 CURVAS EM Rm

Seguindo o raciocínio de Edwards (1973), vamos considerar primeiro o caso especial

da aplicação f : R → Rm. Se pedirmos alguns exemplos de curvas, o leitor provavelmente

terá em mente algum subconjunto de R2 e R3, por exemplo, uma circunferência f :

[0, 2π] ⊂ R → R2 de�nida por f(t) = (a cos(t), a sin(t)) de raio a, ou uma curva aleatória

no espaço (ver Exemplo 3.1.2). Generalizando esta ideia de curvas, de�nimos curvas em

Rm.

De�nição 3.1.1 Uma curva de Rm é uma aplicação da forma

f : D ⊆ R → Rm

que associa cada valor t ∈ D a um único vetor f(t) ∈ Rm.

62

Chamaremos a imagem de f de trajetória da curva ou traço da curva.

Exemplo 3.1.2 Seja a curva f : R → R3 de�nida por f(t) = (cos(t), sin(t), t).

Neste exemplo, a trajetória da curva f é a hélice representada pela Figura 3.2.

Figura 3.2: Representação geométrica da hélice.


Considere a seguinte aplicação f : D ⊂ R → Rm com f(x) = (f1(x), · · · , fm(x))

para cada x ∈ D. Então, f1, · · · , fm são funções de valores reais ditas coordenadas funci-

onais de f . O Lema a seguir trata do limite em cada coordenada funcional, estendendo

os conceitos de limites de uma variável para aplicações da forma f : D ⊂ R → Rm.

Lema 3.1.3 Suponha f = (f1, · · · , fm) : D → Rm sendo a um ponto de acumulação de

D e b = (b1, · · · , bm) ∈ Rm. Então,

limx→a

f(x) = b (3.1.1)

se, e somente se

limx→a

fi(x) = bi, i = 1, · · · ,m. (3.1.2)

Demonstração:

(⇒) Dado ε > 0 existe δ > 0 tal que para x ∈ D e 0 < |x−a| < δ implica em |f(x)−b| < ε.

Assim,

0 < |x− a| < δ ⇒ |fi(x) − bi| =

√(fi − bi)

2

6√

(f1 − b1)2 + · · · + (fm − bm)2

= |f(x) − b| < ε,

Logo, (3.1.2) é válida para cada i = 1, · · · ,m.

(⇐) Dado ε > 0, para cada i = 1, · · · ,m existe um δi > 0 tal que

x ∈ D e 0 < |x− a| < δi ⇒ |fi(x) − bi| <ε√m.

63

Se escolhermos agora δ = min{δ1, · · · , δm}, então x ∈ D e

0 < |x− a| < δ ⇒ |f(x) − b| =

[m∑

i=1

|fi(x) − bi|2] 1

2

=(|f1(x) − b1|2 + ...+ |fm(x) − bm|2

) 12

<

[(ε√m

)2

+ ...+

(ε√m

)2] 1

2

=(ε2m

m

) 12

= ε.

com isso prova-se a recíproca.

Pelo Lema 3.1.3, a aplicação f : R → Rm é diferenciável em a se, e somente se,

cada uma de suas coordenadas funcionais f1, · · · , fm for diferenciável em a, nesse caso

f ′ = (f ′1, · · · , f ′

m).

Portanto, a aplicação f : R → Rm poderá ser diferenciável em cada termo de suas coor-

denadas e se aplicarmos as propriedades de derivada de funções reais para cada função

coordenada devemos obter os resultados descritos no Teorema 3.1.5 que será ainda apre-

sentado nesta seção.

Agora, vamos considerar uma curva em Rm traçada por um ponto móvel cuja

posição no tempo t se dá por f(t) ∈ Rm, queremos de�nir sua velocidade no ponto t.

Para m = 1 o problema nos remete à de�nição de derivada, vista no capítulo anterior, f ′

de f . A mudança da posição da partícula do tempo a ao tempo a+h é descrito pelo vetor

f(a+ h) − f(a), assim a velocidade média da partícula durante este intervalo de tempo é

a conhecida relação incremental

f(a+ h) − f(a)

h,

se o limite existir ao fazer h tender para 0, pela De�nição 2.1.5, a velocidade instantânea

no tempo a passa a ser de�nida por

f ′(a) = limh→0

f(a+ h) − f(a)

h

e neste caso, diremos que f é diferenciável em a ∈ R. O vetor derivada f ′(a) de f em

a pode ser considerado como o vetor tangente à curva no ponto f(a), como podemos

visualizar na Figura 3.3 supondo estarmos trabalhando no espaço tridimensional. O com-

primento, expresso pelo módulo |f ′(a)| é a velocidade escalar em t = a obtido movendo o

ponto f(t) através da curva. Assim, chamaremos f ′(a) de vetor velocidade em t = a.

64

Se a aplicação f ′ : R → Rm em si é derivável em a, sua derivada em a é dita segunda

derivada, f ′′, de f em a. Se continuarmos com a ideia de f exprimir o movimento de um

ponto em Rm, chamaremos f ′′(a) de vetor aceleração em t = a.

Figura 3.3: Vetor derivada em R3.


Vamos de�nir as operações entre as aplicações R → Rm de acordo com o que segue.

De�nição 3.1.4 Considere as aplicações f, g : R → Rm dadas por f = (f1, · · · , fm),

g = (g1, · · · , gm) e uma função φ : R → R. Assim, de�nimos (f+g), (φf), (f.g) : R → Rm

respectivamente por

f + g = (f1 + g1, · · · , fm + gm),

φf = (φf1, · · · , φfm),

f.g = f1.g1 + · · · + fm.gm.

Teorema 3.1.5 Considere as aplicações f, g : R → Rm e φ : R → R, todas diferenciáveis.

Então,

(f + g)′ = f ′ + g′,

(φf)′ = φ′f + φf ′,

(f.g)′ = f ′.g + f.g′,

(f ◦ φ)′(t) = φ′(t)f ′(φ(t)).

Esta última é chamada de regra da cadeia para a composição R φ→ R f→ Rm.

Demonstração: Considere as aplicações diferenciáveis f, g : R → Rm de�nidas por

f = (f1, · · · , fm) e g = (g1, · · · , gm). Assim,

65

i (f + g)′ = f ′ + g′, pois

(f + g)′ = (f1 + g1, · · · , fm + gm)′

= ((f1 + g1)′, · · · , (fm + gm)′)

= (f ′1 + g′

1, · · · , f ′m + g′

m)

= (f ′1, · · · , f ′

m) + (g′1, · · · , g′

m)

= f ′ + g′.

ii (φf)′ = φ′f + φf ′, pois

(φf)′ = (φf1, · · · , φfm)′

= ((φf1)′, · · · , (φfm)′)

= (φ′f1 + f ′1φ, · · · , φ′fm + f ′

mφ)

= (φ′f1, · · · , φ′fm) + (f ′1φ, · · · , f ′

mφ)

= φ′f + f ′φ.

iii (fg)′ = f ′g + fg′, pois

(f.g)′ = (f1.g1 + · · · + fm.gm)′

= ((f1.g1)′ + · · · + (fm.gm)′)

= (f ′1.g1 + g′

1.f1 + · · · + f ′m.gm + g′

m.fm)

= (f ′1.g1 + · · · + f ′

m.gm) + (g′1.f1 + · · · + g′

m.fm)

= f ′.g + g′.f.

iv (f ◦ φ)′(t) = φ′(t)f ′(φ(t)), pois

(f ◦ φ)′(t) = ((f1 ◦ φ)(t), · · · , (fm ◦ φ)(t))′

= ((f1 ◦ φ)′(t), · · · , (fm ◦ φ)′(t))

= (f ′1(φ(t))φ′(t)), · · · , f ′

m(φ(t))φ′(t))

= φ′(t)(f ′1(φ(t)), · · · , f ′

m(φ(t)))

= φ′(t)f ′(φ(t)).

Edwards (1973) a�rma que duas curvas com mesma derivada diferem apenas por

uma constante, que neste caso passa a ser um vetor, ou seja, o Corolário 2.2.16 estende-se

66

para as aplicações R em Rm. De fato, consideremos as aplicações

f : R → Rm

x 7→ (f1(x), f2(x), · · · , fm(x))

g : R → Rm

x 7→ (g1(x), g2(x), · · · , gm(x))

Por hipótese sabemos que f ′(x) = g′(x). Derivando as aplicações obtemos,

f ′(x) = (f ′1(x), f

′2(x), · · · , f ′

m(x))

g′(x) = (g′1(x), g

′2(x), · · · , g′

m(x))

Assim,

f ′(x) = g′(x) ⇒ f ′i(x) = g′

i(x), i ∈ {1, · · · ,m}.

Pelo Corolário 2.2.16 do Capítulo anterior temos que,

fi(x) − gi(x) = ci, ∀i ∈ {1, · · · ,m}.

Portanto,

f(x) − g(x) = (f1(x) − g1(x), f2(x) − g2(x), · · · , fm(x) − gm(x))

= (c1, c2, · · · , cm).

O mesmo autor a�rma que o Teorema do valor médio (Teorema 2.2.14) não se

mantém, um contra exemplo é apresentado a seguir.

Exemplo 3.1.6 Considere uma partícula que se move sobre uma hélice circular em R3,

cuja posição é descrita pelo vetor

γ(t) = (a cos(ωt), a sin(ωt), bωt)

com a, b e ω constantes. Conclua que a equação

γ′(τ) =γ(t2) − γ(t1)

t2 − t1. (3.1.3)

não é válida para qualquer τ ∈ (t1, t2).

67

Consideremos t1 = 0 e t2 = 2πω, assim γ(t1) = (a, 0, 0) e γ(t2) = (a, 0, 2πb). Temos que

γ′(t)|t=τ = ω(−a sin(ωτ), a cos(ωτ), b).

Então substituindo as informações na Equação (3.1.3) obtemos,

ω(−a sin(ωτ), a cos(ωτ), b) =(a, 0, 2πb) − (a, 0, 0)

2π

ω− 0

=ω

2π(0, 0, 2πb)

= ω(0, 0, b).

Portanto,

(−a sin(ωτ), a cos(ωτ), b) = (0, 0, b).

Logo, sin(ωτ) = 0 e cos(ωτ) = 0. Absurdo, pois não podemos satisfazer estas duas

igualdades simultaneamente. Assim, apresentamos um exemplo de que o Teorema do

valor médio não vale para curvas.

No início desta seção vimos que para aplicações f : R → Rm diferenciáveis com

m = 1, f ′(a) pode ser considerado como o vetor tangente à curva no ponto f(a). Vamos

estender este conceito para m > 1 e de�nir conforme Edwards (1973) a construção da

linha tangente da seguinte forma.

De�nição 3.1.7 A linha tangente à imagem da curva em f(a) da aplicação diferenciável

f : R → Rm é a linha que passa por f(a) e é paralela ao vetor tangente f ′(a).

O Teorema a seguir nos fornece a condição necessária e su�ciente para que uma

aplicação f : R → Rm seja diferenciável em a ∈ R.

Teorema 3.1.8 A aplicação f : R → Rm é diferenciável em a ∈ R se, e somente se,

existir uma aplicação linear L : R → Rm tal que

limh→0

f(a+ h) − f(a) − L(h)

h= 0. (3.1.4)

Demonstração:

(⇒) Suponha que a aplicação f : R → Rm seja diferenciável em a ∈ R, ou seja,

f ′(a) = limh→0

f(a+ h) − f(a)

h

0 = limh→0

f(a+ h) − f(a)

h− f ′(a)

0 = limh→0

f(a+ h) − f(a) − hf ′(a)

h.

68

Assim, vamos considerar L : R → Rm de�nida por L(h) = hf ′(a), de fato L(h) é linear,

pois para quaisquer k, h1, h2 ∈ R

L(kh1 + h2) = (kh1 + h2)f′(a)

= kh1f′(a) + h2f

′(a)

= h1f′(a)k + h2f

′(a)

= L(h1)k + L(h2).

Portanto,

limh→0

f(a+ h) − f(a) − L(h)

h= 0.

(⇐) Suponha uma aplicação linear L : R → Rm que satisfaça a Equação (3.1.4). Então,

existe b ∈ Rm tal que L é de�nido por L(h) = hb. Mostraremos que f ′(a) existe e assume

f ′(a) = b. Assim,

f ′(a) = limh→0

f(a+ h) − f(a)

h= lim

h→0

f(a+ h) − f(a)

h+ b− b

= limh→0

f(a+ h) − f(a) − hb

h+ b

= 0 + b

= b.

Portanto, a aplicação é diferenciável em a ∈ R e f ′(a) = b.

Representaremos gra�camente o resultado do Teorema 3.1.8 com o auxílio da Fi-

gura 3.4, supondo estarmos trabalhando no espaço tridimensional. Para tal, consideremos

uma aplicação f : R → Rm de�nindo

∆fa(h) = f(a+ h) − f(a)

para a variação em f de a para a+ h, e

dfa(h) = hf ′(a)

para a linearidade como uma função dependente de h, cujo objetivo é alterar o compri-

mento de f ′(a) ao longo da linha tangente.

69

Figura 3.4: Aproximação por uma aplicação linear em R3.


De fato, quando h é pequeno, menor será o vetor diferença ∆fa(h) − dfa(h), de tal

forma que

limh→0

∆fa(h) − dfa(h)

h= 0.

Segundo Edwards (1973), se f : R → Rm é diferenciável em a, então a aplicação

linear dfa : R → Rm de�nida por dfa(h) = hf ′(a) é chamada diferencial de f em a. Repare

que se olharmos a derivada f ′(a) como um vetor coluna então ele é a matriz da aplicação

linear dfa e se apresenta da seguinte forma

dfa(h) = hf ′(a) =

f ′1(a)...

f ′m(a)

(h).

Na próxima seção vamos de�nir derivadas e a diferencial para aplicações de Rn em

Rm, adiantamos que esta relação discutida será mantida, sendo a diferencial a aplicação

linear cuja matriz é a derivada.

3.2 DERIVADAS DIRECIONAIS E O DIFERENCIAL

Conforme visto nos capítulos anteriores, a ideia da derivada de funções de uma

única variável baseia-se em de�nir uma reta tangente à curva. De uma maneira bem

similar, o conceito de diferenciabilidade de funções de várias variáveis é motivado pelo

problema em de�nir planos tangentes às superfícies, planos esses com o mesmo conceito

de hiperplanos, conforme comentado anteriormente.

Conforme Edwards(1973), normalmente de�nimos o grá�co em R3 da função

f : R2 → R como uma superfície cuja projeção está no plano xy. Podemos considerar este

grá�co como a imagem da aplicação F : R2 → R3 de�nida por F (x, y) = (x, y, f(x, y)).

Vamos generalizar esta interpretação geométrica no caso de m > n e tomar a

imagem da aplicação F : Rn → Rm como uma superfície n-dimensional em Rm, tendo

70

em cada ponto um plano tangente n-dimensional. Entende-se por plano n-dimensional

em Rm como sendo a translação paralela de um subespaço de dimensão n em Rm. Se V

for um subespaço de Rm, a sua translação paralela pelo ponto a ∈ Rm será formada pelo

conjunto dos pontos x ∈ Rm tais que x− a ∈ V , isto é

W = {x ∈ Rm/x = v + a : v ∈ V } .

A Figura 3.5 ilustra o que acabamos de discutir para o caso particular de um subespaço

V de dimensão 1 em R3.

Figura 3.5: Translação paralela do subespaço V .


Se V é o conjunto solução da equação linear

Ax = 0,

onde

V = {v ∈ Rm/Av = 0},

então a translação paralela de V é o conjunto solução da equação

A(x− a) = 0,

pois v = x− a ∈ V .

Consideremos a aplicação F : Rn → Rm e um ponto a ∈ Rn. Queremos de�nir

um plano tangente à imagem da superfície S de F em F (a). Assim, o plano tangente

deve consistir de todas as linhas tangentes às curvas contidas na superfície S em F (a)

conforme ilustrado na Figura 3.6. Daqui por diante, quando mencionarmos um ponto

a ∈ Rn, estaremos nos referindo ao ponto A de Rn que tem como vetor posição o vetor a.

71

Figura 3.6: Plano tangente

Fonte: EDWARDS (1973, p.64), editado pelo autor

Dado um vetor v ∈ Rn e um ponto a ∈ Rn, construiremos uma curva γv : R → Rm

de�nida por

γv(t) = F (a+ tv)

para cada t ∈ R. Tal curva é a imagem F da linha em Rn que passa pelo ponto a e é

paralela ao vetor v. Com o auxílio desta curva, de�nimos

De�nição 3.2.1 A derivada direcional com respeito a v de F em a é o vetor velocidade

γ′v(0), ou seja,

γ′v(0) = F ′(a).v

= DvF (a).

Isto é,

DvF (a) = limh→0

F (a+ hv) − F (a)

h

desde que o limite exista.

Assim, o vetor DvF (a) transladado para o ponto F (a) torna-se o vetor tangente à

S em F (a) conforme Figura 3.7.

72

Figura 3.7: Derivada direcional


Segundo Edwards (1973), o interessante em se estudar esse conteúdo são as deri-

vadas direcionais de F em relação aos vetores das bases canônicas e1, · · · , en. Essas são

chamadas de derivadas parciais de F , cuja i-ésima derivada parcial de F em a denota-se

por

DiF (a) ou∂F

∂xi

(a),

cuja de�nição é

DiF (a) =∂F

∂xi

(a) = DeiF (a). (3.2.1)

Se a = (a1, · · · , an) ∈ Rn, então a i-ésima derivada parcial será

DiF (a) = limh→0

F (a+ hei) − F (a)

h

= limh→0

F (a1, · · · , ai + h, · · · , an) − F (a1, · · · , ai, · · · , an)

h.

Assim, DiF (a) é o resultado de diferenciar F como uma função de xi, mantendo as demais

variáveis �xadas.

Exemplo 3.2.2 Determine as derivadas parciais da função f(x, y, z) = y3 + x sin(yz).

Derivando parcialmente a função, segue que

D1f(x, y, z) = sin(yz), (3.2.2)

D2f(x, y, z) = 3y2 + xz cos(yz),

D3f(x, y, z) = xy cos(yz).

De acordo com Gonçalves (2000), as derivadas parciais de uma aplicação vetorial f

também são aplicações de várias variáveis. Portanto, se as derivadas parciais destas apli-

73

cações existem, elas são ditas derivadas de segunda ordem de f . Seguindo este raciocínio,

obtemos as derivadas parciais de ordem superior.

Através da igualdade

DcvF (a) = limh→0

F (a+ hcv) − F (a)

h

= c limh→0

F (a+ hcv) − F (a)

hc

= c limk→0

F (a+ kv) − F (a)

k= cDvF (a),

concluímos que, se v e w forem colineares em Rn, então DvF (a) e DwF (a) serão colineares

em Rm . De fato, se v e w forem colineares em Rn, então haverá uma linha que passa

por a ∈ Rn paralela aos dois vetores simultaneamente. Assim, a imagem dessa linha

acarretará numa única curva e portanto as derivadas direcionais DvF (a) e DwF (a) a essa

curva serão colineares.

Assim, cada reta que passa pela origem em Rn determinará uma reta que passa

pela origem em Rm. Desejamos que a união de todas as retas em Rm obtidas desse modo,

isto é

La = {DvF (a) ∈ Rm/∀v ∈ Rn} ,

seja um subespaço de Rm. Se La for um subespaço de Rm, então a translação paralela

de La para F (a) será um bom candidato para o plano tangente a superfície S em F (a).

O conjunto La ⊂ Rm é a imagem de Rn pela aplicação L : Rn → Rm de�nida por

L(v) = DvF (a), ∀v ∈ Rn.

De�nição 3.2.3 Seja T : V → W uma aplicação linear. A imagem de T é o conjunto

de vetores w ∈ W tais que existe um vetor v ∈ V , que satisfaz T (v) = w. Ou seja,

Im(T ) = {w ∈ W/T (v) = w, para algum v ∈ V }.

Notemos que a imagem da aplicação linear sempre é um subespaço, então podemos

garantir que La é um subespaço de Rm, exigindo que L seja uma aplicação linear.

Estamos à procura de um plano tangente à superfície S que se ajuste próximo ao

ponto F (a). Isto signi�ca que queremos que L(v) seja uma boa aproximação de F (a +

v) − F (v) quando |v| for pequeno. Esse resultado já foi apresentado no Teorema 3.1.8

para o caso de aplicações do tipo f : R → Rm. Agora, adotamos a condição necessária e

su�ciente para a de�nição de diferenciabilidade no caso geral.

De�nição 3.2.4 A aplicação F , a partir de um subconjunto D ⊂ Rn em Rm, é diferen-

ciável no ponto a ∈ D se, e somente se, existir uma aplicação linear L : Rn → Rm, tal

74

que

limh→0

F (a+ h) − F (a) − L(h)

|h|= 0. (3.2.3)

A aplicação linear L também denota-se por dFa e é chamada de diferencial de F em

a, sua matriz F ′(a) é chamada de derivada de F em a. Poderíamos também de�nir dF (a)

como uma função que possui derivadas direcionais em todas as direções no ponto a como

é feito para funções de uma variável, mas com isso a diferenciabilidade não implicaria na

continuidade.

A partir da de�nição podemos provar que o operador L é único, ou seja, a derivada

é única. A demonstração desse fato será feita no capítulo seguinte para um caso mais

geral.

Teorema 3.2.5 Se a aplicação F : D ⊆ Rn → Rm é diferenciável em a ∈ D, então F é

contínua em a.

Demonstração: Como F é diferenciável em a, então

limh→0

F (a+ h) − F (a) − L(h)

|h|= 0,

ou, equivalentemente

F (a+ h) = F (a) + L(h) + o(|h|) (3.2.4)

onde limh→0

o(|h|)|h|

= 0. Reescrevendo a Equação (3.2.4)

F (a+ h) = F (a) + L(h) +o(|h|)|h|

|h|

Aplicando o limite em ambos os lados, obtemos

limh→0

F (a+ h) = limh→0

[F (a) + L(h) +

o(|h|)|h|

|h|]

= F (a) + limh→0

L(h) + limh→0

[o(|h|)|h|

|h|]

= F (a) + L(0) + limh→0

o(|h|)|h|

limh→0

|h|

= F (a) + 0 + 0.0

= F (a).

Portanto, F é contínua em a.

75

Lema 3.2.6 A aplicação f : Rn → Rm é linear, se e somente se, existir uma matriz A

tal que f(x) = Ax para todo x ∈ Rn. Então, A é a matriz m× n cuja j-ésima coluna é o

vetor coluna f(ej), onde ej = (0, · · · , 1, · · · , 0) é um vetor unitário de Rn.

Demonstração:

(⇒) Considere a aplicação linear f : Rn → Rm, com

f(ej) =

a1j

...

amj

e A = (aij)

Então, dado

x = (x1, · · · , xn) ∈ Rn

= x1e1 + · · · + xnen ∈ Rn

logo

f(x) = f(x1e1 + · · · + xnen)

= x1f(e1) + · · · + xnf(en)

= x1

a11

...

am1

+ · · · + xn

a1n

...

amn

=

a11x1 + · · · + a1nxn

a21x1 + · · · + a2nxn

......

am1x1 + · · · + amnxn

= Ax.

(⇐) Seja A a matriz tal que

f(x) = Ax, ∀x ∈ Rn.

Realizando o processo inverso obtemos

f(x) = f(x1e1 + · · · + xnen).

76

Assim, a aplicação f : Rn → Rm é linear, pois

f(x+ ty) = f(x1e1 + · · · + xnen + ty1e1 + · · · + tynen)

= f((x1 + ty1)e1 + · · · + (xn + tyn)en)

= f(x1e1 + · · · + xnen) + f(ty1e1 + · · · + tynen)

= f(x) + tf(y).

Através do Lema 3.2.6 temos que F ′(a) é a única matriz m× n tal que

dFa(x) = F ′(a)x, ∀x ∈ Rn.

De fato, suponhamos que A não seja única, então existe uma matriz B tal que

f(x) = Bx.

Assim, pelo Lema 3.2.6

f(x) = f(x1e1 + · · · + xnen).

Portanto A = B.

Será abordado mais à frente a prova que o diferencial de F em a está bem de�nido

e para tal, basta mostrar que

F ′(a) =

(∂Fi

∂xj

(a)

)= (DjFi(a)) (3.2.5)

em termos das derivadas parciais das coordenadas funcionais F1, · · · , Fm de F . Assim, se

L1 e L2 são duas aplicações lineares que satisfazem simultaneamente a Equação (3.2.3),

então cada uma teria a mesma matriz apresentada na Equação (3.2.5), o que as tornaria

a mesma aplicação linear.

Se escrevemos ∆Fa = F (a+ h) − F (a), então a Equação (3.2.3) será da forma

limh→0

∆Fa(h) − dFa(h)

|h|= 0.

Como havíamos mencionado na seção anterior, essa equação nos a�rma que a diferença

entre a variação efetiva (real) F entre a e a+ h e a variação aproximada dFa irá para zero

mais rapidamente do que h quando h tende para 0. Denotaremos a aproximação para

a variação efetiva pela diferencial por ∆Fa(h) ≈ dFa(h) ou F (a + h) ≈ F (a) + dFa(h).

Adiante, veremos que se conhecermos as derivadas parciais de F em a, então dFa(h) será

muito fácil de se calcular e esse nos dará uma boa aproximação de F (a + h) quando |h|

77

for pequeno, a Figura 3.8 exempli�ca a aproximação de F (a + h) pelo diferencial para

uma aplicação F : R2 → R3.

Figura 3.8: Aproximação pelo diferencial.


Exemplo 3.2.7 Se F : Rn → Rm é uma aplicação constante, isto é, existe b ∈ Rm tal

que F (x) = b para todo x ∈ Rn, então F é diferenciável com dFa = 0.

De fato, substituindo as informações na Equação (3.2.3), obtemos:

limh→0

F (a+ h) − F (a) − dFa(h)

|h|= lim

h→0

b− b− dFa(h)

|h|= lim

h→0

−dFa(h)

|h|.

Note que na De�nição 3.2.4 deve existir L, então tomando L = dFa = 0 mostramos que

existe e o limite é zero, logo F é diferenciável.

Exemplo 3.2.8 Se F : Rn → Rm é linear, então F é diferenciável em todo o domínio

com

dFa = F ∀a ∈ Rn.

De fato, a aplicação linear é seu próprio diferencial, pois escolhendo dFa = F temos

limh→0

F (a+ h) − F (a) − dFa(h)

|h|= lim

h→0

F (a) + F (h) − F (a) − dFa(h)

|h|

= limh→0

F (h) − dFa(h)

|h|

= limh→0

F (h) − F (h)

|h|

= limh→0

0

|h|= 0,

78

e pela De�nição 3.2.4 F é diferenciável.

Relacionaremos agora, o diferencial com a derivada direcional através do Teorema

responsável pela sua de�nição.

Teorema 3.2.9 Se F : Rn → Rm é diferenciável em a, então a derivada direcional

DvF (a) existe para todo v ∈ Rn e

DvF (a) = dFa(v).

Demonstração: Como F é diferenciável em a por hipótese, temos na Equação (3.2.3)

substituindo h = tv com t tendendo para zero:

0 = limt→0

F (a+ tv) − F (a) − dFa(tv)

|tv|= lim

t→0

F (a+ tv) − F (a) − tdFa(v)

|tv|

=1

|v|

[limt→0

F (a+ tv) − F (a)

t− dFa(v)

]

logo

DvF (a) = limt→0

F (a+ tv) − F (a)

t

existe e

DvF (a) = dFa(v).

Assim, DvF (a) existe e a igualdade DvF (a) = dFa(v) é satisfeita.

A recíproca deste Teorema é falsa. Uma função pode possuir diversas derivadas

direcionais, no entanto a função pode não ser diferenciável e para isto ocorrer, basta que

a função seja descontínua no ponto em questão, um exemplo deste caso é apresentado a

seguir.

Exemplo 3.2.10 Considere a função f : R2 → R de�nida por

f(x, y) =

x2y

x4 + y2, se (x, y) = (0, 0);

0, se (x, y) = (0, 0).

cuja representação grá�ca é dada pela Figura 3.9.

79

Figura 3.9: Grá�co de f(x, y).


Seja v = (a, b) ∈ R2 com b = 0. Então

Dvf(0, 0) = limh→0

f(ah, bh) − f(0, 0)

h

= limh→0

a2h2bh− 0

(a4h4 + b2h2)h

= limh→0

a2b

a4h+ b2=a2

b

a derivada direcional Dvf(0, 0) existe para todo v ∈ R2. Entretanto, a função f(x, y) não

é contínua em O(0, 0) e consequentemente pelo Teorema 3.2.5 f não é diferenciável. De

fato,

lim(x,y)→(0,0)

f(x, y) não existe.

Pois, consideremos C = {(x, y) ∈ R2; y = kx2} como o conjunto de curvas (pará-

bolas) que passam por O(0, 0). Assim,

lim(x,y)→

C(0,0)

f(x, y) = lim(x,kx2)→(0,0)

f(x, kx2)

= limx→0

x2kx2

x4 + k2x4

= limx→0

k

1 + k2

=k

1 + k2= 0 ∀k = 0.

80

Logo, o limite depende do coe�ciente da parábola para se aproximar de 0. Considerando

k = 1 temos que o limite é −1

2e para k = 0 o limite é 0, um absurdo pela unicidade do

limite.

O Teorema a seguir se aprofunda mais em derivadas direcionais expressando-as em

termos das derivadas parciais.

Teorema 3.2.11 Se F : Rn → Rm é diferenciável em a e v = (v1, · · · , vn), então

DvF (a) =n∑

j=1

vjDjF (a).

Demonstração: Pelo fato de F : Rn → Rm ser diferenciável no ponto a, temos pelo

Teorema 3.2.9 a seguinte igualdade

DvF (a) = dFa(v).

Então, pela linearidade dFa temos

DvF (a) = dFa(v1e1 + · · · + vnen)

= dFa(v1e1) + · · · + dFa(vnen)

= v1dFa(e1) + · · · + vndFa(en)

=n∑

j=1

vjdFa(ej).

Pelo Teorema 3.2.9,

dFa(ej) = DejF (a) = DjF (a)

e assim,

DvF (a) =n∑

j=1

vjDjF (a).

No caso da função de valores reais f : Rn → R (m = 1), o vetor

∇f (a) = (D1f (a), · · · , Dnf (a)) ∈ Rn,

cujas componentes são as derivadas parciais de f , é chamado de vetor gradiente de f em

a. Podemos então reescrever o resultado do Teorema 3.2.11 como uma dependência das

derivadas parciais, isto é

Dvf (a) = ∇f (a).v (3.2.6)

81

considerando o produto escalar usual.

No exemplo a seguir, utilizaremos a diferencial como ferramenta para aproximar o

valor de uma determinada função.

Exemplo 3.2.12 Utilize a Equação (3.2.6) e a aproximação ∆fa(h) ≈ dfa(h) para esti-

mar o valor de [(13.1)2 − (4.9)2]12 .

Consideremos a função

f(x, y) = (x2 − y2)12 ,

com a = (13, 5), cuja diferença é h =(

110, −1

10

). As derivadas parciais são:

D1f(x, y) =x

(x2 − y2)12

D2f(x, y) =−y

(x2 − y2)12

Assim, f (a) = 12, D1f (a) = 1312

e D2f (a) = −512. Reescrevendo,

∆fa(h) ≈ dfa(h)

f (a+ h) − f (a) ≈ Dhf (a)

f (a+ h) ≈ f (a) + ∇f (a).h

logo

[(13.1)2 − (4.9)2

] 12 ≈ f(13, 5) + ∇f(13, 5).

(1

10,−1

10

)

= 12 +

(13

12

)(1

10

)+

(−5

12

)(−1

10

)

= 12.15.

Nosso objetivo agora é investigar o signi�cado do vetor gradiente, sendo assim,

vamos considerar uma função diferenciável f : Rn → R e um ponto a ∈ Rn, com ∇f (a) =0. Suponha que queremos determinar a direção de máxima variação de f a partir de a.

A direção será dada pelo vetor unitário u e o ângulo entre u e ∇f (a) por θu. Então, da

Equação (3.2.6) temos,

Duf (a) = ∇f (a).u = |∇f (a)| cos θu.

Deste modo, Duf (a) será máximo quando cos θu = 1, ou seja, quando θu = 0, por

conta disto u e ∇f (a) serão de mesma direção e sentido. De modo análogo, Duf (a)

será mínimo quando cos θu = −1, ou seja, quando θu = π, então u e ∇f (a) terão a

82

mesma direção, porém sentido oposto. E assim, concluímos que |∇f (a)| e −|∇f (a)|serão, respectivamente, os valores de máximo e de mínimo na variação de f a partir de a.

Por exemplo, supondo que f (a) denota a temperatura no ponto a. É natural

pensarmos que o calor procura o frio (o quente tende a se resfriar), isso é, o �uxo de calor

percorre uma direção oposta à de maior aumento na temperatura. Isto nos sugere que a

direção do �uxo do calor em a é dada pelo vetor −∇f (a).

Exemplo 3.2.13 Dada a função temperatura T : R3 → R de�nida por

T (x, y, z) =1

x2 + y2 + z2.

Determine a trajetória descrita por uma partícula que parte de a = (2,−3, 3) que necessita

aquecer-se o mais rápido possível.

Calculemos as derivadas parciais da função temperatura aplicadas em a.

D1T (a) = − 4

(4 + 9 + 9)2 = − 2

242

D2T (a) =6

(4 + 9 + 9)2 =3

242

D3T (a) = − 6

(4 + 9 + 9)2 = − 3

242

Assim, a trajetória é descrita por ∇T (a) =

(− 2

242,

3

242,− 3

242

).

Se ∇f (a) = 0, então a é chamado de ponto crítico de f . De fato, se f é uma

função diferenciável de valores reais de�nido no conjunto aberto D ⊂ Rn e f atinge um

máximo ou mínimo local no ponto a ∈ D, então a é um ponto crítico de f . Para a função

gi(x) = f(a1, · · · , ai−1, x, ai+1, · · · , an) de�nida no intervalo aberto I ⊂ R e ai ∈ I com

máximo ou mínimo local em ai, então Dif (a) = g′i(ai) = 0.

Podemos reescrever a Equação (3.2.6) como uma versão de várias variáveis da

equação df =

(df

dx

)dx, para isso, tomemos x1, · · · , xn como coordenadas funcionais na

função identidade xi : Rn → R de�nido por xi(p1, · · · , pn) = pi, i = 1, · · · , n. Então, xi é

uma função linear, de modo que

dxia(h) = xi(h) = hi ∀a ∈ Rn.

Se a função f : Rn → R é diferenciável em a, então o Teorema 3.2.9, o Teorema 3.2.11 e

83

a Equação (3.2.6) nos garantem a seguinte relação de igualdade entre as funções lineares.

dfa(h) = Dhf (a)

= ∇f (a).h

=n∑

i=1

Dif (a)hi

=n∑

i=1

Dif (a)dxia(h).

Se suprimirmos o índice a e escrevermos∂f

∂xiao invés de Dif (a) obtemos a seguinte

fórmula

df =∂f

∂xidxi + · · · +

∂f

∂xndxn. (3.2.7)

A aplicação a → dfa que associa cada ponto a ∈ Rn na função linear dfa : Rn → R, échamada forma diferencial e a Equação (3.2.7) é a razão histórica para esta terminologia.

Agora, aplicaremos o Teorema 3.2.11 para concluir o cálculo da matriz derivada

F ′(a). Para tal, consideremos o seguinte Lema que trata do diferencial de suas compo-

nentes funcionais.

Lema 3.2.14 A aplicação F : Rn → Rm é diferenciável em a se, e somente se, cada uma

de suas componentes funcionais F 1, · · · , Fm for diferenciável em a, e

dFa = (dF 1a , · · · , dFm

a ).

Demonstração:

(⇒) De acordo com a De�nição 3.2.4 temos,

0 = limh→0

F (a+ h) − F (a) − L(h)

|h|

= limh→0

F (a+ h) − F (a) − dFa(h)

|h|= lim

h→0

[(F 1(a+ h), · · · , Fm(a+ h)) − (F 1(a), · · · , Fm(a)) − (dF 1

a (h), · · · , dFma (h))

] 1

|h|

= limh→0

(F 1(a+ h) − F 1(a) − dF 1

a (h)

|h|, · · · , F

m(a+ h) − Fm(a) − dFma (h)

|h|

)

=

(limh→0

F 1(a+ h) − F 1(a) − dF 1a (h)

|h|, · · · , lim

h→0

Fm(a+ h) − Fm(a) − dFma (h)

|h|

)

84

igualando componente a componente,

0 = limh→0

F 1(a+ h) − F 1(a) − dF 1a (h)

|h|...

0 = limh→0

Fm(a+ h) − Fm(a) − dFma (h)

|h|

Ou seja, cada uma de suas componentes funcionais F 1, · · · , Fm são diferenciáveis em a e

dFa = (dF 1a , · · · , dFm

a ).

pois cada componente de dFa é linear.

(⇐) De modo análogo provamos a volta.

Teorema 3.2.15 Se a aplicação F : Rn → Rm é diferenciável em a, então a matriz F ′(a)

de dFa é

F ′(a) = (DjFi(a)).

Isto é, DjFi(a) é o elemento da i-ésima linha e j-ésima coluna de F ′(a), note que essa

matriz é a matriz de F ′(a) em relação as bases canônicas de Rn e Rm.

F ′ =

∂F 1

∂x1

· · · ∂F 1

∂xn...

...∂Fm

∂x1

· · · ∂Fm

∂xn

.

Demonstração: Vamos utilizar o Lema 3.2.14 e o Teorema 3.2.11 para provar essa

igualdade. Assim,

dFa(v) =

dF 1a (v)...

dFma (v)

=

∑nj=1DjF

1(a)vj

...∑nj=1DjF

m(a)vj

= (DjFi(a))

v1

...

vn

.

Portanto, dFa(v) = F ′(a).v, como era esperado.

85

De�nição 3.2.16 Seja D um subconjunto de Rm. Dizemos que D é um conjunto aberto

se para todo ponto a ∈ D existe r > 0 tal que para todo v ∈ Rm com |v − a| < r tivermos

que v ∈ D.

Exemplo 3.2.17 O conjunto

D = {(x, y) ∈ R2 : 1 < x2 + y2 < 9}.

é aberto.

Consideremos a Figura 3.10 como ilustração deste exemplo.

Figura 3.10: Representação grá�ca do conjunto aberto.


De�nição 3.2.18 A aplicação F : Rn → Rm é dita continuamente diferenciável em a se

todas as derivadas parciais D1F, · · · , DnF existem em cada ponto de um conjunto aberto

que contém a e são contínuas em a.

Finalmente podemos formular a condição su�ciente para diferenciabilidade.

Teorema 3.2.19 Se F é continuamente diferenciável em a, então F é diferenciável em

a.

Demonstração: Pelo Lema 3.2.14, basta considerarmos uma função continuamente

diferenciável de valores reais f : Rn → R. Seja h = (h1, · · · , hn) com h0 = 0 e hi =

(h1, · · · , hi, 0, · · · , 0), i = 1, · · · , n. Então,

f (a+ h) − f (a) = f (a+ h) +[f (a+ h1) − f (a+ h1)

]+ · · · +

+[f (a+ hn−1) − f (a+ hn−1)

]− f (a+ h0).

86

Como h− hn = 0, reajustando os termos, temos

f (a+ h) − f (a) = f (a+ h1) − f (a+ h0) + f (a+ h2) − f (a+ h1) + · · · +

+f (a+ hn) − f (a+ hn−1)

=n∑

i=1

[f (a+ hi) − f (a+ hi−1)

].

O Teorema do valor médio para uma única variável (Teorema 2.2.14) nos dá

f (a+ hi) − f (a+ hi−1) = f(a1 + h1, · · · , ai−1 + hi−1, ai + hi,

ai+1, · · · , an) − f(a1 + h1, · · · , ai−1

+hi−1, ai, · · · , an)

= Dif(a1 + h1, · · · , ai−1 + hi−1, ci,

ai+1, · · · , an)hi

para algum ci ∈ (ai, ai + hi), desde que Dif seja a derivada da função

g(x) = f(a1, · · · , ai−1, x, ai+1, · · · , an).

Portanto, f (a+ hi) − f (a+ hi−1) = hiDif (bi) para algum ponto bi que se aproxima de a

quando h → 0. Assim,

limh→0

|f (a+ h) − f (a) −∑ni=1Dif (a)hi|

|h|= lim

h→0

|∑ni=1

[Dif (bi) −Dif (a)

]hi|

|h|

≤ limh→0

n∑

i=1

|Dif (bi) −Dif (a)| |hi||h|

≤ limh→0

n∑

i=1

|Dif (bi) −Dif (a)|

= 0

conforme desejado, uma vez que cada bi → a quando h → 0 e por hipótese cada Dif é

contínua em a.

Resumidamente, os teoremas que apresentamos nesta seção nos deram uma boa

base para a diferenciabilidade de funções de várias variáveis. Para derivadas direcionais

o Teorema 3.2.11 nos garante uma expressão mais agradável de se calcular, utilizando

derivadas parciais. Da mesma forma o Teorema 3.2.15 descreve a matriz derivada. Por

�m, o Teorema 3.2.19 nos fornece um teste e�caz para a diferenciabilidade de uma função

em termos de suas derivadas parciais, eliminando, na maioria dos casos, a necessidade de

veri�car se a função satisfaz a de�nição de diferenciabilidade. Conforme Edwards (1973),

cada função continuamente diferenciável é diferenciável e cada função diferenciável tem

87

derivadas direcionais.

No início desta seção apresentamos uma motivação para se estudar diferencia-

bilidade de funções F : Rn → Rm. Desta forma conclui-se esta seção com um exemplo

aplicando os resultados que obtivemos até o momento para justamente determinar o plano

tangente à superfície S de F .

Exemplo 3.2.20 Considere a aplicação F : R2 → R4 de�nida por

F (x1, x2) = (x2, x1, x1x2, x22 − x2

1).

Determine o plano tangente à imagem S de F no ponto F (a) = (2, 1, 2, 3), isto é, a =

(1, 2).

Temos que F é continuamente diferenciável e pelo Teorema 3.2.19, F é diferenciável. Pelo

Teorema 3.2.15, a matriz da aplicação linear dFa : R2 → R4 é a matriz 4 × 2

F ′(a) =

0 1

1 0

2 1

−2 4

A imagem La de dFa é o subspaço de R4 gerado pelas colunas b1 = (0, 1, 2,−2)

e b2 = (1, 0, 1, 4) de F ′(a). Uma vez que b1 e b2 sejam linearmente independentes, La é

bi-dimensional. A �m de escrever La na forma matricial Ax = 0, precisamos encontrar

dois vetores linearmente independentes a1 e a2 ortogonais aos vetores b1 e b2, esses serão

os vetores linha da matriz A. Encontremos os vetores a1 e a2 resolvendo as equações

x1 + x3 + 4x4 = 0 (b2.x = 0),

x2 + 2x3 − 2x4 = 0 (b1.x = 0);

por exemplo, a1 = (5, 0,−1,−1) e a2 = (0, 10,−4, 1).

O desejado plano tangente T à S no ponto F (a) = (2, 1, 2, 3) é agora a translação

paralela de La para F (a). Isto é, o plano T é o conjunto de todos os pontos x ∈ R4 tal

que A(x− F (a)) = 0,

(5 0 −1 −1

0 10 −4 1

)

x1 − 2

x2 − 1

x3 − 2

x4 − 3

=

(0

0

).

88

Mediante simpli�cações, obtemos as duas equações

5x1 − x3 − x4 = 5,

10x2 − 4x3 + x4 = 5.

O conjunto solução de cada uma dessas equações é um hiperplano tri-dimensional em R4,

já a interseção destes dois hiperplanos nos garantem o plano T bi-dimensional desejado.

3.3 REGRA DA CADEIA

Para dar início a esta seção consideraremos a composição H = G ◦ F de duas

aplicações diferenciáveis, F : Rn → Rm e G : Rm → Rk. Segundo Edwards (1973), toma-

remos por exemplo F (x) ∈ Rm como sendo o vetor de preços de m produtos fabricados a

partir de n matérias primas de uma fábrica cujo custo é o vetor x ∈ Rn e a composição

H(x) = G(F (x)) sendo o vetor preço resultante de k produtos �nais fabricados em uma

segunda fábrica a partir dos m produtos intermediários. Queremos estimar a variação

∆Ha(h) = H (a + h) − H (a) nos preços dos produtos �nais resultantes da mudança de

a para a + h no custo das matérias primas. Utilizaremos as aproximações diferenciais

∆F ≈ dF e ∆G ≈ dG não nos preocupando inicialmente no quão aproximado isto é.

Assim,

∆Ha(h) = H (a+ h) −H (a)

= G(F (a+ h)) −G(F (a))

= G(F (a) + [F (a+ h) − F (a)]) −G(F (a))

= ∆GF (a)(F (a+ h) − F (a))

≈ dGF (a)(∆Fa(h))

≈ dGF (a)(dFa(h)).

Através desta argumentação sugere-se que a regra da cadeia de várias variáveis seja da

forma dHa = dGF (a) ◦ dFa. Assim, apresentamos o seguinte Teorema, seguindo o exposto

em Edwards (1973).

Teorema 3.3.1 (Regra da cadeia) Sejam U e V subconjuntos abertos de Rn e Rm

respectivamente. Se as aplicações F : U → Rm e G : V → Rk são diferenciáveis em

a ∈ U e F (a) ∈ V respectivamente, então a composição H = G ◦F é diferenciável em a e

dHa = dGF (a) ◦ dFa

(Composição de

aplicações lineares

). (3.3.1)

89

Em termos de suas derivadas, temos

H ′(a) = G′(F (a)).F ′(a)

(Multiplicação

de matrizes

). (3.3.2)

Ou seja, o diferencial da composição é a composição dos diferenciais e a derivada da com-

posição é o produto das derivadas.

Demonstração: Pela De�nição 3.2.3 devemos mostrar que

limh→0

H (a+ h) −H (a) − dGF (a) ◦ dFa(h)

|h|= 0.

Se de�nirmos

φ(h) =F (a+ h) − F (a) − dFa(h)

|h|h = 0 (3.3.3)

e

ψ(k) =G(F (a) + k) −G(F (a)) − dGF (a)(k)

|k|k = 0, (3.3.4)

então pelo fato de que F e G são diferenciáveis em a e F (a) respectivamente a De�nição

3.2.4 nos dá que

limh→0

φ(h) = limk→0

ψ(k) = 0.

Logo,

H (a+ h) −H (a) = G(F (a+ h)) −G(F (a))

= G(F (a) + (F (a+ h) − F (a))) −G(F (a))

= dGF (a)(F (a+ h) − F (a)) + |F (a+ h) − F (a)|ψ(F (a+ h) − F (a)),

utilizando a Equação (3.3.4) com k = F (a+ h)−F (a). Usando a Equação (3.3.3) obtemos

dFa(h) + |h|φ(h) = F (a+ h) − F (a), assim (pela linearidade)

H (a+ h) −H (a) = dGF (a)(dFa(h) + |h|φ(h)) + |F (a+ h) − F (a)|ψ(F (a+ h) − F (a))

= dGF (a) ◦ dFa(h) + |h|dGF (a)(φ(h)) +

|h|∣∣∣∣∣dFa

(h

|h|

)+ φ(h)

∣∣∣∣∣ψ(F (a+ h) − F (a)).

90

Logo,

H (a+ h) −H (a) − dGF (a) ◦ dFa(h)

|h|= dGF (a)(φ(h)) + (3.3.5)

∣∣∣∣∣dFa

(h

|h|

)+ φ(h)

∣∣∣∣∣ψ(F (a+ h) − F (a)).

Porém, limh→0

dGF (a)(φ(h)) = 0 pois limh→0

φ(h) = 0 e a aplicação linear dGF (a) é contínua.

Além disso, limh→0

ψ(F (a+h)−F (a)) = 0 porque F é contínua em a e limk→0

ψ(k) = 0. Por �m,

o número

∣∣∣∣∣dFa

(h

|h|

)+ φ(h)

∣∣∣∣∣ se mantém limitado, pois

(h

|h|

)∈ Sn−1 e os componentes

funcionais da aplicação linear dFa são contínuos e portanto limitados em Sn−1 ⊂ Rn.

Portanto, o limite da Equação (3.3.5) é zero como desejávamos mostrar inicial-

mente. A Equação (3.3.2) segue imediatamente da Equação (3.3.1), uma vez que a matriz

da composição de duas aplicações é o produto das suas matrizes.

Dando continuidade, listaremos através de exemplos trabalhados em Edwards

(1973), algumas fórmulas típicas de regra da cadeia obtidas igualando componentes da

Equação (3.3.2) matricial para vários valores de n, m e k.

Exemplo 3.3.2 Se n = k = 1 teremos a aplicação diferenciável R f→ Rm g→ R, então

h = g ◦ f : R → R é diferenciável com

h′(t) = g′(f(t))f ′(t).

Aqui g′(f(t)) é uma matriz linha 1 ×m e f ′(t) é uma matriz columa m× 1. Em termos

do gradiente de g, temos

h′(t) = ∇g(f(t)).f ′(t) (3.3.6)

Esta é uma generalização do fato de queDvg(a) = ∇g(a).v conforme a Equação (3.2.6). Sef(t) for o vetor posição de uma partícula em movimento em Rm e g a função temperatura

em Rm, então a Equação (3.3.6) nos dará a taxa de variação da temperatura da partícula.

Em particular, esta taxa de variação depende apenas do vetor velocidade da partícula.

Em termos das componentes funcionais f1, · · · , fm de f e das derivadas parciais

de g, a Equação (3.3.6) torna-se

dh

dt=

∂g

∂x1

∂f1

∂t+

∂g

∂x2

∂f2

∂t+ · · · +

∂g

∂xm

∂fm

∂t.

91

Se escrevermos xi = fi(t) e u = g(x), então a equação acima assume a forma

facilmente lembrada

du

dt=

∂u

∂x1

dx1

dt+

∂u

∂x2

dx2

dt+ · · · +

∂u

∂xm

dxm

dt.

Exemplo 3.3.3 Seja as aplicações diferenciáveis F : R2 → R3, G : R3 → R2 e a apli-

cação H : R2 → R2 dada por H = G ◦ F , então a regra da cadeia toma a seguinte

forma:

(D1H1(a) D2H1(a)

D1H2(a) D2H2(a)

)=

(D1G1(F (a)) D2G1(F (a)) D3G1(F (a))

D1G2(F (a)) D2G2(F (a)) D3G2(F (a))

)D1F1(a) D2F1(a)

D1F2(a) D2F2(a)

D1F3(a) D2F3(a)

.

Se escrevermos F (s, t) = (x, y, z) e G(x, y, z) = (u, v) esta equação poderá ser reescrita

∂H1

∂s

∂H1

∂t

∂H2

∂s

∂H2

∂t

=

∂G1

∂x

∂G1

∂y

∂G1

∂z

∂G2

∂x

∂G2

∂y

∂G2

∂z

∂F1

∂s

∂F1

∂t

∂F2

∂s

∂F2

∂t

∂F3

∂s

∂F3

∂t

.

Por exemplo, temos

∂H1

∂t=∂G1

∂x

∂F1

∂t+∂G1

∂y

∂F2

∂t+∂G1

∂z

∂F3

∂t.

Escrevendo

∂u

∂s= D1H1(s, t),

∂u

∂x= D1G1(F (s, t)),

∂x

∂t= D2F1(s, t) etc.,

para percorrer todo o caminho com as variáveis que representam as funções, obtemos as

fórmulas

∂u

∂t=∂u

∂x

∂x

∂t+∂u

∂y

∂y

∂t+∂u

∂z

∂z

∂t

e

∂v

∂s=∂v

∂x

∂x

∂s+∂v

∂y

∂y

∂s+∂v

∂z

∂z

∂s.

O padrão natural formal das fórmulas da regra da cadeia expressa em termos de variáveis

como visto acima, muitas vezes compensa a sua desvantagem de não conter referências

explícitas para os pontos em que as várias derivadas são avaliadas.

92

Exemplo 3.3.4 Seja T : R2 → R2 a aplicação de coordenadas polares de�nida por

T (r, θ) = (r cos θ, r sin θ). Dada uma função diferenciável f : R2 → R, de�nimos g = f ◦Tpor g(r, θ) = f(r cos θ, r sin θ). Então, a regra da cadeia é dada por

(∂g

∂r

∂g

∂θ

)=

(∂f

∂x

∂f

∂y

)(cos θ −r sin θ

sin θ r cos θ

).

Logo,

∂g

∂r=∂f

∂xcos θ +

∂f

∂ysin θ,

∂g

∂θ= −∂f

∂xr sin θ +

∂f

∂yr cos θ.

Desta forma expressamos as derivadas parciais de g em termos das derivadas de f .

O mesmo pode ser feito para as derivadas parciais de segunda ordem. Dada uma

aplicação diferenciável F : Rn → Rm, a derivada parcial DiF é novamente uma aplicação

de Rn em Rm. Se é diferenciável em a, podemos considerar a segunda derivada parcial

DjDiF (a) = Dj(DiF )(a),

cuja notação clássica é

DjDiF =∂2F

∂xj∂xi

.

Finalizado esta parte do conteúdo sobre derivadas no espaço Rn, vamos agora

avançar um pouco no estudo das derivadas em espaços normados em nível introdutório,

completando nosso passeio por esse amplo assunto de derivadas, mostrando algumas faces

da derivada que poucos conhecem.

93

Capítulo 4

INTRODUÇÃO À DERIVADA EM

ESPAÇOS NORMADOS

Nos capítulos anteriores exploramos o cálculo diferencial de uma e de várias variá-

veis reais no espaço Rn com a norma euclidiana. O objetivo neste capítulo é introduzir

o conceito de derivadas em espaços normados apresentando a derivada de Fréchet e a de

Gâteaux.

De�nição 4.0.5 Seja X um espaço vetorial sobre o corpo K. Uma norma em X é uma

função ||.|| : X → R+ que satisfaz

1. ||x|| = 0 ⇐⇒ x = 0;

2. ||λx|| = |λ|||x|| para todo x ∈ X e todo λ ∈ K;

3. ||x+ y|| ≤ ||x|| + ||y|| para quaisquer x, y ∈ X.

Um espaço normado é um espaço vetorial X munido da norma ||.||.

Representaremos os espaços normados no campo real por X e Y . Se X = Rn e

Y = Rm, com Rn,Rm sendo os espaços vetoriais reais com a norma euclidiana, então os

resultados a seguir serão equivalentes aos estudados no capítulo anterior.

4.1 CONCEITOS INICIAIS

Seja a um ponto interior1 do subconjunto aberto D de X e F : D ⊆ X → Y uma

aplicação.

De�nição 4.1.1 Se o limite

limλ→0+

F (a+ λh) − F (a)

λ

1Consideramos ponto interior um ponto de acumulação de um conjunto aberto.

94

existir, o denominaremos de derivada de F no ponto a segundo a direção h e o denotare-

mos por F ′(a;h).

De�nição 4.1.2 Suponhamos que para todo h ∈ X a derivada F ′(a;h) segundo a direção

h existe. A aplicação δ+F (a; .) : X → Y de�nida por

δ+F (a;h) = F ′(a;h)

é chamada primeira variação da aplicação F no ponto a.

Nesse caso, diremos que a aplicação F possui uma primeira variação no ponto a.

De�nição 4.1.3 Suponhamos que F possui no ponto a uma primeira variação e que

exista um operador linear L : X → Y tal que

δ+F (a;h) = L(h).

Então, o operador L é chamado derivada de Gâuteaux da aplicação F no ponto a e denota-

se por F ′G(a).

Assim, F ′G(a) é uma transformação linear de X em Y , tal que para cada h ∈ X

tem-se a relação

F (a+ λh) = F (a) + λF ′G(a)(h) + o(λ)

ondeo(λ)

λ→ 0 quando λ → 0+.

Flett (1980) a�rma que não há uma notação padrão e terminologia para a derivada

de Gâteaux, ou variação de Gâteaux como aparece am algumas obras. As notações mais

comuns para a derivada de Gâteaux são δF (a;h) e V F (a;h).

De�nição 4.1.4 Suponhamos que numa vizinhança do ponto interior a, a aplicação F

satisfaça

limh→0

F (a+ h) − F (a) − L(h)

||h|| = 0, (4.1.1)

onde L é uma transformação linear de X em Y , então F é dita Fréchet diferenciável e L

é chamada de diferencial de Fréchet de F em a, denotada por dF (a).

Observações:

1. Em espaço normado, h → 0 se, e somente se, ||h− 0|| → 0.

95

2. A linearidade da diferencial de Fréchet segue diretamente da De�nição 4.1.4, pode-

mos escrever,

d(cF )(a) = cdF (a),

d(F +G)(a) = dF (a) + dG(a).

3. Se D é um conjunto aberto em X, uma função F sendo Fréchet diferenciável em

cada ponto de D será dita Fréchet diferenciável em D. Também diremos que F é

de classe C1 em um conjunto aberto D ⊆ X se dF é contínua em D.

4. Se F é Fréchet diferenciável em a, então F é Fréchet diferenciável em a quando

as normas em X e Y são substituidas por normas equivalentes. Em particular,

se X e Y são de dimensão in�nita, a propriedade de diferenciabilidade Fréchet é

independente da escolha das normas em X e Y .

Para uma melhor compreensão das de�nições enunciadas anteriormente, iremos

fornecer na seção seguinte, alguns resultados e exemplos.

Proposição 4.1.5 Se F é Fréchet diferenciável no ponto interior a, então a derivada

F ′(a) é única.

Demonstração: Suponhamos que existam L1(h) e L2(h) tal que,

limh→0

F (a+ h) − F (a) − L1(h)

||h|| − F (a+ h) − F (a) − L2(h)

||h|| = 0

se, e somente se

limh→0

L1(h) − L2(h)

||h|| = 0

Fixemos v = 0 e tomemos h = tv. Assim,

limt→0

t(L1(v) − L2(v))

t||v|| = 0

que implica em

L1(v) − L2(v)

||v|| = 0 ⇒ L1(v) = L2(v) ∀v ∈ X.

Portanto, L1 = L2.

96

4.2 RESULTADOS

Teorema 4.2.1 Se F é Fréchet diferenciável em a, então F é contínua em a.

Demonstração: Sabemos que F é Fréchet diferenciável em um ponto interior a, então

limh→0

F (a+ h) − F (a) − L(h)

||h|| = 0,

ou, equivalentemente

F (a+ h) = F (a) + L(h) + o(||h||) (4.2.2)

onde limh→0

o(||h||)||h|| = 0. Reescrevendo a Equação (4.2.2)

F (a+ h) = F (a) + L(h) +o(||h||)||h|| ||h||

Aplicando o limite em ambos os lados, obtemos

limh→0

F (a+ h) = limh→0

[F (a) + L(h) +

o(||h||)||h|| ||h||

]

= F (a) + limh→0

L(h) + limh→0

[o(||h||)||h|| ||h||

]

= F (a) + L(0) + limh→0

o(||h||)||h|| lim

h→0||h||

= F (a) + 0 + 0.0

= F (a).

Portanto, F é contínua em a.

Teorema 4.2.2 Se existirem as derivadas descritas nas De�nições 4.1.1 a 4.1.4, então

obtemos a seguinte cadeia de implicações

4.1.4 =⇒ 4.1.3 =⇒ 4.1.2 =⇒ 4.1.1

A veracidade das implicações podem ser comprovadas diretamente a partir das

de�nições. Veremos a seguir que não podemos ter, em geral, as implicações inversas.

Exemplo 4.2.3 Considere a aplicação F : R2 → R, de�nida por

F (x, y) =

1, x > 0 e y > 0

x2, x ≤ 0 e ∀y−xy, x ≥ 0 e y ≤ 0

97

Tome a = (0, 0) e h1 = (1, 0)

limλ→0+

F (a+ λh) − F (a)

λ= lim

λ→0+

F ((0, 0) + λ(1, 0)) − F (0, 0)

λ

= limλ→0+

F (λ, 0) − F (0, 0)

λ= 0.

Agora, para o mesmo a, tome a direção h2 = (1, 1)

limλ→0+

F (a+ λh) − F (a)

λ= lim

λ→0+

F ((0, 0) + λ(1, 1)) − F (0, 0)

λ

= limλ→0+

F (λ, λ) − F (0, 0)

λ

= limλ→0+

1

λ= +∞.

Assim, existe F ′(a, h1) mas não existe F ′(a, h2). Portanto, F não possui uma primeira

variação no ponto a e consequentemente a De�nição 4.1.1 ; De�nição 4.1.2.

Exemplo 4.2.4 Considere F : R → R de�nida por F = |x|.

Temos que,

δ+F (0;h) = limλ→0+

F (λh) − F (0)

λ

= limλ→0+

|λh| − |0|λ

= limλ→0+

λ|h|λ

= |h|.

Portanto, F possui primeira variação em a = 0 e claramente δ+F (0, h) é não linear.

Assim, De�nição 4.1.2 ; De�nição 4.1.3.

Este mesmo exemplo mostra que a continuidade num ponto não implica na dife-

renciabilidade segundo Gâteaux e mais ainda na diferenciabilidade de Fréchet.

Exemplo 4.2.5 Considere F : R2 → R de�nida por

F (x1, x2) =

{1, se x1 = x2

2 e x2 > 0

0, nos outros casos.

F é diferenciável segundo Gâteaux no ponto a = (0, 0).

98

De fato, temos

F ′((0, 0), (h1, h2)) = limλ→0+

F ((0, 0) + λ(h1, h2)) − F (0, 0)

λ

= limλ→0+

F (λh1, λh2)

λ= 0,

pois se acontecesse F (λh1, λh2) = 1, teríamos h1 = λh22, h2 > 0 com λ constante, o que

é uma contradição. Assim F é Gâteaux diferenciável no ponto a e F ′G(0, 0) = 0. É claro

que F é descontínua no ponto a, logo F não é Fréchet diferenciável em a, logo De�nição

4.1.3 ; De�nição 4.1.4.

Assim, podemos notar que a derivada de Gâuteaux ou a de Fréchet é, por de�nição,

uma aplicação linear de X em Y .

Na seção seguinte, apresentaremos uma séries de exemplos das derivadas de Fréchet

de modo a melhorar a compreensão deste conteúdo.

4.3 EXEMPLOS DA DERIVADA DE FRÉCHET

Apresentaremos a seguir uma série de exemplos envolvendo a derivada de Fréchet,

cujo objetivo é apresentar a solução do método dos mínimos quadrados.

Exemplo 4.3.1 Se F : D ⊆ X → Y é uma aplicação constante, então F é Fréchet

diferenciável em cada ponto interior a de D e dF (a) é uma função nula de X em Y .

Temos que F é uma aplicação constante, isto é, existe b ∈ Y tal que F (x) = b para todo

x ∈ D. Pela Equação (4.1.1) obtemos

limh→0

F (a+ h) − F (a) − L(h)

||h|| = limh→0

b− b− L(h)

||h|| = limh→0

−L(h)

||h||

Tomando L(h) = 0 temos limh→0−L(h)

||h|| = 0. Como L é única, ela deve ser a

derivada de Fréchet de F .

Exemplo 4.3.2 Se F : D ⊆ X → Y é uma aplicação linear, então F Fréchet diferenciá-

vel em cada ponto interior a de D e dF = F .

Pela de�nição da diferenciabilidade de Fréchet,

limh→0

F (a+ h) − F (a) − L(h)

||h|| = limh→0

F (a) + F (h) − F (a) − L(h)

||h||= lim

h→0

F (h) − L(h)

||h|| ,

99

tomando L(h) = F (h) temos,

limh→0

F (a+ h) − F (a) − L(h)

||h|| = limh→0

F (h) − F (h)

||h|| = 0. (4.3.3)

Como L é única, então a derivada de Fréchet dF é F .

Exemplo 4.3.3 Se G : Rn → R é uma aplicação de�nida por G(x) = ⟨Ax, b⟩, onde

A é uma matriz m × n, x, b ∈ Rn e ⟨., .⟩ é o produto escalar canônico de Rn, então

G′(a)(h) = ⟨Ah, b⟩.

De acordo com a De�nição 4.1.4 temos:

limh→0

G(a+ h) −G(a) − L(h)

||h|| = limh→0

⟨A(a+ h), b⟩ − ⟨Aa, b⟩ − L(h)

||h||= lim

h→0

⟨Aa+ Ah, b⟩ − ⟨Aa, b⟩ − L(h)

||h||= lim

h→0

⟨Aa, b⟩ + ⟨Ah, b⟩ − ⟨Aa, b⟩ − L(h)

||h||= lim

h→0

⟨Ah, b⟩ − L(h)

||h||

Tomando G′(a)(h) = L(h) = ⟨Ah, b⟩ segue que

limh→0

G(a+ h) −G(a) − L(h)

||h|| = limh→0

⟨Ah, b⟩ − ⟨Ah, b⟩||h|| = 0

Exemplo 4.3.4 Se H : Rn → R é uma aplicação de�nida por H(x) = ⟨Ax,Ax⟩, onde Aé uma matriz m× n, então H ′(a)(h) = 2⟨Aa,Ah⟩.

limh→0

H(a+ h) −H(a) − L(h)

||h|| = limh→0

⟨A(a+ h), A(a+ h)⟩ − ⟨Aa,Aa⟩ − L(h)

||h||= lim

h→0

⟨Aa+ Ah,Aa+ Ah⟩ − ⟨Aa,Aa⟩ − L(h)

||h||

= limh→0

(⟨Aa,Aa⟩ + ⟨Ah,Ah⟩

||h||⟨Ah,Aa⟩ + ⟨Aa,Ah⟩ − ⟨Aa,Aa⟩ − L(h)

||h||

)

= limh→0

⟨Ah,Ah⟩ + 2⟨Aa,Ah⟩ − L(h)

||h||

100

Tomando H ′(a)(h) = L(h) = 2⟨Aa,Ah⟩ segue que

limh→0

H(a+ h) −H(a) − L(h)

||h|| = limh→0

⟨Ah,Ah⟩ + 2⟨Aa,Ah⟩ − 2⟨Aa,Ah⟩||h||

= limh→0

⟨Ah,Ah⟩||h||

= limh→0

||Ah||2||h|| = 0.

Note que a última igualdade se obtém do fato de que se ||h|| =√

⟨h, h⟩, então a

norma de A induzida pela norma euclidiana ||.|| é dada por ||A|| = maxx=0

||Ax||||x|| . A norma

||A|| de�nida desta maneira é de fato uma norma em Rn×n e satisfaz

||A|| > 0 se A = 0

||αA|| = α||A||||A+B|| ≤ ||A|| + ||B||

||AB|| ≤ ||A||.||B||, ∀A,B ∈ Rn×n.

Se ||A|| é induzida pela norma vetorial ||x||, então temos a seguinte relação:

||Ah|| ≤ ||A||.||h||.

Portanto,

0 ≤ ||Ah||2||h|| =

⟨Ah,Ah⟩||h|| =

⟨ATAh, h⟩||h|| ≤ ||ATAh||.||h||

||h|| = ||ATAh|| ≤ ||ATA||.||h||

Assim,

0 ≤ limh→0

||Ah||2||h|| ≤ lim

h→0||ATA||.||h|| = 0

o que implica em limh→0

||Ah||2||h|| = 0.

Exemplo 4.3.5 Considere o sistema Ax = b onde A ∈ Rm×n, b ∈ Rm e m > n. Supondo

que o posto de A é n, determine a solução de quadrados mínimos do sistema Ax = b, ou

seja, encontre minx∈Rn

||Ax− b||22.

Considere ϕ(x) =1

2||Ax− b||22, então basta calcular min

x∈Rnϕ(x).

ϕ(x) =1

2⟨Ax− b, Ax− b⟩ =

1

2[⟨Ax,Ax⟩ − 2⟨Ax, b⟩ + ⟨b, b⟩]

101

⇒ ϕ′(x)(h) =1

2[2⟨Ax,Ah⟩ − 2⟨Ah, b⟩ + 0]

= ⟨Ax,Ah⟩ − ⟨Ah, b⟩= ⟨ATAx, h⟩ − ⟨h,AT b⟩= ⟨ATAx, h⟩ − ⟨AT b, h⟩= ⟨ATAx− AT b, h⟩

ou seja,

ϕ′(x)(h) = 0 ⇒ ATAx− AT b = 0

⇒ ATAx = AT b

⇒ x = (ATA)−1AT b.

Portanto, existe(ATA)−1 pois posto ATA = posto A = n. Implica que x = (ATA)

−1AT b

é ponto de mínimo global, pois ϕ é convexa. A equação ATAx−AT b = 0 é conhecida nos

cursos de ciências exatas como sistema de equações normais.

De acordo com as De�nições apresentadas neste capítulo, toda função F Fréchet

diferenciável, também é Gâteaux diferenciável. Assim, todos as derivadas dos exemplos

apresentados nesta seção também são exemplos de derivadas de Gâteaux. No caso de

espaços normados, a derivada de Gateaux corresponde a derivada direcional e a derivada

de Fréchet corresponde a derivada forte vistas no espaço Rn.

102

CONCLUSÃO

O presente trabalho visou explorar de forma introdutória a evolução de uma das

ferramentas mais aplicáveis da Matemática que é a derivada. Para tornar isso possível,

houve a necessidade de ingressar no estudo dos conteúdos de História da Matemática,

Cálculo diferencial e Álgebra linear, vistos na maioria dos cursos de ciências exatas. No

estudo de cálculo diferencial estuda-se a derivada e sua interpretação geométrica que nada

mais é do que a inclinação da reta tangente a uma curva. A partir da tangente a uma

curva pode-se inferir várias características dessa curva, como concavidade, crescimento,

decrescimento, pontos de máximos e mínimos, etc. A pesquisa por tangentes a curvas é

muito antiga, remontando aos gregos tendo como de partida a tangente ao circulo com a

de�nição dada por Euclides em �Os Elementos�. Ao decidirmos pelo estudo das derivadas

tornou-se evidente iniciar o estudo pelas origens das tangentes e sua evolução até chegar

nas derivadas. O primeiro capítulo do nosso trabalho foi de longe o mais trabalhoso

de se construir e o principal motivo foi a escassez de material sobre as tangentes antes

de Newton e Leibniz. Este estudo histórico foi essencial para o trabalho pois transmite

ao leitor as di�culdades que matemáticos como Descartes e Fermat tiveram para obter

tangentes às curvas. Este ponto de vista histórico sobre tangentes permitiu-nos observar

que a derivada não surgiu de uma hora para a outra, ela nasceu dos trabalhos de muitos

matemáticos ao longo da história.

Após esta importante introdução histórica iniciamos o estudo da derivada de fun-

ções de uma variável real para que pudéssemos visualizar a passagem da derivada como

ente geométrico para algo mais abstrato que é a derivada de uma função. Nossa aborda-

gem deste conteúdo não foi tão rigorosa quanto gostaríamos que fosse pois só agora com

a disciplina de Análise real no último semestre do curso de Licenciatura em Matemática,

que muitos conceitos �caram mais claros sendo possível aprofundá-los. Contudo nosso ob-

jetivo foi cumprido pois fornecemos a de�nições e os resultados mais interessantes desse

conteúdo.

O terceiro capítulo foi o que mais acrescentou em minha formação, pois nele abor-

damos o cálculo diferencial de uma forma, que ao meu ver, foi muito diferente do que

havíamos trabalhado durante a graduação. Apresentamos as derivadas as curvas, deriva-

das direcionais e o diferencial envolvendo o conteúdo de transformação linear, nos dando

a possibilidade de ver como tudo está conectado. O mais prazeroso neste capítulo foi que,

103

por mais que os conceitos fossem abstratos e um pouco diferente do que tínhamos visto

na graduação, o resultado obtido através do exemplo em se determinar o plano tangente

à imagem de uma função foi sem dúvida muito grati�cante.

O último capítulo nos trouxe uma abordagem introdutória para derivadas em es-

paços normados, mostrando-nos a abrangência desta ferramenta, onde apresentamos uma

solução do problema de mínimos quadrados trabalhado na disciplina de Tópicos em Ál-

gebra Linear.

Assim, acreditamos que o objetivo desse trabalho foi alcançado com sucesso. Sem-

pre que possível foram apresentados exemplos variados e propostos com �ns didáticos.

Deixamos para o leitor a possibilidade de se aprofundar nos estudos, pois em todos os

capítulos apresentados há muito a se investigar, e para tal, recomendamos as obras aqui

referenciadas.

Com este trabalho conseguimos fazer um passeio pelas derivadas desde as tangentes

até as derivadas em espaços normados mostrando ao leitor que o universo das derivadas é

amplo e não se esgota por aqui. Poderíamos ter falado também da derivada de Hadamar e

da derivada fraca mas devido a profundidade e amplitude destes conteúdos não foi possível

abordá-los neste trabalho e �ca como sugestão que estes conteúdos sejam trabalhos em

futuros trabalhos de conclusão que irão complementar nosso trabalho e mostrar que as

derivadas tem mais faces do que poderíamos imaginar.

104

REFERÊNCIAS

AABOE, A. Episódios da História Antiga da Matemática. São Paulo: SBM, 1984.

BARTLE, R. G. Elementos de Análise Real. Rio de Janeiro: Campus, 1983.

CARVALHO, S.G. A Teoria das Tangentes Antes Da Invenção Do Cálculo Dife-

rencial. Coimbra: Imprensa da Universidade. 1919.

CARVALHO, R.M. A invenção do Cálculo por Newton e Leibniz e sua evo-

lução para o Cálculo conteporâneo. Belo Horizonte, 2007.

CONSCIENCIA.ORG. O Discurso do Método. Disponível em

<http://www.consciencia.org./o-discurso-do-metodo-rene-descartes>Acesso em:

14 de dezembro de 2012.

DUHAMEL, M. Mémoire sur la Méthode des Máxima et Minima de Fermat

et sur les Méthodes des Tangents de Fermat et Descartes. Paris: Edição do

Institute Impérial de France, 1960.

ENCYCLOPEDIA. Bryson of Heraclea. Complete Dictionary of Scienti�c Biography.

Disponível em <http://www.encyclopedia.com/doc/1G2-2830900686.html>Acesso em:

10 de dezembro de 2012.

EDWARDS, C.H. Advanced Calculus of Several Variables. Vol 1. New York: Dover

Publications, 1973.

EDWARDS, C.H. PENNEY, D.E. Cálculo com Geometria Analítica. Vol 1. Rio

de Janeiro: Editora Prentice-Hall do Brasil LTDA, 1994.

EUCLIDES. Os Elementos. São Paulo: Editora UNESP, 2009.

FLETT,T.M. Di�erential Analysis. Cambridge: Cambridge University Press, 1980.

GARBI, G. G. A Rainha das Ciências. ed.5. São Paulo: Editora Livraria da Fí-

sica, 2010.

105

GONÇALVES, M.B. FLEMMING, D.M. Cálculo C. 3 ed. São Paulo: MAKRON Books,

2000.

LIMA, E. L. Análise Real. Vol 2. Rio de Janeiro: IMPA, 2009.

LIMA, E. L. Curso de Análise. Vol 1. Rio de Janeiro: IMPA, 2008.

NETTO, C.D. Elementos de Cálculo In�nitesimal. 3 ed. São Paulo: Companhia

Editora Nacional, 1977.

PIRES, J.A.L. Cálculo Diferencial-Estudo histórico sobre a evolução do Cál-

culo Diferencial no século XVII. Vila Real, 2004.

SMITH, D. E. History of Mathematics. Vol 1. New York: Dover Publications Inc,

1923.

SMITH, D. E. History of Mathematics. Vol 2. New York: Dover Publications Inc,

1925.

THOMAS, G.B. Cálculo. 11 ed. São Paulo: Addison Wesley. 2009.

106

APÊNDICE

APÊNDICE A - De�nições e Teoremas Necessários

Os Teoremas aqui descritos com base na obra de Lima(2008) e Edwards (1994),

servem como base para alguns resultados apresentados no Capítulo 2 �Derivada em R�.

De�nição 4.3.6 Um conjunto X é dito compacto se toda sequência contida em X possui

uma subsequência que converge para algum ponto de X.

Teorema 4.3.7 A imagem f(X) de um conjunto compacto X ⊂ R por uma função

contínua f : X → R é um conjunto compacto.

Demonstração: Vamos mostrar que toda sequência de pontos yn ∈ f(X) admite uma

subsequência que converge para um ponto em f(X). Para cada n ∈ N temos f(xn) = yn

com xn ∈ X. Como X é compacto, a sequência (xn) possui uma subsequência (xn)n∈N′

que converge para um ponto a ∈ X. Sendo f contínua no ponto a, de limn∈N′

= a concluimos

que, pndo b = f(a), temos b ∈ f(X) e, além disso, limn∈N′

yn = limn∈N′

f(xn) = f(a) = b, como

queríamos demonstrar.

Teorema 4.3.8 (Teorema de Weierstrass) Seja f : X → R uma função contínua no

conjunto compacto X ⊂ R. Existem x0, x1 ∈ X tais que f(x0) ≤ f(x) ≤ f(x1), para todo

x ∈ X.

Demonstração: Como f é contínua e X compacto. Pelo Teorema 4.3.7, f(X) também

é compacto. Logo existem x0, x1 ∈ X tais que

f(x0) ≤ f(x) ≤ f(x1), ∀x ∈ X. (4.3.4)

Teorema 4.3.9 (Teorema do Confronto) Suponhamos que f(x) ≤ g(x) ≤ h(x) para

todo x em alguma vizinhança restrita de a e também que

limx→a

f(x) = L = limx→a

h(x).

Então,

limx→a

g(x) = L.

107

Demonstração: Dado ε > 0, escolhe-se δ1 e δ2 tais que

0 < |x− a| < δ1 ⇒ |f(x) − L| < ε

e

0 < |x− a| < δ2 ⇒ |h(x) − L| < ε.

Seja δ = min{δ1, δ2}. Então, δ > 0 e se 0 < |x− a| < δ , então f(x) e h(x) são pontos do

intervalo aberto (L− ε, L+ ε). Assim,

L− ε < f(x) ≤ g(x) ≤ h(x) < L+ ε.

Portanto,

0 < |x− a| < δ ⇒ |g(x) − L| < ε,

conforme desejado.

108

Documents

UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO …sistemabu.udesc.br/pergamumweb/vinculos/000019/0000197c.pdf · parcial para a obtenção do grau de Licenciatura em Matemática