Upload
doanthu
View
217
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE DO ESTADO DE SANTA CATARINA
CENTRO DE CIÊNCIAS TECNOLÓGICAS - CCT
CURSO DE LICENCIATURA EM MATEMÁTICA
GEOVANE AUGUSTO HAVEROTH
AS VÁRIAS FACES DA DERIVADA
JOINVILLE - SC
2013-06-17
GEOVANE AUGUSTO HAVEROTH
AS VÁRIAS FACES DA DERIVADA
Trabalho de Graduação apresentado ao Cursode Licenciatura em Matemática do Centrode Ciências Tecnológicas, da Universidadedo Estado de Santa Catarina, como requisitoparcial para a obtenção do grau de Licenciaturaem Matemática.
Orientador: Prof. Dr. Rogério de AguiarCo-Orientadora: Prof. Dra. Elisandra Bar deFigueiredo
JOINVILLE - SC
2013
H387a
Haveroth, Geovane AugustoAs Várias Faces da Derivada / Geovane Augusto Haveroth.
- 2013.108 p.: il
Bibliogra�a: f. 105Trabalho de Conclusão de Curso (Graduação) - Universi-
dade do Estado de Santa Catarina, Centro de Ciências Tec-nológicas, Curso de Licenciatura em Matemática. Joinville,2013.
Orientador: Rogério de AguiarCo-orientadora: Elisandra Bar de Figueiredo
1. História da Tangente. 2. Derivada. 3. Diferencial. 4.Derivada em Espaços Normados.I. Aguiar, Rogério. II. Figueiredo, Elisandra. III. Universi-dade do Estado de Santa Catarina - Curso de Licenciaturaem Matemática. IV. As Várias Faces da Derivada.
CDD: 515.33
Aos que me apoiaram.
AGRADECIMENTOS
Agradeço a minha mãe, dona Erna e irmãos, Adari, Adorli e Edelci por terem me
aguentado durante vários e vários anos, principalmente àquela que me concebeu e tornou
isso possível.
Agradeço os professores por nos conduzir durante esta etapa da graduação, em
especial aos professores Elisandra e Rogério.
Agradeço minha garota Thais, por me fazer esquecer dos problemas que a vida e
que a matemática proporciona.
E a Deus, por proporcionar condições para que eu adquirisse as competências ne-
cessárias para ultrapassar esta etapa da vida.
A Matemática apresenta invenções tão sutisque poderão servir não só para satisfazer oscuriosos como, também para auxiliar as artes epoupar trabalho aos homens.
René Descartes
RESUMO
HAVEROTH, Geovane Augusto. As várias faces da derivada. 2013. 107 p.. Trabalhode Conclusão de Curso (Graduação em Licenciatura em Matemática) - Universidade doEstado de Santa Catarina, Joinville, 2013.
Por meio de um estudo histórico tendo como ponto de partida Euclides da Grécia antiga,destacamos de modo sistemático os principais responsáveis pela evolução dos métodosutilizados na obtenção das tangentes às curvas. Antes do século XVII, tais métodoseram complexos e demandavam muito esforço, mas com o amadurecimento do conceito delimite, Newton e Leibniz desenvolveram de maneira totalmente independente o que conhe-cemos hoje por cálculo diferencial. Iniciaremos com métodos geométricos para obtençãodas tangentes e apresentaremos sua relação com a derivada de funções de uma variávelreal, expondo as notações, os principais resultados e algumas aplicações utilizando osdiferenciais. Em seguida apresentamos o cálculo diferencial de várias variáveis, cuja moti-vação é determinar os planos tangentes às imagens das funções num determinado ponto,permitindo-nos o acesso a um novo conjunto de ferramentas para o tratamento destasfunções. Para �nalizar, introduziremos as derivadas em espaços normados de�nindo aderivada de Fréchet e a de Gâteaux.
Palavras-chave: História da tangente, Derivada, Diferencial, Derivada em espaços nor-mados.
ABSTRACT
HAVEROTH, Geovane Augusto. The many faces of the derivative. 2013. 107 p..Work of Course Conclusion (Graduate Degree in Mathematics) - Santa Catarina StateUniversity, 2013.
Through a historical study having as starting point Euclid in ancient Greece, we highlightin a sistematic way the main responsible for the evolution the methods used to obtainthe tangents to the curves. Before the seventeenth century, such methods were complexand required a lot of e�ort, but with the maturation of the concept of limit, Newton andLeibniz developed in a way entirely independent what we know today by di�erential calcu-lus. We begin with geometric methods to obtain the tangents and we present its relationwith the derivative of functions of real variable, showing the notations, the main resultsand some applications using di�erentials. Then we introduce the di�erential calculus ofseveral variables, whose motivation is to determine the tangent planes to the images ofthe functions at a certain point, allowing us access to a new set of tools for handling thesefunctions. Finally, we introduce the derivatives in normed spaces by setting the derivativeof Fréchet and Gâteaux.
Key-words: History of the tangent, Derivative, Di�erential, Derivative in normed spaces.
LISTA DE ILUSTRAÇÕES
1.1 Espiral de Arquimedes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.2 Comparação entre ângulos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.3 Tangente à curva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.4 Obra de Descartes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.5 Primeiro método de Descartes. . . . . . . . . . . . . . . . . . . . . . . . . . . 191.6 Primeiro método de Descartes na curva y =
√2x + 3. . . . . . . . . . . . . . . 20
1.7 Terceiro método de Descartes. . . . . . . . . . . . . . . . . . . . . . . . . . . 211.8 Subtangente a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.9 Tangente à parábola. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251.10 Folium de Descartes para a = 1. . . . . . . . . . . . . . . . . . . . . . . . . . 261.11 Curva para o método geral de Fermat . . . . . . . . . . . . . . . . . . . . . . 271.12 Máximos e Mínimos na determinação das tangentes. . . . . . . . . . . . . . . . 281.13 Método de Newton. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1 Tangente ao círculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.2 Método dinâmico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.3 Aproximação linear. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.4 Função modular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.5 Tangente vertical. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.6 Ponto cuspidal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.7 Função quadrática. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492.8 Função descontínua. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.9 Função cúbica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522.10 Pontos de máximos e mínimos. . . . . . . . . . . . . . . . . . . . . . . . . . . 522.11 Representação do Teorema de Rolle. . . . . . . . . . . . . . . . . . . . . . . . 542.12 Contrução do teorema do valor médio. . . . . . . . . . . . . . . . . . . . . . . 552.13 A diferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.1 Aproximação linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.2 Representação geométrica da hélice. . . . . . . . . . . . . . . . . . . . . . . . 633.3 Vetor derivada em R3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.4 Aproximação por uma aplicação linear em R3. . . . . . . . . . . . . . . . . . . 703.5 Translação paralela do subespaço V . . . . . . . . . . . . . . . . . . . . . . . . 713.6 Plano tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.7 Derivada direcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.8 Aproximação pelo diferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . 783.9 Grá�co de f(x, y). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 803.10 Representação grá�ca do conjunto aberto. . . . . . . . . . . . . . . . . . . . . 86
SUMÁRIO
INTRODUÇÃO 12
1 TANGENTES NO PRÉ-CÁLCULO 141.1 EUCLIDES, ARQUIMEDES E APOLÔNIO . . . . . . . . . . . . . . . . . 141.2 DESCARTES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2.1 Métodos de Descartes . . . . . . . . . . . . . . . . . . . . . . . . . . 191.3 FERMAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.4 CONTEMPORÂNEOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281.5 BARROW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291.6 NEWTON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.6.1 Fluente e Fluxão . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.7 LEIBNIZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2 DERIVADA EM R 372.1 DA TANGENTE À DERIVADA EM R . . . . . . . . . . . . . . . . . . . . 372.2 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 482.3 A DIFERENCIAL EM R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3 CÁLCULO DIFERENCIAL DE VÁRIAS VARIÁVEIS 613.1 CURVAS EM Rm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623.2 DERIVADAS DIRECIONAIS E O DIFERENCIAL . . . . . . . . . . . . . 703.3 REGRA DA CADEIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4 INTRODUÇÃO À DERIVADA EM ESPAÇOS NORMADOS 944.1 CONCEITOS INICIAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.2 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3 EXEMPLOS DA DERIVADA DE FRÉCHET . . . . . . . . . . . . . . . . 99
CONCLUSÃO 103
REFERÊNCIAS 105
APÊNDICE 107APÊNDICE A - De�nições e Teoremas Necessários . . . . . . . . . . . . . . . . 107
INTRODUÇÃO
O cálculo diferencial é uma das ferramentas mais aplicáveis no ramo da matemática
e foi por esta razão que nos dedicamos a este trabalho, cujo objetivo é apontar os principais
responsáveis pelo desenvolvimento da derivada partindo dos problemas em de�nir retas
tangentes às curvas e tendo como ponto de chegada as derivadas em espaços normados.
Começaremos realizando um estudo histórico sobre os principais colaboradores
para o surgimento do cálculo diferencial, tendo como ponto de partida a obtenção de
retas tangentes na Grécia antiga com Euclides, Arquimedes e Apolônio. Na obra intitu-
lada Os elementos de Euclides (300 A.C), o geômetra de Alexandria já havia de�nido a
tangente à circunferência como sendo a reta que toca o círculo de modo que não o corta
ao ser prolongada. A utilização das retas tangentes nessa etapa do desenvolvimento se
restringia à construção da quadratura (Cálculo de áreas) de círculos. Por muitos sécu-
los a construção da tangente �cou estacionada, ressurgindo com os franceses Descartes e
Fermat. Já no século XVII dois eminentes matemáticos, Newton e Leibniz de uma forma
quase simultânea e independente, descobrem um método geral para a resolução de pro-
blemas associados ao problema da tangente a uma dada curva, hoje conhecido por cálculo
diferencial.
No segundo capítulo apresentaremos as mais diversas notações e operações utili-
zadas para as derivadas, alguns resultados relevantes ao conteúdo, como o Teorema de
Rolle e o Teorema do Valor Médio e a diferencial, utilizada para estimar valores. Resumi-
damente, a ideia do cálculo diferencial baseia-se em aproximar funções não lineares pelas
lineares. No cálculo de apenas uma variável este conceito �ca bem claro. Segundo Tho-
mas (2009), se interpretarmos a razão incremental como o coe�ciente angular da secante,
então a derivada nos dará o coe�ciente angular da reta tangente à curva no ponto.
O capítulo seguinte tratará das derivadas de funções de várias variáveis, cuja mo-
tivação não se dá mais no problema de de�nir reta tangente, mas sim em determinar o
plano tangente à imagem da função em um determinado ponto. Desta forma, teremos um
novo arsenal de ferramentas para o tratamento dessas funções, como derivadas direcionais,
derivadas parciais, matriz derivada etc. Finalizaremos este terceiro capítulo apresentando
exemplos práticos que abrangem a maioria do conteúdo trabalhado.
O quarto e último capítulo fará uma breve introdução aos conceitos de derivada
em espaços normados, tendo como ponto central a de�nição de Fréchet e a de Gâteaux.
12
Para um melhor entendimento desses conceitos, serão apresentados alguns exemplos e
�nalizaremos com uma interessante aplicação da derivada de Fréchet para a solução de
um problema de mínimos quadrados.
13
Capítulo 1
TANGENTES NO PRÉ-CÁLCULO
1.1 EUCLIDES, ARQUIMEDES E APOLÔNIO
Euclides1 teve seus pensamentos �orescidos em Alexandria. Sua principal obra
intitula-se Os Elementos e nele incorpora-se todo conhecimento matemático acumulado
em seu tempo, com exceção das cônicas e da geometria esférica. O geômetra de Alexandria
apresentou este material de uma forma sistemática num conjunto de treze livros.
Carvalho (1919), comenta que a circunferência é a única curva mencionada em
Os Elementos logo no terceiro livro, sendo objeto de estudo de diversos matemáticos
das escolas anteriores, portanto, antes mesmo de Euclides, já havia a necessidade de
considerar suas tangentes. A De�nição de Tangente ao Círculo expressa em Euclides
(2009), apresenta-se a seguir:
De�nição 1.1.1 Uma reta que, tocando o círculo e, sendo prolongada, não o corta, é
dita ser tangente ao círculo.
De acordo com Encyclopedia (2008), Bryson2, citado na Epístola XIII de Platão,
pode ter sido um aluno de Sócrates, na Grécia antiga. O mesmo fez contribuições no que
se refere à quadratura do círculo, porém, não conseguiria traçar o polígono circunscrito
ao círculo sem a noção de tangente à circunferência. Temos portanto, um antecessor de
Euclides que já explorava tangentes.
A teoria das seções cônicas não é encontrada nos Elementos, porém Pappus3, tra-
tando das cônicas de Apolônio4, atribuiu a Euclides, um tratado sobre Seções Cônicas
em quatro livros que teriam formado o fundamento dos quatro primeiros livros da obra
de Apolônio que continham teoremas sobre eixos, diâmetros, tangentes e assíntotas. De
1Euclides de Alexandria. Em grego antigo E′νκλειδηζ. 300 A.C. Em Os Elementos grande parte dosteoremas é demonstrada por Reductio ad absurdum ou Redução ao absurdo, que Euclides introduziu nasciências exatas.
2Bryson de Heraclea. 450 A.C.3Pappus de Alexandria. 300 A.C.4Apolônio de Perga. Em latim, Apollonius. 225 A.C.
14
acordo com Carvalho (1919), Arquimedes5, em suas obras, as supõe conhecidas por Apolô-
nio, no entanto, o tratado de Euclides não sobreviveu, perdendo-se com o passar dos anos.
Tratando-se de determinações in�nitesimais, Eudoxo6 promoveu uma grande con-
tribuição com seu trabalho de quadratura usando seu método, cujos matemáticos do século
XVII denominaram de método da exaustão7. O trabalho de Eudoxo também se baseou
em antigas ideias de aproximação da área do círculo por polígonos inscritos com número
crescente de lados, promovido por Atífon8.
Se quisermos demonstrar que uma quantidade de A é igual a outra quan-
tidade de B, tomamos uma terceira C de modo que a diferença A − Cpossa diminuir tanto nós quisermos, isto é, que se possa esgotar (Charles,
l.c) o que dá o nome do método. Devemos considerar primeiro C > Ae depois C < A. Se depois da comparação de C com B resultar um
absurdo, �cará provado, como pretendíamos, que A é igual a B. (CAR-
VALHO, 1919, p.3).
Euclides, utilizando-se desta técnica, demonstrou que as áreas dos círculos estão
entre si como os quadrados dos seus diâmetros.
Arquimedes é considerado por muitos historiadores, como um dos maiores mate-
máticos de todos os tempos, pois foi quem melhor proveito tirou do método da exaustão,
sendo que, a custas de demonstrações por exaustão que o geômetra calculou áreas de
superfícies e volumes de muitos corpos e também determinou a tangente à espiral.
No livro Tratado das Espirais, que de acordo com Carvalho (1919), é composto
de 28 proposições, Arquimedes estuda a curva que chamamos de espiral de Arquimedes
ilustrada na Figura 1.1. Neste tratado não consta nenhuma de�nição de tangente, o
que mostra que Arquimedes estendeu à espiral a De�nição 1.1.1 que Euclides dera para
circunferência e demonstra na Proposição 13 de seu tratado que a tangente à curva a toca
unicamente num ponto.
Figura 1.1: Espiral de Arquimedes.
Fonte: Produção do próprio autor.
5Arquimedes de Siracusa. Em latim, Archimedes. 225 A.C.6Eudoxo de Cnido (Atual Turquia). Em latim Eudoxus. 370 A.C.7Método da exaustão: consiste no método que determina a área de uma �gura inserindo uma sequência
de polígonos dentro dela, cuja soma das áreas converge para área desejada.8Atífon de Atenas. Em latim Antiphon. 430 A.C.
15
Conforme Carvalho (1919), as Proposições 16 e 17 do tratado de Arquimedes
referem-se a grandeza dos ângulos que a tangente num ponto faz com o raio vetor deste
ponto, mostrando que são diferentes e portanto um será agudo e outro obtuso. Vamos
exempli�car esta situação no Exemplo 1.1.2.
Exemplo 1.1.2 Seja a Espiral de Arquimedes dada por r(θ) = 1 + θ, com θ ∈ [0, 2π].
Com o auxílio do software Geogebra9 construímos uma reta tangente qualquer e
seu respectivo raio vetor, o resultado segue na Figura 1.2 ilustrando as Proposições acima
citadas.
Figura 1.2: Comparação entre ângulos.
Fonte: Produção do próprio autor
Percebe-se que, de fato, temos os ângulos diferentes, isto é, um ângulo obtuso e
um agudo.
Logo após termos discutido sobre Euclides e Arquimedes vamos nos ater a Apolô-
nio, conhecido como �O grande geômetra� (GARBI, 2010, p. 99) por conta de seu traba-
lho com seções cônicas. Este trabalho é composto de oito livros, contendo mais de 480
proposições, rigorosamente demonstradas, sobre a elipse, a hipérbole e a parábola como
também, diversas propriedades relativas a centros, diâmetros, tangentes etc. Algumas
destas demonstrações foram obtidas por meio de construções geométricas. Os quatro pri-
meiros livros foram, conforme dito anteriormente, atribuídos a Euclides e são encontrados
em grego. Já o quinto, sexto e sétimo, de acordo com Carvalho (1919), são conhecidos
talvez de traduções árabes e o oitavo reconstituído mediante referências de Pappus de
Alexandria.
Vamos explorar, através de construção geométrica e com o auxílio de Carvalho
(1919), uma destas proposições do trabalho do geômetra de Perga. No que diz respeito
à tangentes, Apolônio começa a demonstrar (Livro I, proposição 17) que a paralela AC
às ordenadas respectivas, tiradas pelo extremo A de um diâmetro, é tangente à curva,
pois se não fosse, cortaria em um ponto B e a reta AB devia ser dividida ao meio pelo
9Geogebra: aplicativo de matemática dinâmica que combina conceitos de geometria e álgebra.
16
diâmetro, o que é absurdo. A Figura 1.3 abaixo representa o que foi dito, sendo que a
curva, neste caso, é uma cirfunferência.
Figura 1.3: Tangente à curva.
Fonte: Produção do próprio autor.
Durante muito tempo não houve mais contribuições signi�cativas neste ramo da
matemática, porém no século XVII renasce este problema antigo de obtenções de tangentes
como veremos nas seções a seguir.
1.2 DESCARTES
Descartes10, um dos gigantes na arte da Matemática, nasceu em La Haye, Touraine
e foi �um dos homens mais in�uentes na revolução matemática� (SMITH, 1923, p.371,
tradução nossa). De acordo com Garbi (2010), desde muito cedo Descartes procurou o
conhecimento e aos oito anos foi enviado ao colégio jesuíta de La Flèche, permanecendo até
seus dezesseis anos de idade. Foi nesta escola que Descartes conheceu e se tornou amigo
de Mersenne11. Ao deixar o colégio, Descartes dirigiu-se à Paris para dar continuidade
aos seus estudos. Reencontrando-se com Mersenne, interessou-se pela Geometria e teve
contato com os maiores matemáticos da época. Apesar da matemática ser sua paixão,
Descartes graduou-se em leis.
O Rumo de sua vida mudou bruscamente em 1617, quando integrou-se ao exército
holandês, permanecendo até 1621, quando se deu conta através de um �sonho traumático
(...) da inutilidade daquilo que vinha fazendo� (GARBI, 2010, p. 188). Mersenne,
nesta época havia virado um grande escritor ciêntí�co e correspondia-se com os maiores
matemáticos da Europa.
Ao mudar para a Holanda, Descartes encontrou tranquilidade para botar no papel
as ideias que brotaram em sua mente anos antes. Nos quatro primeiros anos dedicou-se ao
10René Descartes. 1596-1650.11Marin Mersenne. 1588-1648. O padre Mersenne teve grande in�uência no desenvolvimento da
Matemática do século XVII, pois lutou bravamente contra o isolamento dos matemáticos da época,incentivando-os a explorarem suas ideias.
17
estudo da Filoso�a e posteriormente Biologia, Física e Cosmologia. Logo após, Descartes
elaborou um método para estudo da ciência, lógica e racional. Concebeu, então, um
método e o expôs em seu trabalho �Discours de la Méthode pour bien conduire la Raison
e chercher la Vérité dans les Sciences� (Figura 1.4). Esta obra contêm três apêndices,
são eles: Les Météores(Meteoros), La Dioptrique (Dióptrica) que estuda a refração da luz
e o último La Géométrie (Geometria), �um pequeno livro de mão de apenas uma centena
de páginas�(SMITH, 1923, p. 375, tradução nossa) mostrou que a geometria poderia ser
estudada por meio da Álgebra. La Géométrie (Geometria), foi sua única obra matemática
publicada e de acordo com Garbi (2010), o imortalizou e valeu-lhe a reputação de criador
da Geometria Analítica. Garbi (2010) a�rma que, o que Descartes fez nesta obra foi
mostrar que a Álgebra já havia evoluido de tal forma que poderia ser utilizada como
ferramenta para o estudo da Geometria.
Figura 1.4: Obra de Descartes.
Fonte: Consciência.
Garbi (2010), também a�rma que em sua obra intitulada Geometria publicada em
1637, Descartes não escondeu que seu trabalho era de difícil compreensão e enviou uma
carta à Mersenne dizendo:
Nada omiti, a não ser propositadamente. Previ que certas pessoas, que
se vangloriam se tudo saber, certamente não deixariam de a�rmar que eu
nada teria escrito além daquilo que já lhes era de antemão conhecido, se
para elas eu me houvesse tornado su�cientemente compreensível(GARBI,
2010, p.192).
Através de uma edição para torná-lo mais digerível, foi que Newton tomou conhe-
cimento de tal obra, nela foram apresentadas três formas de obtenção de tangentes às
curvas. Vamos descrever e explorar a primeira e a terceira forma, apresentando exemplos
destas. Não apresentaremos o segundo método por ter um processo muito semelhante ao
terceiro.
18
1.2.1 Métodos de Descartes
O método para determinar a tangente, de acordo com Pires (2004), recorre a uma
curva auxiliar conhecida, como, por exemplo, a circunferência. Esta curva auxiliar deve
interceptar a curva original em dois pontos distintos, sendo um deles o ponto onde deve-se
determinar a tangente. O segundo ponto deve fazer-se coincidir com o primeiro. Assim,
a curva auxiliar passa a ser tangente à curva no ponto (raiz dupla da equação). O centro
da circunferência e o ponto de tangência de�nem a normal à curva, facilitando a obtenção
da reta tangente.
Primeiro Método
Vamos obter a tangente pelo primeiro método de Descartes.
Seja f(x, y) = 0 uma curva e M um ponto qualquer sobre esta curva. Pretende-
mos traçar uma tangente a esta curva no ponto M . Consideremos uma curva auxiliar
conhecida, no caso a circunferência de centro N e raio NM que corta a curva no ponto
M1 conforme indicado na Figura 1.5, onde AP = x, PM = y, MN = s, AN = v.
Figura 1.5: Primeiro método de Descartes.
Fonte: Produção do próprio autor.
Este método de acordo com Pires (2004) consiste basicamente em encontrar a posi-
ção de N quando o segmentoMN é normal a curva f(x, y) = 0 no pontoM . Se a posição
de N for aproximada, então a circunferência (curva auxiliar) com mesmo centro cortará
num outro ponto M1, próximo a M , que Descartes obriga a coincidir com M usando um
processo posteriormente denominado por método dos coe�cientes indeterminados.
De acordo com a Figura 1.5, a equação da circunferência deslocada (curva auxiliar)
é equacionada por:
s2 = y2 + (x− v)2 (1.2.1)
reescrevendo tem-se,
y =√s2 − v2 + 2vx− x2
19
A curva, portanto assume, no ponto M(x, y) a seguinte forma,
f(x,√s2 − v2 + 2vx− x2) = 0 (1.2.2)
O método de Descartes consiste em forçar a equação a ter uma raíz de multiplicidade dois
para obter um único ponto de interseção que garantirá a reta normal emM . Vamos a um
exemplo prático.
Exemplo 1.2.2 Determine a reta normal à curva y =√
2x+ 3 quando a abscissa for
x = 3.
Para satisfazer a condição de Descartes, a curva auxiliar será tangente à curva
f(x, y) = 0 em apenas um ponto. O conhecimento da curva auxiliar nesta posição nos
permite determinar a reta normal ao ponto M .
A função y =√
2x+ 3 pode ser escrita da seguinte forma,
y2 − 2x− 3 = 0.
Figura 1.6: Primeiro método de Descartes na curva y =√
2x + 3.
Fonte: Produção do próprio autor.
Utilizando-se da curva auxiliar, Equação (1.2.1), e com s e v sendo MN e AN
respectivamente, conforme Figura 1.6. Escrevemos,
−s2 + (x− v)2 + 2x+ 3 = 0.
Descartes impõe a existência de uma raiz dupla a, logo
−s2 + (x− v)2 + 2x+ 3 = (x− a)2
x2 + x(−2v + 2) − s2 + v2 + 3 = x2 − 2xa+ a2
20
então pela igualdade de polinômios,
{2v − 2 = 2a
s2 − v2 − 3 = −a2
v = a+ 1
s =√
−a2 + (a+ 1)2 + 3
Atribuindo a = 3 como o ponto de abscissa onde queremos determinar a reta normal,
obtemos v = 4 e s =√
10. Então, tem-se os pontos M = (3, 3) e N = (4, 0) cuja reta
normal é y = −3x+12. Com as ferramentas atuais podemos veri�car facilmente a solução.
Derivando a função e aplicando no ponto correspondente x = 3 obtemos:
y′(x) =1√
2x+ 3
y′(3) =1
3. Sabemos que este valor é o coe�ciente da reta tangente, então para a normal
obtemos a mesma solução que pelo método de Descartes.
Veja também a obtenção da tangente à conchoide de Nicomedes por este mesmo
método na obra de Carvalho (1919, p.21-22).
Terceiro Método
O terceiro método é um processo formalmente idêntico ao segundo método que não
foi apresentado neste trabalho. A reta secante é traçada usando como referência o ponto
de tangência. Para determinar a reta tangente basta coincidir o segundo ponto com o
primeiro. Consideremos a Figura 1.7 abaixo.
Figura 1.7: Terceiro método de Descartes.
Fonte: Produção do próprio autor.
De acordo com Pires (2004), neste processo é dada a abscissa do ponto de contato
N e a tangente será a posição da secante TNN1 quando N1 se coincidir com N pela curva.
21
De�nimos AI = x, NI = y, TI = a, II1 = e, N1I1 = h e f(x, y) = 0 uma curva qualquer.
Por semelhança de triângulos temos:
a
a+ e=y
h
então,
h = y(1 +
e
a
).
Este método de Descartes �cará mais claro por meio de um exemplo.
Exemplo 1.2.3 Dada a curva y3 = mx , queremos localizar a tangente num ponto P de
coordenadas (x, y).
Fazendo f(x+ e, y
(1 +
e
a
))= 0 e aplicando o método:
y3(1 +
e
a
)3
−m(x+ e) = 0
y3
(1 +
3e
a+
3e2
a2+e3
a3
)−mx−me = 0
podemos desprezar as potências de e de grau ≥ 2 pois trata-se de valores muito pequenos
e uma vez que y3 = mx e e são quantidades diferentes de zero, resulta:
3y3
a= m ⇔ a =
3y3
m⇔ a = 3x
Tanto Descartes quanto Fermat, utilizam a subtangente a como meio para se obter
a reta tangente. A subtangente é a projeção sobre o eixo das coordenadas, do segmento
de reta compreendido entre a interseção da reta tangente com o eixo e o ponto de contato
com a curva, pontos estes que determinam a reta tangente (Figura 1.8).
Figura 1.8: Subtangente a.
Fonte: Produção do próprio autor.
22
Conforme Carvalho (1919), estes métodos só poderiam ser utilizados no seu tempo
para curvas cujas equações sejam redutíveis à forma inteira, caso contrário seria impos-
sível aplicar o método dos coe�cientes indeterminados que �Descartes descreve como um
processo válido para a determinação de quantidades desconhecidas que satisfazem certas
condições� (PIRES, 2004, p.41), nem efetuar o desenvolvimento de
f(x+ e, y
(1 +
e
a
))= 0.
1.3 FERMAT
Durante a mesma época de Descartes outro grande Francês conhecido como Fer-
mat12, o Príncipe dos Amadores , �dedicou seu excepcional talento ao estudo amadorístico
da Matemática, e nela deixou sua marca de gênio� (GARBI, 2010, p.194). Sem qualquer
estudo formal nas ciências exatas, mas com grande talento, ele foi uma peça fundamental
na evolução da Matemática do século XVII.
Segundo Garbi (2010), Fermat nasceu em Beaumont de Lomagne e foi educado
a dar maior relevância a Literatura, Latim e Grego. Assim como fez Descartes, Fermat
graduou-se em leis e com isso exerceu as funções de magistrado no parlamento da cidade
de Toulouse, onde obtinha um bom rendimento e tomava pouco de seu tempo. O tempo
livre foi dedicado ao estudo da Matemática por simples satisfação, os feitos que obtinha
eram comunicados por correspondências com os maiores matemáticos da época: Marin
Mersenne, René Descartes, John Wallis, Roberval13, Blaise Pascal e Christian Huygens.
Fermat dominava o Grego antigo e através de Papus, teve conhecimento do tra-
tado de lugares geométricos planos, de Apolônio, que estava parcialmente perdido. Fermat
dispôs-se a reconstruí-lo e enquanto o fazia descobriu como associar equações indetermi-
nadas a linhas geométricas, ou seja, a ideia principal da Geometria Analítica.
Os gregos já haviam de�nido tangente (De�nição 1.1.1), �embora válida para cir-
funferência e elipse é inaceitável no caso geral�(GARBI, 2010, p.197) e Fermat resolveu
pesquisar este antigo problema com suas técnicas analíticas.
Em uma correspondência à Mersenne, Pierre Fermat relata dois problemas envol-
vendo máximos para os quais obtivera a solução. Questionado sobre o processo utilizado,
Fermat divulga seu método de obtenção de máximos e mínimos como também sua aplica-
ção na determinação da tangente às curvas. Tal método foi alvo de críticas pelos amigos
de Mersenne, entre eles destaca-se Descartes, que conforme a seção anterior, apresentava
outro método de obtenção de tangentes às curvas aproximando dois pontos sobre esta.
Vejamos a seguir o método de Fermat para determinar os máximos e mínimos de
uma função dada.
12Pierre de Fermat. 1601-1665.13Gilles Personne de Roberval 1602-1675. Matemático e físico que se correspondia com Mersenne.
23
Para determinar os máximos e mínimos de uma função, Fermat considerava que
se, para um valor da variável x a expressão f(x) é um valor máximo/mínimo para valores
próximo de x, ou seja, x + e ou x − e, a variação de f(x) é relativamente menor que e,
sendo este um valor pequeno. Portanto, se igualarmos14 as expressões f(x) e f(x + e)
eliminaremos os termos comuns, como também as potências de e igual ou superior a 2,
em seguida dividiremos por e, sendo e = 0, obtemos então o valor ou os valores de x onde
a expressão f(x) é máxima ou mínima.
Segundo uma carta a ROBERVAL de 22 de setembro de 1636, este mé-
todo havia sido descoberto sete anos antes, mas só em Janeiro de 1638
é que, por intermédio de MERSENNE que recebera de CARCAVY nos
�ns de 1637 (Bulletin Sciences Math.,1918 ), ele viera às mãos de DES-
CARTES (CARVALHO, 1919, p.28).
De acordo com Carvalho (1919), Fermat não demonstrou a regra anterior, pois
devia ser fundamentada num teorema de Kepler. �Este método foi baseado numa ideia
de Kepler, inserta na sua obra intitulada Nova steriometria doloriom vinariorum, em
1615.�(PIRES, 2004, p.22).
Aplicaremos o método utilizando o exemplo apresentado no trabalho de Pires
(2004), cujo enunciado segue abaixo.
Exemplo 1.3.1 Determinar as dimensões do retângulo de perímetro 2a que apresenta
área máxima.
Aplicando o método de Fermat à expressão que traduz a área do retângulo que
devemos maximizar.
f(x) = x(a− x)
Obtemos a igualdade
x(a− x) = (x+ e)(a− x− e)
2ex = ea− e2
Logo a resultante é:
x =a
2.
O primeiro método das tangentes de Fermat baseia-se na regra acima descrita.
Sejam (x, y) as coordenadas do ponto B da parábola x = y2 e (x − e, y1) as do ponto
B1 na proximidade de B (Figura 1.9). Considere o problema de determinar a tangente à
parábola no ponto B, de acordo com Carvalho (1919) temos:
14Na realidade Fermat não iguala a princípio as duas expressões. Compara-as por adégalité o que querdizer que só considera o sinal igual quando faz tender e para zero.
24
Figura 1.9: Tangente à parábola.
Fonte: CARVALHO (1919, p.29), editado pelo autor.
Observe que
y12 = (x− e)
y12y2 = (x− e)y2
y12x = (x− e)y2
y12
x− e=
y2
x
Assim,
y2
y12
=x
x− e
como OI > y1 então
y2
OI2 <
x
x− e. (1.3.1)
Mas, por semelhança de triângulos
y
OI=CE
IE
tomando CE = a
y
OI=CE
IE=
a
a− e
Substituindo em (1.3.1) virá
a2
(a− e)2 <x
x− e
a2(x− e) < x(a2 − 2ae+ e2)
a2x− a2e < a2x− 2xae+ e2x
25
e aplicando a regra, temos por adégalité
a = 2x,
que determina a subtangente.
Fermat a�rma que seu método pode ser aplicado a qualquer curva e que nunca
falha. Ainda de acordo com o mesmo autor, Fermat começa a exposição do seu método
a�rmando que ele é uma consequência da sua teoria de máximos e mínimos, porém não
nos deixa claro quais são os máximos e mínimos que devemos procurar.
Descartes errou ao pensar que a distância de E ao ponto de tangência era o máximo
das distâncias de E aos pontos da curva, com isso tentou provar que a regra de Fermat
não era verídica. Além disso, Descartes também não conseguira, por meio deste método,
determinar as tangentes à elipse e a hipérbole, pois as via como parábolas.
Sentindo as dores de Fermat, Roberval juntamente com Pascal15 mostraram à Des-
cartes que ele deveria aplicar a regra de Fermat utilizando as propriedades especí�cas de
cada curva e a�rmaram que Fermat tratou o problema com tangentes independentemente
dos máximos e mínimos. Em uma carta de Descartes à Mersenne, esta opinião foi du-
ramente criticada. Para explicar a eliminação dos termos que tivessem e como fator,
descobriu o segundo e o terceiro método das tangentes, apresentado na seção anterior.
Fermat determinou, através de um manuscrito, a tangente à elipse pelo mesmo método,
utilizando-se das propriedades desta curva expressa pela equação y2 = qx(2a−x). O mé-
todo a que nos referimos exige que a curva tenha equação da forma y = f(x) e Descartes,
para mostrar que o método não era tão geral como Fermat supunha, em 18 de janeiro de
1638 propôs a construção das tangentes ao folium16.
Figura 1.10: Folium de Descartes para a = 1.
Fonte: Produção do próprio Autor.
Conforme Carvalho (1919), em uma carta datada de 20 de julho de 1638 entregue
15Blaise Pascal. 1623-1662.16Folium de Descartes é uma curva de�nida pela equação x3 + y3 − 3ayx = 0 para a > 0 cuja assíntota
é x + y + a = 0 (Figura 1.10)
26
por Mersenne à Descartes, Fermat apresentou a solução deste problema por outro método
geral, que em uma linguagem mais moderna se resume da seguinte forma:
Considere a Figura 1.11 abaixo,
Figura 1.11: Curva para o método geral de Fermat
Fonte: CARVALHO (1919, p.32), editado pelo autor.
Seja CA uma curva dada cuja equação é f(x, y) = 0 e (x, y) as coordenadas de um
dos seus pontos A.
Por um ponto E da tangente, que supomos já construída, tiremos a reta EF
paralela a BA e seja BF = e, BD = a.
Como o pontoE não pertence à curva, por triângulos semelhantes, EF = y
(a− e
a
)
será diferente de FI, mas, se �zermos tender e para zero, o ponto F no limite confunde-se
com o ponto B e devemos ter
f(x− e, y
(1 − e
a
))= 0. (1.3.2)
Carvalho (1919) a�rma que Fermat chega a uma equação análoga a obtida por
Descartes e por um caminho idêntico, ele chega à equação tratando o problema por meios
in�nitamente pequenos, substituindo os elementos da curva pelos segmentos correspon-
dentes da tangente.
Este trabalho foi alvo de críticas por Descartes, pois considerava este muito di-
ferente do primeiro e não envolvia a investigação de máximos e mínimos de qualquer
quantidade. Supunha também que Fermat só encontrou este método depois de ter co-
nhecimento de suas descobertas. Há indícios que Fermat nunca vira a descoberta de
Descartes, portanto descobrira seu método independentemente das invenções de Descar-
tes. �Fermat utilizou este método para a parábola, para a cissoide, para à conchoide dos
antigos, para a cicloide e para o folium(...).�(CARVALHO, 1919, p.34).
O leitor poderá encontrar exemplos da determinação da tangente ao folium, à
cicloide, à quadratriz e à oval de Fermat em Carvalho (1919, p.34-38).
Numa carta dirigida por Fermat a Descartes em julho de 1638, apresenta-se uma
nova maneira de aplicar seu método de máximos e mínimos à determinação das tangentes.
27
Não devemos, diz Fermat, procurar o máximo da distância AB, pois que
isso conduzir-nos-ia a um valor in�nito, mas devemos buscar um ponto
O, de modo que a distância AO seja mínima, porque a perpendicular
à reta AO assim determinada é a tangente em A como é fácil demons-
trar.(CARVALHO, 1919, p.41).
De acordo com a citação acima, vamos buscar o ponto O de forma que a distância
AB seja mínima. Para tal, utilizaremos a Figura 1.12 como auxílio.
Suponhamos que a perpendicular a AO não seja tangente em A, e considere AE a
tangente. Baixemos de O a perpendicular OE que encontra a curva no ponto D.
Como a curva deve estar toda para o lado da tangente OD < OE e como OE é
perpendicular a AB por construção, também temos que OE < OA, portanto OD < OA,
temos portanto uma contradição.
Figura 1.12: Máximos e Mínimos na determinação das tangentes.
Fonte: CARVALHO (1919, p.41), editado pelo autor.
Fermat se contenta com esta demonstração, porém, mais tarde, Barrow mostrou
que a distância OA pode ser até um máximo.
Observa-se nos métodos de Fermat uma certa �habilidade� em trabalhar com quan-
tidades in�nitesimais e realizar aproximações. Grandiosas conquistas para a matemática,
que serviram de inspiração às conquistas de Newton e Leibiniz. Além das tangentes, Fer-
mat interessou-se também por quadraturas (cálculo de áreas), comprimento de curvas e
centros de gravidade. Pires(2004), descreve Fermat como um dos matemáticos que mais
se aproximou da descoberta do cálculo in�nitesimal antes de Newton.
1.4 CONTEMPORÂNEOS
Outros grandes matemáticos também deram suas contribuições, entre eles podemos
citar Roberval, Torricelli e Pascal. Roberval intermediou os feitos de Fermat e Descar-
tes e foi o primeiro que generalizou o método de obtenção de tangente, �e considerou a
28
tangente como a direção, em cada ponto, do movimento resultante.�(CARVALHO, 1919,
p.51). Torricelli teve sua participação ao reinventar o método fundado na composição
das velocidades, Carvalho (1919), comenta ainda que, Torricelli foi discípulo de Galileu
Galilei e Blaise Pascal acabou tornando-se o porta-voz de Fermat.
1.5 BARROW
Os trabalhos de Descartes, Fermat e Roberval passaram para a Inglaterra, onde
matemáticos importantes, em posse desses trabalhos, deram grandes contribuições no
avanço do cálculo in�nitesimal. Entre esses matemáticos destaca-se Barrow, que na época
lecionava geometria na Universidade de Cambridge e foi professor de Newton. Como
Roberval, Barrow �imagina as linhas descritas por pontos animados de vários movimentos,
considerando, quase sempre, aqueles que hoje se exprimem pelas leis�(CARVALHO, 1919,
p.61), leis descritas como
x = ϕ(t), y = at,
podendo assim, representar as coordenadas a partir do tempo t.
Barrow descreve a tangente a uma curva como reta que toca a curva sem cortá-la
e tem seus pontos no exterior a curva, exceto o ponto de contato.
1.6 NEWTON
Issac Newton nasceu em 1642, em tempos de rebelião, numa pequena vila, na
costa da Inglaterra e de acordo com Smith (1923), era uma criança pequena e frágil.
Aos 12 anos foi matriculado no colégio de Grantham e em sua própria declaração a�rma
ter sido extremamente desatento aos seus estudos, classi�cando-se entre os piores alunos
da escola. Mais tarde começou a desenvolver capacidades intelectuais consideráveis, em
1660 foi colocado no colégio Trinity College em Cambridge, onde fora aluno de Isaac
Barrow e a quem sucedeu como professor aos 27 anos. Em 1664 estudou séries in�nitas
mostrando que a regra para expandir (a+ b)n era válida para todos os valores de n.
No ano seguinte começou a trabalhar em cálculo diferencial que denominou, na época,
como a teoria de �uxões, utilizando-se desta teoria para determinar a tangente e o raio
de curvatura em qualquer ponto de uma curva. Posteriormente trabalhou em diversas
teorias. Começou a investigar a teoria da gravidade aplicando o método das �uxões para
estudar as equações que exprimiam fenômenos físicos. Em seu trabalho intitulado Optics
(1704), de acordo com Pires (2004), são publicados alguns trabalhos, dispersos, referente
a �uxões e quadratura de curvas como também o uso das séries in�nitas no tratamento
desses problemas.
Tornou-se diretor da casa da moeda britânica e foi eleito presidente da Royal
29
Society17, lugar que ocupou até seu falecimento. �Em 1713, foi nomeado Cavaleiro18
pela rainha Ana, tornando-se assim, detentor do título honorí�co de Sir Isaac Newton.�
(PIRES, 2004, p.45).
De acordo com Smith (1923), Newton sempre hesitou em publicar suas descobertas,
como no caso da sua principal obra intitulada Newton's Principia : the mathematical
principles of natural philosophy, que teve início em 1685, porém, publicada somente em
1687, sob pressão de seu amigo astrônomo Halley19.
Em sua vida, Newton continuou o estudo que Galileu havia dado início sobre
a origem e a natureza dos movimentos. �A ideia física de curva devida a Galileu e a
decomposição da velocidade em duas componentes, de natureza algo difusa, defendida
por Roberval são percebidas por Newton.�(PIRES, 2004, p.44).
Sir Isaac Newton morreu em março de 1727, com 85 anos e foi enterrado na Abadia
de Westminster, com honras de estado.
Pires (2004), a�rma que em anexo ao seu trabalho entitulado Óptics (1704), foram
publicados alguns trabalhos, dispersos, referentes a �uxões e a quadratura de curvas
como também o uso das séries in�nitas no tratamento destes problemas. Os manuscritos
Methodus Di�erencialis e De Analysi per Equaciones Numero Terminorum, publicados
sete anos depois, são dois resumos sobre o tratamento e aplicação de séries ao cálculo
diferencial que, anos antes, já teria comunicado a Barrow, Collins20 e a Leibniz em 1676,
por intermédio de cartas. Estes trabalhos realizados por Newton em 1666, estão na origem
da descoberta do cálculo diferencial como veremos a seguir.
1.6.1 Fluente e Fluxão
De acordo com Carvalho (2007), as ideias de Newton baseavam-se na geração
de curvas por movimentos, acabando por denominar o espaço percorrido de �uente e a
velocidade ou celeridades do móvel de �uxão, que de acordo com Pires (2004), apresentava
uma ideia cinemática de curva, o mesmo acontecendo para superfícies e sólidos. Estas
ideias citadas acima constituiram a base para o que Newton denominou de Method of
Fluxions.21
Para descrever a natureza das curvas Newton utilizou qualquer movimento local
como fosse movimento acelerado ou retardado.17Royal Society ou The Royal Society of London for the Improvement of Natural Knowledge é uma
instituição destinada à promoção do conhecimento cientí�co, fundada em 28 de novembro de 1660.18Cavaleiro: título concedido como homenagem ou recompensa por serviços prestados, conferida geral-
mente pelo monarca.19Edmund Halley. 1646-1719. Matemático e astrônomo britânico conhecido por ser o descobridor do
cometa Halley em 1696.20John Collins. 1624-1683. Matemático de Oxford, teve um papel junto aos ingleses muito semelhante
ao de Mersenne com matemáticos continentais.21Method of Fluxions foi o último trabalho de Newton, apenas publicado em 1736, o conteúdo foi
percebido mais tarde quando o conceito de limite �cou claramente de�nido.
30
Newton associou uma curva à trajetória possível de um móvel através de
relações matemáticas entre variáveis (os �uentes) que pudessem sofrer pe-
quenas variações de velocidades ou celeridades (as �uxões)(...).(PIRES,
2004, pg. 52).
Vejamos as notações que, de acordo com Pires (2004), foram as mais utilizadas.a, b, c, ... Constantes.
x, y, z, ... Variáveis (�uentes).
p ou x Velocidade associada a x (�uxão).
q ou y Velocidade associada a y (�uxão).
o Quantidade muito pequena, geralmente associada ao tempo.
p.o ou x.o(q.o ou y.o) Momento de �uxão x(y), ou seja, acréscimo da variável x(y).
Vamos descrever o método utilizando a Figura 1.13 exposta no trabalho de Pires
(2004).
Figura 1.13: Método de Newton.
Fonte: PIRES (2004, p.48), editado pelo autor.
Seja ACK uma curva qualquer. Consideremos V T como sendo a tangente a curva
no ponto C com abscissa B, V B como sendo a subtangente, c como o ponto sobre a curva
correspondente a C depois de sujeitado a �uxão xo, Cc é a corda que une os dois pontos
e BC e bc são paralelos, assim como CE e AB.
Analisando a secante à curva no ponto C e num ponto próximo deste, pretendemos
veri�car as condições em que podemos localizar a tangente à curva no ponto C.
Se deslocarmos de BC para bc iremos provocar um aumento Bb (�uxão xo) na
abscissa AB (�uente), um aumento Ec (�uxão yo) na ordenada BC (�uente), como
também um acréscimo Cc (�uxão so) na curva AC.
Veri�camos que ∆CET é semelhante a ∆V BC e com isso,
BC
V B=ET
CE.
31
Esta constante de proporcionalidade foi denominada por Newton de Prime Ra-
tio of Nascents Arguments (Primeira razão dos primeiros argumentos). Para pequenos
acréscimos de x podemos considerar ∆CET semelhante a ∆CEc.
Seguindo o raciocínio de Pires (2004), temos que se traçarmos Cc e �zermos bc
tender para BC, o ponto c irá se aproximar de C. A secante Cc vai coincidir com a
tangente e o ∆CEc vai de aproximar do ∆CET . Com esta argumentação, podemos
concluir então queEc
CE=yo
xo. (1.6.1)
A igualdade da Equação (1.6.1) é classi�cada por Newton de Ultimate Ratio of
evanescents parts e que na posição limite, é igual aET
CEchamada de Prime Ratio of
nascents arguments.
De acordo com Carvalho (2007), Newton encontrou uma relação entre as quanti-
dades in�nitamente pequenas de �uentes com as suas respectivas �uxões. Ele percebeu
que os �uentes x, y, z, ... poderiam ser expressos respectivamente por x.o, y.o, z.o, ..., mos-
trando que estas estão relacionadas com as suas �uxões x, y, z, .... Estes momentos de
�uxão x.o, y.o, z.o, ... das quantidades �uentes x, y, z, ..., são seus incrementos in�nita-
mente pequenos e para um intervalo in�nitamente pequeno, teremos x + xo e y + yo,
atualmente entendidos por x+ ∆x e y + ∆y.
Basicamente, o método de Newton consiste em provocar um acréscimo nas �uentes
em um determinado intervalo de tempo o. Substituí-lo na equação e desprezar todos os
termos cujas potências de o são maiores ou iguais a 2, então subtrair a equação principal e
em seguida dividir a resultante por o. Notamos aqui um procedimento similar ao utilizado
por Fermat.
Abaixo segue um exemplo prático explorado no trabalho de Carvalho (2007).
Exemplo 1.6.2 Seja a curva de equação x3 − ax2 + axy− y3 = 0 em um intervalo curto
de tempo, determine a relação entre as �uxões.
Podemos substituir x por x+ xo e y por y + yo, onde teremos:
(x+ xo)3 − a(x+ xo)2 + a(x+ xo)(y + yo) − (y + yo)3 = 0
expandindo e subtraindo-o pela equação inicial dada, teremos:
3x2xo+ 3xx2o2 + x3o3 + 2axxo− ax2o2 − axyo+ ayxo+ axyo2 − 3y2yo− 3yy2o2 = 0.
Dividimos tudo pelo tempo in�nitamente pequeno o,
3x2x+ 3xx2o+ x3o2 + 2axx− ax2o− axy + ayx+ axyo− 3y2y − 3yy2o = 0
32
os fatores que contém o são insigni�cantes e portanto podemos desprezá-los, restando
apenas:
3x2x+ 2axx− axy + ayx− 3y2y = 0 (1.6.2)
Na matemática contemporânea temos a seguinte notação para a Equação (1.6.2),
que é resultado da derivação implícita:
3x2dx
dt+ 2ax
dx
dt− ax
dy
dt+ ay
dx
dt− 3y2dy
dt= 0. (1.6.3)
Caso o leitor tenha interesse poderá veri�car um exemplo em que Pires (2004, p.50)
utiliza um sistema de equações para dar continuidade ao método.
(...) Newton, para diferenciar (ou integrar) expressões desconhecidas,
usava variáveis auxiliares das quais conhecia as respectivas �uxões. A
manipulação algébrica permitia-lhe obter a respectiva �uxão ou �uente
e consequentemente obter resultados que uma vez tabelados e organiza-
dos podiam sugerir uma lei de formação que se revelaria profunda na
generalização de resultados.(PIRES, 2004, p. 53).
Pires (2004), ainda a�rma que Newton utizando-se de �uxões conhecidas e de uma
notação mais leve, apresentou exemplos de um método, hoje conhecido, como método da
substituição do cálculo diferencial e integral.
Utilizando-se de diferenciais, expôs o método, hoje conhecido, por Newton-Raphson,
cujo processo permite uma aproximação, tanto quanto se queira, das raízes de uma equa-
ção. Também utilizou o método das �uxões para o cálculo do declive da tangente a uma
curva C num ponto dado.
Vamos explorar este problema da tangente com um exemplo prático.
Exemplo 1.6.3 Considere uma curva C representada pela equação y = 2x23 . Determine
a reta tangente a esta curva em x = 1 utilizando o método das �uxões.
Queremos determinar a tangente à curva no ponto (1, 2), para tal vamos reescrever
esta equação como y3 − 8x2 = 0. Precisamos agora, atribuir acréscimos às variáveis x e
y, para isto, vamos considerar:
x = x+ xo
y = y + yo
Substituindo estes acréscimos na curva y3 − 8x2 = 0 obtemos,
(y + yo)3 − 8(x+ xo)2 = 0.
33
Expandindo e subtraindo a equação original, como também desprezando os temos que
contenham o com grau maior ou igual a 2, teremos:
y2yo+ 2y2yo− 16xxo = 0
dividindo ambos os lados por o,
3y2y = 16xx.
Logo a expressão que representa o declive num ponto genérico da curva é dada por:
y
x=
16x
3y2=
4
3√x. (1.6.4)
Assim, se x = 1, o declive da tangente no ponto (1, 2) é4
3e a reta tangente é dada por
f(x) =4x+ 2
3.
O estudo do declive de curvas permitiu que Newton determinasse pontos impor-
tantes desta. De acordo com Pires (2004), em 1665, Newton refere-se a esses pontos como
sendo aqueles no qual a variação da respectiva �uxão é nula, isto é, onde a tangente é
horizontal. Esses pontos são muito importantes, pois, ao estudar a vizinhança podemos
determinar os máximos e mínimos de uma dada curva, bastando igualar a respectiva
�uxão a zero.
Após se aprofundar nos estudos de Descartes, Newton aplicou a álgebra aos es-
tudos de geometria, utilizou-se também das suas técnicas para diversas aplicações, como
o cálculo da curvatura. Conforme Carvalho (2007), realizou ainda, demonstrações de
como calcular a quadratura de regiões sob curvas utilizando uma série in�nita de termos
(problema inverso à tangente), a qual não abordaremos neste trabalho.
1.7 LEIBNIZ
Gottfried Wilhelm von Leibniz nasceu na Alemanha em 1646. De acordo com
Smith (1923), Leibniz demonstrou muita facilidade com a matemática e antes dos 20
anos já havia lido os mais importantes tratados. Foi o único matemático puro, de ponta,
produzido na Alemanha durante o século XVII. Obteve o grau de Bacharel em leis na
Universidade de Leipzig, aos 21 anos alcançou o título de doutor pela Universidade Al-
torf, seguiu com a carreira diplomática e por intermédio de suas viajens, a serviço do
estado alemão, tomou conhecimento dos matemáticos renomados da Holanda, França e
Inglaterra.
Em 1673, de acordo com Pires (2004), a política o levou a Londres, onde candidatou-
se a membro da Royal Society e apresentando uma máquina de calcular ainda incompleta,
obtivera êxito apesar de críticas. Neste mesmo ano, Smith (1925) a�rma que, provavel-
34
mente Leibniz se reuniu com estudiosos que estavam cientes das descobertas de Newton,
inclusive Barrow, com quem ele mantivera correspondências, �Ele parece ter começado a
pensar sobre o assunto em 1673, alguns anos depois que Newton havia explicado o cálculo
�uxional a seus alunos.� (SMITH, 1923, p. 417).
Devido a morte do último de seus protetores, o arcebispo Eleitor de Mainz, Pires
(2004), a�rma ainda que, Leibniz regressou a Paris, onde começou o período em que
mais se aprofundou em seus conhecimentos matemáticos. �Através de Huygens, teve
conhecimento de alguns estudos de Pascal, Fabri, James Gregory, Grégoire de S. Vincent,
Descartes e Sluze, fundamentais para o desenvolvimento do seu trabalho.�(PIRES, 2004,
p.76).
Neste período Leibniz trabalhou, de acordo com Smith (1925), nos problemas de
tangentes e quadraturas, desenvolvendo uma notação que era original e ao mesmo tempo
era, geralmente, mais adequada do que a de Newton. Pires (2004) comenta que tal notação
viria a ser universalmente aceita e também sua principal marca no ramo da matemática.
Leibniz, de acordo com Pires (2004), trocou correspondência com Newton por
intermédio de seu secretário Oldenburg da Royal Society, e por este, �cou sabendo de que
Newton e Gregory estavam em posse de um método para o tratamento de diferenciais. Tais
correspondências começaram a �car defasadas ao longo do tempo por desentendimentos
sobre a prioridade da descoberta do cálculo.
Não há mais dúvidas de que Leibniz desenvolveu seu cálculo de forma
totalmente independente, e que ele e Newton têm direito a crédito por
suas respectivas descobertas. As duas linhas de abordagem foram ra-
dicalmente diferentes, embora as respectivas teorias conseguiram resul-
tados que eram praticamente idênticos.(SMITH, 1923, p.418, tradução
nossa).
Smith (1923) ainda a�rma que Leibniz podia ter sabido o que Newton estava
fazendo e com isso manteve essa linha de trabalho, também sabia das contribuições feitas
por Barrow, na forma do �triângulo diferencial�, contudo ele foi muito original nas suas
realizações. Pires (2004) a�rma que Leibniz encontrou o �triângulo diferencial� utilizado
por Barrow no estudo da obra de Pascal Traité des sinus du quart de cercle.
Ao longo da história vimos que muitos matemáticos se preocuparam em de�nir
tangentes e em como determiná-las, pois elas podem conter diversos signi�cados, algumas
estão descritas na citação abaixo.
Em óptica, a tangente determinava o ângulo no qual o raio de luz pene-
traria numa lente curva. Em mecânica, a tangente determinava a direção
do movimento de um corpo em qualquer ponto ao longo de seu percurso.
Em geometria, as tangentes a duas curvas num ponto de interseção de-
terminavam o ângulo em que as curvas se cortavam(...). (THOMAS,
2009, p. 132).
35
No capítulo seguinte, iremos realizar uma síntese entre o embasamento histórico
referente a obtenção de tangentes e a sua conexão com o cálculo diferencial. Então,
poderemos nos aprofundar neste conceito amparado por diversos Teoremas que iremos
expor neste trabalho. A partir daqui, nossa abordagem para o cálculo diferencial será a
abordagem moderna, seguindo a linha de pensamentos de Edwards (1973).
36
Capítulo 2
DERIVADA EM R
No capítulo anterior vimos que desde a antiguidade vários matemáticos trabalha-
ram no problema de de�nir retas tangentes às curvas para os mais variados �ns e para
determiná-la demandava muito esforço. Com o passar do tempo, diversos matemáticos se
empenharam em determinar métodos mais gerais e e�cazes abrangendo uma maior gama
de curvas, de fato, é natural pensar que procuravam o aperfeiçoamento dos métodos e
na obtenção das tangentes não foi diferente. Começaremos este capítulo de�nindo reta
tangente, explorando-a tanto na construção quanto nas suas particularidades, para então
relacioná-la com a derivada. Nosso objetivo neste capítulo é apresentar as mais diversas
notações utilizadas, alguns resultados e algumas aplicações das derivadas de funções de
uma variável real da forma f : R → R.
2.1 DA TANGENTE À DERIVADA EM R
Para círculos, Euclides já havia de�nido tangente em sua obra Os Elementos con-
forme De�nição 1.1.1 exposta no capítulo anterior. De acordo com Thomas (2009), a
tangente ao círculo é apresentada pela De�nição 2.1.1, ilustrada pela Figura 2.1.
De�nição 2.1.1 Uma reta L será tangente a um círculo em um ponto P se L passar por
P perpendicularmente ao raio em P .
Figura 2.1: Tangente ao círculo.
Fonte: Produção do próprio autor.
37
O mesmo autor a�rma que a de�nição anterior não serve para curvas mais gerais.
Então, para de�nirmos tangência para o caso geral, vamos utilizar o que ele descreve
como método dinâmico, tal método considera o comportamento das secantes que cortam
a curva C em P e pontos próximos Q. A Figura 2.2 expõe a ideia do método que estamos
nos referindo.
Figura 2.2: Método dinâmico.
Fonte: (THOMAS, 2009, p.130), editado pelo autor.
O método dinâmico citado anteriormente segue as três etapas seguintes:
1. Calcula-se o coe�ciente angular da reta formada por PQ;
2. Investiga-se o limite do coe�ciente angular de PQ quando Q tende a P ao longo de
C;
3. Se o limite existir, o tomamos como o coe�ciente angular da reta tangente no ponto
P em C.
Seguindo o trabalho de Thomas (2009), usaremos o mesmo processo acima para
determinar a tangente à curva y = f(x) num ponto P = (a, f(a)). Queremos calcular o
coe�ciente angular da secante PQ, sendo Q = (a+ h, f(a+ h)) (Figura 2.3). Veri�camos
o limite formado pela secante quando h tende a 0, se o limite existir o tomaremos como
coe�ciente angular da reta tangente. Através deste raciocínio, as de�nições de coe�ciente
angular e da tangente à curva �cam claras e bem de�nidas, conforme veremos a seguir.
38
Figura 2.3: Aproximação linear.
Fonte: Produção do próprio autor.
De�nição 2.1.2 O coe�ciente angular da reta tangente à curva y = f(x) num ponto
P = (a, f(a)) é o número m dado por
m = limh→0
f(a+ h) − f(a)
h
desde que este limite exista.
De�nição 2.1.3 A reta tangente à curva y = f(x) no ponto P = (a, f(a)) é a reta que
passa por este ponto e tem o coe�ciente angular m descrito na De�nição 2.1.2.
Para realizar a síntese da conexão entre a reta tangente e a derivada será necessário
de�nir este objeto em questão. De acordo com Netto (1977), para determinar a derivada
devemos considerar uma curva y = f(x) e um ponto a em que a função seja contínua,
de modo que a diferença f(a + h) − f(a) tem limite zero quando h tende a 0. A relação
entre o acréscimo da função e o acréscimo da variável, denomina-se relação incremental
de f(x) no ponto a e é dada por:
f(a+ h) − f(a)
h. (2.1.1)
Uma vez que já dispomos da relação incremental podemos de�nir a derivada de
funções de uma variável real no ponto a.
De�nição 2.1.4 A função f(x) é derivável no ponto a se existir e for �nito o limite da
relação incremental (2.1.1) quando h → 0 e se representa por f ′(a). Assim, por de�nição:
f ′(a) = limh→0
f(a+ h) − f(a)
h(2.1.2)
supondo a existência de tal limite.
39
De forma equivalente a De�nição 2.1.4, alguns autores utilizam
f ′(a) = limx→a
f(x) − f(a)
x− a= lim
∆x→0
f(a+ ∆x) − f(a)
∆x.
Quando a relação incremental vista anteriormente tem por limite ±∞ denotada
por f ′(a) = ±∞, dizemos que a derivada não existe neste ponto.
O conceito de derivada foi instituido, em �ns do século XVII, por LEIBI-
NIZ e por NEWTON, devendo-se ao primeiro o uso da palavra derivada.
LEIBNIZ partiu do problema geométrico das tangentes e NEWTON de
uma noção cinemática, denominando a derivada de �uxão e a função de
�uente.(NETTO, 1977, P.109).
Segundo Thomas (2009), se interpretarmos a razão incremental como um coe�ci-
ente angular da secante, então a derivada nos dará o coe�ciente angular da tangente à
curva no ponto a. Edwards (1973), a�rma que a ideia principal do cálculo diferencial é
aproximar funções não lineares pelas lineares e esta está bem clara no cálculo diferencial
de apenas uma variável. Se a função f(x) é diferenciável no ponto a, então a reta tangente
em P = (a, f(a)) é dada pela equação:
y = f(a) + f ′(a)(x− a),
isto é, podemos escrever a reta tangente em termos da derivada no ponto a, linearizando
a função naquele ponto conforme o autor a�rmou.
Conforme mencionado de De�nição 2.1.4, f ′(a) corresponde ao coe�ciente angular
da reta tangente à curva naquele ponto, mas no entanto esse não é o único signi�cado. A
derivada também é utilizada para obter a taxa de variação instantânea de uma função.
Podemos interpretar a relação incremental (Equação (2.1.1)), conforme Thomas (2009),
como sendo a taxa de variação média da função f(x) no intervalo [a, a + h], cujo limite
quando h → 0 será considerado a taxa com que a função f(x) varia em a. Com esta
argumentação de�nimos taxa de variação instantânea da seguinte forma:
De�nição 2.1.5 A taxa de variação instantânea da função f(x) em a é a derivada:
f ′(a) = limh→0
f(a+ h) − f(a)
h
desde que este limite exista.
Segundo Thomas (2009), vamos supor que o movimento de um corpo possa ser
descrito por uma função s = f(t), sendo s o deslocamento em função do tempo t. Assim,
∆s = f(t + ∆t) − f(t) será o deslocamento do corpo no intervalo [t, t + ∆t] e a sua
40
velocidade média será a relação incremental∆s
∆t. Se �zermos ∆t tender a zero iremos
obter a velocidade instantânea do corpo no instante t.
De�nição 2.1.6 A velocidade instantânea é a derivada da posição em relação ao tempo.
Se a posição de um corpo no instante t é s = f(t), então sua velocidade no instante t é
v(t) = lim∆→0
f(t+ ∆t) − f(t)
∆t
desde que este limite exista.
Se derivarmos a velocidade em função do tempo iremos obter a aceleração ins-
tantânea no ponto, podemos adiantar que a aceleração é a segunda derivada da função
deslocamento em relação ao tempo. A derivada poderá signi�car as mais variadas taxas
instantâneas, dependendo do contexto no qual se trabalha.
Até o momento vimos a derivada aplicada num ponto, queremos agora generalizar
este conceito e de�nir uma função derivada. Considerando o limite em cada um dos pontos
do domínio da função, segundo Thomas (2009), a de�nição seguinte nos dá esta função
derivada.
De�nição 2.1.7 A derivada de uma função f(x) em relação à variável x é a função
f ′(x) cujo valor é
f ′(x) = limh→0
f(x+ h) − f(x)
h
desde que o limite exista.
Segundo o mesmo autor, f(x) é dita derivável caso a função f ′(x) exista para
todos os pontos x do domínio, se a função apresentar diferenciabilidade no ponto x, então
diremos que f(x) é derivável em x.
Antes de continuarmos expondo as de�nições referentes à derivada, será de grande
importância apresentarmos suas notações. Thomas (2009) relata que há diversas formas
de representação das derivadas de funções y = f(x) em que x é a variável independente e
y a dependente. Veja a seguir algumas das variações mais comuns na notação de derivada:
lim∆x→0
∆y
∆x= f ′(x) = y′ =
dy
dx=df
dx=
d
dxf(x) = D(f)(x) = Dxf(x).
Os caracteresd
dxe D chamam-se operadores de derivação e designam a operação
de derivação. Para indicarmos o valor de uma derivada em um número especí�co x = a
utiliza-se uma das seguintes notações:
f ′(a) =dy
dx
∣∣∣∣x=a
=df
dx
∣∣∣∣x=a
=d
dxf(x)
∣∣∣∣x=a
41
A notação f ′(x) para a derivada de f(x) é devida a José Luís LA-
GRANGE (1736-1813). Representa-se, ainda, a derivada de y = f(x)
por uma das notações seguintes:dy
dxatribuída a LEIBNIZ, Dxf(x) a
CAUCHY e Df(x) a L.F.A. ARBOGAST (1759-1803). A notação y,proposta por NEWTON, �cou em desuso durante muito tempo; atual-
mente está sendo utilizada em Mecânica. (NETTO, 1977, p.109).
Após termos visto as variações na notação de derivada, vamos dar continuidade às
de�nições. A próxima de�nição que veremos trabalha com a derivabilidade de f(x) em
um intervalo.
De�nição 2.1.8 Uma função y = f(x) será derivável num intervalo I aberto, �nito ou
in�nito, se a função conter uma derivada em cada ponto do intervalo. A função y = f(x)
será derivável num intervalo fechado [a, b] se for derivável no interior (a, b) e se existirem
os limites abaixo nas extremidades.
f ′+(a) = lim
h→o+
f(a+ h) − f(a)
h(2.1.3)
f ′−(b) = lim
h→o−
f(b+ h) − f(b)
h
f ′+(a) é chamada de derivada à direita em a e f ′
−(b) de derivada à esquerda em b.
De acordo com as propriedades de limite, �uma função terá uma derivada em um
ponto se, e somente se, tiver derivadas à direita e à esquerda nesse ponto e se essas
derivadas laterais forem iguais.� (THOMAS, 2009, p.150).
Veri�caremos a derivabilidade de uma função através de um dos exemplos discuti-
dos em Thomas (2009).
Exemplo 2.1.9 Mostre que a função f(x) = |x| não contém derivada no ponto x = 0.
Figura 2.4: Função modular.
Fonte: Produção do próprio autor.
42
Vamos aplicar as derivadas laterais em x = 0.
Derivada à direita de x = 0:
f ′+(0) = lim
h→0+
|0 + h| − |0|h
= limh→0+
|h|h
= limh→0+
h
h= 1
e derivada à esquerda de x = 0:
f ′−(0) = lim
h→0−
|0 + h| − |0|h
= limh→0−
|h|h
= limh→0−
−hh
= −1.
Temos que f ′+(0) = f ′
−(0) e portanto não há derivada em x = 0.
Explorando a derivabilidade das funções, percebemos que ela está intimamente
ligada ao que Thomas (2009), descreve como suavidade do grá�co da f(x). Se a função
apresentar um bico, como, por exemplo, a função modular (Figura 2.4), conclui-se que
não há derivada em P , pois as derivadas laterais são distintas, também quando a relação
incremental, vista anteriormente, tem por limite ±∞ no ponto, implicando na verticali-
dade da reta tangente (Figura 2.5), ou no que chamamos de Ponto cuspidal (Figura 2.6),
quando o coe�ciente angular de PQ tende a +∞ de um lado e −∞ do outro e por último,
como veremos a seguir no Teorema 2.1.10, quando houver descontinuidade.
Figura 2.5: Tangente vertical.
Fonte: (THOMAS,2009, p.151), editado
pelo autor.
Figura 2.6: Ponto cuspidal.
Fonte: (THOMAS, 2009, p.151), editado
pelo autor.
O Teorema a seguir faz uma conexão entre derivabilidade e continuidade.
Teorema 2.1.10 Se f tem uma derivada em x = a, então f é contínua em x = a.
Demonstração: Por hipótese sabemos que f ′(a) existe, isto é
f ′(a) = limh→0
f(a+ h) − f(a)
h.
43
Queremos mostrar que limx→a
f(x) = f(a). Chamamos h = x− a com h → 0 e mostraremos
que limh→0
f(a+ h) = f(a). Seja h = 0, então
f(a+ h) = f(a+ h) + f(a) − f(a)
= f(a) +f(a+ h) − f(a)
h.h
Aplicando o limite em ambos os lados para h → 0.
limh→0
f(a+ h) = limh→0
f(a) + limh→0
f(a+ h) − f(a)
h. limh→0
h
= f(a) + f ′(a).0
= f(a)
Portanto, limh→0
f(a+ h) = f(a).
A recíproca deste teorema é falsa, um contra-exemplo é a função modular (Figura
2.4) vista no Exemplo 2.1.9, neste caso a função é contínua, porém não é derivável no
ponto x = 0.
Para continuarmos expondo os teoremas será necessário uma série de regras que nos
servirão de base para realizarmos as operações mais diversas com as funções derivadas.
A seguir, descreveremos um conjunto de regras descritas nas obras de Netto (1910) e
Thomas (2009).
i Derivada de constante. Se uma função f(x) = c é constante num intervalo, então
f ′(x) = 0.
Demonstração: Seja f(x) = c com c ∈ R, temos que f(x+ h) = c e portanto:
f ′(x) = limh→0
f(x+ h) − f(x)
h= lim
h→0
c− c
h= 0.
A função constante f(x) = c é representada por uma reta paralela ao eixo das
abscissas, logo o coe�ciente angular da reta é igual a zero.
ii Produto por uma constante. Se f(x) é uma função derivável e c ∈ R uma
constante, então
[cf(x)]′ = cf ′(x).
Demonstração: Aplicamos a de�nição para a função h(x) = cf(x), sabemos que
44
h(x+ h) = cf(x+ h) bastando substituir
[cf(x)]′ = limh→0
cf(x+ h) − cf(x)
h
= c limh→0
f(x+ h) − f(x)
h= cf ′(x).
Esta regra nos mostra que quando uma função derivável é multiplicada por uma
constante c, então a derivada dessa função também é multiplicada por c.
iii Derivada da soma e da subtração. Se f(x) e g(x) são funções deriváveis, então
(f(x) ± g(x))′ = f ′(x) ± g′(x).
isto é, a soma e a subtração são deriváveis em qualquer ponto onde ambas sejam
deriváveis.
Demonstração: Vamos mostrar a igualdade acima para a soma, analogamente
segue para a subtração. Aplicando a de�nição de derivada para h(x) = f(x)+ g(x),
temos que:
(f(x) + g(x))′ = limh→0
[f(x+ h) + g(x+ h)] − [f(x) + g(x)]
h
= limh→0
[f(x+ h) − f(x)
h+g(x+ h) − g(x)
h
]
= limh→0
f(x+ h) − f(x)
h+ lim
h→0
g(x+ h) − g(x)
h= f ′(x) + g′(x).
Esta regra nos ajuda nos mais diversos cálculos de derivação, já que há diversas
funções que contém somas, como por exemplo, os polinômios.
iv Derivada do produto. Se f(x) e g(x) são funções deriváveis, então
[f(x)g(x)]′ = f(x)g′(x) + g(x)f ′(x).
ou seja, o produto f(x)g(x) também é derivável.
45
Demonstração: Utilizaremos a de�nição para h(x) = f(x)g(x).
h′(x) = limh→0
f(x+ h)g(x+ h) − f(x)g(x)
h
= limh→0
f(x+ h)g(x+ h) − f(x)g(x) + [f(x+ h)g(x) − f(x+ h)g(x)]
h
= limh→0
f(x+ h)
[g(x+ h) − g(x)
h
]+ g(x)
[f(x+ h) − f(x)
h
]
= limh→0
f(x+ h) limh→0
[g(x+ h) − g(x)
h
]+ g(x) lim
h→0
[f(x+ h) − f(x)
h
]
= f(x)g′(x) + g(x)f ′(x).
v Derivada do quociente. Sejam f(x) e g(x) = 0 funções deriváveis, então
[f(x)
g(x)
]′=g(x)f ′(x) − f(x)g′(x)
[g(x)]2.
Vamos ocultar a prova desta regra, pois assemelha-se muito às provas anteriores,
bastando aplicar a de�nição.
vi Potenciação para inteiros positivos. Se f(x) = xn com n ∈ Z∗+, então
f ′(x) = nxn−1.
Demonstração: Seja a função f(x) = xn e f(x + h) = (x+ h)n, como n ∈ Z∗+
podemos expandir (x+ h)n pelo teorema binomial de Newton. Assim,
f ′(x) = limh→0
f(x+ h) − f(x)
h
= limh→0
(x+ h)n − xn
h
= limh→0
[xn + nxn−1h+ n(n−1)
2xn−2h2 + · · · + nxhn−1 + hn
]− xn
h
= limh→0
nxn−1h+ n(n−1)2
xn−2h2 + · · · + nxhn−1 + hn
h
= limh→0
[nxn−1 +
n(n− 1)
2xn−2h+ · · · + nxhn−2 + hn−1
]
= nxn−1
Repare que se aplicarmos essa regra para n = 1 teremos o caso particular da derivada
de variável livre, isto é, se uma função é igual a própria variável livre, sua derivada
46
é igual a 1. Geometricamente, a função f(x) = x é representada pela bissetriz, cuja
reta tem coe�ciente angular de tg(π
4
)= 1.
vii Potenciação para inteiros negativos. Se n ∈ Z∗−, então
(xn)′ = nxn−1.
Demonstração: Sabe-se que n ∈ Z∗−, então tomamos n = −m, logo m ∈ Z∗
+
e xn = x−m =1
xm. Para demonstrar esta regra é necessário utilizar a regra do
quociente com as funções f(x) = 1 e g(x) = xm, cujas derivadas são respectivamente
f ′(x) = 0 e g′(x) = mxm−1, portanto
[f(x)
g(x)
]′=
g(x)f ′(x) − f(x)g′(x)
[g(x)]2
=xm.0 − 1.mxm−1
x2m
=0 −mxm−1
x2m
= −mx−(m+1)
= nxn−1.
viii Derivada da função composta (Regra da Cadeia). Seja f(x) e g(x) funções
deriváveis, então a derivada de uma função composta (f ◦ g)(x) = f(g(x)) é dada
por
(f ◦ g)′(x) = f ′(g(x)).g′(x),
se f(u) é derivável em u = g(x) e g(x) é derivável em x.
Demonstração: Vamos utilizar a de�nição de derivada para mostrar a regra em
questão:
[f(g(x))]′ = limh→0
f(g(x+ h)) − f(g(x))
h
= limh→0
f(g(x+ h)) − f(g(x))
h.
[g(x+ h) − g(x)
g(x+ h) − g(x)
]
= limh→0
f(g(x+ h)) − f(g(x))
g(x+ h) − g(x). limh→0
g(x+ h) − g(x)
h
= limh→0
f(g(x+ h)) − f(g(x))
g(x+ h) − g(x).g′(x)
47
chamamos a = g(x) e z = g(x+ h), quando h → 0 tem-se z → a. Assim,
[f(g(x))]′ = limz→a
f(z) − f(a)
z − a.g′(x)
= f ′(a).g′(x)
= f ′(g(x)).g′(x)
Portanto, mostramos que de fato (f ◦ g)′(x) = f ′(g(x)).g′(x).
ix Derivada implícita. Sempre que uma função possa ser escrita da forma y = f(x),
dizemos que y é uma função explícita de x, pois isolamos a variável dependente de
um lado e a expressão do outro. Caso não seja possível isolar, ou não a explicitamos,
dizemos que é uma função implícita. O Método da derivação implícita consiste em
derivar os dois lados da equação em relação a variável x, usando a regra da cadeia,
e depois determinar y′ na equação resultante através de manipulações algébricas.
Exemplo 2.1.11 Determine a derivada em função de x das funções y = 3x2 + 5 e
y − 3x2 − 5 = 0.
Percebemos que a primeira função está na forma explícita, pois podemos escreve-la
da forma y = f(x). Assim, a derivada é y′ = 6x. Agora reparemos a segunda
função, ela está na forma implícita, isto é, f(x, y) = 0. Derivando-a em ambos os
lados obtemos y′ − 6x = 0 e isolando y′ obtemos y′ = 6x.
Conforme havíamos comentado, a aceleração instantânea é representada pela se-
gunda derivada do deslocamento em função do tempo, ela é dita derivada de segunda
ordem. De acordo com Netto (1977), vamos supor uma função derivável f(x) no intervalo
I e em todo ponto de I considere f ′(x) uma derivada �nita, a derivada de f ′(x) num ponto
a ∈ I, quando existe, seja �nita ou in�nita é dita segunda derivada de f(x), representada
por f ′′(x). Se f ′′(x) é �nita em todos os pontos do intervalo I, f ′′(x) será uma função
de�nida no intervalo I e a derivada de f ′′(x) num ponto b ∈ I, quando existe, seja �nita
ou in�nita, é chamada de terceira derivada de f(x) e denota-se por f ′′′(x), e assim segue
sucessivamente as derivadas de ordem superior. Vale salientar que a partir da derivada
de quarta ordem denota-se por f (n)(x) a n-ésima derivada de f(x), também encontramos
as derivadas sucessivas de uma função y = f(x) com as seguintes notações:
Dy,D2y,D3y, · · · , Dny oudy
dx,d2y
dx2, · · · , d
ny
dxn.
2.2 RESULTADOS
Nesta seção apresentaremos os resultados mais interessantes, do nosso ponto de
vista, do cálculo diferencial de uma variável real. Aquele estudante que desejar um maior
48
aprofundamento, sugerimos os livros de Edwards (1994) e Lima (2008).
Edwards (1994), a�rma que em muitos problemas é necessário encontrar os valores
máximos e mínimos que uma grandeza poderá atingir.
De�nição 2.2.1 Seja f : [a, b] → R uma função. Se c está no intervalo fechado [a, b],
então f(c) é chamado mínimo de f(x) em [a, b] se f(c) ≤ f(x) para todo x ∈ [a, b].
Analogamente, se d ∈ [a, b], então f(d) é chamado máximo de f(x) em [a, b] se f(d) ≥f(x) para todo x ∈ [a, b]. Se f(c) é um mínimo, então o ponto c ∈ [a, b] é chamado de
ponto mínimo da função f . Analogamente, se f(d) é um ponto de máximo, então o ponto
d ∈ [a, b] é chamado de ponto máximo da função f .
Desta forma, se f(c) é o mínimo e f(d) é o máximo de f(x) em [a, b], então
f(c) ≤ f(x) ≤ f(d), ∀x ∈ [a, b].
Exemplo 2.2.2 Seja f : [−1, 2] → R a função de�nida por f(x) = x2 (Figura 2.7).
Determine c, d ∈ [−1, 2] tais que satisfaçam a De�nição 2.2.1.
Figura 2.7: Função quadrática.
Fonte: Produção do próprio autor.
Tome c = 0 e d = 2. Assim,
f(c) = 0 ≤ f(x) ≤ f(2) = 4, ∀x ∈ [−1, 2].
O Teorema a seguir nos garante a existência do valor máximo e do mínimo, sob a
hipótese da função f ser contínua num intervalo fechado.
Teorema 2.2.3 (Teorema de Weierstrass) Se a função f é contínua no intervalo fe-
chado [a, b], então existem c, d ∈ [a, b] tais que
f(c) ≤ f(x) ≤ f(d), ∀x ∈ [a, b].
49
Demonstração: A demonstração este Teorema encontra-se no Apêndice A.
A hipótese de que f seja uma função contínua num intervalo fechado [a, b] é uma
condição essencial nesse Teorema. Consideremos os dois exemplos seguintes, onde o pri-
meiro falha na hipótese do intervalo fechado e o segundo falha a continuidade na função.
Exemplo 2.2.4 Seja a função contínua f(x) = x de�nida no intervalo aberto (a, b).
Não há como determinar os valores de máximo e mínimo no intervalo aberto (a, b), pois
dado c ∈ (a, b) vai existir k ∈ (a, b) com k < c tal que f(k) < f(c). A explicação é análoga
para o caso de valor máximo.
Exemplo 2.2.5 Considere a função descontínua f(x) =1
xse x = 0 e f(0) = 0 no
intervalo [−1, 1], conforme Figura 2.8.
Figura 2.8: Função descontínua.
Fonte: Produção do próprio autor.
Novamente não há como determinar os valores de máximos e mínimos, pois dado
c ∈ [−1, 1], sempre haverá k ∈ [−1, 1] tal que f(k) < f(c). A explicação é análoga para o
caso de valor máximo.
Através desse resultado, sabemos que se f é uma função contínua, então haverá
valores máximo e mínimos no intervalo fechado [a, b]. Agora, queremos determinar a
localização de tais valores, para tal, vamos determinar os máximos e mínimos locais.
De�nição 2.2.6 Dizemos que f(c) é um máximo local da função f se f(x) ≤ f(c) para
todo x su�cientemente próximo de c. Se esta desigualdade é válida para todo x que esteja
simultaneamente no domínio de f e em algum intervalo contendo c, então f(c) é um
máximo local de f . Analogamente, dizemos que f(c) é um mínimo local de f se f(x) ≥f(c) para todo x su�cientemente próximo de c.
50
Geometricamente, um máximo local é um ponto tal que nenhum outro ponto na
vizinhança está em posição mais alta, e um mínimo local é um ponto tal que nenhum
outro ponto na vizinhança está em posição mais baixa. Um extremo local é um mínimo
local ou um máximo local.
Teorema 2.2.7 (Máximos e Mínimos Locais) Se f é diferenciável em c, está de�-
nida em um intervalo aberto contendo c e se f(c) é um máximo local ou mínimo local de
f , então f ′(c) = 0.
Demonstração: Suponhamos que f(c) seja um máximo local de f . Pela hipótese de
que f ′(c) existe temos que os limites laterais (Equação (2.1.3)) existem e são iguais a
f ′(c).
Se h > 0, então
f(c+ h) − f(c)
h≤ 0,
pois f(c) ≥ f(c + h) para todos os valores positivos pequenos de h. Assim, por uma
versão unilateral do Teorema do confronto para limites (Apêndice A), esta igualdade se
mantém ao fazermos h tender a zero. Obtemos assim,
f ′(c) = limh→0+
f(c+ h) − f(c)
h≤ lim
h→0+0 = 0.
Analogamente, para h < 0 temos
f(c+ h) − f(c)
h≥ 0,
Portanto,
f ′(c) = limh→0−
f(c+ h) − f(c)
h≥ lim
h→0−0 = 0.
Como f ′(c) ≤ 0 e f ′(c) ≥ 0, concluímos que f ′(c) = 0.
A recíproca desse Teorema é falsa, ou seja, o fato de que f ′(c) = 0 não é su�ciente
para que f(c) seja um extremo local. Um contra-exemplo é a função f(x) = x3. Sua
derivada f ′(x) = 3x2 é zero em x = 0, no entanto veri�camos pelo grá�co (Figura 2.9) de
que f(0) não é extremo local de f .
51
Figura 2.9: Função cúbica.
Fonte: Produção do próprio autor.
Quanto aos problemas de otimização, nem sempre estamos interessados nos extre-
mos locais, mas nos máximos e mínimos globais, ou absolutos atingidos por uma função
contínua.
De�nição 2.2.8 Se f é uma função com domínio D, dizemos que f(c) é o máximo
absoluto (mínimo absoluto), ou máximo global (mínimo global), de f em D, se f(c) ≥ f(x)
(f(c) ≤ f(x)) para todo x ∈ D.
Ou seja, f(c) é o maior (menor) valor de f em D.
Consideremos a Figura 2.10 com o objetivo de ilustrar os pontos de máximos/mínimos
locais e absolutos, conforme discutimos até o momento.
Figura 2.10: Pontos de máximos e mínimos.
Fonte: Produção do próprio autor
De�nição 2.2.9 O valor c no domínio de f é dito ponto crítico de f se f ′(c) = 0 ou se
f ′(c) não existe.
O Teorema a seguir nos diz que o máximo ou mínimo absoluto da função f no
intervalo fechado [a, b] ocorre ou em uma das extremidades, ou em um ponto crítico de f .
52
Teorema 2.2.10 (Máximos e Mínimos Absolutos) Suponhamos que f(c) seja o má-
ximo absoluto (ou mínimo absoluto) da função contínua f no intervalo fechado [a, b].
Então, c ou é ponto crítico de f , ou é um dos extremos a ou b.
Demonstração: Se c não é um dos pontos extremos de [a, b], então f(c) é um extremo
local de f no intervalo aberto (a, b). Assim, o Teorema 2.2.7 implica f ′(c) = 0, desde que
f seja diferenciável em c.
Exemplo 2.2.11 Determine os valores de máximos e mínimos absolutos da função dife-
renciável
f(x) =3
5(30x− x2)
no intervalo fechado [0, 30].
A derivada da função f é
f ′(x) =3
5(30 − 2x),
que é zero em x = 15. Incluindo as extremidades, nossa relação de valores para os quais
o x pode resultar em extremos de f consiste em 0, 15 e 30. Assim,
f(0) = 0,
f(15) = 135,
f(30) = 0.
Portanto, o valor de máximo de f(x) é 135 e mínimo de f(x) é 0.
De�nição 2.2.12 A função f é crescente no intervalo I = (a, b) se
f(x1) < f(x2)
para todos os pares de números x1, x2 ∈ I tais que x1 < x2. A função é decrescente em I
se
f(x1) > f(x2)
para todos os pares de números x1, x2 ∈ I tais que x1 < x2.
Ou seja, f será crescente em I se os valores de f(x) crescem quando x cresce e f será
decrescente em I se os valores de f(x) decrescem quando x cresce.
O signi�cado do sinal da derivada de uma função é de grande importância. De
fato, f(x) é crescente em um intervalo onde f ′(x) > 0 e descrescente onde f ′(x) < 0.
53
Geometricamente, onde f ′(x) > 0, o grá�co de y = f(x) sobe ao ser percorrido da
esquerda para a direita. Onde f ′(x) < 0, o grá�co desce.
Embora intuitivo, não podemos tomar como verídico o sinal da derivada estar li-
gado diretamente ao crescimento ou decrescimento da função. Para prová-lo, necessitamos
apresentar o Teorema do Valor Médio . Daremos primeiramente um resultado preliminar,
que nos servirá de base para a prova do Teorema do Valor Médio.
Teorema 2.2.13 (Teorema de Rolle) Se f é uma função contínua em [a, b], derivável
em (a, b) e f(a) = f(b), então existe c ∈ (a, b) tal que f ′(c) = 0.
Figura 2.11: Representação do Teorema de Rolle.
Fonte: Produção do próprio autor.
Demonstração: Se f for constante em [a, b], então f ′(c) = 0 para todo c ∈ (a, b). Logo,
suponha que f não é constante em [a, b]. Como f é contínua, por hipótese, pelo Teorema
2.2.3, temos que f assume máximo e mínimo absoluto em [a, b]. Sejam c1, c2 ∈ [a, b] tais
que
f(c1) ≤ f(x) ≤ f(c2), ∀x ∈ [a, b].
Como f(a) = f(b) e f não é uma função constante, então c1 ∈ (a, b) ou c2 ∈ (a, b). Logo
pelo Teorema 2.2.10, c1 ou c2 é ponto crítico e como f é difereciável em (a, b) obtém-se
que f ′(c1) = 0 ou f ′(c2) = 0. Portanto tome c = c1 ou c = c2.
Agora, estamos em condições de enunciar e demonstrar o Teorema do Valor Médio.
Teorema 2.2.14 (Teorema do valor médio) Seja a função f contínua no intervalo
fechado [a, b] e diferenciável no intervalo aberto (a, b). Então, haverá pelo menos um
ponto c ∈ (a, b) tal que
f ′(c) =f(b) − f(a)
b− a.
54
Demonstração: Considere a Figura 2.12 como auxílio para construirmos a demonstra-
ção.
Figura 2.12: Contrução do teorema do valor médio.
Fonte: THOMAS (2009), editado pelo Autor.
Seja y = f(x) uma curva dada e sobre ela traçamos uma reta g(x) através dos
pontos A e B. A reta g(x) tem como equação
g(x) = f(a) +f(b) − f(a)
b− a(x− a).
Seja h(x) a função dada pela diferença vertical entre os grá�cos f(x) e g(x), logo
h(x) = f(x) − g(x) (2.2.1)
= f(x) − f(a) − f(b) − f(a)
b− a(x− a)
A função h(x) satisfaz as hipóteses do Teorema de Rolle no intervalo [a, b]. É
contínua em [a, b], derivável em (a, b) e h(a) = h(b) = 0. Portanto, a derivada de h(x) é
nula em algum ponto de (a, b). Seja c ∈ (a, b) o ponto obtido pelo Teorema de Rolle, isto
é h′(c) = 0. Derivando ambos os lados da Equação (2.2.1) temos
h′(x) = f ′(x) − g′(x)
h′(x) = f ′(x) − f(b) − f(a)
b− a.
55
Aplicando em x = c, obtemos
h′(c) = f ′(c) − f(b) − f(a)
b− a
0 = f ′(c) − f(b) − f(a)
b− a
f ′(c) =f(b) − f(a)
b− a
e com isto provamos o Teorema.
Apresentamos a seguir algumas consequências diretas deste Teorema.
Corolário 2.2.15 Se f ′(x) = 0 para todo x ∈ (a, b), então f é uma função constante em
[a, b]. Em outras palavras, existe uma constante C tal que f(x) = C para algum x ∈ (a, b).
Demonstração: Apliquemos o Teorema do Valor Médio à função f no intervalo [a, x],
onde x é um número �xo, porém arbitrário do intervalo (a, b]. Obtemos
f(x) − f(a) = f ′(c)(x− a) (2.2.2)
para algum número c entre a e x. Como f ′(x) é sempre zero em (a, b), temos que f ′(c) = 0.
Assim, f(x) − f(a) = 0 e f(x) = f(a).
Essa última equação vale para todo x ∈ [a, b]. Portanto, f(x) = f(a) para todo
x ∈ [a, b], isto é, f(x) tem o valor �xo C = f(a).
Este Corolário costuma ser aplicado sob uma forma equivalente, como enunciamos
a seguir.
Corolário 2.2.16 Se f ′(x) = g′(x) em cada ponto de x de um intervalo aberto (a, b),
então existe uma constante C tal que f(x) = g(x) + C para qualquer x ∈ (a, b). Ou seja,
f(x) − g(x) é uma constante em (a, b).
Demonstração: Para cada x ∈ (a, b), a derivada da função diferença h(x) = f(x)−g(x)será dada por
h′(x) = f ′(x) − g′(x) = 0.
De acordo com o Corolário 2.2.15 h(x) = C. Portanto f(x) − g(x) = C em (a, b), então
f(x) = g(x) + C.
Exemplo 2.2.17 Seja f ′(x) = 2 cos(x) e f(0) = 5, determine a função f(x).
Sabemos que uma função explícita com derivada 2 cos(x) é
g(x) = 2 sin(x).
56
Logo, o Corolário 2.2.16 implica que existe uma constante C tal que
f(x) = g(x) + C = 2 sin(x) + C
em qualquer intervalo dado [a, b] que contenha o zero. Podemos determinar C fazendo
x = 0
f(0) = 2 sin(0) + C
5 = 2.0 + C
de modo que C = 5. Assim, a função f é
f(x) = 2 sin(x) + 5.
A consequência do Teorema do Valor Médio a seguir, veri�ca as observações sobre
funções crescentes e decrescentes que comentamos no início desta seção.
Corolário 2.2.18 Se f ′(x) > 0 para todo x em (a, b), então f é uma função crescente
em [a, b]. Se f ′(x) < 0 para todo x em (a, b), então f é uma função decrescente em [a, b].
Demonstração: Suponhamos que f ′(x) > 0 para todo x em (a, b). Devemos mostrar
que, se m e n forem pontos de [a, b], com m < n, então f(m) < f(n). Aplicamos o
Teorema do Valor Médio a f , porém no intervalo fechado [m,n] pois, [m,n] está contido
em [a, b], logo f satisfaz as hipóteses do Teorema do Valor Médio tanto em [m,n] quanto
em [a, b]. O resultado é que
f(n) − f(m) = f ′(c)(n−m)
para algum número c ∈ (m,n). Como m < n e como por hipótese, f ′(c) > 0, segue que
f(n) − f(m) > 0
Ou seja, f(m) < f(n) como queríamos provar. Analogamente prova-se o caso em que
f ′(x) < 0.
Finalizamos esta seção salientando que não abordamos todos os Teoremas referen-
tes às derivadas em R, realizando uma comparação bem grosseira, o que aqui apresentamos
foi apenas a ponta de um grande iceberg. Caso o leitor queira se aprofundar em demais
resultados aconselhamos a leitura dos trabalhos de Lima (2008) e Edwards (1994).
57
2.3 A DIFERENCIAL EM R
De acordo com Edwards (1994), as vezes necessitamos de uma estimativa rápida
da variação f(x) resultante de uma dada variação de x, tal estimativa é dada por dife-
renciais que é outra aplicação da derivada. Por exemplo, podemos utilizar diferenciais
para determinar o problema da variação do alcance de um projétil quando o ângulo de
lançamento passa de α para β (sendo β próximo a α).
Primeiramente, admitimos que a alteração na variável independente seja o incre-
mento ∆x gerado na variação de x para x + ∆x. A variação do valor de y = f(x) é o
incremento ∆y obtido através da subtração
∆y = f(x+ ∆x) − f(x).
Queremos aproximar ∆y usando a aproximação linear que está relacionada com os diferen-
ciais. Utilizaremos a Figura 2.13 como auxílio para discutirmos a interpretação geométrica
dos diferenciais.
Figura 2.13: A diferencial.
Fonte: Produção do próprio autor.
Comparemos o incremento efetivo ∆y com a alteração que ocorreria no valor de y,
se este variasse à taxa �xa f ′(x) enquanto o valor da variável independente se deslocasse
de x para x+ ∆x. Essa variação em y é a diferencial
dy = f ′(x)∆x. (2.3.1)
Como podemos ver na Figura 2.13, dy é a variação da altura de um ponto que
se move ao longo da reta tangente. Vamos admitir x �xo, então pela Equação (2.3.1) a
diferencial dy é uma função linear do incremento ∆x. Edwards (1994) a�rma que, por esta
razão dy é chamado de aproximação linear do incremento ∆y. Assim, podemos aproximar
58
f(x+ ∆x) substituindo ∆y por dy.
f(x+ ∆x) = y + ∆y ≈ y + dy.
Como y = f(x) e dy = f ′(x)∆x, teremos a aproximação linear
f(x+ ∆x) ≈ f(x) + f ′(x)∆x. (2.3.2)
De fato, quando ∆x é pequeno, dy = f ′(x)∆x será uma boa aproximação para ∆y.
Vamos substituir x por a na Equação (2.3.2) obtendo a seguinte aproximação
f(a+ ∆x) ≈ f(a) + f ′(a)∆x, (2.3.3)
assim, como ∆x = x− a, x = a+ ∆x temos,
f(x) ≈ f(a) + f ′(a)(x− a).
O lado direito desta equação é uma função linear de x, chamado de aproximação linear
da função f na vizinhança do ponto x = a.
Como o próprio nome já diz, a aproximação linear gera um pequeno erro que é
determinado pelo cálculo da diferença entre a variação real e a estimativa diferencial, ou
seja,
Erro = ∆y − dy
= [f(a+ ∆x) − f(a)] − f ′(a)∆x
=
[f(a+ ∆x) − f(a)
∆x− f ′(a)
]∆x
= ϵ∆x
quando ∆x → 0, a relação incrementalf(a+ ∆x) − f(a)
∆xse aproxima de f ′(a) tornando
ϵ um valor muito pequeno, isso é, quando ∆x é pequeno, o erro ϵ∆x é menor ainda.
Exemplo 2.3.1 Calcule o valor aproximado de 3√
64.5.
Consideremos a função f(x) = 3√x e utilizando a Equação(2.3.3) temos que a aproximação
diferencial será dada por:
f(a+ ∆x) ≈ f(a) + f ′(a)∆x
≈ 3√a+
1
33√a2
∆x
59
Assumindo a = 64 e ∆x = 0.5 segue que
3√
64.5 ≈ 3√
64 +1
33√
642(0.5)
≈ 4 + 0.01041 = 4.01041
O valor calculado diretamente é 3√
64.5 = 4.01038. Assim a diferença entre os dois resul-
tados é da casa de 10−4.
Exemplo 2.3.2 O raio de uma esfera mede 9cm. Sabendo que o erro desta medida pode
ser de 0.05cm para mais, calcule, utilizando diferenciais, um valor aproximado para o erro
máximo no cálculo do volume desta esfera causado pelo erro de medida do raio.
O volume de uma esfera é representada pela expressão
V =4πr3
3
assim, o aumento estimado do volume é
dV = v′(r)dr
= 4πr2dr
onde dV e dr são respectivamente a diferencial do aumento do volume e o acréscimo do
raio. Logo,
dV = 4π(9)2(0.05) = 50.894cm3.
O volume da esfera com r = 9cm e com r = 9.05cm são dados respectivamente por V1 e
V2.
V1 =4(9)3π
3= 3053.628cm3
V2 =4(9.05)3π
3= 3104.805cm3
Portanto, o erro exato é ∆V = V2 − V1 = 51.177cm3 ≈ 50.894cm3 = dV .
Resumidamente, neste capítulo exploramos a ligação entre a reta tangente e a
derivada em R, apresentamos Teoremas referentes às derivadas e a aproximação linear
via diferenciais. Não foi possível explorar todo o conteúdo devido a sua amplitude, aos
leitores interessados recomendamos a leitura da obra de Lima (2008) e Edwards (1994).
No próximo capítulo iremos trabalhar com as derivadas de várias variáveis apresentando
as propriedades e suas devidas aplicações.
60
Capítulo 3
CÁLCULO DIFERENCIAL DE
VÁRIAS VARIÁVEIS
Vimos que uma ideia do cálculo diferencial baseia-se em aproximar funções não
lineares pelas lineares conforme discutido no capítulo anterior. No cálculo de apenas uma
variável real este conceito �ca bem claro, bastando considerar uma função f : R → Rdiferenciável no ponto a, logo a reta tangente ao grá�co y = f(x) no ponto (a, f(a)) será
y − f(a) = f ′(a)(x− a). (3.0.1)
Edwards (1973) descreve que o lado direito da Equação (3.0.1) é uma função linear de
x − a. Então, podemos considerá-la como uma aproximação linear para a variação de
f(x) − f(a) no valor entre a e x.
Contemos com o auxílio da Figura 3.1 para rede�nir, por conveniência, algumas
variáveis que utilizamos no capítulo anterior, adotando as seguintes relações: ∆fa(h) =
f(a+ h) − f(a), dfa(h) = f ′(a)h e h = x− a.
Figura 3.1: Aproximação linear
Fonte: EDWARDS (1973, p.56), editado pelo autor.
61
De acordo com Edwards (1973), a função linear dfa : R → R de�nida por dfa(h) =
f ′(a)h é chamada de diferencial de f em a, ela é a função linear dfa : R → R cuja matriz
(1 × 1) é a derivada f ′(a) de f em a, não referenciada anteriomente por ser uma matriz
unitária. Assim, se h for pequeno, a variação linear dfa(h) será uma boa aproximação da
variação efetiva ∆fa(h), de modo que
limh→0
∆fa(h) − dfa(h)
h= 0.
Resumidamente falando, veremos neste capítulo que a aplicação f : Rn → Rm será
por de�nição diferenciável em a se, e somente se, próximo ao ponto a houver uma apro-
priada aproximação linear dfa : Rn → Rm. Nesse caso, dfa será chamada de diferencial
de f em a e a sua matriz (m × n) será chamada de derivada de f em a, �preservando
assim a relação acima entre o diferencial (uma função linear) e a derivada (as matri-
zes).�(EDWARDS, 1973, p.57, tradução nossa). A motivação para explorarmos o cálculo
diferencial de várias variáveis não se dá mais no problema em de�nir reta tangente como
nos ocupamos até o momento, mas sim em determinar o plano tangente à imagem das fun-
ções em um determinado ponto, permitindo-nos acesso a um novo conjunto de ferramentas
para o tratamento destas funções. O plano tangente que estamos nos referimos não serve
apenas para funções de duas variáveis, aqui generalizamos este conceito e trabalhamos na
verdade com hiperplanos, que são planos em diferentes dimensões.
Para prosseguirmos com o nosso estudo será necessário de�nir a aplicação que nos
servirá de pilar neste capítulo de funções de várias variáveis.
De�nição 3.0.3 Uma aplicação vetorial de várias variáveis f : D ⊂ Rn → Rm, é uma
aplicação que associa cada vetor v ∈ D a um único vetor f(v) em Rm.
3.1 CURVAS EM Rm
Seguindo o raciocínio de Edwards (1973), vamos considerar primeiro o caso especial
da aplicação f : R → Rm. Se pedirmos alguns exemplos de curvas, o leitor provavelmente
terá em mente algum subconjunto de R2 e R3, por exemplo, uma circunferência f :
[0, 2π] ⊂ R → R2 de�nida por f(t) = (a cos(t), a sin(t)) de raio a, ou uma curva aleatória
no espaço (ver Exemplo 3.1.2). Generalizando esta ideia de curvas, de�nimos curvas em
Rm.
De�nição 3.1.1 Uma curva de Rm é uma aplicação da forma
f : D ⊆ R → Rm
que associa cada valor t ∈ D a um único vetor f(t) ∈ Rm.
62
Chamaremos a imagem de f de trajetória da curva ou traço da curva.
Exemplo 3.1.2 Seja a curva f : R → R3 de�nida por f(t) = (cos(t), sin(t), t).
Neste exemplo, a trajetória da curva f é a hélice representada pela Figura 3.2.
Figura 3.2: Representação geométrica da hélice.
Fonte: Produção do próprio autor.
Considere a seguinte aplicação f : D ⊂ R → Rm com f(x) = (f1(x), · · · , fm(x))
para cada x ∈ D. Então, f1, · · · , fm são funções de valores reais ditas coordenadas funci-
onais de f . O Lema a seguir trata do limite em cada coordenada funcional, estendendo
os conceitos de limites de uma variável para aplicações da forma f : D ⊂ R → Rm.
Lema 3.1.3 Suponha f = (f1, · · · , fm) : D → Rm sendo a um ponto de acumulação de
D e b = (b1, · · · , bm) ∈ Rm. Então,
limx→a
f(x) = b (3.1.1)
se, e somente se
limx→a
fi(x) = bi, i = 1, · · · ,m. (3.1.2)
Demonstração:
(⇒) Dado ε > 0 existe δ > 0 tal que para x ∈ D e 0 < |x−a| < δ implica em |f(x)−b| < ε.
Assim,
0 < |x− a| < δ ⇒ |fi(x) − bi| =
√(fi − bi)
2
6√
(f1 − b1)2 + · · · + (fm − bm)2
= |f(x) − b| < ε,
Logo, (3.1.2) é válida para cada i = 1, · · · ,m.
(⇐) Dado ε > 0, para cada i = 1, · · · ,m existe um δi > 0 tal que
x ∈ D e 0 < |x− a| < δi ⇒ |fi(x) − bi| <ε√m.
63
Se escolhermos agora δ = min{δ1, · · · , δm}, então x ∈ D e
0 < |x− a| < δ ⇒ |f(x) − b| =
[m∑
i=1
|fi(x) − bi|2] 1
2
=(|f1(x) − b1|2 + ...+ |fm(x) − bm|2
) 12
<
[(ε√m
)2
+ ...+
(ε√m
)2] 1
2
=(ε2m
m
) 12
= ε.
com isso prova-se a recíproca.
Pelo Lema 3.1.3, a aplicação f : R → Rm é diferenciável em a se, e somente se,
cada uma de suas coordenadas funcionais f1, · · · , fm for diferenciável em a, nesse caso
f ′ = (f ′1, · · · , f ′
m).
Portanto, a aplicação f : R → Rm poderá ser diferenciável em cada termo de suas coor-
denadas e se aplicarmos as propriedades de derivada de funções reais para cada função
coordenada devemos obter os resultados descritos no Teorema 3.1.5 que será ainda apre-
sentado nesta seção.
Agora, vamos considerar uma curva em Rm traçada por um ponto móvel cuja
posição no tempo t se dá por f(t) ∈ Rm, queremos de�nir sua velocidade no ponto t.
Para m = 1 o problema nos remete à de�nição de derivada, vista no capítulo anterior, f ′
de f . A mudança da posição da partícula do tempo a ao tempo a+h é descrito pelo vetor
f(a+ h) − f(a), assim a velocidade média da partícula durante este intervalo de tempo é
a conhecida relação incremental
f(a+ h) − f(a)
h,
se o limite existir ao fazer h tender para 0, pela De�nição 2.1.5, a velocidade instantânea
no tempo a passa a ser de�nida por
f ′(a) = limh→0
f(a+ h) − f(a)
h
e neste caso, diremos que f é diferenciável em a ∈ R. O vetor derivada f ′(a) de f em
a pode ser considerado como o vetor tangente à curva no ponto f(a), como podemos
visualizar na Figura 3.3 supondo estarmos trabalhando no espaço tridimensional. O com-
primento, expresso pelo módulo |f ′(a)| é a velocidade escalar em t = a obtido movendo o
ponto f(t) através da curva. Assim, chamaremos f ′(a) de vetor velocidade em t = a.
64
Se a aplicação f ′ : R → Rm em si é derivável em a, sua derivada em a é dita segunda
derivada, f ′′, de f em a. Se continuarmos com a ideia de f exprimir o movimento de um
ponto em Rm, chamaremos f ′′(a) de vetor aceleração em t = a.
Figura 3.3: Vetor derivada em R3.
Fonte: Produção do próprio autor.
Vamos de�nir as operações entre as aplicações R → Rm de acordo com o que segue.
De�nição 3.1.4 Considere as aplicações f, g : R → Rm dadas por f = (f1, · · · , fm),
g = (g1, · · · , gm) e uma função φ : R → R. Assim, de�nimos (f+g), (φf), (f.g) : R → Rm
respectivamente por
f + g = (f1 + g1, · · · , fm + gm),
φf = (φf1, · · · , φfm),
f.g = f1.g1 + · · · + fm.gm.
Teorema 3.1.5 Considere as aplicações f, g : R → Rm e φ : R → R, todas diferenciáveis.
Então,
(f + g)′ = f ′ + g′,
(φf)′ = φ′f + φf ′,
(f.g)′ = f ′.g + f.g′,
(f ◦ φ)′(t) = φ′(t)f ′(φ(t)).
Esta última é chamada de regra da cadeia para a composição R φ→ R f→ Rm.
Demonstração: Considere as aplicações diferenciáveis f, g : R → Rm de�nidas por
f = (f1, · · · , fm) e g = (g1, · · · , gm). Assim,
65
i (f + g)′ = f ′ + g′, pois
(f + g)′ = (f1 + g1, · · · , fm + gm)′
= ((f1 + g1)′, · · · , (fm + gm)′)
= (f ′1 + g′
1, · · · , f ′m + g′
m)
= (f ′1, · · · , f ′
m) + (g′1, · · · , g′
m)
= f ′ + g′.
ii (φf)′ = φ′f + φf ′, pois
(φf)′ = (φf1, · · · , φfm)′
= ((φf1)′, · · · , (φfm)′)
= (φ′f1 + f ′1φ, · · · , φ′fm + f ′
mφ)
= (φ′f1, · · · , φ′fm) + (f ′1φ, · · · , f ′
mφ)
= φ′f + f ′φ.
iii (fg)′ = f ′g + fg′, pois
(f.g)′ = (f1.g1 + · · · + fm.gm)′
= ((f1.g1)′ + · · · + (fm.gm)′)
= (f ′1.g1 + g′
1.f1 + · · · + f ′m.gm + g′
m.fm)
= (f ′1.g1 + · · · + f ′
m.gm) + (g′1.f1 + · · · + g′
m.fm)
= f ′.g + g′.f.
iv (f ◦ φ)′(t) = φ′(t)f ′(φ(t)), pois
(f ◦ φ)′(t) = ((f1 ◦ φ)(t), · · · , (fm ◦ φ)(t))′
= ((f1 ◦ φ)′(t), · · · , (fm ◦ φ)′(t))
= (f ′1(φ(t))φ′(t)), · · · , f ′
m(φ(t))φ′(t))
= φ′(t)(f ′1(φ(t)), · · · , f ′
m(φ(t)))
= φ′(t)f ′(φ(t)).
Edwards (1973) a�rma que duas curvas com mesma derivada diferem apenas por
uma constante, que neste caso passa a ser um vetor, ou seja, o Corolário 2.2.16 estende-se
66
para as aplicações R em Rm. De fato, consideremos as aplicações
f : R → Rm
x 7→ (f1(x), f2(x), · · · , fm(x))
g : R → Rm
x 7→ (g1(x), g2(x), · · · , gm(x))
Por hipótese sabemos que f ′(x) = g′(x). Derivando as aplicações obtemos,
f ′(x) = (f ′1(x), f
′2(x), · · · , f ′
m(x))
g′(x) = (g′1(x), g
′2(x), · · · , g′
m(x))
Assim,
f ′(x) = g′(x) ⇒ f ′i(x) = g′
i(x), i ∈ {1, · · · ,m}.
Pelo Corolário 2.2.16 do Capítulo anterior temos que,
fi(x) − gi(x) = ci, ∀i ∈ {1, · · · ,m}.
Portanto,
f(x) − g(x) = (f1(x) − g1(x), f2(x) − g2(x), · · · , fm(x) − gm(x))
= (c1, c2, · · · , cm).
O mesmo autor a�rma que o Teorema do valor médio (Teorema 2.2.14) não se
mantém, um contra exemplo é apresentado a seguir.
Exemplo 3.1.6 Considere uma partícula que se move sobre uma hélice circular em R3,
cuja posição é descrita pelo vetor
γ(t) = (a cos(ωt), a sin(ωt), bωt)
com a, b e ω constantes. Conclua que a equação
γ′(τ) =γ(t2) − γ(t1)
t2 − t1. (3.1.3)
não é válida para qualquer τ ∈ (t1, t2).
67
Consideremos t1 = 0 e t2 = 2πω, assim γ(t1) = (a, 0, 0) e γ(t2) = (a, 0, 2πb). Temos que
γ′(t)|t=τ = ω(−a sin(ωτ), a cos(ωτ), b).
Então substituindo as informações na Equação (3.1.3) obtemos,
ω(−a sin(ωτ), a cos(ωτ), b) =(a, 0, 2πb) − (a, 0, 0)
2π
ω− 0
=ω
2π(0, 0, 2πb)
= ω(0, 0, b).
Portanto,
(−a sin(ωτ), a cos(ωτ), b) = (0, 0, b).
Logo, sin(ωτ) = 0 e cos(ωτ) = 0. Absurdo, pois não podemos satisfazer estas duas
igualdades simultaneamente. Assim, apresentamos um exemplo de que o Teorema do
valor médio não vale para curvas.
No início desta seção vimos que para aplicações f : R → Rm diferenciáveis com
m = 1, f ′(a) pode ser considerado como o vetor tangente à curva no ponto f(a). Vamos
estender este conceito para m > 1 e de�nir conforme Edwards (1973) a construção da
linha tangente da seguinte forma.
De�nição 3.1.7 A linha tangente à imagem da curva em f(a) da aplicação diferenciável
f : R → Rm é a linha que passa por f(a) e é paralela ao vetor tangente f ′(a).
O Teorema a seguir nos fornece a condição necessária e su�ciente para que uma
aplicação f : R → Rm seja diferenciável em a ∈ R.
Teorema 3.1.8 A aplicação f : R → Rm é diferenciável em a ∈ R se, e somente se,
existir uma aplicação linear L : R → Rm tal que
limh→0
f(a+ h) − f(a) − L(h)
h= 0. (3.1.4)
Demonstração:
(⇒) Suponha que a aplicação f : R → Rm seja diferenciável em a ∈ R, ou seja,
f ′(a) = limh→0
f(a+ h) − f(a)
h
0 = limh→0
f(a+ h) − f(a)
h− f ′(a)
0 = limh→0
f(a+ h) − f(a) − hf ′(a)
h.
68
Assim, vamos considerar L : R → Rm de�nida por L(h) = hf ′(a), de fato L(h) é linear,
pois para quaisquer k, h1, h2 ∈ R
L(kh1 + h2) = (kh1 + h2)f′(a)
= kh1f′(a) + h2f
′(a)
= h1f′(a)k + h2f
′(a)
= L(h1)k + L(h2).
Portanto,
limh→0
f(a+ h) − f(a) − L(h)
h= 0.
(⇐) Suponha uma aplicação linear L : R → Rm que satisfaça a Equação (3.1.4). Então,
existe b ∈ Rm tal que L é de�nido por L(h) = hb. Mostraremos que f ′(a) existe e assume
f ′(a) = b. Assim,
f ′(a) = limh→0
f(a+ h) − f(a)
h= lim
h→0
f(a+ h) − f(a)
h+ b− b
= limh→0
f(a+ h) − f(a) − hb
h+ b
= 0 + b
= b.
Portanto, a aplicação é diferenciável em a ∈ R e f ′(a) = b.
Representaremos gra�camente o resultado do Teorema 3.1.8 com o auxílio da Fi-
gura 3.4, supondo estarmos trabalhando no espaço tridimensional. Para tal, consideremos
uma aplicação f : R → Rm de�nindo
∆fa(h) = f(a+ h) − f(a)
para a variação em f de a para a+ h, e
dfa(h) = hf ′(a)
para a linearidade como uma função dependente de h, cujo objetivo é alterar o compri-
mento de f ′(a) ao longo da linha tangente.
69
Figura 3.4: Aproximação por uma aplicação linear em R3.
Fonte: Produção do próprio autor.
De fato, quando h é pequeno, menor será o vetor diferença ∆fa(h) − dfa(h), de tal
forma que
limh→0
∆fa(h) − dfa(h)
h= 0.
Segundo Edwards (1973), se f : R → Rm é diferenciável em a, então a aplicação
linear dfa : R → Rm de�nida por dfa(h) = hf ′(a) é chamada diferencial de f em a. Repare
que se olharmos a derivada f ′(a) como um vetor coluna então ele é a matriz da aplicação
linear dfa e se apresenta da seguinte forma
dfa(h) = hf ′(a) =
f ′1(a)...
f ′m(a)
(h).
Na próxima seção vamos de�nir derivadas e a diferencial para aplicações de Rn em
Rm, adiantamos que esta relação discutida será mantida, sendo a diferencial a aplicação
linear cuja matriz é a derivada.
3.2 DERIVADAS DIRECIONAIS E O DIFERENCIAL
Conforme visto nos capítulos anteriores, a ideia da derivada de funções de uma
única variável baseia-se em de�nir uma reta tangente à curva. De uma maneira bem
similar, o conceito de diferenciabilidade de funções de várias variáveis é motivado pelo
problema em de�nir planos tangentes às superfícies, planos esses com o mesmo conceito
de hiperplanos, conforme comentado anteriormente.
Conforme Edwards(1973), normalmente de�nimos o grá�co em R3 da função
f : R2 → R como uma superfície cuja projeção está no plano xy. Podemos considerar este
grá�co como a imagem da aplicação F : R2 → R3 de�nida por F (x, y) = (x, y, f(x, y)).
Vamos generalizar esta interpretação geométrica no caso de m > n e tomar a
imagem da aplicação F : Rn → Rm como uma superfície n-dimensional em Rm, tendo
70
em cada ponto um plano tangente n-dimensional. Entende-se por plano n-dimensional
em Rm como sendo a translação paralela de um subespaço de dimensão n em Rm. Se V
for um subespaço de Rm, a sua translação paralela pelo ponto a ∈ Rm será formada pelo
conjunto dos pontos x ∈ Rm tais que x− a ∈ V , isto é
W = {x ∈ Rm/x = v + a : v ∈ V } .
A Figura 3.5 ilustra o que acabamos de discutir para o caso particular de um subespaço
V de dimensão 1 em R3.
Figura 3.5: Translação paralela do subespaço V .
Fonte: Produção do próprio autor.
Se V é o conjunto solução da equação linear
Ax = 0,
onde
V = {v ∈ Rm/Av = 0},
então a translação paralela de V é o conjunto solução da equação
A(x− a) = 0,
pois v = x− a ∈ V .
Consideremos a aplicação F : Rn → Rm e um ponto a ∈ Rn. Queremos de�nir
um plano tangente à imagem da superfície S de F em F (a). Assim, o plano tangente
deve consistir de todas as linhas tangentes às curvas contidas na superfície S em F (a)
conforme ilustrado na Figura 3.6. Daqui por diante, quando mencionarmos um ponto
a ∈ Rn, estaremos nos referindo ao ponto A de Rn que tem como vetor posição o vetor a.
71
Figura 3.6: Plano tangente
Fonte: EDWARDS (1973, p.64), editado pelo autor
Dado um vetor v ∈ Rn e um ponto a ∈ Rn, construiremos uma curva γv : R → Rm
de�nida por
γv(t) = F (a+ tv)
para cada t ∈ R. Tal curva é a imagem F da linha em Rn que passa pelo ponto a e é
paralela ao vetor v. Com o auxílio desta curva, de�nimos
De�nição 3.2.1 A derivada direcional com respeito a v de F em a é o vetor velocidade
γ′v(0), ou seja,
γ′v(0) = F ′(a).v
= DvF (a).
Isto é,
DvF (a) = limh→0
F (a+ hv) − F (a)
h
desde que o limite exista.
Assim, o vetor DvF (a) transladado para o ponto F (a) torna-se o vetor tangente à
S em F (a) conforme Figura 3.7.
72
Figura 3.7: Derivada direcional
Fonte: EDWARDS (1973, p.65), editado pelo autor
Segundo Edwards (1973), o interessante em se estudar esse conteúdo são as deri-
vadas direcionais de F em relação aos vetores das bases canônicas e1, · · · , en. Essas são
chamadas de derivadas parciais de F , cuja i-ésima derivada parcial de F em a denota-se
por
DiF (a) ou∂F
∂xi
(a),
cuja de�nição é
DiF (a) =∂F
∂xi
(a) = DeiF (a). (3.2.1)
Se a = (a1, · · · , an) ∈ Rn, então a i-ésima derivada parcial será
DiF (a) = limh→0
F (a+ hei) − F (a)
h
= limh→0
F (a1, · · · , ai + h, · · · , an) − F (a1, · · · , ai, · · · , an)
h.
Assim, DiF (a) é o resultado de diferenciar F como uma função de xi, mantendo as demais
variáveis �xadas.
Exemplo 3.2.2 Determine as derivadas parciais da função f(x, y, z) = y3 + x sin(yz).
Derivando parcialmente a função, segue que
D1f(x, y, z) = sin(yz), (3.2.2)
D2f(x, y, z) = 3y2 + xz cos(yz),
D3f(x, y, z) = xy cos(yz).
De acordo com Gonçalves (2000), as derivadas parciais de uma aplicação vetorial f
também são aplicações de várias variáveis. Portanto, se as derivadas parciais destas apli-
73
cações existem, elas são ditas derivadas de segunda ordem de f . Seguindo este raciocínio,
obtemos as derivadas parciais de ordem superior.
Através da igualdade
DcvF (a) = limh→0
F (a+ hcv) − F (a)
h
= c limh→0
F (a+ hcv) − F (a)
hc
= c limk→0
F (a+ kv) − F (a)
k= cDvF (a),
concluímos que, se v e w forem colineares em Rn, então DvF (a) e DwF (a) serão colineares
em Rm . De fato, se v e w forem colineares em Rn, então haverá uma linha que passa
por a ∈ Rn paralela aos dois vetores simultaneamente. Assim, a imagem dessa linha
acarretará numa única curva e portanto as derivadas direcionais DvF (a) e DwF (a) a essa
curva serão colineares.
Assim, cada reta que passa pela origem em Rn determinará uma reta que passa
pela origem em Rm. Desejamos que a união de todas as retas em Rm obtidas desse modo,
isto é
La = {DvF (a) ∈ Rm/∀v ∈ Rn} ,
seja um subespaço de Rm. Se La for um subespaço de Rm, então a translação paralela
de La para F (a) será um bom candidato para o plano tangente a superfície S em F (a).
O conjunto La ⊂ Rm é a imagem de Rn pela aplicação L : Rn → Rm de�nida por
L(v) = DvF (a), ∀v ∈ Rn.
De�nição 3.2.3 Seja T : V → W uma aplicação linear. A imagem de T é o conjunto
de vetores w ∈ W tais que existe um vetor v ∈ V , que satisfaz T (v) = w. Ou seja,
Im(T ) = {w ∈ W/T (v) = w, para algum v ∈ V }.
Notemos que a imagem da aplicação linear sempre é um subespaço, então podemos
garantir que La é um subespaço de Rm, exigindo que L seja uma aplicação linear.
Estamos à procura de um plano tangente à superfície S que se ajuste próximo ao
ponto F (a). Isto signi�ca que queremos que L(v) seja uma boa aproximação de F (a +
v) − F (v) quando |v| for pequeno. Esse resultado já foi apresentado no Teorema 3.1.8
para o caso de aplicações do tipo f : R → Rm. Agora, adotamos a condição necessária e
su�ciente para a de�nição de diferenciabilidade no caso geral.
De�nição 3.2.4 A aplicação F , a partir de um subconjunto D ⊂ Rn em Rm, é diferen-
ciável no ponto a ∈ D se, e somente se, existir uma aplicação linear L : Rn → Rm, tal
74
que
limh→0
F (a+ h) − F (a) − L(h)
|h|= 0. (3.2.3)
A aplicação linear L também denota-se por dFa e é chamada de diferencial de F em
a, sua matriz F ′(a) é chamada de derivada de F em a. Poderíamos também de�nir dF (a)
como uma função que possui derivadas direcionais em todas as direções no ponto a como
é feito para funções de uma variável, mas com isso a diferenciabilidade não implicaria na
continuidade.
A partir da de�nição podemos provar que o operador L é único, ou seja, a derivada
é única. A demonstração desse fato será feita no capítulo seguinte para um caso mais
geral.
Teorema 3.2.5 Se a aplicação F : D ⊆ Rn → Rm é diferenciável em a ∈ D, então F é
contínua em a.
Demonstração: Como F é diferenciável em a, então
limh→0
F (a+ h) − F (a) − L(h)
|h|= 0,
ou, equivalentemente
F (a+ h) = F (a) + L(h) + o(|h|) (3.2.4)
onde limh→0
o(|h|)|h|
= 0. Reescrevendo a Equação (3.2.4)
F (a+ h) = F (a) + L(h) +o(|h|)|h|
|h|
Aplicando o limite em ambos os lados, obtemos
limh→0
F (a+ h) = limh→0
[F (a) + L(h) +
o(|h|)|h|
|h|]
= F (a) + limh→0
L(h) + limh→0
[o(|h|)|h|
|h|]
= F (a) + L(0) + limh→0
o(|h|)|h|
limh→0
|h|
= F (a) + 0 + 0.0
= F (a).
Portanto, F é contínua em a.
75
Lema 3.2.6 A aplicação f : Rn → Rm é linear, se e somente se, existir uma matriz A
tal que f(x) = Ax para todo x ∈ Rn. Então, A é a matriz m× n cuja j-ésima coluna é o
vetor coluna f(ej), onde ej = (0, · · · , 1, · · · , 0) é um vetor unitário de Rn.
Demonstração:
(⇒) Considere a aplicação linear f : Rn → Rm, com
f(ej) =
a1j
...
amj
e A = (aij)
Então, dado
x = (x1, · · · , xn) ∈ Rn
= x1e1 + · · · + xnen ∈ Rn
logo
f(x) = f(x1e1 + · · · + xnen)
= x1f(e1) + · · · + xnf(en)
= x1
a11
...
am1
+ · · · + xn
a1n
...
amn
=
a11x1 + · · · + a1nxn
a21x1 + · · · + a2nxn
......
am1x1 + · · · + amnxn
= Ax.
(⇐) Seja A a matriz tal que
f(x) = Ax, ∀x ∈ Rn.
Realizando o processo inverso obtemos
f(x) = f(x1e1 + · · · + xnen).
76
Assim, a aplicação f : Rn → Rm é linear, pois
f(x+ ty) = f(x1e1 + · · · + xnen + ty1e1 + · · · + tynen)
= f((x1 + ty1)e1 + · · · + (xn + tyn)en)
= f(x1e1 + · · · + xnen) + f(ty1e1 + · · · + tynen)
= f(x) + tf(y).
Através do Lema 3.2.6 temos que F ′(a) é a única matriz m× n tal que
dFa(x) = F ′(a)x, ∀x ∈ Rn.
De fato, suponhamos que A não seja única, então existe uma matriz B tal que
f(x) = Bx.
Assim, pelo Lema 3.2.6
f(x) = f(x1e1 + · · · + xnen).
Portanto A = B.
Será abordado mais à frente a prova que o diferencial de F em a está bem de�nido
e para tal, basta mostrar que
F ′(a) =
(∂Fi
∂xj
(a)
)= (DjFi(a)) (3.2.5)
em termos das derivadas parciais das coordenadas funcionais F1, · · · , Fm de F . Assim, se
L1 e L2 são duas aplicações lineares que satisfazem simultaneamente a Equação (3.2.3),
então cada uma teria a mesma matriz apresentada na Equação (3.2.5), o que as tornaria
a mesma aplicação linear.
Se escrevemos ∆Fa = F (a+ h) − F (a), então a Equação (3.2.3) será da forma
limh→0
∆Fa(h) − dFa(h)
|h|= 0.
Como havíamos mencionado na seção anterior, essa equação nos a�rma que a diferença
entre a variação efetiva (real) F entre a e a+ h e a variação aproximada dFa irá para zero
mais rapidamente do que h quando h tende para 0. Denotaremos a aproximação para
a variação efetiva pela diferencial por ∆Fa(h) ≈ dFa(h) ou F (a + h) ≈ F (a) + dFa(h).
Adiante, veremos que se conhecermos as derivadas parciais de F em a, então dFa(h) será
muito fácil de se calcular e esse nos dará uma boa aproximação de F (a + h) quando |h|
77
for pequeno, a Figura 3.8 exempli�ca a aproximação de F (a + h) pelo diferencial para
uma aplicação F : R2 → R3.
Figura 3.8: Aproximação pelo diferencial.
Fonte: EDWARDS (1973, p.68), editado pelo autor
Exemplo 3.2.7 Se F : Rn → Rm é uma aplicação constante, isto é, existe b ∈ Rm tal
que F (x) = b para todo x ∈ Rn, então F é diferenciável com dFa = 0.
De fato, substituindo as informações na Equação (3.2.3), obtemos:
limh→0
F (a+ h) − F (a) − dFa(h)
|h|= lim
h→0
b− b− dFa(h)
|h|= lim
h→0
−dFa(h)
|h|.
Note que na De�nição 3.2.4 deve existir L, então tomando L = dFa = 0 mostramos que
existe e o limite é zero, logo F é diferenciável.
Exemplo 3.2.8 Se F : Rn → Rm é linear, então F é diferenciável em todo o domínio
com
dFa = F ∀a ∈ Rn.
De fato, a aplicação linear é seu próprio diferencial, pois escolhendo dFa = F temos
limh→0
F (a+ h) − F (a) − dFa(h)
|h|= lim
h→0
F (a) + F (h) − F (a) − dFa(h)
|h|
= limh→0
F (h) − dFa(h)
|h|
= limh→0
F (h) − F (h)
|h|
= limh→0
0
|h|= 0,
78
e pela De�nição 3.2.4 F é diferenciável.
Relacionaremos agora, o diferencial com a derivada direcional através do Teorema
responsável pela sua de�nição.
Teorema 3.2.9 Se F : Rn → Rm é diferenciável em a, então a derivada direcional
DvF (a) existe para todo v ∈ Rn e
DvF (a) = dFa(v).
Demonstração: Como F é diferenciável em a por hipótese, temos na Equação (3.2.3)
substituindo h = tv com t tendendo para zero:
0 = limt→0
F (a+ tv) − F (a) − dFa(tv)
|tv|= lim
t→0
F (a+ tv) − F (a) − tdFa(v)
|tv|
=1
|v|
[limt→0
F (a+ tv) − F (a)
t− dFa(v)
]
logo
DvF (a) = limt→0
F (a+ tv) − F (a)
t
existe e
DvF (a) = dFa(v).
Assim, DvF (a) existe e a igualdade DvF (a) = dFa(v) é satisfeita.
A recíproca deste Teorema é falsa. Uma função pode possuir diversas derivadas
direcionais, no entanto a função pode não ser diferenciável e para isto ocorrer, basta que
a função seja descontínua no ponto em questão, um exemplo deste caso é apresentado a
seguir.
Exemplo 3.2.10 Considere a função f : R2 → R de�nida por
f(x, y) =
x2y
x4 + y2, se (x, y) = (0, 0);
0, se (x, y) = (0, 0).
cuja representação grá�ca é dada pela Figura 3.9.
79
Figura 3.9: Grá�co de f(x, y).
Fonte: Produção do próprio autor.
Seja v = (a, b) ∈ R2 com b = 0. Então
Dvf(0, 0) = limh→0
f(ah, bh) − f(0, 0)
h
= limh→0
a2h2bh− 0
(a4h4 + b2h2)h
= limh→0
a2b
a4h+ b2=a2
b
a derivada direcional Dvf(0, 0) existe para todo v ∈ R2. Entretanto, a função f(x, y) não
é contínua em O(0, 0) e consequentemente pelo Teorema 3.2.5 f não é diferenciável. De
fato,
lim(x,y)→(0,0)
f(x, y) não existe.
Pois, consideremos C = {(x, y) ∈ R2; y = kx2} como o conjunto de curvas (pará-
bolas) que passam por O(0, 0). Assim,
lim(x,y)→
C(0,0)
f(x, y) = lim(x,kx2)→(0,0)
f(x, kx2)
= limx→0
x2kx2
x4 + k2x4
= limx→0
k
1 + k2
=k
1 + k2= 0 ∀k = 0.
80
Logo, o limite depende do coe�ciente da parábola para se aproximar de 0. Considerando
k = 1 temos que o limite é −1
2e para k = 0 o limite é 0, um absurdo pela unicidade do
limite.
O Teorema a seguir se aprofunda mais em derivadas direcionais expressando-as em
termos das derivadas parciais.
Teorema 3.2.11 Se F : Rn → Rm é diferenciável em a e v = (v1, · · · , vn), então
DvF (a) =n∑
j=1
vjDjF (a).
Demonstração: Pelo fato de F : Rn → Rm ser diferenciável no ponto a, temos pelo
Teorema 3.2.9 a seguinte igualdade
DvF (a) = dFa(v).
Então, pela linearidade dFa temos
DvF (a) = dFa(v1e1 + · · · + vnen)
= dFa(v1e1) + · · · + dFa(vnen)
= v1dFa(e1) + · · · + vndFa(en)
=n∑
j=1
vjdFa(ej).
Pelo Teorema 3.2.9,
dFa(ej) = DejF (a) = DjF (a)
e assim,
DvF (a) =n∑
j=1
vjDjF (a).
No caso da função de valores reais f : Rn → R (m = 1), o vetor
∇f (a) = (D1f (a), · · · , Dnf (a)) ∈ Rn,
cujas componentes são as derivadas parciais de f , é chamado de vetor gradiente de f em
a. Podemos então reescrever o resultado do Teorema 3.2.11 como uma dependência das
derivadas parciais, isto é
Dvf (a) = ∇f (a).v (3.2.6)
81
considerando o produto escalar usual.
No exemplo a seguir, utilizaremos a diferencial como ferramenta para aproximar o
valor de uma determinada função.
Exemplo 3.2.12 Utilize a Equação (3.2.6) e a aproximação ∆fa(h) ≈ dfa(h) para esti-
mar o valor de [(13.1)2 − (4.9)2]12 .
Consideremos a função
f(x, y) = (x2 − y2)12 ,
com a = (13, 5), cuja diferença é h =(
110, −1
10
). As derivadas parciais são:
D1f(x, y) =x
(x2 − y2)12
D2f(x, y) =−y
(x2 − y2)12
Assim, f (a) = 12, D1f (a) = 1312
e D2f (a) = −512. Reescrevendo,
∆fa(h) ≈ dfa(h)
f (a+ h) − f (a) ≈ Dhf (a)
f (a+ h) ≈ f (a) + ∇f (a).h
logo
[(13.1)2 − (4.9)2
] 12 ≈ f(13, 5) + ∇f(13, 5).
(1
10,−1
10
)
= 12 +
(13
12
)(1
10
)+
(−5
12
)(−1
10
)
= 12.15.
Nosso objetivo agora é investigar o signi�cado do vetor gradiente, sendo assim,
vamos considerar uma função diferenciável f : Rn → R e um ponto a ∈ Rn, com ∇f (a) =0. Suponha que queremos determinar a direção de máxima variação de f a partir de a.
A direção será dada pelo vetor unitário u e o ângulo entre u e ∇f (a) por θu. Então, da
Equação (3.2.6) temos,
Duf (a) = ∇f (a).u = |∇f (a)| cos θu.
Deste modo, Duf (a) será máximo quando cos θu = 1, ou seja, quando θu = 0, por
conta disto u e ∇f (a) serão de mesma direção e sentido. De modo análogo, Duf (a)
será mínimo quando cos θu = −1, ou seja, quando θu = π, então u e ∇f (a) terão a
82
mesma direção, porém sentido oposto. E assim, concluímos que |∇f (a)| e −|∇f (a)|serão, respectivamente, os valores de máximo e de mínimo na variação de f a partir de a.
Por exemplo, supondo que f (a) denota a temperatura no ponto a. É natural
pensarmos que o calor procura o frio (o quente tende a se resfriar), isso é, o �uxo de calor
percorre uma direção oposta à de maior aumento na temperatura. Isto nos sugere que a
direção do �uxo do calor em a é dada pelo vetor −∇f (a).
Exemplo 3.2.13 Dada a função temperatura T : R3 → R de�nida por
T (x, y, z) =1
x2 + y2 + z2.
Determine a trajetória descrita por uma partícula que parte de a = (2,−3, 3) que necessita
aquecer-se o mais rápido possível.
Calculemos as derivadas parciais da função temperatura aplicadas em a.
D1T (a) = − 4
(4 + 9 + 9)2 = − 2
242
D2T (a) =6
(4 + 9 + 9)2 =3
242
D3T (a) = − 6
(4 + 9 + 9)2 = − 3
242
Assim, a trajetória é descrita por ∇T (a) =
(− 2
242,
3
242,− 3
242
).
Se ∇f (a) = 0, então a é chamado de ponto crítico de f . De fato, se f é uma
função diferenciável de valores reais de�nido no conjunto aberto D ⊂ Rn e f atinge um
máximo ou mínimo local no ponto a ∈ D, então a é um ponto crítico de f . Para a função
gi(x) = f(a1, · · · , ai−1, x, ai+1, · · · , an) de�nida no intervalo aberto I ⊂ R e ai ∈ I com
máximo ou mínimo local em ai, então Dif (a) = g′i(ai) = 0.
Podemos reescrever a Equação (3.2.6) como uma versão de várias variáveis da
equação df =
(df
dx
)dx, para isso, tomemos x1, · · · , xn como coordenadas funcionais na
função identidade xi : Rn → R de�nido por xi(p1, · · · , pn) = pi, i = 1, · · · , n. Então, xi é
uma função linear, de modo que
dxia(h) = xi(h) = hi ∀a ∈ Rn.
Se a função f : Rn → R é diferenciável em a, então o Teorema 3.2.9, o Teorema 3.2.11 e
83
a Equação (3.2.6) nos garantem a seguinte relação de igualdade entre as funções lineares.
dfa(h) = Dhf (a)
= ∇f (a).h
=n∑
i=1
Dif (a)hi
=n∑
i=1
Dif (a)dxia(h).
Se suprimirmos o índice a e escrevermos∂f
∂xiao invés de Dif (a) obtemos a seguinte
fórmula
df =∂f
∂xidxi + · · · +
∂f
∂xndxn. (3.2.7)
A aplicação a → dfa que associa cada ponto a ∈ Rn na função linear dfa : Rn → R, échamada forma diferencial e a Equação (3.2.7) é a razão histórica para esta terminologia.
Agora, aplicaremos o Teorema 3.2.11 para concluir o cálculo da matriz derivada
F ′(a). Para tal, consideremos o seguinte Lema que trata do diferencial de suas compo-
nentes funcionais.
Lema 3.2.14 A aplicação F : Rn → Rm é diferenciável em a se, e somente se, cada uma
de suas componentes funcionais F 1, · · · , Fm for diferenciável em a, e
dFa = (dF 1a , · · · , dFm
a ).
Demonstração:
(⇒) De acordo com a De�nição 3.2.4 temos,
0 = limh→0
F (a+ h) − F (a) − L(h)
|h|
= limh→0
F (a+ h) − F (a) − dFa(h)
|h|= lim
h→0
[(F 1(a+ h), · · · , Fm(a+ h)) − (F 1(a), · · · , Fm(a)) − (dF 1
a (h), · · · , dFma (h))
] 1
|h|
= limh→0
(F 1(a+ h) − F 1(a) − dF 1
a (h)
|h|, · · · , F
m(a+ h) − Fm(a) − dFma (h)
|h|
)
=
(limh→0
F 1(a+ h) − F 1(a) − dF 1a (h)
|h|, · · · , lim
h→0
Fm(a+ h) − Fm(a) − dFma (h)
|h|
)
84
igualando componente a componente,
0 = limh→0
F 1(a+ h) − F 1(a) − dF 1a (h)
|h|...
0 = limh→0
Fm(a+ h) − Fm(a) − dFma (h)
|h|
Ou seja, cada uma de suas componentes funcionais F 1, · · · , Fm são diferenciáveis em a e
dFa = (dF 1a , · · · , dFm
a ).
pois cada componente de dFa é linear.
(⇐) De modo análogo provamos a volta.
Teorema 3.2.15 Se a aplicação F : Rn → Rm é diferenciável em a, então a matriz F ′(a)
de dFa é
F ′(a) = (DjFi(a)).
Isto é, DjFi(a) é o elemento da i-ésima linha e j-ésima coluna de F ′(a), note que essa
matriz é a matriz de F ′(a) em relação as bases canônicas de Rn e Rm.
F ′ =
∂F 1
∂x1
· · · ∂F 1
∂xn...
...∂Fm
∂x1
· · · ∂Fm
∂xn
.
Demonstração: Vamos utilizar o Lema 3.2.14 e o Teorema 3.2.11 para provar essa
igualdade. Assim,
dFa(v) =
dF 1a (v)...
dFma (v)
=
∑nj=1DjF
1(a)vj
...∑nj=1DjF
m(a)vj
= (DjFi(a))
v1
...
vn
.
Portanto, dFa(v) = F ′(a).v, como era esperado.
85
De�nição 3.2.16 Seja D um subconjunto de Rm. Dizemos que D é um conjunto aberto
se para todo ponto a ∈ D existe r > 0 tal que para todo v ∈ Rm com |v − a| < r tivermos
que v ∈ D.
Exemplo 3.2.17 O conjunto
D = {(x, y) ∈ R2 : 1 < x2 + y2 < 9}.
é aberto.
Consideremos a Figura 3.10 como ilustração deste exemplo.
Figura 3.10: Representação grá�ca do conjunto aberto.
Fonte: Produção do próprio autor.
De�nição 3.2.18 A aplicação F : Rn → Rm é dita continuamente diferenciável em a se
todas as derivadas parciais D1F, · · · , DnF existem em cada ponto de um conjunto aberto
que contém a e são contínuas em a.
Finalmente podemos formular a condição su�ciente para diferenciabilidade.
Teorema 3.2.19 Se F é continuamente diferenciável em a, então F é diferenciável em
a.
Demonstração: Pelo Lema 3.2.14, basta considerarmos uma função continuamente
diferenciável de valores reais f : Rn → R. Seja h = (h1, · · · , hn) com h0 = 0 e hi =
(h1, · · · , hi, 0, · · · , 0), i = 1, · · · , n. Então,
f (a+ h) − f (a) = f (a+ h) +[f (a+ h1) − f (a+ h1)
]+ · · · +
+[f (a+ hn−1) − f (a+ hn−1)
]− f (a+ h0).
86
Como h− hn = 0, reajustando os termos, temos
f (a+ h) − f (a) = f (a+ h1) − f (a+ h0) + f (a+ h2) − f (a+ h1) + · · · +
+f (a+ hn) − f (a+ hn−1)
=n∑
i=1
[f (a+ hi) − f (a+ hi−1)
].
O Teorema do valor médio para uma única variável (Teorema 2.2.14) nos dá
f (a+ hi) − f (a+ hi−1) = f(a1 + h1, · · · , ai−1 + hi−1, ai + hi,
ai+1, · · · , an) − f(a1 + h1, · · · , ai−1
+hi−1, ai, · · · , an)
= Dif(a1 + h1, · · · , ai−1 + hi−1, ci,
ai+1, · · · , an)hi
para algum ci ∈ (ai, ai + hi), desde que Dif seja a derivada da função
g(x) = f(a1, · · · , ai−1, x, ai+1, · · · , an).
Portanto, f (a+ hi) − f (a+ hi−1) = hiDif (bi) para algum ponto bi que se aproxima de a
quando h → 0. Assim,
limh→0
|f (a+ h) − f (a) −∑ni=1Dif (a)hi|
|h|= lim
h→0
|∑ni=1
[Dif (bi) −Dif (a)
]hi|
|h|
≤ limh→0
n∑
i=1
|Dif (bi) −Dif (a)| |hi||h|
≤ limh→0
n∑
i=1
|Dif (bi) −Dif (a)|
= 0
conforme desejado, uma vez que cada bi → a quando h → 0 e por hipótese cada Dif é
contínua em a.
Resumidamente, os teoremas que apresentamos nesta seção nos deram uma boa
base para a diferenciabilidade de funções de várias variáveis. Para derivadas direcionais
o Teorema 3.2.11 nos garante uma expressão mais agradável de se calcular, utilizando
derivadas parciais. Da mesma forma o Teorema 3.2.15 descreve a matriz derivada. Por
�m, o Teorema 3.2.19 nos fornece um teste e�caz para a diferenciabilidade de uma função
em termos de suas derivadas parciais, eliminando, na maioria dos casos, a necessidade de
veri�car se a função satisfaz a de�nição de diferenciabilidade. Conforme Edwards (1973),
cada função continuamente diferenciável é diferenciável e cada função diferenciável tem
87
derivadas direcionais.
No início desta seção apresentamos uma motivação para se estudar diferencia-
bilidade de funções F : Rn → Rm. Desta forma conclui-se esta seção com um exemplo
aplicando os resultados que obtivemos até o momento para justamente determinar o plano
tangente à superfície S de F .
Exemplo 3.2.20 Considere a aplicação F : R2 → R4 de�nida por
F (x1, x2) = (x2, x1, x1x2, x22 − x2
1).
Determine o plano tangente à imagem S de F no ponto F (a) = (2, 1, 2, 3), isto é, a =
(1, 2).
Temos que F é continuamente diferenciável e pelo Teorema 3.2.19, F é diferenciável. Pelo
Teorema 3.2.15, a matriz da aplicação linear dFa : R2 → R4 é a matriz 4 × 2
F ′(a) =
0 1
1 0
2 1
−2 4
A imagem La de dFa é o subspaço de R4 gerado pelas colunas b1 = (0, 1, 2,−2)
e b2 = (1, 0, 1, 4) de F ′(a). Uma vez que b1 e b2 sejam linearmente independentes, La é
bi-dimensional. A �m de escrever La na forma matricial Ax = 0, precisamos encontrar
dois vetores linearmente independentes a1 e a2 ortogonais aos vetores b1 e b2, esses serão
os vetores linha da matriz A. Encontremos os vetores a1 e a2 resolvendo as equações
x1 + x3 + 4x4 = 0 (b2.x = 0),
x2 + 2x3 − 2x4 = 0 (b1.x = 0);
por exemplo, a1 = (5, 0,−1,−1) e a2 = (0, 10,−4, 1).
O desejado plano tangente T à S no ponto F (a) = (2, 1, 2, 3) é agora a translação
paralela de La para F (a). Isto é, o plano T é o conjunto de todos os pontos x ∈ R4 tal
que A(x− F (a)) = 0,
(5 0 −1 −1
0 10 −4 1
)
x1 − 2
x2 − 1
x3 − 2
x4 − 3
=
(0
0
).
88
Mediante simpli�cações, obtemos as duas equações
5x1 − x3 − x4 = 5,
10x2 − 4x3 + x4 = 5.
O conjunto solução de cada uma dessas equações é um hiperplano tri-dimensional em R4,
já a interseção destes dois hiperplanos nos garantem o plano T bi-dimensional desejado.
3.3 REGRA DA CADEIA
Para dar início a esta seção consideraremos a composição H = G ◦ F de duas
aplicações diferenciáveis, F : Rn → Rm e G : Rm → Rk. Segundo Edwards (1973), toma-
remos por exemplo F (x) ∈ Rm como sendo o vetor de preços de m produtos fabricados a
partir de n matérias primas de uma fábrica cujo custo é o vetor x ∈ Rn e a composição
H(x) = G(F (x)) sendo o vetor preço resultante de k produtos �nais fabricados em uma
segunda fábrica a partir dos m produtos intermediários. Queremos estimar a variação
∆Ha(h) = H (a + h) − H (a) nos preços dos produtos �nais resultantes da mudança de
a para a + h no custo das matérias primas. Utilizaremos as aproximações diferenciais
∆F ≈ dF e ∆G ≈ dG não nos preocupando inicialmente no quão aproximado isto é.
Assim,
∆Ha(h) = H (a+ h) −H (a)
= G(F (a+ h)) −G(F (a))
= G(F (a) + [F (a+ h) − F (a)]) −G(F (a))
= ∆GF (a)(F (a+ h) − F (a))
≈ dGF (a)(∆Fa(h))
≈ dGF (a)(dFa(h)).
Através desta argumentação sugere-se que a regra da cadeia de várias variáveis seja da
forma dHa = dGF (a) ◦ dFa. Assim, apresentamos o seguinte Teorema, seguindo o exposto
em Edwards (1973).
Teorema 3.3.1 (Regra da cadeia) Sejam U e V subconjuntos abertos de Rn e Rm
respectivamente. Se as aplicações F : U → Rm e G : V → Rk são diferenciáveis em
a ∈ U e F (a) ∈ V respectivamente, então a composição H = G ◦F é diferenciável em a e
dHa = dGF (a) ◦ dFa
(Composição de
aplicações lineares
). (3.3.1)
89
Em termos de suas derivadas, temos
H ′(a) = G′(F (a)).F ′(a)
(Multiplicação
de matrizes
). (3.3.2)
Ou seja, o diferencial da composição é a composição dos diferenciais e a derivada da com-
posição é o produto das derivadas.
Demonstração: Pela De�nição 3.2.3 devemos mostrar que
limh→0
H (a+ h) −H (a) − dGF (a) ◦ dFa(h)
|h|= 0.
Se de�nirmos
φ(h) =F (a+ h) − F (a) − dFa(h)
|h|h = 0 (3.3.3)
e
ψ(k) =G(F (a) + k) −G(F (a)) − dGF (a)(k)
|k|k = 0, (3.3.4)
então pelo fato de que F e G são diferenciáveis em a e F (a) respectivamente a De�nição
3.2.4 nos dá que
limh→0
φ(h) = limk→0
ψ(k) = 0.
Logo,
H (a+ h) −H (a) = G(F (a+ h)) −G(F (a))
= G(F (a) + (F (a+ h) − F (a))) −G(F (a))
= dGF (a)(F (a+ h) − F (a)) + |F (a+ h) − F (a)|ψ(F (a+ h) − F (a)),
utilizando a Equação (3.3.4) com k = F (a+ h)−F (a). Usando a Equação (3.3.3) obtemos
dFa(h) + |h|φ(h) = F (a+ h) − F (a), assim (pela linearidade)
H (a+ h) −H (a) = dGF (a)(dFa(h) + |h|φ(h)) + |F (a+ h) − F (a)|ψ(F (a+ h) − F (a))
= dGF (a) ◦ dFa(h) + |h|dGF (a)(φ(h)) +
|h|∣∣∣∣∣dFa
(h
|h|
)+ φ(h)
∣∣∣∣∣ψ(F (a+ h) − F (a)).
90
Logo,
H (a+ h) −H (a) − dGF (a) ◦ dFa(h)
|h|= dGF (a)(φ(h)) + (3.3.5)
∣∣∣∣∣dFa
(h
|h|
)+ φ(h)
∣∣∣∣∣ψ(F (a+ h) − F (a)).
Porém, limh→0
dGF (a)(φ(h)) = 0 pois limh→0
φ(h) = 0 e a aplicação linear dGF (a) é contínua.
Além disso, limh→0
ψ(F (a+h)−F (a)) = 0 porque F é contínua em a e limk→0
ψ(k) = 0. Por �m,
o número
∣∣∣∣∣dFa
(h
|h|
)+ φ(h)
∣∣∣∣∣ se mantém limitado, pois
(h
|h|
)∈ Sn−1 e os componentes
funcionais da aplicação linear dFa são contínuos e portanto limitados em Sn−1 ⊂ Rn.
Portanto, o limite da Equação (3.3.5) é zero como desejávamos mostrar inicial-
mente. A Equação (3.3.2) segue imediatamente da Equação (3.3.1), uma vez que a matriz
da composição de duas aplicações é o produto das suas matrizes.
Dando continuidade, listaremos através de exemplos trabalhados em Edwards
(1973), algumas fórmulas típicas de regra da cadeia obtidas igualando componentes da
Equação (3.3.2) matricial para vários valores de n, m e k.
Exemplo 3.3.2 Se n = k = 1 teremos a aplicação diferenciável R f→ Rm g→ R, então
h = g ◦ f : R → R é diferenciável com
h′(t) = g′(f(t))f ′(t).
Aqui g′(f(t)) é uma matriz linha 1 ×m e f ′(t) é uma matriz columa m× 1. Em termos
do gradiente de g, temos
h′(t) = ∇g(f(t)).f ′(t) (3.3.6)
Esta é uma generalização do fato de queDvg(a) = ∇g(a).v conforme a Equação (3.2.6). Sef(t) for o vetor posição de uma partícula em movimento em Rm e g a função temperatura
em Rm, então a Equação (3.3.6) nos dará a taxa de variação da temperatura da partícula.
Em particular, esta taxa de variação depende apenas do vetor velocidade da partícula.
Em termos das componentes funcionais f1, · · · , fm de f e das derivadas parciais
de g, a Equação (3.3.6) torna-se
dh
dt=
∂g
∂x1
∂f1
∂t+
∂g
∂x2
∂f2
∂t+ · · · +
∂g
∂xm
∂fm
∂t.
91
Se escrevermos xi = fi(t) e u = g(x), então a equação acima assume a forma
facilmente lembrada
du
dt=
∂u
∂x1
dx1
dt+
∂u
∂x2
dx2
dt+ · · · +
∂u
∂xm
dxm
dt.
Exemplo 3.3.3 Seja as aplicações diferenciáveis F : R2 → R3, G : R3 → R2 e a apli-
cação H : R2 → R2 dada por H = G ◦ F , então a regra da cadeia toma a seguinte
forma:
(D1H1(a) D2H1(a)
D1H2(a) D2H2(a)
)=
(D1G1(F (a)) D2G1(F (a)) D3G1(F (a))
D1G2(F (a)) D2G2(F (a)) D3G2(F (a))
)D1F1(a) D2F1(a)
D1F2(a) D2F2(a)
D1F3(a) D2F3(a)
.
Se escrevermos F (s, t) = (x, y, z) e G(x, y, z) = (u, v) esta equação poderá ser reescrita
∂H1
∂s
∂H1
∂t
∂H2
∂s
∂H2
∂t
=
∂G1
∂x
∂G1
∂y
∂G1
∂z
∂G2
∂x
∂G2
∂y
∂G2
∂z
∂F1
∂s
∂F1
∂t
∂F2
∂s
∂F2
∂t
∂F3
∂s
∂F3
∂t
.
Por exemplo, temos
∂H1
∂t=∂G1
∂x
∂F1
∂t+∂G1
∂y
∂F2
∂t+∂G1
∂z
∂F3
∂t.
Escrevendo
∂u
∂s= D1H1(s, t),
∂u
∂x= D1G1(F (s, t)),
∂x
∂t= D2F1(s, t) etc.,
para percorrer todo o caminho com as variáveis que representam as funções, obtemos as
fórmulas
∂u
∂t=∂u
∂x
∂x
∂t+∂u
∂y
∂y
∂t+∂u
∂z
∂z
∂t
e
∂v
∂s=∂v
∂x
∂x
∂s+∂v
∂y
∂y
∂s+∂v
∂z
∂z
∂s.
O padrão natural formal das fórmulas da regra da cadeia expressa em termos de variáveis
como visto acima, muitas vezes compensa a sua desvantagem de não conter referências
explícitas para os pontos em que as várias derivadas são avaliadas.
92
Exemplo 3.3.4 Seja T : R2 → R2 a aplicação de coordenadas polares de�nida por
T (r, θ) = (r cos θ, r sin θ). Dada uma função diferenciável f : R2 → R, de�nimos g = f ◦Tpor g(r, θ) = f(r cos θ, r sin θ). Então, a regra da cadeia é dada por
(∂g
∂r
∂g
∂θ
)=
(∂f
∂x
∂f
∂y
)(cos θ −r sin θ
sin θ r cos θ
).
Logo,
∂g
∂r=∂f
∂xcos θ +
∂f
∂ysin θ,
∂g
∂θ= −∂f
∂xr sin θ +
∂f
∂yr cos θ.
Desta forma expressamos as derivadas parciais de g em termos das derivadas de f .
O mesmo pode ser feito para as derivadas parciais de segunda ordem. Dada uma
aplicação diferenciável F : Rn → Rm, a derivada parcial DiF é novamente uma aplicação
de Rn em Rm. Se é diferenciável em a, podemos considerar a segunda derivada parcial
DjDiF (a) = Dj(DiF )(a),
cuja notação clássica é
DjDiF =∂2F
∂xj∂xi
.
Finalizado esta parte do conteúdo sobre derivadas no espaço Rn, vamos agora
avançar um pouco no estudo das derivadas em espaços normados em nível introdutório,
completando nosso passeio por esse amplo assunto de derivadas, mostrando algumas faces
da derivada que poucos conhecem.
93
Capítulo 4
INTRODUÇÃO À DERIVADA EM
ESPAÇOS NORMADOS
Nos capítulos anteriores exploramos o cálculo diferencial de uma e de várias variá-
veis reais no espaço Rn com a norma euclidiana. O objetivo neste capítulo é introduzir
o conceito de derivadas em espaços normados apresentando a derivada de Fréchet e a de
Gâteaux.
De�nição 4.0.5 Seja X um espaço vetorial sobre o corpo K. Uma norma em X é uma
função ||.|| : X → R+ que satisfaz
1. ||x|| = 0 ⇐⇒ x = 0;
2. ||λx|| = |λ|||x|| para todo x ∈ X e todo λ ∈ K;
3. ||x+ y|| ≤ ||x|| + ||y|| para quaisquer x, y ∈ X.
Um espaço normado é um espaço vetorial X munido da norma ||.||.
Representaremos os espaços normados no campo real por X e Y . Se X = Rn e
Y = Rm, com Rn,Rm sendo os espaços vetoriais reais com a norma euclidiana, então os
resultados a seguir serão equivalentes aos estudados no capítulo anterior.
4.1 CONCEITOS INICIAIS
Seja a um ponto interior1 do subconjunto aberto D de X e F : D ⊆ X → Y uma
aplicação.
De�nição 4.1.1 Se o limite
limλ→0+
F (a+ λh) − F (a)
λ
1Consideramos ponto interior um ponto de acumulação de um conjunto aberto.
94
existir, o denominaremos de derivada de F no ponto a segundo a direção h e o denotare-
mos por F ′(a;h).
De�nição 4.1.2 Suponhamos que para todo h ∈ X a derivada F ′(a;h) segundo a direção
h existe. A aplicação δ+F (a; .) : X → Y de�nida por
δ+F (a;h) = F ′(a;h)
é chamada primeira variação da aplicação F no ponto a.
Nesse caso, diremos que a aplicação F possui uma primeira variação no ponto a.
De�nição 4.1.3 Suponhamos que F possui no ponto a uma primeira variação e que
exista um operador linear L : X → Y tal que
δ+F (a;h) = L(h).
Então, o operador L é chamado derivada de Gâuteaux da aplicação F no ponto a e denota-
se por F ′G(a).
Assim, F ′G(a) é uma transformação linear de X em Y , tal que para cada h ∈ X
tem-se a relação
F (a+ λh) = F (a) + λF ′G(a)(h) + o(λ)
ondeo(λ)
λ→ 0 quando λ → 0+.
Flett (1980) a�rma que não há uma notação padrão e terminologia para a derivada
de Gâteaux, ou variação de Gâteaux como aparece am algumas obras. As notações mais
comuns para a derivada de Gâteaux são δF (a;h) e V F (a;h).
De�nição 4.1.4 Suponhamos que numa vizinhança do ponto interior a, a aplicação F
satisfaça
limh→0
F (a+ h) − F (a) − L(h)
||h|| = 0, (4.1.1)
onde L é uma transformação linear de X em Y , então F é dita Fréchet diferenciável e L
é chamada de diferencial de Fréchet de F em a, denotada por dF (a).
Observações:
1. Em espaço normado, h → 0 se, e somente se, ||h− 0|| → 0.
95
2. A linearidade da diferencial de Fréchet segue diretamente da De�nição 4.1.4, pode-
mos escrever,
d(cF )(a) = cdF (a),
d(F +G)(a) = dF (a) + dG(a).
3. Se D é um conjunto aberto em X, uma função F sendo Fréchet diferenciável em
cada ponto de D será dita Fréchet diferenciável em D. Também diremos que F é
de classe C1 em um conjunto aberto D ⊆ X se dF é contínua em D.
4. Se F é Fréchet diferenciável em a, então F é Fréchet diferenciável em a quando
as normas em X e Y são substituidas por normas equivalentes. Em particular,
se X e Y são de dimensão in�nita, a propriedade de diferenciabilidade Fréchet é
independente da escolha das normas em X e Y .
Para uma melhor compreensão das de�nições enunciadas anteriormente, iremos
fornecer na seção seguinte, alguns resultados e exemplos.
Proposição 4.1.5 Se F é Fréchet diferenciável no ponto interior a, então a derivada
F ′(a) é única.
Demonstração: Suponhamos que existam L1(h) e L2(h) tal que,
limh→0
F (a+ h) − F (a) − L1(h)
||h|| − F (a+ h) − F (a) − L2(h)
||h|| = 0
se, e somente se
limh→0
L1(h) − L2(h)
||h|| = 0
Fixemos v = 0 e tomemos h = tv. Assim,
limt→0
t(L1(v) − L2(v))
t||v|| = 0
que implica em
L1(v) − L2(v)
||v|| = 0 ⇒ L1(v) = L2(v) ∀v ∈ X.
Portanto, L1 = L2.
96
4.2 RESULTADOS
Teorema 4.2.1 Se F é Fréchet diferenciável em a, então F é contínua em a.
Demonstração: Sabemos que F é Fréchet diferenciável em um ponto interior a, então
limh→0
F (a+ h) − F (a) − L(h)
||h|| = 0,
ou, equivalentemente
F (a+ h) = F (a) + L(h) + o(||h||) (4.2.2)
onde limh→0
o(||h||)||h|| = 0. Reescrevendo a Equação (4.2.2)
F (a+ h) = F (a) + L(h) +o(||h||)||h|| ||h||
Aplicando o limite em ambos os lados, obtemos
limh→0
F (a+ h) = limh→0
[F (a) + L(h) +
o(||h||)||h|| ||h||
]
= F (a) + limh→0
L(h) + limh→0
[o(||h||)||h|| ||h||
]
= F (a) + L(0) + limh→0
o(||h||)||h|| lim
h→0||h||
= F (a) + 0 + 0.0
= F (a).
Portanto, F é contínua em a.
Teorema 4.2.2 Se existirem as derivadas descritas nas De�nições 4.1.1 a 4.1.4, então
obtemos a seguinte cadeia de implicações
4.1.4 =⇒ 4.1.3 =⇒ 4.1.2 =⇒ 4.1.1
A veracidade das implicações podem ser comprovadas diretamente a partir das
de�nições. Veremos a seguir que não podemos ter, em geral, as implicações inversas.
Exemplo 4.2.3 Considere a aplicação F : R2 → R, de�nida por
F (x, y) =
1, x > 0 e y > 0
x2, x ≤ 0 e ∀y−xy, x ≥ 0 e y ≤ 0
97
Tome a = (0, 0) e h1 = (1, 0)
limλ→0+
F (a+ λh) − F (a)
λ= lim
λ→0+
F ((0, 0) + λ(1, 0)) − F (0, 0)
λ
= limλ→0+
F (λ, 0) − F (0, 0)
λ= 0.
Agora, para o mesmo a, tome a direção h2 = (1, 1)
limλ→0+
F (a+ λh) − F (a)
λ= lim
λ→0+
F ((0, 0) + λ(1, 1)) − F (0, 0)
λ
= limλ→0+
F (λ, λ) − F (0, 0)
λ
= limλ→0+
1
λ= +∞.
Assim, existe F ′(a, h1) mas não existe F ′(a, h2). Portanto, F não possui uma primeira
variação no ponto a e consequentemente a De�nição 4.1.1 ; De�nição 4.1.2.
Exemplo 4.2.4 Considere F : R → R de�nida por F = |x|.
Temos que,
δ+F (0;h) = limλ→0+
F (λh) − F (0)
λ
= limλ→0+
|λh| − |0|λ
= limλ→0+
λ|h|λ
= |h|.
Portanto, F possui primeira variação em a = 0 e claramente δ+F (0, h) é não linear.
Assim, De�nição 4.1.2 ; De�nição 4.1.3.
Este mesmo exemplo mostra que a continuidade num ponto não implica na dife-
renciabilidade segundo Gâteaux e mais ainda na diferenciabilidade de Fréchet.
Exemplo 4.2.5 Considere F : R2 → R de�nida por
F (x1, x2) =
{1, se x1 = x2
2 e x2 > 0
0, nos outros casos.
F é diferenciável segundo Gâteaux no ponto a = (0, 0).
98
De fato, temos
F ′((0, 0), (h1, h2)) = limλ→0+
F ((0, 0) + λ(h1, h2)) − F (0, 0)
λ
= limλ→0+
F (λh1, λh2)
λ= 0,
pois se acontecesse F (λh1, λh2) = 1, teríamos h1 = λh22, h2 > 0 com λ constante, o que
é uma contradição. Assim F é Gâteaux diferenciável no ponto a e F ′G(0, 0) = 0. É claro
que F é descontínua no ponto a, logo F não é Fréchet diferenciável em a, logo De�nição
4.1.3 ; De�nição 4.1.4.
Assim, podemos notar que a derivada de Gâuteaux ou a de Fréchet é, por de�nição,
uma aplicação linear de X em Y .
Na seção seguinte, apresentaremos uma séries de exemplos das derivadas de Fréchet
de modo a melhorar a compreensão deste conteúdo.
4.3 EXEMPLOS DA DERIVADA DE FRÉCHET
Apresentaremos a seguir uma série de exemplos envolvendo a derivada de Fréchet,
cujo objetivo é apresentar a solução do método dos mínimos quadrados.
Exemplo 4.3.1 Se F : D ⊆ X → Y é uma aplicação constante, então F é Fréchet
diferenciável em cada ponto interior a de D e dF (a) é uma função nula de X em Y .
Temos que F é uma aplicação constante, isto é, existe b ∈ Y tal que F (x) = b para todo
x ∈ D. Pela Equação (4.1.1) obtemos
limh→0
F (a+ h) − F (a) − L(h)
||h|| = limh→0
b− b− L(h)
||h|| = limh→0
−L(h)
||h||
Tomando L(h) = 0 temos limh→0−L(h)
||h|| = 0. Como L é única, ela deve ser a
derivada de Fréchet de F .
Exemplo 4.3.2 Se F : D ⊆ X → Y é uma aplicação linear, então F Fréchet diferenciá-
vel em cada ponto interior a de D e dF = F .
Pela de�nição da diferenciabilidade de Fréchet,
limh→0
F (a+ h) − F (a) − L(h)
||h|| = limh→0
F (a) + F (h) − F (a) − L(h)
||h||= lim
h→0
F (h) − L(h)
||h|| ,
99
tomando L(h) = F (h) temos,
limh→0
F (a+ h) − F (a) − L(h)
||h|| = limh→0
F (h) − F (h)
||h|| = 0. (4.3.3)
Como L é única, então a derivada de Fréchet dF é F .
Exemplo 4.3.3 Se G : Rn → R é uma aplicação de�nida por G(x) = ⟨Ax, b⟩, onde
A é uma matriz m × n, x, b ∈ Rn e ⟨., .⟩ é o produto escalar canônico de Rn, então
G′(a)(h) = ⟨Ah, b⟩.
De acordo com a De�nição 4.1.4 temos:
limh→0
G(a+ h) −G(a) − L(h)
||h|| = limh→0
⟨A(a+ h), b⟩ − ⟨Aa, b⟩ − L(h)
||h||= lim
h→0
⟨Aa+ Ah, b⟩ − ⟨Aa, b⟩ − L(h)
||h||= lim
h→0
⟨Aa, b⟩ + ⟨Ah, b⟩ − ⟨Aa, b⟩ − L(h)
||h||= lim
h→0
⟨Ah, b⟩ − L(h)
||h||
Tomando G′(a)(h) = L(h) = ⟨Ah, b⟩ segue que
limh→0
G(a+ h) −G(a) − L(h)
||h|| = limh→0
⟨Ah, b⟩ − ⟨Ah, b⟩||h|| = 0
Exemplo 4.3.4 Se H : Rn → R é uma aplicação de�nida por H(x) = ⟨Ax,Ax⟩, onde Aé uma matriz m× n, então H ′(a)(h) = 2⟨Aa,Ah⟩.
limh→0
H(a+ h) −H(a) − L(h)
||h|| = limh→0
⟨A(a+ h), A(a+ h)⟩ − ⟨Aa,Aa⟩ − L(h)
||h||= lim
h→0
⟨Aa+ Ah,Aa+ Ah⟩ − ⟨Aa,Aa⟩ − L(h)
||h||
= limh→0
(⟨Aa,Aa⟩ + ⟨Ah,Ah⟩
||h||⟨Ah,Aa⟩ + ⟨Aa,Ah⟩ − ⟨Aa,Aa⟩ − L(h)
||h||
)
= limh→0
⟨Ah,Ah⟩ + 2⟨Aa,Ah⟩ − L(h)
||h||
100
Tomando H ′(a)(h) = L(h) = 2⟨Aa,Ah⟩ segue que
limh→0
H(a+ h) −H(a) − L(h)
||h|| = limh→0
⟨Ah,Ah⟩ + 2⟨Aa,Ah⟩ − 2⟨Aa,Ah⟩||h||
= limh→0
⟨Ah,Ah⟩||h||
= limh→0
||Ah||2||h|| = 0.
Note que a última igualdade se obtém do fato de que se ||h|| =√
⟨h, h⟩, então a
norma de A induzida pela norma euclidiana ||.|| é dada por ||A|| = maxx=0
||Ax||||x|| . A norma
||A|| de�nida desta maneira é de fato uma norma em Rn×n e satisfaz
||A|| > 0 se A = 0
||αA|| = α||A||||A+B|| ≤ ||A|| + ||B||
||AB|| ≤ ||A||.||B||, ∀A,B ∈ Rn×n.
Se ||A|| é induzida pela norma vetorial ||x||, então temos a seguinte relação:
||Ah|| ≤ ||A||.||h||.
Portanto,
0 ≤ ||Ah||2||h|| =
⟨Ah,Ah⟩||h|| =
⟨ATAh, h⟩||h|| ≤ ||ATAh||.||h||
||h|| = ||ATAh|| ≤ ||ATA||.||h||
Assim,
0 ≤ limh→0
||Ah||2||h|| ≤ lim
h→0||ATA||.||h|| = 0
o que implica em limh→0
||Ah||2||h|| = 0.
Exemplo 4.3.5 Considere o sistema Ax = b onde A ∈ Rm×n, b ∈ Rm e m > n. Supondo
que o posto de A é n, determine a solução de quadrados mínimos do sistema Ax = b, ou
seja, encontre minx∈Rn
||Ax− b||22.
Considere ϕ(x) =1
2||Ax− b||22, então basta calcular min
x∈Rnϕ(x).
ϕ(x) =1
2⟨Ax− b, Ax− b⟩ =
1
2[⟨Ax,Ax⟩ − 2⟨Ax, b⟩ + ⟨b, b⟩]
101
⇒ ϕ′(x)(h) =1
2[2⟨Ax,Ah⟩ − 2⟨Ah, b⟩ + 0]
= ⟨Ax,Ah⟩ − ⟨Ah, b⟩= ⟨ATAx, h⟩ − ⟨h,AT b⟩= ⟨ATAx, h⟩ − ⟨AT b, h⟩= ⟨ATAx− AT b, h⟩
ou seja,
ϕ′(x)(h) = 0 ⇒ ATAx− AT b = 0
⇒ ATAx = AT b
⇒ x = (ATA)−1AT b.
Portanto, existe(ATA)−1 pois posto ATA = posto A = n. Implica que x = (ATA)
−1AT b
é ponto de mínimo global, pois ϕ é convexa. A equação ATAx−AT b = 0 é conhecida nos
cursos de ciências exatas como sistema de equações normais.
De acordo com as De�nições apresentadas neste capítulo, toda função F Fréchet
diferenciável, também é Gâteaux diferenciável. Assim, todos as derivadas dos exemplos
apresentados nesta seção também são exemplos de derivadas de Gâteaux. No caso de
espaços normados, a derivada de Gateaux corresponde a derivada direcional e a derivada
de Fréchet corresponde a derivada forte vistas no espaço Rn.
102
CONCLUSÃO
O presente trabalho visou explorar de forma introdutória a evolução de uma das
ferramentas mais aplicáveis da Matemática que é a derivada. Para tornar isso possível,
houve a necessidade de ingressar no estudo dos conteúdos de História da Matemática,
Cálculo diferencial e Álgebra linear, vistos na maioria dos cursos de ciências exatas. No
estudo de cálculo diferencial estuda-se a derivada e sua interpretação geométrica que nada
mais é do que a inclinação da reta tangente a uma curva. A partir da tangente a uma
curva pode-se inferir várias características dessa curva, como concavidade, crescimento,
decrescimento, pontos de máximos e mínimos, etc. A pesquisa por tangentes a curvas é
muito antiga, remontando aos gregos tendo como de partida a tangente ao circulo com a
de�nição dada por Euclides em �Os Elementos�. Ao decidirmos pelo estudo das derivadas
tornou-se evidente iniciar o estudo pelas origens das tangentes e sua evolução até chegar
nas derivadas. O primeiro capítulo do nosso trabalho foi de longe o mais trabalhoso
de se construir e o principal motivo foi a escassez de material sobre as tangentes antes
de Newton e Leibniz. Este estudo histórico foi essencial para o trabalho pois transmite
ao leitor as di�culdades que matemáticos como Descartes e Fermat tiveram para obter
tangentes às curvas. Este ponto de vista histórico sobre tangentes permitiu-nos observar
que a derivada não surgiu de uma hora para a outra, ela nasceu dos trabalhos de muitos
matemáticos ao longo da história.
Após esta importante introdução histórica iniciamos o estudo da derivada de fun-
ções de uma variável real para que pudéssemos visualizar a passagem da derivada como
ente geométrico para algo mais abstrato que é a derivada de uma função. Nossa aborda-
gem deste conteúdo não foi tão rigorosa quanto gostaríamos que fosse pois só agora com
a disciplina de Análise real no último semestre do curso de Licenciatura em Matemática,
que muitos conceitos �caram mais claros sendo possível aprofundá-los. Contudo nosso ob-
jetivo foi cumprido pois fornecemos a de�nições e os resultados mais interessantes desse
conteúdo.
O terceiro capítulo foi o que mais acrescentou em minha formação, pois nele abor-
damos o cálculo diferencial de uma forma, que ao meu ver, foi muito diferente do que
havíamos trabalhado durante a graduação. Apresentamos as derivadas as curvas, deriva-
das direcionais e o diferencial envolvendo o conteúdo de transformação linear, nos dando
a possibilidade de ver como tudo está conectado. O mais prazeroso neste capítulo foi que,
103
por mais que os conceitos fossem abstratos e um pouco diferente do que tínhamos visto
na graduação, o resultado obtido através do exemplo em se determinar o plano tangente
à imagem de uma função foi sem dúvida muito grati�cante.
O último capítulo nos trouxe uma abordagem introdutória para derivadas em es-
paços normados, mostrando-nos a abrangência desta ferramenta, onde apresentamos uma
solução do problema de mínimos quadrados trabalhado na disciplina de Tópicos em Ál-
gebra Linear.
Assim, acreditamos que o objetivo desse trabalho foi alcançado com sucesso. Sem-
pre que possível foram apresentados exemplos variados e propostos com �ns didáticos.
Deixamos para o leitor a possibilidade de se aprofundar nos estudos, pois em todos os
capítulos apresentados há muito a se investigar, e para tal, recomendamos as obras aqui
referenciadas.
Com este trabalho conseguimos fazer um passeio pelas derivadas desde as tangentes
até as derivadas em espaços normados mostrando ao leitor que o universo das derivadas é
amplo e não se esgota por aqui. Poderíamos ter falado também da derivada de Hadamar e
da derivada fraca mas devido a profundidade e amplitude destes conteúdos não foi possível
abordá-los neste trabalho e �ca como sugestão que estes conteúdos sejam trabalhos em
futuros trabalhos de conclusão que irão complementar nosso trabalho e mostrar que as
derivadas tem mais faces do que poderíamos imaginar.
104
REFERÊNCIAS
AABOE, A. Episódios da História Antiga da Matemática. São Paulo: SBM, 1984.
BARTLE, R. G. Elementos de Análise Real. Rio de Janeiro: Campus, 1983.
CARVALHO, S.G. A Teoria das Tangentes Antes Da Invenção Do Cálculo Dife-
rencial. Coimbra: Imprensa da Universidade. 1919.
CARVALHO, R.M. A invenção do Cálculo por Newton e Leibniz e sua evo-
lução para o Cálculo conteporâneo. Belo Horizonte, 2007.
CONSCIENCIA.ORG. O Discurso do Método. Disponível em
<http://www.consciencia.org./o-discurso-do-metodo-rene-descartes>Acesso em:
14 de dezembro de 2012.
DUHAMEL, M. Mémoire sur la Méthode des Máxima et Minima de Fermat
et sur les Méthodes des Tangents de Fermat et Descartes. Paris: Edição do
Institute Impérial de France, 1960.
ENCYCLOPEDIA. Bryson of Heraclea. Complete Dictionary of Scienti�c Biography.
Disponível em <http://www.encyclopedia.com/doc/1G2-2830900686.html>Acesso em:
10 de dezembro de 2012.
EDWARDS, C.H. Advanced Calculus of Several Variables. Vol 1. New York: Dover
Publications, 1973.
EDWARDS, C.H. PENNEY, D.E. Cálculo com Geometria Analítica. Vol 1. Rio
de Janeiro: Editora Prentice-Hall do Brasil LTDA, 1994.
EUCLIDES. Os Elementos. São Paulo: Editora UNESP, 2009.
FLETT,T.M. Di�erential Analysis. Cambridge: Cambridge University Press, 1980.
GARBI, G. G. A Rainha das Ciências. ed.5. São Paulo: Editora Livraria da Fí-
sica, 2010.
105
GONÇALVES, M.B. FLEMMING, D.M. Cálculo C. 3 ed. São Paulo: MAKRON Books,
2000.
LIMA, E. L. Análise Real. Vol 2. Rio de Janeiro: IMPA, 2009.
LIMA, E. L. Curso de Análise. Vol 1. Rio de Janeiro: IMPA, 2008.
NETTO, C.D. Elementos de Cálculo In�nitesimal. 3 ed. São Paulo: Companhia
Editora Nacional, 1977.
PIRES, J.A.L. Cálculo Diferencial-Estudo histórico sobre a evolução do Cál-
culo Diferencial no século XVII. Vila Real, 2004.
SMITH, D. E. History of Mathematics. Vol 1. New York: Dover Publications Inc,
1923.
SMITH, D. E. History of Mathematics. Vol 2. New York: Dover Publications Inc,
1925.
THOMAS, G.B. Cálculo. 11 ed. São Paulo: Addison Wesley. 2009.
106
APÊNDICE
APÊNDICE A - De�nições e Teoremas Necessários
Os Teoremas aqui descritos com base na obra de Lima(2008) e Edwards (1994),
servem como base para alguns resultados apresentados no Capítulo 2 �Derivada em R�.
De�nição 4.3.6 Um conjunto X é dito compacto se toda sequência contida em X possui
uma subsequência que converge para algum ponto de X.
Teorema 4.3.7 A imagem f(X) de um conjunto compacto X ⊂ R por uma função
contínua f : X → R é um conjunto compacto.
Demonstração: Vamos mostrar que toda sequência de pontos yn ∈ f(X) admite uma
subsequência que converge para um ponto em f(X). Para cada n ∈ N temos f(xn) = yn
com xn ∈ X. Como X é compacto, a sequência (xn) possui uma subsequência (xn)n∈N′
que converge para um ponto a ∈ X. Sendo f contínua no ponto a, de limn∈N′
= a concluimos
que, pndo b = f(a), temos b ∈ f(X) e, além disso, limn∈N′
yn = limn∈N′
f(xn) = f(a) = b, como
queríamos demonstrar.
Teorema 4.3.8 (Teorema de Weierstrass) Seja f : X → R uma função contínua no
conjunto compacto X ⊂ R. Existem x0, x1 ∈ X tais que f(x0) ≤ f(x) ≤ f(x1), para todo
x ∈ X.
Demonstração: Como f é contínua e X compacto. Pelo Teorema 4.3.7, f(X) também
é compacto. Logo existem x0, x1 ∈ X tais que
f(x0) ≤ f(x) ≤ f(x1), ∀x ∈ X. (4.3.4)
Teorema 4.3.9 (Teorema do Confronto) Suponhamos que f(x) ≤ g(x) ≤ h(x) para
todo x em alguma vizinhança restrita de a e também que
limx→a
f(x) = L = limx→a
h(x).
Então,
limx→a
g(x) = L.
107
Demonstração: Dado ε > 0, escolhe-se δ1 e δ2 tais que
0 < |x− a| < δ1 ⇒ |f(x) − L| < ε
e
0 < |x− a| < δ2 ⇒ |h(x) − L| < ε.
Seja δ = min{δ1, δ2}. Então, δ > 0 e se 0 < |x− a| < δ , então f(x) e h(x) são pontos do
intervalo aberto (L− ε, L+ ε). Assim,
L− ε < f(x) ≤ g(x) ≤ h(x) < L+ ε.
Portanto,
0 < |x− a| < δ ⇒ |g(x) − L| < ε,
conforme desejado.
108