quinta-feira, 3 de agosto de 2017

No texto As coordenadas esféricas e a lei da gravitação expus a utilização das coordenadas esféricas na resolução de um dos mais importantes problemas da mecânica celeste. Se considerarmos \(\phi\) constante e ignorarmos a força \(F_\phi\), vemos que o problema geral da dinâmica de uma partícula em coordenadas polares é descrito pela equação

\[
\left\lbrace
\begin{array}{l}
\frac{d^2r}{dt^2}-r\left(\frac{d\theta}{dt}\right)^2=F_r\\
r\frac{d^2\theta}{dt^2}+2\frac{dr}{dt}\frac{d\theta}{dt}=F_\theta
\end{array}
\right.
\]

Consideramos aqui que o sistema de unidades de massa é tal que a massa da partícula é unitária. Se multiplicarmos por \(r\) a segunda equação obtemos

\[
\frac{d}{dt}\left(r^2\frac{d\theta}{dt}\right)=rF_\theta
\]

cujo integral é dado por

\[
r^2\frac{d\theta}{dt}=f+\int{rF_\theta dt}
\]

onde \(f\) é a constante de integração. Multiplicamos a equação anterior por \(rF_\theta\) para ficarmos com

\[
r^3F_\theta\frac{d\theta}{dt}=\frac{d}{dt}\left\lbrack f\int{rF_\theta dt}+\frac{1}{2}\left(\int{rF_\theta dt}\right)^2\right\rbrack
\]

cujo integral se pode reduzir a

\[
f+\int{rF_\theta dt}=\sqrt{f^2+2\int{r^3F_\theta d\theta}}
\]

A consideração do primeiro integral obtido permite concluir a identidade

\[
\frac{d\theta}{dt}=\frac{\sqrt{f^2+2\int{r^3F_\theta d\theta}}}{r^2}
\]

Vemos que é possível determinar o valor do ângulo \(\theta\) como função do parâmetro \(t\), resolvendo esta equação diferencial. Se fizermos, para abreviar, \(\rho=\int{r^3F_\theta d\theta}\), segue-se que

\[
\frac{dr}{dt}=\frac{dr}{d\theta}\frac{d\theta}{dt}=\frac{f\sqrt{1+2\rho}}{r^2}\frac{dr}{d\theta}
\]

Derivamos a equação anterior em ordem ao tempo e introduzimos na equação radial, nomeadamente,

\[
\frac{d^2r}{dt^2}-r\left(\frac{d\theta}{dt}\right)^2=F_r
\]

para obtermos

\[
\frac{f^2}{r^4}\frac{d^2r}{d\theta^2}-\frac{2f^2}{r^5}\left(\frac{dr}{d\theta}\right)^2-\frac{f^2}{r^3}=\frac{F_r-\frac{F_\theta}{r}\frac{dr}{d\theta}}{\sqrt{1+2\rho}}
\]

após algumas simplificações e de notar que \(\frac{d\rho}{d\theta}=\frac{r^3F_\theta}{f^2}\). Multiplicamos ambos os membros da equação por \(r^2\) e aplicamos a regra do produto para escrevermos

\[
\frac{d}{d\theta}\left(\frac{f^2}{r^2}\frac{dr}{d\theta}\right)-\frac{f^2}{r}=\frac{r^2F_r-F_\theta r\frac{dr}{d\theta}}{1+2\rho}
\]

A transformação

\[
u=\frac{f^2}{r}
\]

reduz a equação anterior a

\[
\frac{d^2u}{d\theta^2}-\frac{f^2F_\theta}{1+2\rho}\frac{du}{d\theta}+u=-\frac{r^2F_r}{1+2\rho}
\]

É útil notar que, se fizermos \(F_\theta=0\) e \(F_r=-\frac{\psi}{r^2}\) obtemos a equação do movimento harmónico simples

\[
\frac{d^2u}{d\theta^2}+u=\psi
\]

cuja solução se pode escrever na forma

\[
u=\psi+A\cos\left(\theta-\theta_0\right)
\]

isto é,

\[
r=\frac{\frac{f^2}{\psi}}{1+\frac{A}{\psi\cos\left(\theta-\theta_0\right)}}
\]

que constitui a equação da elipse, como seria de esperar.

A resolução do problema tal como aqui se encontra apresentada foi exposta por Clairaut na sua Théorie de la Lune deduite du seul principe de l'attraction reciproquement proportionelle aux carrés des distances. O mesmo autor voltou ao assunto uns anos mais tarde, na sua Mémoire sur l'orbite apparent du Soleil onde considerou a equação da órbita na forma

\[
\frac{d^2u}{d\theta^2}+u=\Omega
\]

sendo \(\Omega\) dada pela série

\[
\Omega(\theta)=\sum_{k=0}^{+\infty}{a_k\cos(n\theta)}
\]

Nesse trabalho surgiu, pela primeira vez, um método geral para determinar o valor das constantes \(a_k\), conhecidos os valores da função \(\Omega\) em pontos equidistantes no intervalo \(\left\lbrack0,2\pi\right\rbrack\). A consideração de séries semelhantes tinha sido anteriormente levada a cabo por Euler e por D'Alembert. O autor considerou que, sendo infinito o número \(n\) de subdivisões do intervalo \(\left\lbrack 0,2\pi\right\rbrack\), então os coeficientes são dados pelas famosas expressões integrais conhecidas da teoria das séries trigonométricas para o caso dos co-senos. Resta notar que as séries discretas para os senos foram estudadas por Lagrange no decurso da apresentação da sua teoria do som e as séries mais gerais, por Gauss. Mais tarde, Fourier desenvolveu a teoria para o caso de um número infinito de subdivisões do intervalo, considerando simultaneamente as séries de senos e co-senos.

domingo, 23 de julho de 2017

A função característica

Em óptica, um sistema de raios de segunda ordem consiste num conjunto de linhas cuja parametrização é dada por dois parâmetros. Se designarmos por \(\vec{n}\) os vectores de norma unitária que definem as direcções das linhas de um sistema então este é de segunda ordem se, a cada ponto do espaço \((x,y,z)\), corresponder apenas uma direcção \(\vec{n}(x,y,z)\). De facto, a equação vectorial de uma recta geral pode ser escrita na forma

$$(x,y,z)=(a,b,c)+\lambda\left(u_1,u_2,u_3\right)$$

Vemos tratar-se de uma família parametrizda por seis parâmetros. No entanto, diferentes parâmetros representam a mesma recta. Em primeiro lugar, tanto \(\vec{u}=\left(u_1,u_2,u_3\right)\) como \(\alpha\vec{u}\) para algum \(\alpha\) constante parametrizam a mesma recta. Podemos considerar portanto que o vector \(\vec{u}\) possui norma unitária. A mesma equação pode descrever a mesma recta para diferentes pontos. Com efeito, considerando um novo ponto \(\left(a_1,b_1,c_1\right)\) na recta, temos

$$(x,y,z)=\left(a_1,b_1,c_1\right)+\lambda_1\left(u_1,u_2,u_3\right)$$

Como o ponto pertence à recta então verifica a equação

$$\left(a_1,b_1,c_1\right)=(a,b,c)+\lambda\left(u_1,u_2,u_3\right)$$

para algum \(\lambda\). Se considerarmos a representação

$$\left(a_1-a,b_1-b,c_1-c\right)=\alpha\vec{v}_1+\beta\vec{v}_2+\lambda{u}$$

onde \(\vec{v}_1\), \(\vec{v}_2\) e \(\vec{v}_3\) são linearmente independentes, verificarmos imediatamente que ambas as equações representam a mesma recta se e só se \(\alpha=\beta=0\). O conjunto de todas as rectas pode, portanto, ser representado pela família de equações

$$(x,y,z)=(a,b,c)+\alpha\vec{v}_1+\beta\vec{v}_2+\lambda\left(u_1,u_2,u_3\right)$$

onde \((a,b,c)\) é um ponto escolhido arbitrariamente que consideramos ser a origem. Assim, todas as rectas podem ser representadas pela família de equações

$$(x,y,z)=\alpha\vec{v}_1+\beta\vec{v}_2+\lambda\left(u_1,u_2,u_3\right)$$

onde os vectores \(\vec{v}_1\) e \(\vec{v}_2\) são escolhidos em função de \(\vec{u}\). A família de todas as rectas é, portanto, definida por quatro parâmetros onde dois deles definem a direcção e os outros dois, a posição. Se a direcção for dada em função da posição, apenas os dois parâmetros que lhe estão associados são considerados, tratando-se de um sistema de segunda ordem.

Um sistema de segunda ordem diz-se ter congruência normal se for possível encontrar uma superfície que seja normal a todos os seus raios. A importância desta definição reside no teorema de Mauls-Dupin onde é afirmado que a congruência normal se mantém após uma sequência finita de reflexões e refracções. Se essa superfície possuir equação \(f(x,y,z)=k\) com \(k\) contante, sabemos que a condição para que esta seja normal a todos os raios é

$$\vec{\nabla}f=\lambda\vec{n}$$

onde \(\vec{n}\) constitui a direcção do raio associado ao ponto de incidência. A função característica \(U\) foi definida por Hamilton de tal forma que

$$\vec{n}=\vec{\nabla}U$$

É interessante mostrar que esta definição não é desprovida de sentido. Ora, de \(\vec{\nabla}f=\lambda\vec{n}\) concluímos

$$\vec{\nabla}\times\left(\lambda\vec{n}\right)=0=\vec{\nabla}\lambda\times\vec{n}+\lambda\vec{\nabla}\times\vec{n}$$

Como \(\vec{n}\cdot\vec{n}=1\) segue-se que \(\left(\vec{n}\cdot\vec{\nabla}\right)\vec{n}=0\) e, da identidade

$$\frac{1}{2}\vec{\nabla}\left(\vec{n}\cdot\vec{n}\right)=\left(\vec{n}\cdot\vec{\nabla}\right)\vec{n}+\vec{n}\times\vec{\nabla}\times\vec{n}$$

obtemos \(\vec{n}\times\vec{\nabla}\times\vec{n}=0\). A mesma identidade, como \(\lambda\vec{n}\) no lugar de \(\vec{n}\) fica na forma

$$\frac{1}{2}\vec{\nabla}\lambda^2=\lambda\left(\vec{n}\cdot\vec{\nabla}\right)\left(\lambda\vec{n}\right)+\lambda^2\vec{n}\times\vec{\nabla}\times\vec{n}$$

Segue-se que

$$\vec{\nabla}\lambda=\left(\vec{n}\cdot\vec{\nabla}\right)\left(\lambda\vec{n}\right)$$

Mas como

$$\left(\vec{n}\cdot\vec{\nabla}\right)\left(\lambda\vec{n}\right)=\lambda\left(\vec{n}\cdot\vec{\nabla}\right)\vec{n}+\left(\vec{n}\cdot\vec{\nabla}\lambda\right)\vec{n}$$

então, porque \(\left(\vec{n}\cdot\vec{\nabla}\right)\vec{n}=0\) ficamos com

$$\left(\vec{n}\cdot\vec{\nabla}\right)\left(\lambda\vec{n}\right)=\left(\vec{n}\cdot\vec{\nabla}\lambda\right)\vec{n}$$

Concluímos que \(\vec{\nabla}\lambda\times\vec{n}=0\) e, como \(\vec{\nabla}\lambda\times\vec{n}+\lambda\vec{\nabla}\times\vec{n}=0\), também

$$\vec{\nabla}\times\vec{n}=0$$

Segue-se daqui que é possível encontrar uma função \(U\) tal que \(\vec{\nabla}U=\vec{n}\), como pretendido.

sábado, 27 de maio de 2017

As coordenadas esféricas e a lei da gravitação

Um ponto definido pelo vector \(\vec{\rho}=(x,y,z)\) é representado, em coordenadas esféricas, pelos parâmetros \(\left(r,\theta,\phi\right)\) de acordo com a transformação
\[
\left\lbrace
\begin{array}{l}
x=r\cos\theta\sin\phi\\
y=r\sin\theta\sin\phi\\
z=r\cos\phi
\end{array}
\right.
\]
O conjunto de equações \(\theta=const.\), \(\phi=const\) define uma curva. Definimos \(\vec{e}_r\) como sendo o vector unitário com a direcção da tangente à curva. Concluímos, portanto, que
\[
\vec{e}_r=\left(\cos\theta\sin\phi,\sin\theta\sin\phi,\cos\phi\right)
\]
Do mesmo modo, construímos os vectores unitários cuja direcção se encontra ao longo da tagente das curvas sobre as quais variam apenas \(\theta\) e \(\phi\), isto é,
\[
\begin{array}
\vec{e}_\theta=\left(-\sin\theta,\cos\theta,0\right)\\
\left(\cos\theta\cos\phi,\sin\theta\cos\phi,-\sin\phi\right)
\end{array}
\]
Se a posição de um corpo for representada pelo vector \(\vec{\rho}=(x,y,z)\), no novo sistema de coordenadas será representada por \(\vec{\rho}=r\vec{e}_r\). A sua velocidade será dada por
\[
\frac{d\vec{\rho}}{dt}=\frac{dr}{dt}\vec{e}_r+r\frac{d\theta}{dt}\sin\phi\vec{e}_\theta+r\frac{d\phi}{dt}\vec{e}_\phi
\]
e a sua aceleração será, portanto,
\[
\begin{array}{l}
\frac{d^2\vec{\rho}}{dt^2} & = & \left\lbrack \frac{d^2r}{dt^2}-r\sin\phi\left(\frac{d\theta}{dt}\right)^2+r\left(\frac{d\phi}{dt}\right)^2\right\rbrack\vec{e}_r+\\
 & & + \left\lbrack \frac{d}{dt}\left(r\frac{d\theta}{dt}\sin\phi\right)+r\sin\phi\frac{dr}{dt}\frac{d\theta}{dt}+r\cos\phi\frac{d\theta}{dt}\frac{d\phi}{dt}\right\rbrack\vec{e}_\theta+\\
 & & + \left\lbrack \frac{d}{dt}\left(r\frac{d\phi}{dt}\right)+\frac{dr}{dt}\frac{d\phi}{dt}-r\left(\frac{d\theta}{dt}\right)^2\sin\phi\cos\phi\right\rbrack\vec{e}_\phi
\end{array}
\]
Se \(\vec{F}_r\), \(\vec{F}_\theta\) e \(\vec{F}_\phi\) forem as componentes da resultante das forças que actuam na partícula segundo as direcções dos vectores \(\vec{e}_r\), \(\vec{e}_\theta\) e \(\vec{e}_\phi\) então as equações do movimento baseadas na segunda lei de Newton escrevem-se como
\[
\left\lbrace
\begin{array}{l}
\frac{d^2r}{dt^2}-r\sin\phi\left(\frac{d\theta}{dt}\right)^2+r\left(\frac{d\phi}{dt}\right)^2=\frac{\vec{F}_r}{m}\\
\frac{d}{dt}\left(r\frac{d\theta}{dt}\sin\phi\right)+r\sin\phi\frac{dr}{dt}\frac{d\theta}{dt}+r\cos\phi\frac{d\theta}{dt}\frac{d\phi}{dt}=\frac{\vec{F}_\theta}{m}\\
\frac{d}{dt}\left(r\frac{d\phi}{dt}\right)+\frac{dr}{dt}\frac{d\phi}{dt}-r\left(\frac{d\theta}{dt}\right)^2\sin\phi\cos\phi=\frac{\vec{F}_\phi}{m}
\end{array}
\right.
\]
Iremos agora determinar a forma da resultante das forças que actuam num corpo que se move de acordo com as leis de Kepler. Estas são:
1) O corpo move-se ao longo de uma elipse.
2) O raio vector definido por um dos focos da elipse e o corpo varre áreas iguais em intervalos de tempo iguais.
3) O quadrado do período de revolução do movimento é directamente proporcional ao cubo do semi-eixo maior da elipse.


Começamos por observar que, sendo \(\phi=\frac{\pi}{2}\) constante, então o sistema de equações diferenciais reduz-se a
\[
\left\lbrace
\begin{array}{l}
\frac{d^2r}{dt^2}-r\left(\frac{d\theta}{dt}\right)^2=\frac{\vec{F}_r}{m}\\
r\frac{d^2\theta}{dt^2}+2\frac{dr}{dt}\frac{d\theta}{dt}=\frac{\vec{F}_\theta}{m}\\
0=\frac{\vec{F}_\phi}{m}
\end{array}
\right.
\]
Analisemos agora a segunda lei. Ora, a área de uma superfície \(S\) é dada pelo integral
\[
A=\iint\limits_{S}dxdy=\iint\limits_{S}rdrd\theta
\]
Quando superfície \(S\) é dada por uma equação da forma \(r=r(\theta)\), o integral duplo reduz-se a
\[
A=\frac{1}{2}\int_{\theta_0}^{\theta}{r^2d\theta}
\]
seguindo-se
\[
\frac{dA}{dt}=\frac{1}{2}r^2\frac{d\theta}{dt}=const.
\]
e, consequentemente,
\[
\frac{d^2A}{dt^2}=r\frac{dr}{dt}\frac{d\theta}{dt}+\frac{r^2}{2}\frac{d^2\theta}{dt^2}=0
\]
Vimos imediatamente que
\[
\left\lbrace
\begin{array}{l}
\frac{d^2r}{dt^2}-r\left(\frac{d\theta}{dt}\right)^2=\frac{\vec{F}_r}{m}\\
0=\frac{\vec{F}_\theta}{m}\\
0=\frac{\vec{F}_\phi}{m}
\end{array}
\right.
\]
A segunda lei só pode ser satisfeita se a força exercida no corpo for central, isto é, possuir a direcção do raio vector. Para obtermos a forma da força radial, começamos por determinar a equação da elipse que possui o foco na origem em coordenadas esféricas, supondo que esta se encontra no plano horizontal \(\phi=\frac{\pi}{2}\). A distância do foco que se encontra na origem ao corpo é igual a \(r\). O teorema de Carnot aplicado ao triângulo formado pelos focos e o corpo permite-nos concluir que a distância do segundo corpo ao foco é igual a
\[
\sqrt{r^2+4f^2+4fr\cos\theta}
\]
sendo \(2f\) a distância interfocal. Como a elipse é o lugar geométrico de todos os pontos cuja soma das distâncias destes a ambos os focos é igual ao comprimento do eixo maior, temos
\[
r+\sqrt{r^2+4f^2+4fr\cos\theta}=2a
\]
onde \(a\) corresponde ao comprimento do semi-eixo maior. Se subtrairmos \(r\) a cada um dos membros, quadrarmos e simplificarmos, obtemos
\[r\left(a+f\cos\theta\right)=a^2-f^2\]
Se \(e=\frac{f}{a}\) for a excentricidade, temos
\[r=\frac{a\left(1-e^2\right)}{1+e\cos\theta}\]
Se utilizarmos a abreviação \(\psi=a\left(1-e^2\right)\), a equação da elipse escreve-se como
\[r=\frac{\psi}{1+e\cos\theta}\]
ou
\[
e\cos\theta=\frac{\psi}{r}-1
\]
Derivamos a equação em ordem ao parâmetro \(t\), vindo
\[
\frac{dr}{dt}=\frac{\psi e\sin\theta}{\left(1+e\cos\theta\right)^2}=\frac{r^2}{\psi}e\sin\theta\frac{d\theta}{dt}
\]
A segunda derivada fica, por seu turno, na forma
\[
\frac{d^2r}{dt^2}=\frac{r}{\psi}e\sin\theta\left(r\frac{d^2\theta}{dt^2}+2\frac{dr}{dt}\frac{d\theta}{dt}\right)+r\left(\frac{d\theta}{dt}\right)^2-\frac{r^2}{\psi}\left(\frac{d\theta}{dt}\right)^2
\]
Como, de acordo com a segunda lei temos \(\frac{d\theta}{dt}=\frac{k}{r^2}\), com \(k\) constante, então
\[
\frac{d^2r}{dt^2}-r\left(\frac{d\theta}{dt}\right)^2=-\frac{k^2}{\psi}\frac{1}{r^2}
\]
isto é,
\[
\vec{F}_r=-\frac{k^2}{\psi}\frac{1}{r^2}
\]
Trata-se da famosa lei da gravitação.
A consequência da terceira lei, apesar de subtil, é deveras interessante. Segue-se a seguinte equação diferencial da lei das áreas:
\[\frac{d\theta}{dt}=\frac{k}{r^2}=\frac{k}{\psi^2}\left(1+e\cos\theta\right)^2\]
Sendo uma equação separável, podemos escrever
\[
\int_0^{2\pi}{\frac{1}{2}\frac{\psi^2}{\left(1+e\cos\theta\right)^2}d\theta}=\frac{kT}{2}
\]
onde \(T\) representa o período da órbita. O integrando na equação anterior constitui uma função racional de funções trigonométricas e pode ser resolvido com o auxílio dos métodos habituais. No entanto, representando a área de uma elipse, o seu valor é dado por \(\pi ab\) e a equação reduz-se a
\[
\pi ab=\frac{kT}{2}
\]
ou
\[
\pi a\sqrt{a^2-f^2}=\frac{kT}{2}
\]
Se quadrarmos, ficamos com
\[
\pi^2a^2\left(1-e^2\right)=\frac{k^2T^2}{4}
\]
isto é,
\[
\pi^2a^3\psi=\frac{k^2T^2}{4}
\]
Concluímos desta forma que
\[
\psi=\frac{k^2}{4\pi^2}\frac{T^2}{a^3}
\]
e, portanto, a constante \(\psi\) que figura na forma da força central não depende dos parâmetros da órbita.

segunda-feira, 1 de maio de 2017

Dois artigos em metafísica

Encontrei dois artigos de Euler sobre metafísica que achei interessantes:

  1. Ensaio sobre uma demonstração metafísica do princípio geral do equilíbrio
  2. Reflexões sobre o espaço e o tempo
É interessante comparar as conclusões deste segundo artigo com as ideias modernas da teoria da relatividade.

Digressões em óptica geométrica

Nestes últimos tempos tenho escrito aqui alguns artigos sobre óptica geométrica. Decidi, portanto, à semelhança do que já tenho feito em textos no âmbito da matemática, compilar as ideias em ficheiros e actualizá-los ao longo do tempo ao invés de as individualizar.
Coloquei no OneDrive um documento que intitulei por Digressões em óptica geométrica e que serve esse propósito.

quinta-feira, 15 de dezembro de 2016

Um problema sobre reflexões e refracções

No texto As leis da reflexão e refracção em forma vectorial apresentei uma dedução das leis da reflexão e refracção a partir do princípio do tempo mínimo. No entanto, considero útil apresentar o tema de um ponto de vista historicamente mais coerente e deduzir o princípio do tempo mínimo a partir das leis empíricas da reflexão e refracção. Fá-lo-ei antes de aplicar as leis à resolução de um problema específico.
Em Óptica Geométrica, a luz é descrita com base no conceito de raios luminosos, os quais constituem abstracções que permitem modelar o seu comportamento. De acordo com a disciplina, valem os seguintes princípios:
  • Os raios luminosos são rectilíneos se a luz se propagar no seio de um meio homgéneo;
  • Os raios luminosos apresentam uma mudança de direcção na superfície de separação entre dois meios distintos;
  • Podem ser reflectidos aquando da sua incidência numa superfície de separação entre dois meios.
No caso da reflexão, um raio, designado por raio incidente, que parta do ponto \(P\) e incida no ponto \(R\) da superfície \(S\), é reflectido em direcção ao ponto \(Q\) que se encontra no mesmo lado do ponto \(P\) relativamente à superfície. São verificadas duas leis:
  1.  Os raios incidente, reflectido e a normal à superfície encontram-se no mesmo plano;
  2. O ângulos de incidência e de reflexão são iguais, sendo de incidência o ângulo compreendido entre o raio incidente e a normal à superfície e de reflexão, o ângulo compreendido entre o raio reflectido e a normal à superfície.
Designando por \(\vec{n}\) o vector normal à superfície no sentido dos pontos \(P\) e \(Q\), por \(\vec{i}\) o vector de norma unitária com a direcção do raio incidente e sentido do ponto \(R\) e por \(\vec{r}\) o vector unitário com a direcção do raio reflectido e sentido do ponto \(Q\), tem-se
\[\vec{i}=\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}\]
e
\[\vec{r}=\frac{\vec{\rho}}{\left\|\vec{\rho}\right\|}\]
onde \(\vec{\varepsilon}=R-P\) e \(\vec{\rho}=Q-R\). Da primeira lei é possível concluir que existem dois números, \(\alpha\) e \(\beta\), de tal forma que
\[\vec{r}=\alpha\vec{i}+\beta\vec{n}\]
O produto vectorial da equação anterior por \(\vec{n}\) resulta em
\[\vec{n}\times\vec{r}=\alpha\vec{n}\times\vec{i}\]
Como os ângulos de incidência e de reflexão são iguais então \(\left\|\vec{n}\times\vec{r}\right\|=\left\|\vec{n}\times\vec{i}\right\|\) e, portanto, \(\alpha=\pm 1\). Dado o sentido do vector de reflexão relativamente ao de incidência, conclui-se facilmente que \(\alpha=1\). A equação de reflexão escreve-se na forma
\[\vec{r}=\vec{i}+\beta\vec{n}\]
A multiplicação escalar por \(\vec{n}\), atendendo a que \(\vec{i}\cdot\vec{n}=-\vec{r}\cdot\vec{n}\), proporciona \(\beta=-2\vec{i}\cdot\vec{n}\), isto é,
\[\vec{r}=\vec{i}-2\left(\vec{i}\cdot\vec{n}\right)\vec{n}\]
Se \(R(u,v)\) definir a superfície de incidência então
\[\left\lbrace\begin{array}{c}\vec{n}\cdot\frac{\partial R}{\partial u}=0\\\vec{n}\cdot\frac{\partial R}{\partial u}=0\end{array}\right.\]
que, atendendo a que \(\vec{r}=\vec{i}+\beta\vec{n}\), se reduz a
\[\left\lbrace\begin{array}{c}\left(\frac{\vec{\rho}}{\left\|\vec{\rho}\right\|}-\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}\right)\cdot\frac{\partial R}{\partial u}=0\\\left(\frac{\vec{\rho}}{\left\|\vec{\rho}\right\|}-\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}\right)\cdot\frac{\partial R}{\partial v}=0\end{array}\right.\]
Ora, verifica-se facilmente que o sistema é equivalente a
\[\left\lbrace\begin{array}{c}\frac{\partial}{\partial u}\left(\left\|\vec{\rho}\right\|+\left\|\vec{\varepsilon}\right\|\right)=0\\\frac{\partial}{\partial v}\left(\left\|\vec{\rho}\right\|+\left\|\vec{\varepsilon}\right\|\right)=0\end{array}\right.\]
Segue-se daqui que \(\left\|\vec{\rho}\right\|+\left\|\vec{\varepsilon}\right\|=k\) onde \(k\) é uma constante. Como consequência imediata desta equação, se qualquer raio que parta do ponto \(P\), seja reflectido na superfície \(S\) e passe pelo ponto \(Q\), então a superfície \(S\) constitui um elipsóide de revolução.
As equações da reflexão permitem ainda mostrar um resultado banal do ponto de vista prático. Seja a superfície \(S\) um plano cuja normal é \(\vec{n}\). A equação da recta que define a reflexão de um raio que parta do ponto \(P\), seja reflectido no plano de normal \(\vec{n}\) e chegue ao ponto \(Q\) é da forma
\[X=P+\vec{\varepsilon}+\lambda\left\lbrack\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}-\frac{2}{\left\|\vec{\varepsilon}\right\|}\left(\vec{\varepsilon}\cdot\vec{n}\right)\vec{n}\right\rbrack\]
Um raio que parta do ponto \(P\) e incida na superfície \(S\) sobre o ponto \(R'\) é reflectido segundo a direcção da recta de equação
\[X'=P+\vec{\varepsilon}'+\lambda'\left\lbrack\frac{\vec{\varepsilon}'}{\left\|\vec{\varepsilon}'\right\|}-\frac{2}{\left\|\vec{\varepsilon}\right\|}'\left(\vec{\varepsilon}'\cdot\vec{n}\right)\vec{n}\right\rbrack\]
onde \(\vec{\varepsilon}'=R'-P\).No ponto de intersecção de ambas as rectas tem-se \(X=X'\) e, portanto,
\[0=\vec{\varepsilon}-\vec{\varepsilon}'+\lambda\left\lbrack\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}-\frac{2}{\left\|\vec{\varepsilon}\right\|}\left(\vec{\varepsilon}\cdot\vec{n}\right)\vec{n}\right\rbrack-\lambda'\left\lbrack\frac{\vec{\varepsilon}'}{\left\|\vec{\varepsilon}'\right\|}-\frac{2}{\left\|\vec{\varepsilon}\right\|}\left(\vec{\varepsilon}'\cdot\vec{n}\right)\vec{n}\right\rbrack\]
Como \(\vec{\varepsilon}-\vec{\varepsilon'}\) é um vector do plano então \(\left(\vec{\varepsilon}-\vec{\varepsilon'}\right)\cdot\vec{n}=0\), isto é,
\[\vec{\varepsilon}\cdot\vec{n}=\vec{\varepsilon}'\cdot\vec{n}\]
Segue-se que a multiplicação escalar por \(\vec{n}\) da equação vectorial para a intersecção das rectas fica da forma
\[\frac{\lambda}{\left\|\vec{\varepsilon}\right\|}\vec{\varepsilon}\cdot\vec{n}=\frac{\lambda'}{\left\|\vec{\varepsilon}'\right\|}\vec{\varepsilon}'\cdot\vec{n}\]
A substituição na equação da intersecção das rectas proporciona
\[0=\left(\frac{\lambda}{\left\|\vec{\varepsilon}\right\|}+1\right)\vec{\varepsilon}-\left(\frac{\lambda'}{\left\|\vec{\varepsilon}'\right\|}+1\right)\vec{\varepsilon}'\]
Considerando que o ponto \(P\) não se encontra no plano, os vectores \(\vec{\varepsilon}\) e \(\vec{\varepsilon}'\) são linearmente independentes e, portanto, vale o sistema de equações
\[\left\lbrace\begin{array}{c}\lambda=-\left\|\vec{\varepsilon}\right\|\\\lambda'=\left\|\vec{\varepsilon}'\right\|\end{array}\right.\]
A substituição nas equações das rectas proporciona-nos o ponto de intersecção \(Q'\) na forma
\[Q'=P+2\left(\vec{\varepsilon}\cdot\vec{n}\right)\vec{n}=P+2\left(\vec{\varepsilon}'\cdot\vec{n}\right)\vec{n}\]
uma vez que \(\vec{\varepsilon}\cdot\vec{n}=\vec{\varepsilon}'\cdot\vec{n}\). Como \(Q'\) não depende do ponto \(R'\) escolhido, conclui-se imediatamente que todas as rectas que definem a direcção da reflexão de raios que partem do ponto \(P\) intersectam-se no mesmo ponto \(Q'\). Ao ponto \(Q'\) dá-se a designação de ponto focal.

Um raio que parta do ponto \(P\) localizado num meio com densidade óptica \(\eta_1\) e que incida na superfície \(S\) de separação com o meio de densidade óptica \(\eta_2\) pode penetrá-lo, alterando a sua direcção. A tal fenómeno dá-se a designação de refracção e pode-se descrever com o auxílio das leis:

  1. Os raios incidente, refractado e a normal à superfície encontram-se no mesmo plano;
  2. O ângulos de incidência, \(\theta_i\), e de refracção, ângulo \(\theta_r\) definido com a normal à superfície, satisfazem a lei de Snell-Descartes

\[\eta_1\sin{\theta_i}=\eta_2\sin{\theta_r}\]
Considere-se um raio que parte do ponto \(P\) localizado no meio com índice óptico \(\eta_1\), incida no ponto \(R\) da superfície de separação e é refractado no ponto \(Q\) localizado no meio com índice óptico \(\eta_2\). Definam-se os vectores \(\vec{\varepsilon}=R-P\) e \(\vec{\rho}=Q-R\) e os vectores unitários que lhes são colineares
\[\vec{i}=\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}\]
e
\[\vec{r}=\frac{\vec{\rho}}{\left\|\vec{\rho}\right\|}\]
Da primeira lei, segue-se a identidade
\[\vec{r}=\alpha\vec{i}+\beta\vec{n}\]
Aplicando o produto vectorial de \(\vec{n}\) a cada membro da equação anterior fica
\[\vec{n}\times\vec{r}=\alpha\vec{i}\times\vec{n}\]
A segunda lei permite concluir que
\[\alpha=\frac{\eta_1}{\eta_2}\]
isto é,
\[\vec{r}=\frac{\eta_1}{\eta_2}\vec{i}+\beta\vec{n}\]
No artigo supracitado mostrou-se que
\[\beta=-\frac{1}{\eta_2}\left(\eta_1\vec{i}\cdot\vec{n}+\sqrt{\eta_2^2-\eta_1^2\left(\vec{i}\times\vec{n}\right)^2}\right)\]
Da equação
\[\eta_2\beta\vec{n}=\eta_2\vec{r}-\eta_1\vec{i}\]
segue-se, recorrendo ao mesmo artifício atrás apresentado, o sistema de equações
\[\left\lbrace\begin{array}{c}\left(\eta_1\vec{i}-\eta_2\vec{r}\right)\cdot\frac{\partial R}{\partial u}\\\left(\eta_1\vec{i}-\eta_2\vec{r}\right)\cdot\frac{\partial R}{\partial v}\end{array}\right.\]
ou
\[\left\lbrace\begin{array}{c}\left(\eta_1\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}-\eta_2\frac{\vec{\rho}}{\left\|\vec{\rho}\right\|}\right)\cdot\frac{\partial R}{\partial u}\\\left(\eta_1\frac{\vec{\varepsilon}}{\left\|\vec{\varepsilon}\right\|}-\eta_2\frac{\vec{\rho}}{\left\|\vec{\rho}\right\|}\right)\cdot\frac{\partial R}{\partial v}\end{array}\right.\]
onde \(R(u,v)\) é um ponto da superfície \(S\) parametrizado por \(u\) e \(v\). O sistema é equivalente a
\[\left\lbrace\begin{array}{c}\frac{\partial}{\partial u}\left(\eta_1\left\|\vec{\varepsilon}\right\|-\eta_2\left\|\vec{\rho}\right\|\right)=0\\\frac{\partial}{\partial v}\left(\eta_1\left\|\vec{\varepsilon}\right\|-\eta_2\left\|\vec{\rho}\right\|\right)=0\\\end{array}\right.\]
Conclui-se, portanto, que \(\eta_1\left\|\vec{\varepsilon}\right\|-\eta_2\left\|\vec{\rho}\right\|=k\) onde \(k\) é uma constante. Deste modo, a família de superfícies dadas por aquela equação permitem refractar todos os raios que partem do ponto \(P\) e incidem na superfície \(S\) no ponto \(Q\). A superfície é conhecida como oval de Descartes.

quarta-feira, 14 de setembro de 2016

Teoria probabilística dos erros de medição

A medição de uma quantidade não pode ser despida de imprecisões ou incertezas, quer seja devido às limitações técnicas dos aparelhos ou técnicas usadas, ao confluir de uma série de factores que dificultam a sua execução ou a qualquer outra situação adversa. Distinguem-se dois tipos de erros, nomeadamente, os erros aleatórios e os erros sistemáticos. Os erros aleatórios devem-se ao conjunto de factores que não estão submetidos ao controlo do experimentador, variando entre medições. Os erros sistemáticos resultam de processos inválidos de medição e são transversais a todas as medições efectuadas mediante esses mesmos processos.
Os erros sistemáticos poderão ser eliminados pela correcção dos processos de medição ao contrário dos erros aleatórios. Interessa, pois, estudar o quão precisa é uma medição, sabendo que esta se encontra sujeita a erros aleatórios. Seja \(x\) uma grandeza que se pretenda medir e \(y_i\), com \(i=1,\cdots,n\), um conjunto de \(n\) valores medidos da grandeza \(x\). Supondo que o processo de medição não introduz erros sistemáticos, é possível escrever \(y_i-x=\delta_i\) onde \(\delta_i\) representa o erro aleatório. Pretende-se determinar a função que permite determinar a probabilidade de um erro \(\delta\) de uma medição se encontrar no intervalo \((a,b)\).
De acordo com os processos habituais da teoria das probabilidades, é pretendido a obtenção da forma da função \(\varphi(\delta)\) tal que a probabilidade \(P(a\lt\delta\lt b)\) do erro \(\delta\) se encontrar confinado ao intervalo \((a,b)\) seja dada por
\[P(a\lt\delta\lt b)=\int_a^b{\varphi(\delta)d\delta}\]
De modo a que \(\varphi(\delta)\) seja uma distribuição, tem de ser verificada a relação
\[\int_{-\infty}^{+\infty}{\varphi(\delta)d\delta}=1\]
Para possibilitar a determinação da forma da distribuição, é necessária a introdução das hipóteses simplificativas:


  1. Erros com a mesma magnitude são igualmente prováveis, isto é, \(\varphi(-\delta)=\varphi(\delta)\).
  2. A probabilidade é máxima para \(\delta=0\).
  3. A probabilidade da ocorrência de um erro suficientemente grande é nula.
  4. A função de distribuição é contínua (hipótese simplificativa).

Se for efectuada uma série de \(n\) medições a probabilidade que os seus valores sejam \(y_i\), \(i=1,2,\cdots,n\) sabendo que o valor da grandeza se encontra cingido ao intervalo infinitesimal compreendido entre \(x\) e \(x+dx\) é dada por
\[\varphi\left(x-y_1\right)\varphi\left(x-y_2\right)\cdots\varphi\left(x-y_n\right)dx=\Omega dx\]
Foi aqui assumido que as medições são processos estocásticos independentes.
Como é pretendita a probabilidade do valor da grandeza se encontrar no intervalo \((x,x+dx)\), sabendo que os valores medidos são \(y_i\), é útil o recorrer ao conhecido conceito da probabilidade condicionada. Assim, se \(p(y|x)\) representar a probabilidade das medições proporcionarem os valores \(y_i\) sabendo que \(x\) se encontra no intervalo compreendido entre \(x\) e \(x+dx\), tem-se
\[p(x|y)p(y)=p(y|x)p(x)\]
Se for efectuado um novo processo de medição, a probabilidade da grandeza a ser medida se encontrar no intervalo \((x,x+dx)\) será a mesma, uma vez que não depende do processo. É seguro, também, assumir que a probabilidade de o conjunto de valores ser \(y_i\), \(i=1,2,\cdots,n\) não depende do processo e seja, portanto, igual à probabilidade anterior. Assim,
\[\frac{p(x|y)}{p'(x|y)}=\frac{p(y|x)}{p'(y|x)}\]
Segue-se daqui que
\[p(x|y)=\lambda\Omega dx\]
O valor mais provável da grandeza é aquele para o qual o erro é nulo, isto é, é aquele que maximiza a função \(\Omega\). Este valor satisfaz, portanto, a equação
\[\sum_{i=1}^n{\frac{\partial\Omega}{\partial\delta_i}\frac{d\delta_i}{dx}}\]
Para determinar uma forma para a função de distribuição é necessária a introdução da hipótese adicional de que o valor mais provável \(\mu\) corresponde à média, isto é,
\[\mu=\frac{1}{n}\sum_{i=1}^n{y_i}\]
Ora, como
\[\frac{\partial\Omega}{\partial\delta_i}=\frac{\Omega}{\varphi\left(\delta_i\right)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=\delta_i}\]
e \(\delta_i=\mu-y_i\), segue-se que
\[\sum_{i=1}^n{\frac{1}{\varphi\left(y_i-\mu\right)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=y_i-\mu}}\]
Como o resultado das medições pode ser arbitrário, analise-se o sistema de valores \(y_i\) da forma
\[y_2=y_3=\cdots=y_n=y_1-nm\]
sendo \(m\) um valor escolhido aleatoriamente. Este sistema de valores proporciona
\[\mu=y_1-(n-1)m\]
A substituição na equação anterior conduz ao resultado
\[\frac{1}{\varphi\left((n-1)m\right)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=(n-1)m}=(n-1)\frac{1}{\varphi(m)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=m}\]
Denotando por \(f(m)\) a função
\[\frac{1}{\varphi(m)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=m}\]
verifica-se facilmente que esta satisfaz a identidade \(f\left((n-1)m\right)=(n-1)f(m)\). Não é difícil constatar que \(f(0)=0\), \(f(n-1)=(n-1)f(1)\), fazendo \(m=0\) e \(m=1\) na identidade. Fazendo \(m=\frac{r}{n-1}\alpha\) obtém-se
\[f\left(\frac{r}{n-1}\alpha\right)=\frac{r}{n-1}f(\alpha)\]
Segue-se daqui que \(f(m)=rm\) onde \(r=f(1)\) para qualquer valor racional de \(m\). Como \(f\) é contínua, a sua forma estende-se para todos os valores de \(m\) reais. Assim,
\[\frac{1}{\varphi(m)}\frac{d\varphi}{dr}=\frac{d\log{\varphi(m)}}{dr}=rm\]
cuja solução é dada por
\[\varphi(m)=Ae^{\frac{1}{2}rm^2}\]
Como a probabilidade de erros suficientemente grandes tende a anular-se, então \(r=-2k^2<0\). Além disso, como
\[\int_{-\infty}^{+\infty}{e^{-k^2m^2}dm}=\frac{\sqrt{\pi}}{k}\]
a função de distribuição fica da forma
\[\varphi(m)=\frac{k}{\sqrt{\pi}}e^{-k^2m^2}\]
Esta é conhecida como a distribuição normal.