quarta-feira, 14 de setembro de 2016

Teoria probabilística dos erros de medição

A medição de uma quantidade não pode ser despida de imprecisões ou incertezas, quer seja devido às limitações técnicas dos aparelhos ou técnicas usadas, ao confluir de uma série de factores que dificultam a sua execução ou a qualquer outra situação adversa. Distinguem-se dois tipos de erros, nomeadamente, os erros aleatórios e os erros sistemáticos. Os erros aleatórios devem-se ao conjunto de factores que não estão submetidos ao controlo do experimentador, variando entre medições. Os erros sistemáticos resultam de processos inválidos de medição e são transversais a todas as medições efectuadas mediante esses mesmos processos.
Os erros sistemáticos poderão ser eliminados pela correcção dos processos de medição ao contrário dos erros aleatórios. Interessa, pois, estudar o quão precisa é uma medição, sabendo que esta se encontra sujeita a erros aleatórios. Seja \(x\) uma grandeza que se pretenda medir e \(y_i\), com \(i=1,\cdots,n\), um conjunto de \(n\) valores medidos da grandeza \(x\). Supondo que o processo de medição não introduz erros sistemáticos, é possível escrever \(y_i-x=\delta_i\) onde \(\delta_i\) representa o erro aleatório. Pretende-se determinar a função que permite determinar a probabilidade de um erro \(\delta\) de uma medição se encontrar no intervalo \((a,b)\).
De acordo com os processos habituais da teoria das probabilidades, é pretendido a obtenção da forma da função \(\varphi(\delta)\) tal que a probabilidade \(P(a\lt\delta\lt b)\) do erro \(\delta\) se encontrar confinado ao intervalo \((a,b)\) seja dada por
\[P(a\lt\delta\lt b)=\int_a^b{\varphi(\delta)d\delta}\]
De modo a que \(\varphi(\delta)\) seja uma distribuição, tem de ser verificada a relação
\[\int_{-\infty}^{+\infty}{\varphi(\delta)d\delta}=1\]
Para possibilitar a determinação da forma da distribuição, é necessária a introdução das hipóteses simplificativas:


  1. Erros com a mesma magnitude são igualmente prováveis, isto é, \(\varphi(-\delta)=\varphi(\delta)\).
  2. A probabilidade é máxima para \(\delta=0\).
  3. A probabilidade da ocorrência de um erro suficientemente grande é nula.
  4. A função de distribuição é contínua (hipótese simplificativa).

Se for efectuada uma série de \(n\) medições a probabilidade que os seus valores sejam \(y_i\), \(i=1,2,\cdots,n\) sabendo que o valor da grandeza se encontra cingido ao intervalo infinitesimal compreendido entre \(x\) e \(x+dx\) é dada por
\[\varphi\left(x-y_1\right)\varphi\left(x-y_2\right)\cdots\varphi\left(x-y_n\right)dx=\Omega dx\]
Foi aqui assumido que as medições são processos estocásticos independentes.
Como é pretendita a probabilidade do valor da grandeza se encontrar no intervalo \((x,x+dx)\), sabendo que os valores medidos são \(y_i\), é útil o recorrer ao conhecido conceito da probabilidade condicionada. Assim, se \(p(y|x)\) representar a probabilidade das medições proporcionarem os valores \(y_i\) sabendo que \(x\) se encontra no intervalo compreendido entre \(x\) e \(x+dx\), tem-se
\[p(x|y)p(y)=p(y|x)p(x)\]
Se for efectuado um novo processo de medição, a probabilidade da grandeza a ser medida se encontrar no intervalo \((x,x+dx)\) será a mesma, uma vez que não depende do processo. É seguro, também, assumir que a probabilidade de o conjunto de valores ser \(y_i\), \(i=1,2,\cdots,n\) não depende do processo e seja, portanto, igual à probabilidade anterior. Assim,
\[\frac{p(x|y)}{p'(x|y)}=\frac{p(y|x)}{p'(y|x)}\]
Segue-se daqui que
\[p(x|y)=\lambda\Omega dx\]
O valor mais provável da grandeza é aquele para o qual o erro é nulo, isto é, é aquele que maximiza a função \(\Omega\). Este valor satisfaz, portanto, a equação
\[\sum_{i=1}^n{\frac{\partial\Omega}{\partial\delta_i}\frac{d\delta_i}{dx}}\]
Para determinar uma forma para a função de distribuição é necessária a introdução da hipótese adicional de que o valor mais provável \(\mu\) corresponde à média, isto é,
\[\mu=\frac{1}{n}\sum_{i=1}^n{y_i}\]
Ora, como
\[\frac{\partial\Omega}{\partial\delta_i}=\frac{\Omega}{\varphi\left(\delta_i\right)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=\delta_i}\]
e \(\delta_i=\mu-y_i\), segue-se que
\[\sum_{i=1}^n{\frac{1}{\varphi\left(y_i-\mu\right)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=y_i-\mu}}\]
Como o resultado das medições pode ser arbitrário, analise-se o sistema de valores \(y_i\) da forma
\[y_2=y_3=\cdots=y_n=y_1-nm\]
sendo \(m\) um valor escolhido aleatoriamente. Este sistema de valores proporciona
\[\mu=y_1-(n-1)m\]
A substituição na equação anterior conduz ao resultado
\[\frac{1}{\varphi\left((n-1)m\right)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=(n-1)m}=(n-1)\frac{1}{\varphi(m)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=m}\]
Denotando por \(f(m)\) a função
\[\frac{1}{\varphi(m)}\left.\frac{d\varphi}{d\delta}\right|_{\delta=m}\]
verifica-se facilmente que esta satisfaz a identidade \(f\left((n-1)m\right)=(n-1)f(m)\). Não é difícil constatar que \(f(0)=0\), \(f(n-1)=(n-1)f(1)\), fazendo \(m=0\) e \(m=1\) na identidade. Fazendo \(m=\frac{r}{n-1}\alpha\) obtém-se
\[f\left(\frac{r}{n-1}\alpha\right)=\frac{r}{n-1}f(\alpha)\]
Segue-se daqui que \(f(m)=rm\) onde \(r=f(1)\) para qualquer valor racional de \(m\). Como \(f\) é contínua, a sua forma estende-se para todos os valores de \(m\) reais. Assim,
\[\frac{1}{\varphi(m)}\frac{d\varphi}{dr}=\frac{d\log{\varphi(m)}}{dr}=rm\]
cuja solução é dada por
\[\varphi(m)=Ae^{\frac{1}{2}rm^2}\]
Como a probabilidade de erros suficientemente grandes tende a anular-se, então \(r=-2k^2<0\). Além disso, como
\[\int_{-\infty}^{+\infty}{e^{-k^2m^2}dm}=\frac{\sqrt{\pi}}{k}\]
a função de distribuição fica da forma
\[\varphi(m)=\frac{k}{\sqrt{\pi}}e^{-k^2m^2}\]
Esta é conhecida como a distribuição normal.

sexta-feira, 27 de maio de 2016

Tradução de dois artigos

Realize a tradução de dois artigos com algum interesse histórico:

  1. Reflexões sobre a potência motora do fogo: primeira tentativa do estabelecimento de uma teoria sobre o funcionamento das máquinas térmicas e que pode ser considerado como o trabalho que fundou a disciplina da Termodinâmica.
  2. Sobre um aparato de expansão que permite tornar visíveis os rastos de partículas ionizantes em gases e alguns resultados da sua utilização: descrição do primeiro aparato que permitia detectar partículas elementares e que contribui para o advento da Física das Partículas.

quinta-feira, 12 de maio de 2016

Alguns artigos interessantes na história do estudo dos buracos negros

Entre os objectos mais estranho estudados em Astrofísica contam-se os buracos negros e a história da sua descoberta e maturação da teoria tem, também, o seu interesse. Não considero aqui útil uma descrição do tópico no que concerne à sua divulgação. Dentro do âmbito do que aqui tenho colocado, torna-se certamente mais interessante publicar traduções dos artigos mais marcantes no desenvolvimento da sua teoria. Começo com estes:

  1. A massa máxima de estrelas anãs ideais
  2. Aplicações da teoria do gás electrónico de Pauli-Fermi ao problema das forças coesivas
  3. Sobre a matéria densa
  4. Sobre o campo gravitacional de uma esfera de fluido incompressível de acordo com a teoria de Einstein
  5. Sobre o campo gravitacional de uma massa pontual de acordo com a teoria de Einstein
  6. A densidade de estrelas anãs brancas
Nos dois últimos dos artigos aqui listados, Schwarzschild obteve duas soluções das equações de campo gravítico, uma para uma esfera de fluido e outra para uma massa pontual. Observa-se aí que, estando toda a matéria condensada no interior de uma esfera cujo raio é inferior a um raio crítico, a velocidade de escape de qualquer partícula que aí se encontre terá de ser superior à velocidade da luz. Tal objecto possui, portanto, as características de um buraco negro.
No primeiro dos artigos, Chandrasekhar determinou o limite para a massa de um gás degenerado de electrões que constitui um modelo preciso das estrelas anãs brancas. Esse artigo baseia-se na teoria dos gases electrónicos estudada anteriormente por outros autores. Tentarei continuar a pesquisar todos os artigos que permitam dar um seguimento coerente à história subjacente ao estudo dos buracos negros.

quarta-feira, 27 de maio de 2015

Tradução e resumo de alguns artigos conhecidos

Alguns dos artigos que tenho vindo a traduzir ao longo do tempo:
Sobre a Teoria Quântica das linhas espectrais por Bohr, no qual o autor estende a sua teoria dos estados estacionários do átomo de hidrogénio aos sistemas condicionalmente periódicos.
A lei da dispersão da teoria de Bohr do espectro e A teoria quântica da dispersão por Krammers desempenharam um papel importante no desenvolvimento da Teoria Quântica anterior à Mecânica das Matrizes e à Teoria Ondulatória.
Como infelizmente ainda não sou capaz de ler alemão, tentei apenas identificar os pontos essenciais até à teoria do último multiplicador, exposta por Jacobi nas suas famosas Lições sobre Dinâmica. Ficou de fora a teoria das transformações canónicas, que espero aqui vir a incluir mais tarde.

sábado, 2 de maio de 2015

As leis da reflexão e refracção em forma vectorial

Aqui há tempos publiquei um texto sobre a dedução da lei da refracção a partir do princípio do menor tempo (ver aqui). Agora, apresentarei uma demonstração semelhante da qual resultam as mesmas leis na forma vectorial.

A lei da reflexão na forma vectorial

Suponhamos que um raio de luz parte do ponto A, é reflectido no ponto P de uma superfície no espaço e chega ao ponto B. Se o raio viajar sempre no mesmo meio, o tempo de viagem entre os pontos A e B é dado por
\[\tau=\frac{1}{c}\left(\|\vec{r}_P-\vec{r}_A\|+\|\vec{r}_B-\vec{r}_P\|\right)\]
onde \(\vec{r}_A=\left(x_A,y_A,z_A\right)\) e \(\vec{r}_B=\left(x_B,y_B,z_B\right)\) nos dão respectivamente as coordenadas dos pontos A e B e
\[\vec{r}_P=\left(x(u,v),y(u,v),z(u,v)\right)\]
dá-nos as coordenadas do ponto P mapeada pelos parâmetros \(u\) e \(v\) da superfície. O ponto P que minimiza o tempo percorrido pelo raio de luz é aquele que satisfaz as equações
\[\left\lbrace\begin{matrix}\frac{d\tau}{du}=0\\ \frac{d\tau}{dv}=0\end{matrix}\right.\]
Se definirmos
\[\begin{matrix}\vec{i}=\frac{\vec{r}_P-\vec{r}_A}{\left\|\vec{r}_P-\vec{r}_A\right\|}, & \vec{r}=\frac{\vec{r}_B-\vec{r}_P}{\left\|\vec{r}_B-\vec{r}_P\right\|}\end{matrix}\]
o sistema anterior escreve-se na forma equivalente
\[\left\lbrace\begin{matrix}\left(\vec{i}-\vec{r}\right)\cdot\frac{\partial\vec{r}_P}{\partial u}=0\\ \left(\vec{i}-\vec{r}\right)\frac{\partial\vec{r}_P}{\partial v}=0\end{matrix}\right.\]
Este resultado permite-nos concluir que o vector \(\vec{i}-\vec{r}\) é colinear com a normal \(\vec{n}\) à superfície. Convencionamos que esta normal tem o sentido tal que \(\vec{i}\cdot\vec{n}<0\). Sendo \(\alpha\) o factor da colinearidade, temos
\[\vec{i}-\vec{r}=\alpha\vec{n}\]
Se multiplicarmos escalarmente a equação por \(\vec{i}\) e \(\vec{r}\), e somarmos obtemos a conhecida lei da reflexão, nomeadamente,
\[\vec{i}\cdot\vec{n}+\vec{r}\cdot\vec{n}=0\]
e, portanto,
\[\alpha=2\vec{i}\cdot\vec{n}\]
Por fim, a lei da reflexão na forma vectorial vem dada pela expressão
\[\vec{r}=\vec{i}-2\left(\vec{i}\cdot\vec{n}\right)\vec{n}\]

A lei da refracção na forma vectorial

Se designarmos por \(v_i\) a velocidade da luz no meio \(i\) e por \(c\) a sua velocidade no vazio, definimos o índice de refracção \(\eta_i\) associado ao meio \(i\) por intermédio da expressão
\[v_i=\frac{c}{\eta_i}\]
Se um raio partir do ponto A situado no meio \(1\), for refractado no ponto P de uma superfície de separação entre os meios e chega ao ponto B situado no meio \(2\), o tempo que este demora a realizar o percurso é dado por
\[\tau=\frac{1}{c}\left(\eta_1\|\vec{r}_P-\vec{r}_A\|+\eta_2\|\vec{r}_B-\vec{r}_P\|\right)\]
Se definirmos o versor de transferência pela expressão
\[\vec{t}=\frac{\vec{r}_B-\vec{r}_P}{\left\|\vec{r}_B-\vec{r}_P\right\|}\]
o processo de minimização habitual conduz-nos ao sistema de equações
\[\left\lbrace\begin{matrix}\left(\eta_1\vec{i}-\eta_2\vec{t}\right)\cdot\frac{\partial\vec{r}_P}{\partial u}=0\\ \left(\eta_1\vec{i}-\eta_2\vec{t}\right)\cdot\frac{\partial\vec{r}_P}{\partial v}=0\end{matrix}\right.\]
isto é,
\[\eta_1\vec{i}-\eta_2\vec{t}=k\vec{n}\]
Se aplicarmos, à equação, o produto externo por \(\vec{n}\), obtemos a identidade
\[\eta_1\left(\vec{i}\times\vec{n}\right)=\eta_2\left(\vec{t}\times\vec{n}\right)\]
Como todos os vectores considerados nos produtos vectoriais possuem norma unitária, a expressão anterior resume-se em
\[\eta_1\sin{\alpha_1}=\eta_2\sin{\alpha_2}\]
onde \(\alpha_1\) e \(\alpha_2\) são os ângulos formados pelos vectores de incidência e de refracção com a normal à superfície, respectivamente. Esta é a famosa lei da refracção.
Para resolvermos o problema a que nos propusermos, teremos de determinar o valor de \(k\). Voltemos então à equação de colinearidade
\[\eta_1\vec{i}-\eta_2\vec{t}=k\vec{n}\]
Multiplicamos escalarmente a equação por \(\eta_1\vec{i}\), depois por \(\eta_2\vec{t}\), somamos os resultados e reorganizamos os temos para obtermos
\[\eta_2\vec{t}\cdot\vec{n}=\frac{\eta_1^2-\eta_2^2}{k}-\eta_1\vec{i}\cdot\vec{n}\]
Se multiplicarmos escalarmente a mesma equação por \(\vec{n}\) obtemos
\[k=\eta_1\vec{i}\cdot\vec{n}-\eta_2\vec{t}\cdot\vec{n}\]
a qual, combinada com a equação anterior, nos proporciona a equação de segundo grau para \(k\),
\[k^2-2k\eta_1\vec{i}\cdot\vec{n}+\eta_1^2-\eta_2^2=0\]
A fórmula resolvente permite-nos escrever
\[k=\eta_1\vec{i}\cdot\vec{n}\pm\sqrt{\eta_2^2-\eta_1^2\left(\vec{i}\times\vec{n}\right)^2}\]
uma vez que
\[\left(\vec{i}\times\vec{n}\right)^2=\left|\begin{matrix}\vec{i}\cdot\vec{i} & \vec{i}\cdot\vec{n}\\ \vec{n}\cdot\vec{i} & \vec{v}\cdot\vec{n}\end{matrix}\right|=1-\left(\vec{i}\cdot\vec{n}\right)^2\]
Tendo calculado o valor de \(k\), temos então
\[\eta_1\vec{i}-\eta_2\vec{t}=\left(\eta_1\vec{i}\cdot\vec{n}\pm\sqrt{\eta_2^2-\eta_1^2\left(\vec{i}\times\vec{n}\right)^2}\right)\vec{n}\]
Resta-nos determinar qual das soluções para \(k\) nos proporciona a expressão correcta. Para o efeito, multiplicamos escalarmente a equação anterior por \(\vec{n}\), surgindo a identidade
\[-\eta_2\vec{n}\cdot\vec{t}=\pm\sqrt{\eta_2^2-\eta_1^2\left(\vec{i}\times\vec{n}\right)^2}\]
Como estamos a considerar que o raio de luz se move no sentido do meio com índice de refracção \(\eta_2\) e o vector normal aponta no sentido do outro meio, concluímos que nos interessa a solução com o sinal positivo, isto é,
\[\eta_1\vec{i}-\eta_2\vec{t}=\left(\eta_1\vec{i}\cdot\vec{n}+\sqrt{\eta_2^2-\eta_1^2\left(\vec{i}\times\vec{n}\right)^2}\right)\vec{n}\]
ou
\[\vec{t}=\frac{\eta_1}{\eta_2}\vec{i}-\frac{1}{\eta_2}\left(\eta_1\vec{i}\cdot\vec{n}+\sqrt{\eta_2^2-\eta_1^2\left(\vec{i}\times\vec{n}\right)^2}\right)\]
se pretendermos determinar a direcção do raio refractado, conhecendo as direcções dos raios incidente e normal.

Ângulo crítico

A fórmula da refracção atrás apresentada vale apenas no domínio
\[\eta_2^2-\eta_1^2\left(\vec{i}\times\vec{n}\right)\ge0\]
Ora, se considerarmos um raio que incida na superfície paralelamente à direcção normal, o raio refractado será dado por \(\vec{t}=\vec{i}\). À medida que o raio de incidência se afasta da normal, o raio refractado afasta-se da normal até que seja atingido o ângulo de incidência \(\theta_i\) tal que
\[\sin\theta_i=\frac{\eta_2}{\eta_1}\]
Nestas condições vale a identidade
\[\vec{t}=\frac{\eta_1}{\eta_2}\left\lbrack \vec{i}-\left(\vec{i}\cdot\vec{n}\right)\vec{n}\right\rbrack\]
Para um ângulo \(\theta_i\) nestas condições, designado por ângulo crítico, temos \(\vec{t}\cdot\vec{n}=0\), isto é, o raio refractado tem a direcção tangente à superfície. Todos os raios que incidam na superfície, fazendo um ângulo com a normal superior ao ângulo crítico, são reflectidos.

sábado, 13 de dezembro de 2014

Descoberta de um novo princípio de Mecânica

O título Descoberta de um novo princípio de Mecânica foi dado por Euler ao seu trabalho sobre o movimento geral dos corpos sólidos com dimensões finitas. O autor defende neste interessante texto que os princípios da Mecânica dos corpos, anteriormente enunciados, encontram apenas aplicações nos casos simples dos movimentos compostos por uma translação e um movimento de rotação em torno de um eixo imóvel. De modo a poder descrever o movimento geral de um corpo sólido enuncia o seguinte princípio:
A descrição do movimento geral de um corpo obtém-se através da aplicação dos princípios de Mecânica a todos os elementos infinitesimais constituintes os quais admitem apenas movimentos de translação.
Além de resolver o problema dos corpos sólidos, defende que o princípio enunciado, apesar da sua simplicidade, encontra aplicações tanto nos domínios da Hidráulica bem como em campos da Física ainda por conhecer.

sábado, 31 de maio de 2014

O método dos elementos finitos

Publiquei o texto O método dos elementos finitos onde apresento uma brevíssima introdução ao método dos elementos finitos cujo propósito se prende com a resolução numérica de problemas em equações diferenciais com condições fornteira. O artigo constitui um extracto de um texto nos domínios da computação paralela.