 <img src="Images/fc.pos.jpg" class="bg-primary" align = 'left' width=200/>

# Academia de Física 2025
## Análise de Dados e o Sensor de Aceleração do Telemóvel


In [None]:
%matplotlib inline                                     
import numpy as np                    # modulo numérico , essencial para trabalho cientifico; chamado np
import matplotlib.pyplot as plt 
import scipy.stats as st

## Sumário
Os telemóveis atuais (_smart phones_) dispoẽm de um conjunto alargado de sensores, necessários para os padrões de funcionamento que o consumidor espera deste produto. 

Neste trabalho, recorremos a uma _App_ para aceder diretamente aos dados do sensor de aceleração. Este sensor é vetorial e mede as três componentes da aceleração da gravidade, segundo o eixo $Oz$ perpendicular ao écran, e os eixos $Ox$ e $Oy$ no plano do écran. Com o telemóvel em repouso em várias posições, recolhemos os dados das três componentes, durante alguns segundos, evidenciando a existência de ruído aleatório, que analisamos com conceitos de estatística.  

### Experiência 1
Este trabalho é baseado no artigo da [ref. 1](#ref1). Usámos a app _PhyPhox_ que regista os valores da aceleração da gravidade. O sensor foi configurado para a opção de  `timed run` com um atraso de 3 s   e um tempo de recolha de dados de 50 segundos.Durante a experiência o telemóvel esteve imóvel pousado com o ecrán para cima, sobre uma mesa.

Os eixos do telemóvel são os indicados na figura

<img src="Images/eixos-tlm.png" width=300
     align='center'/> 

Reproduzido de [ref. 2](#ref2) 


Os resultados das medições das 3 componentes da aceleração foram exportados na forma de ficheiro `Excel` para a _cloud_ e descarregados localmente. Para importação e processamento no Júpiter o ficheiro excel deve ser guardado no fomato _.csv_ (comma separated values). Estes dados são  lidos e representados graficamente na célula seguinte. 

In [None]:
dados1=np.loadtxt("Dados/aceleracao50.csv",delimiter=",",skiprows=1)
len(dados1[:,0])

In [None]:
dados1=np.loadtxt("Dados/aceleracao50.csv",delimiter=",",skiprows=1) # salta a primeira linha de cabeçalhos. 
#
#
plt.figure(figsize=(6,14))
plt.subplot(311)                                      # 331-> 3 linhas, coluna 1,  gráfico 1
plt.plot(dados1[:,0],dados1[:,1],'b-',linewidth=1,ms=2)    # a_x vs tempo
plt.title(r'$a_x$',fontsize=14)
plt.xlabel("time")
plt.xlim(.5,1.5)                                       # representacao de 1 segundo de dados
plt.grid(True)
plt.subplot(312)
plt.plot(dados1[:,0],dados1[:,2],'r-',linewidth=1)     # a_y vs tempo
plt.title(r'$a_y$',fontsize=14)
plt.xlabel("time")
plt.grid(True)
plt.subplot(313)
plt.plot(dados1[:,0],dados1[:,3],'g-',linewidth=1)     # a_z vs tempo
plt.title(r'$a_z$',fontsize=14)
plt.xlabel("time / s ")
plt.grid(True)



In [None]:
#sintaxe explícita
dados1=np.loadtxt("Dados/aceleracao50.csv",delimiter=",",skiprows=1) # salta a primeira linha de cabeçalhos. 
#
#
fig, ax =plt.subplots(3,1, figsize=(6,14),layout='constrained')     # 3,1-> 3 linhas,  1 coluna 1, 
#
ax[0].set_ylabel(r'$a_x$',fontsize=14) 
ax[0].set_xlabel("time")
ax[0].set_xlim([.5,1.5])
ax[0].grid(True)
ax[0].plot(dados1[:,0],dados1[:,1],'b-',linewidth=1,ms=2)    # a_x vs tempo
#
ax[1].set_ylabel(r'$a_y$',fontsize=14) 
ax[1].set_xlabel("time")
#ax[1].set_xlim([.5,1.5])
ax[1].grid(True)
ax[1].plot(dados1[:,0],dados1[:,2],'g-',linewidth=1,ms=2)    # a_y vs tempo
#
ax[2].set_ylabel(r'$a_z$',fontsize=14) 
ax[2].set_xlabel("time")
#ax[2].set_xlim([.5,1.5])
ax[2].grid(True)
ax[2].plot(dados1[:,0],dados1[:,2],'r-',linewidth=1,ms=2)    # a_z vs tempo
fig.suptitle('PhyPhox data')


<div class="alert alert-block alert-warning">
    <b>Parte 1</b>
    <p> Usa o telemóvel do teu grupo e tenta reproduzir o procedimento acima descrito. Obtém e representa graficamente a tua própria série de dados. </p>   
</div>

In [None]:
# usa esta célula para fazer a primeira parte da experiência.


<div class="alert alert-block alert-info">
<b>Pergunta:</b> Qual é a taxa de aquisição do teu sensor? Quantos valores regista por segundo? qual é o intervalo de tempo entre registos sucessivos?
</div>

### Análise de dados
Apesar de teres o telemóvel fixo, os valores  de aceleração variam sem ordem discernível, flutuam aleatóriamente, de instante para instante. Que podemos então dizer sobre a aceleração da gravidade, por exemplo  no caso do eixo $Oz$? Qual é o seu valor?
Na presença de um sequência de observações de uma mesma grandeza, sem alterações de condições, a hipótese mais comum é que cada observação, $a_i$, é dada pela expressão

$$
a_i = a+\epsilon_i
$$

em que $a$ é o valor real da grandeza (invariável de observação para observação) e $\epsilon_i$ é um **erro** de valor  desconhecido, mas que varia de maneira aleatória entre duas observações. Sobre este erro fazemos a hipótese que tem média nula para muitas observações, por cancelamento entre valores positivos e negativos. Assim a melhor estimativa para o valor real é obtido tomando a média das $N$ observações

$$
 \overline{a}\equiv\frac{a_1+a_2+\dots+a_N}{N} =\frac{1}{N}\sum_{i=1}^N a_i =a + \frac{1}{N}\sum_{i=1}^N \epsilon _i\approx a
$$

In [None]:
componente=3
gmedia=np.sum(dados1[:,componente])/len(dados1[:,componente])
print(r'$a_z$ = %7.5f m s^(-2)' %  gmedia)                 #imprimir na forma de float, 6 espaços e 4 casas decimais
 

In [None]:
componente=3
gmedia=np.average(dados1[:,componente])    #maneira mais expedita de calcular a média
print('%6.4f m s^(-2)' %  gmedia)
 

A média não nos dá toda a informação. Imaginemos que em vez de 50 segundos, tinhamos recolhido dados apenas durante 1 segundo. A média seria a mesma? quanto poderia variar?
 
Para responder a esta pergunta temos de medir a variação dos valores relativamente à média. A medida mais comum é a da _variância_, a média dos quadrados das variações em relação à média.

$$
 \Delta a^2 =\frac{1}{N}\sum_{i=1}^N (a_i-\overline{a})^2
$$
Imagina que fazes mais uma medida de aceleração. Quanto podemos esperar que se desvie da média? A _incerteza_ em **um**  valor de $a$ é estimada pelo _desvio quadrático médio_. 

$$
           \Delta a \equiv \sqrt{\Delta a^2}=\sqrt{\frac{1}{N}\sum_{i=1}^N (a_i-\overline{a})^2}
$$           
           


<div class="alert alert-block alert-info">
<b>Pergunta:</b> Porque quadramos os desvios? Não podíamos simplesmente calcular a médias dos desvios?
</div>

In [None]:
componente=3
gmedia, var =np.average(dados1[:,componente]),np.var(dados1[:,componente]) # exemplo de unpacking
print('media=%6.4f m s^(-2); var =%6.4f' %  (gmedia, var))
std=np.sqrt(var)
print( 'std=%6.4f' % std) 

In [None]:
linha1=gmedia+2*std*np.ones(len(dados1[:,0]),float)
linha2=gmedia-2*std*np.ones(len(dados1[:,0]),float)
plt.plot(dados1[:,0],dados1[:,3],'go', dados1[:,0],linha1 , 'r--', dados1[:,0], linha2,'r--', linewidth=2,ms=2)
plt.title(r'$a_z$',fontsize=14)
plt.xlabel("time / s ")
plt.xlim(1,3)                                 # 2 s de dados
plt.grid(True)

Do gráfico anterior fica claro que a maioria das observações está entre $\overline{a}-\sigma$ e $\overline{a}+\sigma$. $\sigma=\Delta a$ é uma designação comum para o desvio quadrático médio. Mas que fração fica de fora deste intervalo? Poderemos contar? Sim,  com um pouco de programação em _Python_.

In [None]:
range(len(dados1))

In [None]:
count=0
for i in range(len(dados1)):
    if dados1[i,3]>gmedia+std:
        count +=1                 # forma abreviada de count=count+1
    elif  dados1[i,3]<gmedia-std:
        count +=1
print(count/len(dados1))
        

Vemos que cerca de 1/3 (0.333) dos valores estão fora do intervalo de um desvio quadrático médio à volta do valor médio. 

<div class="alert alert-block alert-warning">
    <b>Exercício 1</b>
    <p> Estuda o código da célula acima. Tenta modificá-lo para saber a fração de valores que se afastam da média mais do que $2\sigma$</p>   
</div>

In [None]:
# faz aqui o teu exercício


Uma informação ainda mais completa pode ser obtida estudando a maneira como se distribuem os valores das medidas. Por outras palavras, qual é a fração de valores de aceleração que cai num intervalo arbitrário $[y_i,y_{i+1}]$? Felizmente, no `pyplot`  temos uma função que faz essa conta por nós: a função `hist` (de histograma).  Tem como primeiro argumento a lista de valores de aceleração e como segundo o número de intervalos _bins_ em que queremos dividir a gama de variação dos valores de aceleração. Devolve:
 - as contagens de valores em cada _bin_ (primeiro valor)
 - os limites inferiores de cada bin ((segundo valor)
 - um gráfico (histograma) em que o eixo de abcissas são os pontos médios de cada intervalo onde se centra uma coluna de altura proporcional à fração de valores nesse intervalo. 

In [None]:
# opção density=True devolve colunas com área proporcional à fração de valores nesse intervalo.
hheights,bins,patches =plt.hist(dados1[:,3], bins=15, rwidth=.90, density=True)
plt.grid(True)

In [None]:
hheights

In [None]:
bins

Não deve ser a primeira vez que vês esta forma de sino do histograma. Esta distribuição de valores em torno da média é tão comum, que se chama distribuição **normal**. A altura de cada coluna, quando o número de medições se torna muito grande (tende para infinito), tende para um limite dado por uma expressão matemática conhecida, a função gaussiana.  A forma exata não nos interessa de momento, mas é importante notar que fica totalmente determinada pela média e pelo desvio quadrático médio. É existência deste limite que nos permite dizer que o número esperado de medições no intervalor de 1 $\sigma$ da média é cerca de 2/3 (mais exatamente 68.3%) e de $2\sigma$   cerca de 95%.  

In [None]:
mynorm= st.norm(loc=gmedia,scale=std)
val,bins,fig= plt.hist(dados1[:,3], bins=15, rwidth=.9,label='histograma', density=True)
x=  (bins[1:]+bins[:-1])/2.                                 # pontos médios de cada intervalo
distvals = mynorm.pdf(x)                                    # valores da dist normal 
plt.plot(x,distvals,'r-o',  linewidth=1, label='normal pdf')
plt.legend()

<div class="alert alert-block alert-warning">
    <b>Parte 2 </b>. Repete a análise aqui feita, agora para os dados que obtiveste. 
    Copia as células de que precisares e modifica-as adequadamente. Apura a valor médio e desvio quadrático médio dos teus dados.
    <p>

In [None]:
# faz aqui o teu exercício


### Incerteza na média
Para terminar, falta referir uma conceito muito importante. Acima vimos que o desvio quadrático médio quantifica a _incerteza_ no valor de **uma** só  medida. Mas  quando temos várias medidas podemos fazer a média e tomá-la como a nossa melhor aproximação o valor real da grandeza. A questão é saber qual é a _incerteza da média_? A pergunta faz sentido; se tomarmos as primeiras 10 medidas e comparar-mos com as 10 seguintes, não obtemos o mesmo valor.

In [None]:
componente=3
gmedia1 =np.average(dados1[:10,componente])
gmedia2 =np.average(dados1[10:20,componente])
gmedia1,gmedia2

Para erros com uma distribuição normal a resposta à pergunta é simples; a incerteza  (desvio quadrático médio) da **média** $\overline{a}$ de $N$ medidas é a incerteza (desvio quadrático médio) da grandeza $a$, _dividido por raiz quadrada_ de $N$, $\sqrt{N}$

$$
\Delta \overline{a} = \frac{\sigma}{\sqrt{N}}
$$
Como temos quase 10000 medições de aceleração, podemos fazer médias de grupos de 100 e comparar a variação das médias com a variação de cada medição individual. O gráfico seguinte mostra 90 médias de $N=100$ medições , e representa-as entre linhas correspondentes a $\pm \sigma$ (azul) e $\pm \sigma/\sqrt{100}=\pm \sigma/10$ (vermelho). 

**Nota Importante**
 - o desvio padrão de uma amostra dá uma indicação de quanto **uma** medição se pode desviar da média.
 - O desvio padrão da **média** (de $N$ medições) dá uma indicaçãode quanto a **média** pode variar se fizermos outras $N$ medições independentes. 

In [None]:
fig,axes=plt.subplots(figsize=(6,4))
medias=np.zeros(90,float)
line1=np.ones(90,float)*(gmedia+std)
line2=np.ones(90,float)*(gmedia-std)
line3=np.ones(90,float)*(gmedia+std/10)
line4=np.ones(90,float)*(gmedia-std/10)
for k in range(90):
    medias[k]=np.average(dados1[k*100:(k+1)*100,3])
# gráficos
axes.plot(medias, 'gs',ms=3,label='médias')
axes.plot(line1,'b--',label=r'$\pm \sigma$')
axes.plot(line2,'b--')
axes.plot(line3,'r--',label=r'$\pm \sigma/10$')
axes.plot(line4,'r--')
plt.legend()
plt.grid(True)
plt.title(r'$\overline{a_z}$');


Estas considerações explicam a maneira como é indicado o resultado de um conjunto de medições, com tratamento estatístico dos erros: indicamos como valor da observável a média das medições,  e como incerteza o desvio quadrático  médio _das médias_; neste caso $\sigma=0.042$ e $\sigma_{media}=\sigma/\sqrt{10^4}=4.2\times 10^{-4}$.

$$
a_z = 9.9069 \pm 0.0004\  {m}\  s^{-2}
$$

__Nota 1__: Organizações internacionais que mantêm os padrões de medida recomendam o uso de 2 vezes o desvio padrão na expressão da incerteza;

__Nota 2__: na expressão do cálculo da variância, encontrarás em muitas publicações a expressão 

$$
 \Delta a^2 =\frac{1}{N-1}\sum_{i=1}^N (a_i-\overline{a})^2
$$
com um denominador $N-1$ em vez de $N$. A diferença tem a ver com a variância da _amostra_ (com $1/N$) e a melhor estimativa da variância da _população_ (um conjunto virtualmente ilimitado de medições) com $1/(N-1)$. Neste momento isso não precisa de nos preocupar. 

## Experiência 2: Telemóvel na mão

<div class="alert alert-block alert-warning">
    <b>Parte 3 </b>. Repete a  experiência, agora com o telemóvel pousado na mão. Tenta manter o telemóvel parado na horizontal. Determina a média e a variância da aceleração segundo <i>z</i>. 
 <p> Interpreta os resultados; analisa também as acelerações nas outras direções para ver se foste bem sucedido em manter o telemóvel horizontal </p>

In [None]:
# faz aqui o teu exercício


### Experiência 3: Telemóvel inclinado

<div class="alert alert-block alert-warning">
    <b>Parte 4 </b>. Pousa o telemóvel numa superfície inclinada. Usa o sensor de aceleração para determinar o ângulo do eixo <i>z</i> do telemóvel com a vertical.  
</div>

In [None]:
# faz aqui o teu exercício


# Referências
 1.  Martín Monteiro, Cecila Stari, Cecila Cabeza, and Arturo C. Martí. _Using mobile-
device sensors to teach students error analysis._ American Journal of Physics,
89(5):477481, May 2021.<a id='ref1'></a>
 2. Martín Monteiro and Arturo C. Martí. Resource Letter MDS-1: _Mobile devices
and sensors for physics teaching._ American Journal of Physics, 90(5):328343, May
2022.<a id='ref2'></a>