bc0406 Teorema Central do Limite e aplicações

— Teorema Central do Limite —

Consideremos uma sequência {X_1,X_2,\dots} de variáveis aleatórias independentes com a mesma distribuição, de esperança {\mu} finita e variância {\sigma^2 >0} finita.

A soma das {n} primeiras v.a.’s

\displaystyle  S_n \stackrel{\text{\tiny def}}{=} X_1+\cdots+X_n

tem esperança {\mathop{\mathbb E}(S_n)=n\mu} e variância {\mathrm{Var}(S_n)=n\sigma^2} e a média

\displaystyle  M_n \stackrel{\text{\tiny def}}{=} \frac{X_1+\cdots+X_n}n

tem esperança {\mathop{\mathbb E}(M_n)=\mu} e variância {\mathrm{Var}(M_n) = \sigma^2/n}.

O Teorema Central do Limite diz que, para {n} grande a v.a. padronizada de {S_n} e {M_n}

\displaystyle  Z_n \stackrel{\text{\tiny def}}{=} \frac{S_n-n\mu}{\sigma\sqrt n} =\frac{M_n - \mu}{\sigma/\sqrt n} \ \ \ \ \ (53)

têm distribuição aproximadamente {\mathcal{N}(0;1)}.

Exemplo 102 Lâmpadas produzidas numa fábrica têm vida útil em horas regida pela distribuição normal {\mathcal{N}(800;40^2)}. Uma seleção aleatória simples de tamanho 16 tem vida útil média {M_{16}} com distribuição aproximada {\mathcal{N}(800;40^2/16)}. A probabilidade da vida útil média ser menor que 775 horas é aproximadamente

\displaystyle  \mathop{\mathbb P}(M_{16} < 775 ) = \mathop{\mathbb P}\left( \frac{M_{16}- 800}{40/4} < \frac{775-800}{40/4} \right) = \mathop{\mathbb P}( Z_{16} < -2,5) \approx 0,0062

pois \mathop{\mathbb P}( Z < -2,5) = 0,0062 para a normal padão Z .

Exemplo 103 As chamadas telefônicas numa empresa têm duração em minutos que segue a distribuição exponencial com parâmetro 1/3, cuja média é 3 e a variância é 9. Numa amostra aleatória com 50 chamadas a probabilidade da média amostral não ultrapassar {4\,\mathrm{min}} é

\displaystyle  \mathop{\mathbb P} (M_{50} \leq 4 ) = \mathop{\mathbb P}(Z_{50} \leq 2,36 ) \approx 0,991.

Quando {X} e uma sequência {x_n}, {n\geq 1} são variáveis aleatórias de um mesmo modelo probabilístico, dizemos que {X_n} converge para {X} em distribuição, denotado por

\displaystyle  X_n\xrightarrow[n\rightarrow\infty]{\mathcal{D}}X

se

\displaystyle  \lim_{n\rightarrow\infty} \mathop{\mathbb P}(X_n \leq x)= \mathop{\mathbb P}(X \leq x)

de modo que podemos usar {X} como modelo probabilístico aproximado para {X_n} e quanto maior {n} melhor é a aproximação.

Formalmente, o teorema central do limite é enunciado como

Teorema 32 (Teorema Central do Limite (TCL)) Sejam {X_1,X_2,\dots,X_n} variáveis aleatórias independentes com a mesma distribuição, de esperança {\mu} e variância {\sigma^2>0} finitas. Então

\displaystyle  Z_n \xrightarrow[n\rightarrow\infty]{\mathcal{D}} Z \ \ \ \ \ (54)

para {Z\sim \mathcal{N}(0;1)}.

Por exemplo, se uma moeda equilibrada é lançada {n} vezes e {S_n} é a quantidade de caras. Para {n=100} temos {\mathop{\mathbb E}(S_{100})=50} e {\mathrm{Var}(S_{100})=25}. A probabilidade de termos mais que {55} caras é, aproximadamente,

\displaystyle  \mathop{\mathbb P}(S_{100}>55) = \mathop{\mathbb P} \left( \frac{S_{100}-50}5 > \frac{55-50}5 \right) = \mathop{\mathbb P}(Z_{100} > 1) \approx \mathop{\mathbb P}(Z > 1) = 0{,}16.

Agora, para {n=400}, qual a probabilidade com que {S_{400} > 220} (note-se que {220/400 = 55/10})?

\displaystyle  \mathop{\mathbb P}(S_{400}>220) = \mathop{\mathbb P} \left( \frac{S_{400}-200}{10} > \frac{220-200}{10} \right)=\mathop{\mathbb P}(Z_{400} > 2) \approx \mathop{\mathbb P}(Z > 2) = 0{,}025.

Com que probabilidade {40 \leq S_{100}\leq 60}?

\displaystyle  \mathop{\mathbb P}(40 \leq S_{100}\leq 60) = \mathop{\mathbb P} \left( \frac{40-50} 5 \leq \frac{S_{100}-50}5 \leq \frac{60-50}5 \right) = \mathop{\mathbb P}( -2 \leq Z_{100} \leq 2) \approx \mathop{\mathbb P}( -2 \leq Z \leq 2) = 0{,}954.

— Aproximação para a Binomial —

No caso que {X_1,\dots,X_n} são v.a. independentes com distribuição {\mathrm{Bernoulli}(p)} temos {S_n = X_1+\cdots+X_n \sim \mathrm{Binomial}(n,p)}. Pondo {q=1-p} e {Z_n=(M_n-\mu)/(\sigma/\sqrt{n})} o teorema central do limite nos dá

\displaystyle   \mathop{\mathbb P}(k\leq S_n \leq l) \approx \mathop{\mathbb P} \left( \frac{k-np}{\sqrt{n pq}} \leq Z\leq \frac{l-np}{\sqrt{n pq}}\right) \ \ \ \ \ (55)

Por exemplo, se {X\sim \mathrm{Binomial}(225;0,2)} então pela aproximação dada em (55)

\displaystyle  \mathop{\mathbb P}(39\leq X\leq 48) \approx \mathop{\mathbb P} \left( -1 \leq Z\leq 0{,}5 \right) = 0{,}5328072  \ \ \ \ \ (56)

ainda, o valor exato é

\displaystyle  \mathop{\mathbb P}(39\leq X\leq 48) =\sum_{j=39}^{48} \binom{225}j(0,2)^j(0,8)^{225-j} = 0{,}5852713.

Entretanto {0{,}0417 = \mathop{\mathbb P}(X=39) \approx \mathop{\mathbb P}(-1\leq Z \leq -1) = 0} e aproximação seria melhor se fizéssemos

\displaystyle  \mathop{\mathbb P}(X=39) = \mathop{\mathbb P}(38,5 \leq X \leq 39,5) \approx \mathop{\mathbb P} \left( -1,083 \leq Z\leq -0,916 \right) = 0,0403

que chamamos de correção de continuidade, o que melhora a aproximação

{\displaystyle \mathop{\mathbb P}(k\leq X\leq l) = \mathop{\mathbb P}\left(k-\frac 12\leq X\leq l+\frac 12\right) \approx \mathop{\mathbb P} \left( \frac{k-\frac 12-np}{\sqrt{n p(1-p)}} \leq Z\leq \frac{l+\frac 12-np}{\sqrt{n p(1-p)}}\right) }

agora, com a mesma técnica temos uma aproximação melhor que (56)

\displaystyle  \mathop{\mathbb P}(39\leq X\leq 48) \approx \mathop{\mathbb P} \left( -1,083 \leq Z \leq 0,583 \right) = 0,5806491.

normalXbin

Exemplo 104 Um teste tem 200 perguntas com 4 alternativas cada, das quais apenas uma é correta. Qual a probabilidade aproximada que o estudante acerte por chute entre 25 e 30 questões para 80 das 200 questões.

Seja {X\sim\mathrm{Binomial}(80,1/4)} o número de respostas certas. Usando a correção por continuidade

\displaystyle  \mathop{\mathbb P}(25\leq X\leq 30) \approx \mathop{\mathbb P} (1,16\leq Z\leq 2,71) = 0,1196602.

(o valor correto é 0,1192705)

 Aproximacao de P(X<x) da Normal para Binomial(n,p)=( 20 , 0.5 ) 

    Bin(x,n,p)   Aprox.      Erro       c/ correcao  Erro        Razao erros
0   0.00000095   0.00000387 -0.00000292  0.00001076 -0.00000981  3.35976699 
1   0.00002003   0.00002850 -0.00000847  0.00007196 -0.00005194  6.13204207 
2   0.00020123   0.00017331  0.00002792  0.00039812 -0.00019689 -7.05303706 
3   0.00128841   0.00087256  0.00041585  0.00182522 -0.00053680 -1.29084332 
4   0.00590897   0.00364518  0.00226379  0.00695315 -0.00104418 -0.46125469 
5   0.02069473   0.01267366  0.00802107  0.02208567 -0.00139094 -0.17341068 
6   0.05765915   0.03681914  0.02084001  0.05876243 -0.00110328 -0.05294070 
7   0.13158798   0.08985625  0.04173173  0.13177624 -0.00018826 -0.00451111 
8   0.25172234   0.18554668  0.06617565  0.25116748  0.00055486  0.00838463 
9   0.41190147   0.32736042  0.08454105  0.41153164  0.00036984  0.00437465 
10  0.58809853   0.50000000  0.08809853  0.58846836 -0.00036984 -0.00419799 
11  0.74827766   0.67263958  0.07563809  0.74883252 -0.00055486 -0.00733570 
12  0.86841202   0.81445332  0.05395870  0.86822376  0.00018826  0.00348890 
13  0.94234085   0.91014375  0.03219710  0.94123757  0.00110328  0.03426659 
14  0.97930527   0.96318086  0.01612440  0.97791433  0.00139094  0.08626303 
15  0.99409103   0.98732634  0.00676469  0.99304685  0.00104418  0.15435768 
16  0.99871159   0.99635482  0.00235677  0.99817478  0.00053680  0.22777120 
17  0.99979877   0.99912744  0.00067133  0.99960188  0.00019689  0.29328140 
18  0.99997997   0.99982669  0.00015328  0.99992804  0.00005194  0.33883687 
19  0.99999905   0.99997150  0.00002754  0.99998924  0.00000981  0.35599322 
20  1.00000000   0.99999613  0.00000387  0.99999867  0.00000133  0.34301686

— Intervalo de confiança —

Vamos usar o TCL para resolver o seguinte problema. Queremos estimar a média {\mu} de alguma característica de uma população pela média {M_n} de uma amostra aleatória de {n} indivíduos da população com erro controlado: Dados {\epsilon >0} (a margem de erro) e {\gamma \in (0,1)} (o grau de confiança), para uma amostra aleatória simples {X_1,\dots,X_n} queremos uma estimativa intervalar {(M_n -\varepsilon\,,\,M_n+\varepsilon)} para a média {\mu} da população com grau de confiança {\gamma}, isto é,

\displaystyle   \mathop{\mathbb P}\left( \mu \in (M_n -\varepsilon\,,\,M_n+\varepsilon)\right) \geq \gamma \ \ \ \ \ (57)

que ser interpretado assim: num número grande de amostras do mesmo tamanho, se obtivermos um intervalo com grau de confiança, por exemplo 0,95, para cada uma delas, então 95% desses intervalos contém o parâmetro {\mu}.

Um intervalo de confiança de 95% não significa que, para um dado intervalo calculado a partir de dados da realização de uma amostra, há uma probabilidade de 95% do parâmetro da população se encontrar dentro do intervalo, uma vez que um experimento é realizado e é determinado um intervalo, esse intervalo inclui ou não o valor do parâmetro, não é mais uma questão de probabilidade. A probabilidade de 95% refere-se a fiabilidade do método de estimativa, não para um intervalo calculado específico.

ci
100 intervalos determinados de acordo com uma maostra de váriavel {\mathrm{Bernoulli}(0{,}15)} de tamanho {n=1047}, para cada amostra foi computado um intervalo de confiança de grau {0{,}95}. Em vermelho estão os intervalos que mão contêm a média amostral {0{,}15}.

Por exemplo, numa eleição com dois candidatos, {D} e {A}, seja {p} a fração (desconhecida) da população que vota no candidato {D}. Para simplificar, assumimos que só há 2 respostas possíveis e um voto em {D} é ensaio de Bernoulli com parâmetro {p} (a proporção desconhecida). São realizadas {n} entrevistas: a resposta de cada entrevistado pode ser modelada por {V_i \sim \mathrm{Bernoulli}(p)}, a v.a. indicadora do {i}-ésimo voto ser para {D}, para {1\leq i \leq n}. Temos então

1. a v.a. { S_n = V_1 +\cdots+V_n} é o número de votos em D,
{S_n  \sim \mathrm{Binomial}(n,p)}, portanto, tem esperança {np} e variança {np(1-p)};

2. a v.a. { \hat p = M_n = \frac{S_n}{n}} é a proporção da amostra de votos em D, de esperança {p} e variância {p(1-p)/n};

3. p é a proporção (desconhecida) da população de votos em D, a qual queremos estimar.

Exemplo 105 Para uma aproximação grosseira, usamos que {\hat p \approx \mathcal{N}\left(p;\frac{\sigma^2}{n}\right)}, que {\sigma^2 = p(1-p) \leq 1/4} e que uma variável aleatória normalmente distribuída tem probabilidade {0{,}95} de estar entre 2 desvios padrão da esperança, portanto

\displaystyle \mathop{\mathbb P} \left( p - 2\frac{\sigma}{\sqrt{n}} \leq \hat p \leq p + 2\frac{\sigma}{\sqrt{n}} \right) \geq \mathop{\mathbb P} \left( p - \frac{1}{\sqrt{n}} \leq \hat p \leq p + \frac{1}{\sqrt{n}} \right) \approx 0{,}95

de modo que

  • para uma estimativa com margem de erro de 4 pontos percentuais com 95% de grau de confiança temos {1/\sqrt{n} =0{,}04}, logo {n=625};
  • para uma estimativa com margem de erro de 3 pontos percentuais com 95% de grau de confiança temos {1/\sqrt{n} =0{,}03} logo {n=1112}.

Para determinar {n} para uma estimativa com erro de 3 pontos percentuais com 99% de certeza. Nesse caso, precisamos de 3 desvios padrão, i.e.,

\displaystyle  \mathop{\mathbb P} \left( p - 3\frac \sigma{\sqrt{n}} \leq \hat p \leq p + 3\frac \sigma{\sqrt{n}} \right)\geq \mathop{\mathbb P} \left( p - \frac{1{,}5}{\sqrt{n}} \leq \hat p \leq p + \frac{1{,}5}{\sqrt{n}} \right) \approx 0{,}99

portanto, temos {1{,}5/\sqrt{n} =0{,}03} logo {n=1667}.

Vejamos agora como determinar n mais precisamente. Sejam {\varepsilon} o erro tolerado e { \gamma} o grau de confiança

\displaystyle  \begin{array}{rcl}  \mathop{\mathbb P} ( -\varepsilon \leq \hat p - p \leq \varepsilon ) &=& \mathop{\mathbb P} \left( \frac{-\varepsilon}{\sqrt{p(1-p)/n}} \leq \frac{\hat p - p}{\sqrt{p(1-p)/n}} \leq \frac{\varepsilon}{\sqrt{p(1-p)/n}} \right) \end{array}

usando o Teorema Central do Limite para aproximar a distribuição da v.a. {\frac{\hat p - p}{\sqrt{p(1-p)/n}}} temos

\displaystyle  \begin{array}{rcl}    \mathop{\mathbb P} \left( \frac{-\varepsilon}{\sqrt{p(1-p)/n}} \leq \frac{\hat p - p}{\sqrt{p(1-p)/n}} \leq \frac{\varepsilon}{\sqrt{p(1-p)/n}} \right) &\approx& \mathop{\mathbb P} \left( \frac{-\varepsilon}{\sqrt{p(1-p)/n}} \leq Z \leq \frac{\varepsilon}{\sqrt{p(1-p)/n}} \right) \\ &=& \mathop{\mathbb P} \left( \frac{-\varepsilon\sqrt{n}}{\sqrt{p(1-p)}} \leq Z \leq \frac{\varepsilon\sqrt{n}}{\sqrt{p(1-p)}} \right) \\ &=& 2 \mathop{\mathbb P} \left( Z \leq \frac{\varepsilon\sqrt{n}}{\sqrt{p(1-p)}} \right) - 1 \end{array}

Queremos {z_\gamma} (da tabela da normal padrão) tal que {2 \mathop{\mathbb P} \left( Z \leq z_\gamma \right) - 1 = \gamma}. Por exemplo, para {\gamma =0{,}95}, de { \mathop{\mathbb P} \left( Z \leq z_\gamma \right) = {1+\gamma}/2 =\frac{1{,}95}2} tiramos {z_\gamma = 1{,}96}.

Descoberto tal {z_\gamma} precisamos escolher {n} de modo que

\displaystyle  \frac{\varepsilon\sqrt{n}}{\sqrt{p(1-p)}} = z_\gamma

e se usarmos a estimativa mais conservadora (nos dará um intervalo maior) {p(1-p) \leq 1/4}

\displaystyle  \frac{\varepsilon\sqrt{n}}{\sqrt{1/4}} \leq \frac{\varepsilon\sqrt{n}}{\sqrt{p(1-p)}}

portanto é suficente termos {n} tal que

\displaystyle  \frac{\varepsilon\sqrt{n}}{\sqrt 1/4} = z_\gamma

ou seja

\displaystyle  n = \frac {z_\gamma^2}{4\varepsilon^2}.

Exemplo 106 Para {\varepsilon = 0,04} e {\gamma =0,95}

\displaystyle  n= \frac{1,96^2}{4\cdot {0,04}^2} = 600,25

Para uma estimativa com erro de 3 pontos percentuais e 95% de grau de confiança

\displaystyle  n = \frac{1,96^2}{4\cdot {0,03}^2} = 1068.

Analogamente, {n} para uma estimativa com erro de 3 pontos percentuais com 99% de grau de confiança então {z_{0,99} = 2,57} e

\displaystyle  n = \frac{2,57^2}{4\cdot {0,03}^2} = 1835.

Informações obtidas no sítio do IBOPE referentes ao 1º turno das eleições municipais de 2008 exibem a seguinte quantidade de entrevistados de acordo como o erro e o grau de confiança:

tabela

Observacao 9 O valor de {n} não depende do tamanho da população.

No exemplo acima provamos que se n é suficientemente grande então

\displaystyle  \mathop{\mathbb P}\left( \hat p -0{,}04 \leq p \leq \hat p + 0{,}04\right) = 0,95

e dizemos que { [\hat p - \varepsilon  \, ,\, \hat p + \varepsilon ]} é um intervalo de confiança para {p} com grau de confiança 95% e margem de erro \varepsilon. Notemos que {p} é um valor médio desconhecido e {\hat p} é uma variável aleatória, portanto o intervalo é aleatório.

— Tamanho da amostra —

O tamanho {n} para uma amostra aleatória {X_1,\dots,X_n} de variáveis aleatórias independentes, com esperança \mu e variância \sigma^2 satisfazer (57) pode ser determinada como no caso binomial explicado acima, usano o TCL,

\displaystyle  \begin{array}{rcl}  \gamma &=& \mathop{\mathbb P}(M_n -\varepsilon \leq \mu \leq M_n + \varepsilon )\\ &=& \mathop{\mathbb P}\left( - \frac{\varepsilon}{\sigma/\sqrt{n}} \leq \frac{M_n -\mu}{\sigma/\sqrt{n}} \leq \frac{\varepsilon}{\sigma/\sqrt{n}}\right)\\ &\approx& \mathop{\mathbb P}\left( - \frac{\varepsilon}{\sigma/\sqrt{n}} \leq Z_n \leq \frac{\varepsilon}{\sigma/\sqrt{n}}\right)\\ &=& \mathop{\mathbb P}\left( - \frac{\varepsilon\sqrt{n}}{\sigma^2}\sigma \leq Z_n \leq \frac{\varepsilon\sqrt{n}}{\sigma^2}\sigma\right))\\ &=& 2\mathop{\mathbb P}\left( Z_n \leq \frac{\varepsilon\sqrt{n}}{\sigma^2}\sigma\right)-1 \end{array}

Tomemos o valor {z_\gamma} tal que

\displaystyle  \mathop{\mathbb P}( Z\leq z_\gamma) = \frac {1+\gamma}2

e de {\epsilon\sqrt n/\sigma = z_\gamma} deduzimos

\displaystyle  n = \left( \frac {z_\gamma\sigma}{\varepsilon} \right)^2 \ \ \ \ \ (58)

e a estimativa intervalar para {\mu} com grau de confiança {\gamma} e margem de erro \varepsilon é

\displaystyle \mathrm{IC}(\mu;\epsilon,\gamma) \stackrel{\text{\tiny def}}{=} \big[ M_n - \varepsilon \,,\, M_n + \varepsilon \big]

Exemplo 107 A renda per-capita domiciliar numa certa região tem desvio padrão 250 reais e média desconhecida. Se desejamos estimar a renda média da população com erro {50} reais e confiabilidade {\gamma =0,95} quantos domicílios deveremos consultar? Já sabemos que {z_\gamma=1,96}, então

\displaystyle n= \left( \frac{z_\gamma}{\epsilon} \right)^2 \sigma^2 = \left( \frac{1,96}{50} \right)^2 250^2 = 96,04.

No caso em que o tamanho da amostra é fixo (e grande para a aproximação do TCL ser boa) a margem de erro também é fixa, a saber $latex{z_\gamma\frac{\sigma}{\sqrt{n}}}$, e a estimativa é dada por:

\displaystyle \mathrm{IC}(\mu,\gamma) \stackrel{\text{\tiny def}}{=}  \left[M_n - z_\gamma\frac{\sigma}{\sqrt{n}}\,,\, M_n + z_\gamma\frac{\sigma }{\sqrt{n}}\right]

Exemplo 108 Um provedor de internet monitora o a duração da conexão dos clientes a fim de dimensionar os seus servidores. A média e a distribuição desse tempo são desconhecidos mas o desvio padrão é {\sqrt{50}} minutos. Numa amostra de 500 conexões o valor médio foi 25 minutos; o que podemos disser a respeito da média com grau de confiança {92\%}? Como o tamanho da amostra é razoavelmente grande, podemos usar o TCL e aproximar a distribuição por uma normal. Um intervalo de confiança para o tempo de conexão é

\displaystyle  \left[M -z_\gamma \frac{\sigma}{\sqrt n}, M +z_\gamma \frac{\sigma}{\sqrt n}\right] = [24.45,25.55].

Em virtude do uso do TCL, o intervalo acima é com grau de confiança aproximadamente {0,92}.

Na prática não conhecemos {\sigma^2} e devemos substituí-lo por uma estimativa amostral, que pode ser

\displaystyle  S^2 = \frac 1{n-1}\sum (x_i - M_n)^2

Exemplo 109 O tempo de reação de um remédio pode ser considerado como tendo distribuição normal. Num teste, 20 pacientes foram sorteados e os tempo anotados:

{2,9} {3,4} {3,5} {4,1} {4,6} {4,7} {4,5} {3,8} {5,3} {4,9}
{4,8} {5,7} {5,8} {5,0} {3,4} {5,9} {6,3} {4,6} {5,5} {6,2}

então, a variância amostral é {S^2 = 0,992079} e o intervalo a 95% é

\displaystyle \left[M -z_{0,95}\sqrt{\frac{S^2}n}, M +z_{0,95}\sqrt{\frac{S^2}n}\right]=[4{,}278843\,,\,5{,}211157].

— Aproximação de Stirling —

Seja {S_n= X_1+\cdots+X_n} com {X_i\sim \mathrm{Poisson}(1)} v.a.’s independentes. Então

\displaystyle  \mathop{\mathbb P} \left( n-1 < S_n \leq n \right) = \mathop{\mathbb P} \left( \frac{-1}{\sqrt n} < \frac{S_n - n}{\sqrt n} \leq 0 \right) \approx \int_{-1/\sqrt n}^0 \frac 1{\sqrt{2\pi}}\mathrm{e}^{-x^2/2}\;\mathrm{d}x\approx \frac 1{\sqrt{2\pi n}}

portanto

\displaystyle \mathop{\mathbb P}(S_n=n) = \frac{\mathrm{e}^{-n}n^n}{n!} \approx \frac 1{\sqrt{2\pi n}}

donde

\displaystyle n! \approx n^{1/2 +n}\mathrm{e}^{-n}\sqrt{2\pi}.

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s