UNIVERSIDADE FEDERAL DA BAHIA - INSTITUTO DE MATEMÁTICA DEPARTAMENTO DEESTATÍSTICA - MAT021 - ESTATÍSTICA I B Exercícios de Fixação - 1ª Unidade 1.
As fases principais do método estatístico são: i. Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica e definição dos problemas. ii. Amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e planejamento. iii. Definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e interpretação dos dados.
2.
Para cada um dos itens a seguir, indique a população em estudo, a(s) variável(eis) a ser observada(s) e a amostra escolhida. a. Para determinar o rendimento de uma nova variedade de trigo em uma determinada zona rural, foram selecionadas 30 parcelas desta zona e o rendimento em toneladas por hectares foi medido. b. Pretende-se fazer um estudo sobre o número de membros do agregado familiar, numa cidade. Para isso efetuou se um inquérito ao qual responderam 50 famílias. c. Um estudo com 372 estudantes de serviço social com distúrbio de ansiedade foi conduzido para descobrir a relação entre a ingestão de café e esses distúrbios.
3.
Cite pelo menos três vantagens da amostragem.
4.
Identifique o tipo de amostragem utilizada em cada um dos casos seguintes. Justifique sua resposta (em apenas 1 parágrafo), fornecendo as principais características do citado tipo de amostragem. a
a. b. c. d.
e.
5.
Obtém-se uma amostra de um produto extraindo-se em cada lote do produto a 100 unidade da linha de montagem. Geram-se números aleatórios em um computador para selecionar números de série de carros a serem escolhidos para uma revisão. Um shopping center faz um estudo de opinião sobre uma nova opção de lazer para seus clientes entrevistando 50 pessoas que estão circulando no Shopping num determinado dia da semana. Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que tem duas grandes cidades e uma zona rural. Os elementos que compõem a população de interesse são todos os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você sugeriria? Um médico está interessado em obter informação sobre o número médio de vezes em que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se selecionar ao acaso uma amostra de tamanho n = 1.600.
O gerente da Divisão de Atendimento de uma firma de vendas de eletrônicos está interessado em verificar se os consumidores compraram DVD após nos últimos 12omeses satisfeitos com seus estes produtos. Utilizando os certificados de que garantia apresentados a compra, gerenteestavam estava planejando pesquisar consumidores. a. Descreva a população. b. Desenvolva três perguntas categóricas que você acha que seriam apropriadas para esta investigação. c. Desenvolva três perguntas numéricas que você acha que seriam apropriadas para esta investigação.
6.
Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou quantitativa (discreta/contínua). a. Curso a que pertencem os alunos regularmente matriculados na UFBA no último semestre. b. Intenção de voto de um eleitor à presidência da República (possíveis respostas são os nomes dos candidatos, além de “indeciso”). c. Consumo de combustível de diferentes modelos de automóveis em km/litro. d. Número de filhos por família em diferentes países. e. Renda, em reais, dos funcionários de uma empresa. f. Número de disciplinas cursadas por alunos de graduação em Ciências Humanas. g.
Classificação “insuficiente”.da redação dos candidatos de um concurso público em “excelente”, “ótima”, “boa”, “regular” e
Classificação de pisos cerâmicos produzidos como “perfeitos”, “aceitáveis” e “inaceitáveis”. Temperatura medida em graus Celsius. Nível de instrução dos funcionários de uma empresa, medido pelo número de anos completos na escola (excluindo repetências). k. Velocidade de automóveis em uma rodovia federal, declarada “legal” ou “em excesso”. h. i. j.
7.
Renda é uma variável que frequentemente está incluída em pesquisas. Às vezes a pergunta é formulada como: “Qual é a sua renda?”. Em outras pesquisas, é pedido ao entrevistado que “Assinale com um X o intervalo correspondente ao seu nível de renda”,onde são dados vários intervalos para escolher. a. Qual destes dois formatos de respostavocê preferiria utilizar se você estivesse definindo uma pesquisa? Por quê? b. Qual destes dois formatos de resposta iria, provavelmente, trazer a você uma maior quantidade de resposta? Por quê?
8.
Elabore tabelas considerando as informações a seguir: a. Muitos sistemas escolares fornecem o acesso à Internet para seus estudantes hoje em dia. Desde 1996, o acesso à Internet foi facilitado a 21.733 escolas elementares, 7.286 escolas do nível médio e 10.682 escolas de nível superior (Statistical Abstract of United States, 1997). Existe nos Estados Unidos um total de 51.745 escolas elementares, 14.012 escolas do nível médio e 17.229 escolas do nível superior. b. Em determinado curso, o número de alunos matriculados nas 1ª , 2ª e 3ª séries era, respectivamente, 40, 35 e 29 em 1997 e 42, 36 e 32 em 1998. c. Assim sendo, podemos concluir que este banco, em 1995, contou com a colaboração de 345 funcionários, distribuídos pelas nossas 5 agências, a saber: Niterói, 43; Rio de Janeiro, 102; São Paulo, 98; Belo Horizonte, 75; Vitória, 27. Em Niterói, 38 eram do gênero masculino e no Rio de Janeiro, 87. Apenas em Vitória não existiam funcionárias, mas em São Paulo trabalharam 11 delas, enquanto que em Belo Horizonte, apenas 3. d. Segundo o IBGE, a distribuição da população na região Norte do Brasil em 1970 era a seguinte: Rondônia 116.620 habitantes; Acre 218.006 habitantes; Amazonas 960.934 habitantes; Roraima 41.638 habitantes; Pará 2.197.072 habitantes; e Amapá 116.480 habitantes.
No último semestre letivo, a situação dos alunos do curso de Biologia no final do semestre na disciplina de Estatística V foi a seguinte: Dos 88 alunos matriculados, 36 foram aprovados e desses, 34 faziam a disciplina pela primeira vez e os demais eram repetentes. Houve 15 trancamentos, sendo que nenhum aluno repetente trancou a disciplina. Apenas 16 alunos foram reprovados, sendo que destes apenas um era repetente. Porém, 19 alunos iniciantes abandonaram a disciplina enquanto que apenas 2 repetentes seguiram a mesma conduta. Sabendo-se que a fonte destes dados é fictícia, pede-se: a) Faça uma tabela que resuma a situação exposta acima. b) Classifique essa série. c) Faça o esboço de um gráfico adequado para a situação exposta acima. 9.
10.
Calcule a frequência relativa simples (expressa em %) das tabelas a seguir. Classifique também o tipo de série estatística representado em cada tabela.
Tabela 01. MA TRÍCULA S NO ENSINO SUPERIOR SEGUNDO ÁREAS DE ENSINO - BRASIL - 1975 Á REA DE ENSINO MA TRÍCULA S CIÊNCIA S BIOLÓGICA S 32.109 CI ÊN CI AS EX AT AS E T EC NO LÓ GI CA S 65 .9 49 CIÊNCIA S A GRÁ RIA S 2.419 CIÊNCIA S HUMA NA S 148.842 LETRA S 9.883 A RTES 7.464 DUA S OU MA IS Á REA S 16.323 TOTAL 282.989 FONTE: Serviço de Estatística da Educação e da Cultura
11.
Na empresa Mercury Ltda foi observada a distribuição de funcionários do setor de serviços gerais com relação ao salário semanal, conforme mostra a distribuição de frequências: Salário Semanal (em R$) fi 25 |- 30 10 30 |- 35 20 35 |- 40 30 40 |- 45 15 45 |- 50 40 50 |- 55 35 Total 150
Responda: a) Qual o percentual de funcionários que ganham até R$ 40,00, exclusive? b) Qual o percentual de funcionários que ganham entre R$ 30,00 e R$ 45,00, exclusive o segundo valor? c) Qual o percentual de funcionários que ganham mais de R$ 45,00? 12.
Considere a seguinte distribuição de frequência correspondente aos diferentes preços de um determinado produto em vinte lojas pesquisadas. Preços Número de Lojas 50 2 51 5 52 6 53 6 54 Total a. b. c. d.
13.
1 20
Quantas lojas apresentaram o preço de R$ 52,00? Construa uma tabela com as frequências relativas simples e frequências absolutas acumuladas. Quantas lojas apresentaram o preço de até R$ 52,00 (inclusive)? Qual o percentual de lojas com preço maior do que R$ 51,00 e menor do que R$ 54,00?
Quais as semelhanças e diferenças entre os gráficos em coluna e em barras? a. Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos horizontalmente. b. Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos verticalmente. c.
Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e um gráfico de colunas, horizontalmente. d. Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos horizontalmente e um gráfico de colunas, verticalmente. e. Todas as alternativas anteriores são falsas. Em relação a gráficos e medidas descritivas como instrumentos úteis na análise estatística, assinale V(verdadeiro) ou F(falso) nas afirmações abaixo: I. O gráfico de barras representa, por meio de uma série de retângulos, quantidades ou frequências para variáveis qualitativas. II. O gráfico em setores é apropriado quando se quer saber quanto às as categorias da variável representam no todo. III. O histograma pode ser construído utilizando-se, indistintamente, as frequências absolutas ou relativas de intervalos de classe.
14.
IV.
O gráfico de linhas é indicado para representar séries geográficas.
A sequência correta encontrada de cima para baixo é: a. V, V, V, V b. F, F, V, V c. V, V, V, F d. F, V, V, F Os gráficos constituem um recurso bastante utilizado para apresentação dos resultados de uma pesquisa. Considerando o gráfico a seguir, responda as questões: 15.
Salário-base bruto dos soldados e cabos no Brasil (em reais)
a. b. c. d. e.
Classifique o tipo de série estatística. Qual o tipo de gráfico que está sendo apresentado? Que variável(eis) está(ão) sendo investigada(s)? Você tem alguma crítica a fazer em relação à construção deste gráfico? Qual(is)? É possível construir um histograma com esses dados? Por quê?
Com o texto de no máximo 5 linhas, interprete as informações do Gráfico 3 com respeito as informações mais relevantes. 16.
17.
Os quatro programas de televisão de maior audiência nos Estados Unidos foram CSI, ER, Everybody Loves Raymond e Friends (Nielsen Media Research, 11 de janeiro de 2004). Seguem-se os dados que indicam os programas preferidos para uma amostra de 50 telespectadores (ASW, 2009): CSI CSI Friends ER CSI ER CSI Friends Raymond CSI
Responda: a. b. c. d. e. 18.
Friends CSI CSI ER Friends ER Friends Friends Friends ER
CSI Raymond ER Friends CSI ER Friends Raymond ER CSI
CSI ER Friends CSI CSI Friends CSI Friends Friends Friends
CSI ER CSI Raymond Friends Raymond Raymond CSI CSI ER
Estes dados são qualitativos ou quantitativos? Forneça as distribuições de frequência simples absoluta e relativa. Construa um esboço do gráfico em barras e um gráfico em setores para representar estes dados. Com base nestes dados, qual o programa de televisão com a maior audiência? Qual o segundo colocado?
A Recording Industry of America faz um acompanhamento das vendas de gravações musicais levando em consideração o tipo de música, formato e faixa etária. Os dados a seguir apresentam as porcentagens das vendas de música de acordo com o tipo (The New York Times 2002 Almanac) (ASW, 2009). Tipo 1996 1997 1998 1999 2000 Rock 32,6 32,5 25,7 25,2 24,8 Country 12,1 11,2 12,8 10,8 10,7 R&B(Rhythm and Blues) 12,1 11,2 12,8 10,5 9,7 Pop 9,3 9,4 10,0 10,3 11,0 Rap 8,9 10,1 9,7 10,8 12,9 Gospel 4,3 4,5 6,3 5,1 4,8 Clássico 3,4 2,8 3,3 3,5 2,7 Jazz 3,3 2,8 1,9 3,0 2,9 Outros 14,0 15,5 17,5 20,8 20,5 O tipo de música é uma variável qualitativa ou quantitativa? Construa um gráfico das vendas de rock ao longo de cinco anos: use o eixo horizontal para exibir o ano e o eixo vertical para exibir a porcentagem das vendas de gravações musicais. Este gráfico baseia-se em dados de secção transversal ou de série histórica? c. Construa um gráfico de barras do tipo de vendas musicais em 2000. Este gráfico se baseia em dados de secção transversal ou de série histórica? a. b.
Os dados representados a seguir referem-se ao número de livros adquiridos no último ano por uma biblioteca de acordo com as subáreas de conhecimento das ciências exatas. 19.
Ano Física Computação e Tecnologia de Informação Química Engenharias Matemática e Estatística Total Baseando-se em tais dados:
Fonte: FBN/SNBP
Freq. simples absoluta 77 440 59 101 153 830
Freq. Relativa simples (%)
a. Preencha a coluna referente à frequência relativa simples em (%) (usar 1 casa decimal). b. Cite três tipos de representação gráfica que se adequaria aos dados acima? c. É correto afirmar que juntas, as áreas de Física e Química adquiriram mais livros que a área Matemática e Estatística? Justifique sua resposta. 20.
Considere as seguintes distribuições de frequência. A primeira distribuição de frequência fornece uma aproximação da renda bruta ajustada anual dos Estados Unidos (Internal Revenue Service, março de 2003). A segunda distribuição de frequência mostra as notas de exames dos estudantes de um curso de Estatística (ASW, 2009). Renda (US$ Frequência 1.000) (em milhões) 25 0 |– 60 50 25 |– 33 75 50 |– 20 100 75 |– 6 125100 |– 4 150125 |– 2 175150 |– 1 200175 |– 1 Total 127 a. b. c. d.
21.
Notas nos Exames 0| 30 | 40 | 50 | 60 | 70 | 80 | 90 |
30 – 40 – 50 – 60 – 70 – 80 – 90 – 100 – Total
Frequência 2 5 6 13 32 78 43 21 200
Construa um histograma dos dados da renda anual. Existe assimetria na distribuição da renda? Explique. Construa um histograma dos dados de notas dos exames. Que tipo de assimetria ele apresenta? Explique.
A Wageweb realiza pesquisas de dados salariais e apresenta os sumários em seu site. A empresa registrou que os salários anuais dos vice-presidentes de marketing variavam de US$ 85.090 a US$ 190.054 (Wageweb.com, 12 de abril de 2000). Suponha que os dados (em milhares de dólares) a seguir sejam de uma amostra dos salários anuais de 50 vice-presidentes de marketing (ASW, 2009): 145 140 145 173 116 127 155 134 138 114
95 162 127 113 178 143 93 165 160 135
148 118 148 104 123 134 102 123 157 151
112 170 165 141 141 136 154 124 138 138
132 144 138 142 138 137 142 124 131 157
Responda: a. Quais são o menor e o maior salários? b. Use uma amplitude de classe de US$15.000 e elabore uma tabela de frequência para dados agrupados em classe com os salariais anuais. De acordo com a tabela construída, responda os itens a seguir: c. Qual a proporção de salários anuais menores que US$ 150.000? d. Qual a porcentagem de salários anuais iguais ou superiores a US$ 150.000? e. Construa o histograma. Interprete o gráfico. f. Comente a respeito da forma da distribuição.
22.
Uma empresa estudou a ocorrência de acidentes com seus empregados. Para isso, realizou um levantamento abrangendo um período de 36 meses, onde foi observado o número de operários acidentados em cada mês. Os dados correspondentes são: 1 5
2 6
2 6
3 6
3 6
3 6
3 6
4 7
4 7
4 7
4 7
4 7
5 8
5 8
5 8
5 9
5 9
5 10
Responda: a. Construa uma distribuição de frequência para dados agrupados em classes. Use a amplitude do intervalo (h) igual a 2 e o limite inferior da primeira classe igual a 1; b. Represente graficamente a distribuição do item a; c. d.
Em quantos meses houve entrecom três até (inclusive) e cinco (exclusive) acidentes? Qual a porcentagem de meses cinco (exclusive) acidentes ocorridos?
Gabarito da 1ª Lista de Exercícios de MAT021 1.
iii
2.
a. População: uma determinada zona rural com uma nova variedade de trigo; Variável:rendimento em toneladas; Amostra: 30 parcelas da zona; b. População: membros do agregado familiar numa cidade; Variável: nº de membros do agregado familiar; Amostra: 50 famílias; c. População: estudantes de serviço social; Variável: distúrbio de ansiedade; Amostra: 372 estudantes.
3.
Tempo, operacionalidade, economia,...
4.
a.Amostragem sistemática; b. Amostragem aleatória simples; c. Amostragem por conveniência; d.Amostragem estratificada; e. Amostragem sistemática.
5.
a. A população são os consumidores de DVD e a população alvo são esses compradores nos últimos 12 meses; b. Qual o tipo de defeito do seu DVD? Já comprou outro produto na loja? Você está satisfeito com o produto?; c. Quantos clientes compraram DVD em 12 meses? Quantos clientes estão satisfeito com o produto? Quantos clientes pretendem comprar outro produto?
6.
a. Variável qualitativa nominal. As realizações da variável curso são atributos (categorias), e não podem ser ordenadas; b. Variável qualitativa nominal. As realizações da variável preferência declarada são atributos (categorias), e não podem ser ordenadas; c. Variável quantitativa contínua. As realizações da variável consumo em km/l são números, e podem assumir (teoricamente) uma infinidade de valores; d. Variável quantitativa discreta. As realizações da variável número de filhos são números, e podem assumir apenas alguns valores (números inteiros); e. Variável quantitativa contínua; f. Variável quantitativa discreta; g. Variável qualitativa ordinal; h. Variável qualitativa ordinal; i. Variável quantitativa contínua. As realizações da variável temperatura em graus Celsius são números, e podem assumir (teoricamente) uma infinidade de valores; j. Variável quantitativa discreta. As realizações da variável nível de instrução (em número de anos completos) são números, e podem assumir apenas alguns valores (números inteiros); k. Variável qualitativa ordinal. As realizações da variável velocidade (neste caso) são atributos (categorias), e podem ser ordenadas.
7.
a. O 1º formato porque não haveria perda de informação;b. O 2º formato, pois muitos entrevistados não dizem a sua renda, mas informam em que grupo se encaixam;
8. a.
Distribuição do acesso à internet nas escolas por nível de instrução, nos Estados Unidos Nível de instrução Elementar Médio Superior Total
b.
Acesso a internet Sim Não 3.765 47.980 7.286 6.726 10.682 6.547 21.733 61.253
agência Total 51.745 14.012 17.229 82.986
Distribuição do número de alunos, em um Determinado curso, nos anos de 1997 e 1998
Alunos matriculados 1ª série 2ª série 3ª série Total
Ano 1997 40 35 29
1998 42 36 32
104
110
c. Distribuição dos funcionários do banco, em 1995, por sexo e
Total
Sexo Total Masculino Feminino Niterói 38 5 43 Rio de Janeiro 87 15 102 São Paulo 87 11 98 Belo Horizonte 72 3 75 Vitória 27 0 27 Total 311 34 345 d. Distribuição da população da região Norte do Brasil em 1970 Agência
Estados da Região Norte
82 71 61
Pará Amazonas Acre Rondônia
214
Amapá Roraima
Total
Número de habitantes 2.197.072 960.934 218.006 116.620 116.480 41.638
3.650.750
9.
Sem Gabarito
10.
a.11.35%, 23.30%, 0.85%, 52.60%, 3.49%, 2.64% e 5.77%. Série específica; b. 4.97%, 3.14%, 26.95%, 18.64% e 46.31%. Série geográfica; c. 2.45%, 4.44%, 6.34%, 8.48%, 11.25%, 13.18%, 21.20% e 32.67%. Série histórica.
11.
a. 0,4; b. 0,433; c. 0,5.
12.
a. 6; c. 13; d. 85%.
13.
Sem Gabarito
14.
Sem Gabarito
15.
a. série mista; b. Este é um gráfico de barras, com série mista (geográfica e categórica); c. Suas variáveis são: estados, salários e soldado ou cabo; d. O gráfico não tem fonte, o título está incompleto pois não tem o período em que acontece, além de estar confuso devido ao modelo tridimensional; e. Não.
16. Sem Gabarito
17.
a. Dados qualitativos; b. Categorias: CSI, Friends, ER, Raymond. Frequências simples absolutas das respectivas categorias: 18, 15, 11 e 6.Frequências simples relativas das respectivas categorias: 36%, 30%, 22% e 12%; d. O programa com maior audiência é o CSI (36%); e. O
c.
segundo colocado é Friends (30%).
18.
a. qualitativa nominal; b. Gráfico baseia-se em série histórica;
c. Gráfico baseia-se em dados de secção transversal (apenas um ponto do tempo).
19. .: a. Ano Freq. simples absoluta Física 77 Computação e Tecnologia de Informação 440 Química 59 Engenharias 101 Matemática e Estatística 153 Total 830 b. Setor, barra, polígono de frequências,etc...; c. Não.
Freq. Relativa simples (%) 9,28 53,01 7,11 12,17 18,43
20. a. e b. Evidência de assimetria à direita ou positiva;
c. e d. Evidência de assimetria à esquerda ou negativa.
21.
d. 24%
22. a. b. Número de operários acidentados 3 1 |– 3 5 3 |– 9 7 5 |– 13 9 7 |– 8 11 9 |– 3 Total
c. 9; d. 33,33%.
fi
fri (%) 8,33 25,00 36,11 22,22 8,33
36
100,00