PARANÁ
Curitiba-PR
2012
Presidência da República Federativa do Brasil
Ministério da Educação Secretaria de Educação a Distância
2012 © INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA – PARANÁ
– EDUCAÇÃO A DISTÂNCIA
Este Caderno foi elaborado pelo Instituto Federal do Paraná para o Sistema Escola Técnica Aberta do Brasil – e-Tec Brasil.
Prof. Irineu Mario Colombo
Reitor
Prof.ª Cristina Maria Ayroza
Assessora de Ensino, Pesquisa e Extensão – DEPE/EaD
Prof.ª Mara Christina Vilas Boas
Chefe de Gabinete
Prof. Ezequiel Westphal
Pró-Reitoria de Ensino – PROENS
Prof. Gilmar José Ferreira dos Santos
Pró-Reitoria de Administração – PROAD
Prof. Silvestre Labiak
Pró-Reitoria de Extensão, Pesquisa e Inovação
– PROEPI
Neide Alves
Pró-Reitoria de Gestão de Pessoas e Assuntos Estudantis – PROGEPE
Bruno Pereira Faraco
Pró-Reitoria de Planejamento e Desenvolvimento Institucional – PROPLAN
Prof. José Carlos Ciccarino
Diretor Geral do Câmpus EaD
Prof. Ricardo Herrera
Diretor de Planejamento e Administração do Câmpus EaD
Prof.ª Mércia Freire Rocha Cordeiro Machado Diretora de Ensino, Pesquisa e Extensão – DEPE/EaD
Profª Cristina Maria Ayroza
Assessora de Ensino, Pesquisa e Extensão – DEPE/EaD
Prof.ª Márcia Denise Gomes Machado Carlini Coordenadora de Ensino Médio e Técnico do Câmpus EaD
Prof. Roberto José Medeiros Junior
Coordenador do Curso
Prof.ª Ediane Santos Silva
Vice-coordenadora do Curso
Adriana Valore de Sousa Bello Cassiano Luiz Gonzaga da Silva Jéssica Brisola Stori
Denise Glovaski Souto
Assistência Pedagógica
Prof.ª Ester dos Santos Oliveira Prof.ª Sheila Cristina Mocellin Idamara Lobo Dias
Prof.ª Maria Angela Motta
Revisão Editorial
Eduardo Artigas Antoniacomi Flávia Terezinha Vianna da Silva Diagramação
e-Tec/MEC
Projeto Gráfico
|
Catalogação na fonte pela Biblioteca do Instituto Federal do Paraná
Apresentação e-Tec Brasil
Prezado estudante,
Bem-vindo ao e-Tec Brasil!
Você faz parte de uma rede nacional pública de ensino, a Escola Técnica Aberta do Brasil, instituída pelo Decreto nº 6.301, de 12 de dezembro 2007, com o objetivo de democratizar o acesso ao ensino técnico público, na modalidade a distância. O programa é resultado de uma parceria entre o Ministério da Educação, por meio das Secretarias de Educação a Distância (SEED) e de Educação Profissional e Tecnológica (SETEC), as universidades e escolas técnicas estaduais e federais.
A educação a distância no nosso país, de dimensões continentais e grande diversidade regional e cultural, longe de distanciar, aproxima as pessoas ao garantir acesso à educação de qualidade, e promover o fortalecimento da formação de jovens moradores de regiões distantes, geograficamente ou economicamente, dos grandes centros.
O e-Tec Brasil leva os cursos técnicos a locais distantes das instituições de ensino e para a periferia das grandes cidades, incentivando os jovens a concluir o ensino médio. Os cursos são ofertados pelas instituições públicas de ensino e o atendimento ao estudante é realizado em escolas-polo integrantes das redes públicas municipais e estaduais.
O Ministério da Educação, as instituições públicas de ensino técnico, seus servidores técnicos e professores acreditam que uma educação profissional qualificada – integradora do ensino médio e educação técnica, – é capaz de promover o cidadão com capacidades para produzir, mas também com autonomia diante das diferentes dimensões da realidade: cultural, social, familiar, esportiva, política e ética.
Nós acreditamos em você!
Desejamos sucesso na sua formação profissional!
Ministério da Educação
Janeiro de 2010
|
Nosso contato [email protected]
Indicação de ícones
Os ícones são elementos gráficos utilizados para ampliar as formas de linguagem e facilitar a organização e a leitura hipertextual.
Atenção: indica pontos de maior relevância no texto.
Saiba mais: oferece novas informações que enriquecem o assunto ou “curiosidades” e notícias recentes relacionadas ao tema estudado.
Glossário: indica a definição de um termo, palavra ou expressão utilizada no texto.
Mídias integradas: sempre que se desejar que os estudantes desenvolvam atividades empregando diferentes mídias: vídeos, filmes, jornais, ambiente AVEA e outras.
Atividades de aprendizagem: apresenta atividades em diferentes níveis de aprendizagem para que o estudante possa realizá-las e conferir o seu domínio do tema estudado.
e-Tec Brasil
Sumário
Palavra dos professores-autores 9 Aula 1 – Estatística aplicada 11
- Panorama histórico da estatística 12
- O que é estatística? 13
- Conceitos estatísticos 13
Aula 2 – Divisão da estatística 19
- Estatística Descritiva 19
- Estatística Indutiva ou Inferência 19
- Fases do método estatístico 20
Aula 3 – Tabelas e gráficos 23
- Tabelas 24
- Séries estatísticas 24
AULA 4 – Gráficos estatísticos 27
4.1 Principais tipos de gráficos 27
Aula 5 – Distribuição de frequências 33
5.1 Representação dos dados (amostrais ou populacionais) 33
Aula 6 – Elementos principais da tabela de
distribuição de frequências 159
6.1 Elementos de uma distribuição de frequência 159
Aula 7 – Distribuição de frequências 161
7.1 Determinação do número de classes (K) 161
Aula 8 – Tipos de frequências 165
- Frequências simples ou absolutas (fi) 165
- Frequências relativas (fri) 165
- Frequência simples acumulada (faci) 165
- Frequência relativa acumulada (fraci) 165
Aula 9 – Resolução de exercício prático 167
Aula 10 – Distribuição de frequências graficamente 169
10.1 Histograma e polígono de frequências 169
Aula 11 – Resolução de exercícios práticos 171
Aula 12 – Medidas de posição 173
12.1 Médias 173
Aula 13 – Medidas de posição – moda e mediana 179
- Moda (mo) – para dados não agrupados 179
- Mediana (Md) 180
Aula 14 – Comparação entre média, mediana e moda 183 Aula 15 – Medidas de dispersão (medidas de variabilidade) 185
15.1 Tipos de medidas de dispersão absoluta 186 Aula 16 – Variância (σ² ou s²) e desvio padrão (σ ou s) 187 Aula 17 – Exercício prático sobre variância e
desvio padrão 189
Aula 18 – Probabilidade 191
- Experimento aleatório 191
- Espaço Amostral (S) ou Universo 191
- Evento (E) 192
Aula 19 – Cálculo da probabilidade de um evento
ocorrer – princípio da contagem 195
- Eventos complementares P (A) 195
- Probabilidade da união P(A B) = P(A ou B) 196
Aula 20 – Probabilidade condicional 199
20.1 Eventos independentes 199 Referências 203 Atividades autoinstrutiva 205 Currículo dos professores-autores 227
e-Tec Brasil Estatística
Este material foi elaborado a partir de nossa experiência na educação presencial e a distância, buscando trazer de forma objetiva, simples e prática os principais conteúdos que serão importantes para seu exercício profissional.
Esperamos que através dos conteúdos contemplados neste material didático, somados às aulas expositivas e ao seu esforço pessoal, possamos quebrar, juntos, o paradigma de que a Estatística é uma disciplina “difícil, complicada” e transformá-la em uma disciplina de simples compreensão, útil e aplicável no seu cotidiano profissional.
Muito estudo e consequente sucesso nesta caminhada!
Javert Guimarães Falco Roberto José Medeiros Junior
Figura 1.1: Gráfico
Fonte: Acervo do ator
O relacionamento da Estatística com as demais ciências é cada vez mais intenso e mais importante. Veja-se, por exemplo, que a estatística auxilia a Genética, nas questões de hereditariedade; é valiosa na Economia, na aná- lise da produtividade, da rentabilidade, nos estudos de viabilidade, etc; é básica para as Ciências Sociais, nas pesquisas socioeconômicas; é de aplica- ção intensa na Engenharia Industrial, no controle de qualidade, na compa- ração de fabricações, etc; é indispensável à Administração, à Programação, à Medicina, à Psicologia, à História, e, de forma direta ou indireta, às demais atividades.
No decorrer das aulas veremos exemplos práticos das aplicações citadas.
- Panorama histórico da estatística
Figura 1.2: Censo Romano
Fonte: Acervo do autor
Historicamente, o desenvolvimento da estatística pode ser entendido a partir de dois fenômenos – a necessidade de governos coletarem dados censitários e o desenvolvimento da teoria do cálculo das probabilidades.
Dados têm sido coletados através de toda a história. Na Antiguidade , vários povos já registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas sociais, distribuíam equitativamente terras aos povos, cobravam impostos e realizavam inquéritos quantitativos por pro- cessos que, hoje, chamaríamos de “estatísticas”. Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas.
Figura 1.3: Impostos Idade Média
Fonte: Acervo do autor
Atualmente, informações numéricas são necessárias para cidadãos e orga- nizações de qualquer natureza, e de qualquer parte do mundo globalizado, para a tomada de decisões que envolvem a coletividade.
Figura 1.4: Multa e Semáforo
Fonte: Acervo do autor
- O que é estatística?
Figura: 1.5: Gráfico
Fonte: Acervo do autor
Figura: 1.6: Estudos
Fonte: www.sxc.hu
Figura: 1.7: População
Fonte: www.seplan.go.gov.br
“Estatística é um conjunto de métodos e processos quan- titativos que serve para estudar e medir os fenômenos coletivos.”
Dugé de Bernonville
Em outras palavras, é a ciência que se preocupa com a coleta, a organização, descrição (apresentação), análise e interpretação de dados experimentais e tem como objetivo fundamental o estudo de uma população.
Este estudo pode ser feito de duas maneiras:
- Investigando todos os elementos da população
- Amostragem, ou seja, selecionando alguns elementos da população
- Conceitos estatísticos
- População
Conjunto de indivíduos, objetos ou informações que apresentam pelo me- nos uma característica comum, cujo comportamento interessa-nos analisar.
Ou, em outras palavras, conjunto de todas as medidas, observações relativas ao estudo de determinado fenômeno.
Como em qualquer estudo estatístico temos em mente estudar uma ou mais características dos elementos de uma população. É importante definir bem essas características de interesse para que sejam delimitados os elementos que pertencem à população e quais os que não pertencem.
Exemplos:
Deseja-se saber se nas indústrias situadas no Estado do Paraná, em 2010, existia algum tipo de controle ambiental.
- População ou universo: indústrias situadas no Estado do Paraná em
2010.
- Característica: existência ou não de algum tipo de controle ambiental na indústria.
Figura: 1.8 Ciclo Sustentável
Fonte: Acervo do autor
Deseja-se conhecer o consumo total de energia elétrica em MWH nas resi- dências da cidade de Curitiba no ano de 2010.
- População ou universo: todas as residências que estavam ligadas a rede elétrica em Curitiba, em 2007 (dados obtidos com a companhia de energia elétrica da região).
- Características: consumo anual de energia elétrica em MWH (Mega Whatt: unidade padrão de medida para Energia Elétrica.)
Figura: 1.9: Cidade iluminada
Fonte: Acervo do autor
- Divisão da população
- População Finita: apresenta um número limitado de É pos- sível enumerar todos os elementos componentes.
Exemplo: Idade dos alunos do curso de Administração na modalidade a Distância (EAD) no Estado do Paraná.
- População ou Universo Estatístico: Todos os alunos de Administração na modalidade a Distância (EAD) no Estado do Paraná.
Figura 1.10: Colégio
Fonte: http://2.bp.blogspot.com
- População Infinita: apresenta um número ilimitado de Não é possível enumerar todos os elementos componentes. Entretanto, tal definição existe apenas no campo teórico, uma vez que, na prática, nun- ca encontraremos populações com infinitos elementos, mas sim popula- ções com grande número de componentes, e nessas circunstâncias, tais populações são tratadas como se fossem infinitas.
Exemplos: Tipos de bactérias no corpo humano
- População: Todas as bactérias existentes no corpo
Figura 1.11: Bactérias
Fonte: Acervo do autor
Em geral, como os universos são grandes, investigar todos os elementos populacionais para determinarmos a característica necessita muito tempo, e/ou o custo é elevado, e/ou o processo de investigação leva à destruição do elemento observado, ou, como no caso de populações infinitas, é impossí- vel observar a totalidade da população. Assim, estudar parte da população constitui um aspecto fundamental da Estatística.
Amostragem: É a coleta das informações de parte da população, chamada amostra, mediante métodos adequados de seleção destas unidades.
Amostra: É uma parte (um subconjunto finito) representativa de uma po- pulação selecionada segundo métodos adequados. O objetivo é tirar con- clusões sobre populações com base nos resultados da amostra. Para isso é necessário garantir que amostra seja representativa, ou seja, a amostra deve conter as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar.
Censo: É o exame completo de toda população. Quanto maior a amostra mais precisas e confiáveis deverão ser as induções feitas sobre a população. Logo, os resultados mais perfeitos são obtidos pelo Censo. Na prática, esta conclusão muitas vezes não acontece, pois o emprego de amostras, com certo rigor técnico, pode levar a resultados mais confiáveis ou até mesmo melhores do que os que seriam obtidos através de um Censo.
As razões de se recorrer a amostras são: menor custo e tempo para levanta- mento de dados; melhor investigação dos elementos observados.
A Estatística ocupa-se fundamentalmente das propriedades das populações cujas características são passíveis de representação numérica, tais como re- sultado de medições e contagens. Essas características da população são comumente chamadas de VARIÁVEIS. As características ou variáveis podem ser divididas em dois tipos: qualitativas e quantitativas.
- Variáveis qualitativas – quando o resultado da observação é apresenta- do na forma de qualidade ou Dividem-se em:
- variáveis nominais: quando podem ser separadas por categorias cha- madas de não mensuráveis.
Exemplo: a cor dos olhos, tipo de acomodação, marcas de carro, sexo, etc.
- variáveis ordinais: quando os números podem agir como categorias ou ordenações. Como sugere o nome, elas envolvem variáveis que repre- sentam algum elemento de ordem. Uma classificação em anos pode ser um exemplo clássico. A classificação deste tipo de variáveis geralmente causa confusão.
Exemplo: Grau de satisfação da população brasileira com relação ao traba- lho de seu presidente (valores de 0 a 5, com 0 indicando totalmente insatis- feito e 5 totalmente satisfeito).
Para ter acesso a alguns dados do Brasil, basta acessar o site do Instituto Brasileiro de
Geografia e Estatística (IBGE). www.ibge.gov.br br/agencias_pnuma.php
Figura 1.12: Gráfico
Fonte: http://uolpolitica.blog.uol.com.br
- Variáveis quantitativas – quando o resultado da observação é um nú- mero, decorrente de um processo de mensuração ou contagem. Divi- dem-se em:
- variáveis contínuas: são aquelas que podem assumir qualquer valor num certo intervalo (contínuo) da reta real. Não é possível enumerar to- dos os possíveis valores. Essas variáveis, geralmente, provém de medi- ções.
Exemplo: a altura dos alunos é uma variável contínua, pois teoricamente, um aluno poderá possuir altura igual a 1,80m, 1,81m, 1,811m, 1,812m . . . (medições: peso, estatura, etc.)
Figura 1.13: Peso e altura
Fonte: Acervo do autor
- variáveis discretas: são aquelas que podem assumir apenas valores in- teiros em pontos da reta real. É possível enumerar todos os possíveis valores da variável.
Figura 1.14: Conjunto de números reais
Fonte: http://alfaconnection.net
Exemplo: número de alunos de uma escola, número de mensagens em uma secretária eletrônica, etc.
As variáveis podem ser resumidas da seguinte maneira:
A Teoria Estatística moderna se divide em dois grandes campos:
- Estatística Descritiva
É aquela que se preocupa com a coleta, organização, classificação, apresenta- ção, interpretação e analise de dados referentes ao fenômeno através de grá- ficos e tabelas, além de calcular medidas que permita descrever o fenômeno.
- Estatística Indutiva ou Inferência
É a aquela que partindo de uma amostra, estabelece hipóteses, tira conclu- sões sobre a população de origem e que formula previsões fundamentando-
-se na teoria das probabilidades. A estatística indutiva cuida da análise e interpretação dos dados. O processo de generalização do método indutivo está associado a uma margem de incerteza. Isto se deve ao fato de que a conclusão que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas características comuns baseia-se em uma parcela do total de observações.Para se analisar os dados de forma estatísti- ca podem-se obter os resultados de duas maneiras: através de um censo ou através de uma amostragem (pesquisa em uma amostra).
Para exemplificar essas teorias analise o esquema abaixo:
Fluxograma 2.1: técnicas de amostragem
Fonte: Elaborado pelo autor
Exemplos de utilização: Pesquisa de Mercado, Pesquisa de opinião pública e em praticamente todo experimento.
- Fases do método estatístico
- Fase – definição do problema: Saber exatamente aquilo que se preten- de pesquisar é o mesmo que definir corretamente o
- Fase – planejamento: Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostra- gem? E o cronograma de atividades? Os custos envolvidos?
- fase – coleta de dados: Fase operacional. É o registro sistemático de dados, com um objetivo
Coleta de dados. Após a definição do problema a ser estudado e o esta- belecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades; custos envolvidos exame das informa- ções disponíveis; delineamento da amostra etc.), o passo seguinte é a coleta de dados, que pode ser de dois tipos:
- Dados Primários: os dados são obtidos diretamente na fonte originária (coleta direta).
Exemplo: Preferência dos consumidores por um determinado produto.
- Métodos de coleta de dados primários: É importante garantir que a coleta de dados primários seja executada de maneira estatisticamente correta, senão os resultados podem ser
- Observação: O pesquisador não pergunta, observa. Por exemplo pes- quisa de observação para diagnosticar as necessidades de trânsito de uma
- Levantamento: É o método mais comum de se coletar dados. O instru- mento pode ser um questionário estruturado ou um roteiro de itens em que o entrevistado disserta à vontade sobre cada item da
As três principais formas de levantamento, resumindo as vantagens e des- vantagens, são:
- Entrevista pessoal: mais flexível e muito
- Telefone: mais barato, penetra em segmentos difíceis, mas é de fácil
- Questionários (postal, fax ou e-mail): mais lento, média de retor- no das respostas muito baixas, mas sem interferência do
- Dados Secundários : os dados são obtidos de algo já disposto. Provém da coleta
Exemplo: Pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por outras pesquisas.
Observação:
É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição.
- Fase – apuração dos dados: Resumo dos dados através de sua conta- gem e É a condensação e tabulação de dados.
- Fase – apresentação dos dados: Há duas formas de apresentação, que não se excluem A apresentação tabular, ou seja, é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística e a apresentação gráfica dos dados numéricos que constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno.
- Fase – análise e interpretação dos dados: A última fase do trabalho estatístico é a mais importante e Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Na estatística indutiva a interpretação dos dados se fundamenta na teoria da probabilidade.
Resumo
Estatística: é a ciência que se preocupa com a coleta, organização, descri- ção, análise e interpretação de dados experimentais.
População: é um conjunto de indivíduos, objetos ou informações que apre- sentam pelo menos uma característica em comum.
Amostra: é uma parte representativa de uma população.
As características das populações são chamadas de variáveis, que podem ser divididas em:
Estatística Descritiva: se preocupa com a coleta, organização, classificação, apresentação, interpretação e análise de dados experimentais.
Estatística Indutiva ou Inferência: se preocupa com as hipóteses e con- clusões sobre a população.
Anotações
Figura 3.1 Gráficos
Fonte: http://4.bp.blogspot.com
A apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídos de modo ordenado, se- gundo algumas regras práticas ditadas pelo Conselho Nacional de Estatística e pelo IBGE.
As tabelas têm a vantagem de conseguir expor, sinteticamente e em um só local, os resultados sobre determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar.
Essa integração de valores que temos nas tabelas nos permite ainda a utili- zação de representações gráficas, que normalmente é uma forma mais útil e elegante de demonstrar as características que serão analisadas.
- Tabelas
É um quadro (sem que se fechem por completo as linhas e colunas, pois do contrário seria uma grade), que resume um conjunto de observações. Uma tabela compõe-se de:
- Corpo – conjunto de linhas e colunas que contêm informações sobre a variável em estudo;
- Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
- Coluna Indicadora – parte da tabela que especifica o conteúdo das linhas;
- Casa ou Célula – espaço destinado a um só número;
- Título – conjunto de informações, as mais completas possíveis, responden- do às perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela;
- Fonte – indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração.
Saiba mais De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células, devemos colocar:
- um traço horizontal ( ) quando o valor é zero, não só quanto a natureza das coisas, como quanto ao resultado do
inquérito;
- três pontos (…) quando não
temos os dados;
- um ponto de interrogação( ? ) quando temos dúvida quanto a exatidão de determinado valor;
- zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisamos acrescentar
a parte decimal um número correspondente de zeros (0,0;
0,00; 0,00; …).
Figura 3.2 Planilha
Fonte: Acervo do autor
- Séries estatísticas
Denomina-se série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local, ou da espécie (fenômeno).
Numa série estatística observa-se a existência de três elementos ou fatores: o tempo, o espaço e a espécie. Conforme varie um desses elementos, a série estatística classifica-se em temporal, geográfica e específica.
- Série temporal, histórica ou cronológica
É a série cujos dados estão em correspondência com o tempo, ou seja, va- riam com o tempo.
Exemplo:
Tabela 3.1 Preço do artigo “Y” no atacado na cidade “X”
ANOS | PREÇO MÉDIO EM REAIS |
2003 | 2,43 |
2004 | 2,54 |
2005 | 3,01 |
2006 | 2,99 |
2007 | 2,83 |
Fonte: Dados Fictícios
- Série geográfica, territorial ou de localidade
É a série cujos dados estão em correspondência com a região geográfica, ou seja, o elemento variável é o fator geográfico (a região).
Exemplo:
|
Tabela 3.2 Número de Assaltos na cidade “X” em 2006
Fonte: Dados Fictícios
- Série específica ou categórica
É a série cujos dados estão em correspondência com a espécie, ou seja, va- riam com o fenômeno.
Exemplo:
Tabela 3.3 Número de Candidatos ao vestibular da Universidade “X”
ÁREA OFERTADA | NÚMERO DE CANDIDATOS |
Ciências Sociais Aplicadas | 2086 |
Ciências Exatas | 1065 |
Ciências Humanas | 1874 |
Ciências Biológicas | 1102 |
Ciências Tecnológicas | 1902 |
Fonte:Dados Fictícios
- Séries mistas
As combinações entre as séries anteriores constituem novas séries que são denominadas séries compostas ou mistas e são apresentadas em tabelas de dupla entrada.
Exemplo:
Tabela 3.4 Número de Alunos Matriculados nas Escolas Particulares na Cidade “X”
BAIRROS | 2005 | 2006 | 2007 |
BAIRRO-A | 2894 | 3454 | 2989 |
BAIRRO-B | 7075 | 9876 | 6543 |
BAIRRO-C | 1099 | 3218 | 2100 |
BAIRRO-D | 4333 | 3455 | 3543 |
BAIRRO-E | 2976 | 1765 | 4098 |
Fonte: Dados Fictícios
Resumo
Ao final desta aula você adquiriu conhecimentos suficientes para melhor inter- pretar e compreender qualquer tabela ou gráfico que lhe seja apresentado no decorrer de sua carreira profissional.
Portanto, mãos à obra! Este foi mais um passo muito importante à sua formação!
26 e-Tec Brasil
Figura 4.1: Gráfico em planilha
Fonte: Acervo do autor
A apresentação gráfica é um complemento importante da apresentação ta- bular. A vantagem de um gráfico sobre a tabela está em possibilitar uma rápida impressão visual da distribuição dos valores ou das frequências obser- vadas. Os gráficos propiciam uma ideia inicial mais satisfatória da concentra- ção e dispersão dos valores, uma vez que através deles os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil:
- simplicidade: o gráfico deve ser destituído de detalhes e traços desne-
cessários;
- clareza: o gráfico deve possuir uma correta interpretação dos valores representativos do fenômeno em estudo;
- veracidade: o gráfico deve expressar a verdade sobre o fenômeno em
- Principais tipos de gráficos
- Gráficos em curvas ou em linhas
São usados para representar séries temporais, principalmente quando a série cobrir um grande número de períodos de tempo e o mais relevante é
Inclusão social: é um conjunto de meios e ações que combatem a exclusão aos benefícios da vida em sociedade, provocada pela diferença de classe social, origem geográfica, educação, idade, existência de deficiência ou preconceitos raciais
|
Hidrelétricas: usinas de água que geram energia elétrica
Costa: a borda do mar, litoral.
Análise Comparativa: ex- aminar um conjunto, estabelecer algo semelhante ou diferente.
Socioeconômico: envolve uma combinação de fatores sociais e econômicos.
Reordenação institucional: ordenar, organizar novamente as questões referentes a instituições como associações, governos, colônias de pescadores, entre outros.
Precária: condição não garan- tida, nem estável.
Infraestrutura: divisão da sociedade em forças produtivas (homem e material necessário à produção) e relações de produção (classes, instituições etc.)
Beneficiamento: melhorar por processos técnicos.
o “sobe e desce” dos índices, taxas, coeficientes representados no eixo das ordenadas (eixo vertical).
Figura 4.2: Gráfico em curvas e linhas
Fonte: imagem do autor
- Gráficos em colunas
É a representação de uma série estatística através de retângulos, dispos- tos em colunas (na vertical). Este tipo de gráfico representa praticamente qualquer série estatística quando se deseja relacionar grandes quantidades de dados e as respectivas variações de crescimento e/ou decrescimento dos dados apresentados.
Figura 4.3: Gráficos com colunas
Fonte: imagem do autor.
Importante
As regras para a construção são as mesmas do gráfico em curvas. As bases das colunas são iguais e as alturas são proporcionais aos respectivos dados. O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna, mas depende do tipo de dado coletado e do autor adotado. Por hora adotaremos a seguinte regra: análise do tipo de variável coletada.
Por exemplo, se os dados forem variáveis do tipo contínua, não faz sentido apresentar as colunas separadas, pois os dados serão contínuos e, por con- sequência as colunas serão apresentadas de modo contínuo.
No caso do gráfico anterior com o cabeçalho: “Vendas no Oriente Médio (em R$ mil)” as colunas estão separadas. A justificativa para isso é que a va- riável preço “em R$ mil” não foi apresentada de modo contínuo na pesquisa, ou seja, no 1º Trimestre as Vendas foram de mais de R$ 40 mil e ponto! No 2º Trimestre (não importa o dia exato em que se encerrou a coleta de dados do 1º Trimestre) iniciou-se nova coleta, que é independente da primeira.
- Gráficos em barras
É representado por retângulos dispostos horizontalmente, prevalecendo os mesmos critérios adotados na elaboração de gráfico em coluna, porém é mais adequado quando se deseja destacar a variação (máximos e mínimos) de duas, até três variáveis do eixo vertical.
Figura 4.4: Gráficos em barras
Fonte: imagem do autor
- Gráfico em setores
É a representação gráfica de uma série estatística em um círculo de raio qual- quer, pôr meio de setores com ângulos centrais proporcionais às ocorrências. É utilizado quando se pretende comparar cada valor da série com o total.
O total da série corresponde a 360º (total de graus de um arco de circunfe- rência). O gráfico em setores representa valores absolutos ou porcentagens complementares.
As séries geográficas, específicas, e as categorias em nível nominal são mais representadas em gráficos de setores, desde que não apresentem muitas parcelas (no máximo sete).
Cada parcela componente do total será expressa em graus, calculada através de uma proporção simples (a famosa “regra de três”):
Figura 4.5: Gráfico em setores
Fonte: Acervo do autor
Exemplo Prático: Em uma amostra com alunos do Ensino Profissionalizante, quando perguntados sobre o interesse em aprender computação, obteve-se como respostas: 30 alunos manifestaram interesse, 15 não demonstraram interesse e 5 não sabem.
Pede-se:
Representar os dados obtidos graficamente:
Figura 4.6: Gráficos em setores
Fonte: Acervo do autor
- a) Comparação dos Gráficos:
Observe que comparamos lado a lado os dois gráficos, essa prática, é feita quando desejamos obter a melhor representação dos dados, seja para fins acadêmicos ou de apresentação profissional. Em síntese, ter várias opções de gráficos é desejável para podermos estabelecer melhor a comparação de um fenômeno e decidir sobre a melhor e mais impactante apresentação gráfica.
Resumo
Tabela: é um quadro que resume um conjunto de observações.
Série estatística: é toda a tabela que apresenta a distribuição de um con- junto de dados estatísticos em função da época, local, ou da espécie.
As séries podem ser divididas em:
- temporal, histórica ou cronológica
- geométrica, territorial ou de localidade
- específica ou categórica
Gráfico: é um complemento da tabela e deve apresentar simplicidade, cla- reza, veracidade.
Os gráficos podem ser classificados em:
- curvas ou linhas
- colunas
- barras
- setores (ou gráfico de pizza)
Anotações
- Representação dos dados (amostrais ou populacionais)
- Dados brutos:
São aqueles que não foram numericamente organizados, ou seja, estão na forma com que foram coletados.
Por exemplo:
Número de filhos de um grupo de 50 casais
2 |
3 |
0 |
2 |
1 |
1 |
1 |
3 |
2 |
5 |
6 |
1 |
1 |
4 |
0 |
1 |
5 |
6 |
0 |
2 |
1 |
4 |
1 |
3 |
1 |
7 |
6 |
2 |
0 |
1 |
3 |
1 |
3 |
5 |
7 |
1 |
3 |
1 |
1 |
0 |
3 |
0 |
4 |
1 |
2 |
2 |
1 |
2 |
3 |
2 |
- Rol
É a organização dos dados brutos em ordem de grandeza crescente ou de- crescente.
Por exemplo:
Número de filhos de um grupo de 50 casais
0 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
1 | 1 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 |
2 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 4 |
4 | 4 | 5 | 5 | 5 | 6 | 6 | 6 | 7 | 7 |
Fonte: Acervo do autor
- Distribuição de frequência sem intervalos de classe:
É a simples condensação dos dados conforme as repetições de seus valores. Para um ROL de tamanho razoável esta distribuição de frequência é inconve- niente, já que exige muito espaço. Veja exemplo abaixo:
|
Tabela 5.1 Número de pontos obtidos pelos alunos da disciplina-X, colé- gio-Y, em 2006.
Fonte: Acervo do autor
- Distribuição de frequência com intervalos de classe:
Quando o tamanho da amostra é elevado e o número de variáveis é muito grande, é mais racional efetuar o agrupamento dos valores em vários inter- valos de classe. Veja o Exemplo:
Tabela 5.2 Peso de 80 estudantes da escola-x, 2007
Peso (kg) | Número de alunos |
40 50 | 30 |
50 60 | 25 |
60 70 | 13 |
70 80 | 12 |
80 90 | 08 |
Fonte: Acervo do autor
- Vamos agora, analisar um exemplo prático de coleta de dados e organização destes va- lores em tabelas de frequências com inter- valos de classe
- Dados Brutos: Taxas municipais de urbanização (em percentual) no Es- tado X – 2005
8 | 24 | 46 | 13 | 38 | 54 | 44 | 20 | 17 | 14 |
18 | 15 | 30 | 24 | 20 | 8 | 24 | 18 | 9 | 10 |
38 | 79 | 15 | 62 | 23 | 13 | 62 | 18 | 8 | 22 |
11 | 17 | 9 | 35 | 23 | 22 | 37 | 36 | 8 | 13 |
10 | 6 | 92 | 16 | 15 | 23 | 37 | 36 | 8 | 13 |
44 | 17 | 9 | 30 | 26 | 18 | 37 | 43 | 14 | 9 |
28 | 41 | 42 | 35 | 35 | 42 | 71 | 50 | 52 | 17 |
19 | 7 | 28 | 23 | 29 | 29 | 58 | 77 | 72 | 34 |
12 | 40 | 25 | 7 | 32 | 34 | 22 | 7 | 44 | 15 |
9 | 16 | 31 | 30 |
Fonte: Dados fictícios
- Rol: Taxas municipais de urbanização (em percentual) no Estado X – 2005
6 | 6 | 7 | 7 | 7 | 8 | 8 | 8 | 8 | 9 |
9 | 9 | 9 | 9 | 10 | 10 | 11 | 12 | 13 | 13 |
16 | 17 | 17 | 17 | 17 | 18 | 18 | 18 | 18 | 19 |
20 | 20 | 22 | 22 | 22 | 23 | 23 | 23 | 23 | 24 |
24 | 24 | 25 | 26 | 28 | 28 | 29 | 29 | 30 | 30 |
30 | 31 | 32 | 34 | 34 | 34 | 35 | 35 | 35 | 36 |
37 | 37 | 38 | 38 | 40 | 41 | 42 | 42 | 43 | 44 |
44 | 44 | 46 | 50 | 52 | 54 | 58 | 62 | 62 | 71 |
72 | 77 | 79 | 92 |
Fonte: Dados fictícios
- Distribuição de frequências para dados agrupados em classes:
Taxas (em %) Número de Municípios (f i)
6 16 | 29 |
16 26 | 24 |
26 36 | 16 |
36 46 | 13 |
46 56 | 4 |
56 66 | 3 |
66 76 | 2 |
76 86 | 2 |
86 96 | 1 |
Total ( ) |
94 |
Fonte: Acervo do autor
Representaremos o somatório pela letra grega maiúscula sigma ( ).
Resumo
Vimos que através das distribuições em frequências poderemos organizar todas as informações obtidas em uma pesquisa, facilitando a compreensão e transmitindo adequadamente todas as informações ao leitor e ao pesqui- sador.
Não esqueça que esta “ferramenta” deverá ser utilizada, quando oportuna, pois enriquecerá seu trabalho.
Anotações
- Elementos de uma distribuição de frequência
- Classe
São intervalos de variação da variável. As classes são representadas simboli- camente por i, sendo i = 1, 2, 3, . . ., k (onde k é o número total de classes da distribuição).
Pelo exemplo prático anterior, o intervalo 16 26 define a segunda classe (i = 2). A distribuição é formada por nove classes, podemos afirmar que i = 9.
Observação: O símbolo representa um intervalo fechado à esquerda e aber- to à direita: significa que o número a esquerda pertence à classe e o número à direita não pertence. É o mesmo que a representação matemática de con- juntos: lê-se “fechado à esquerda e aberto à direita”.
- Limites de Classe
São os extremos de cada classe. O menor número é o limite inferior da classe (li) e o maior número o limite superior da ls.
Pelo exemplo prático anterior na terceira classe, temos: li3 = 26 e Ls3 = 36
- Amplitude de um Intervalo de Classe (h)
É a medida de intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior. Assim:
Exemplo: A amplitude da classe descrita acima é 10, pois é a diferença do limite superior com o inferior.
- Amplitude Total (H)
É a diferença entre o valor máximo e o valor mínimo da amostra.
Pelo exemplo prático anterior, sabemos que LS = 92 e Li = 6, logo amplitude total é H = 92 – 6 = 86
Aula 6 – Elementos principais da tabela de distribuição de frequências
159
e-Tec Brasil
6.1.4 Ponto Médio de uma Classe (xi):
É o ponto que divide o intervalo de classe em duas partes iguais.
Pelo exemplo prático anterior na quinta classe, temos: li3 = 46 e Ls3= 56, logo o ponto médio dessa classe é
Resumo
Dados brutos: são aqueles que não foram numericamente organizados.
Rol: é a organização dos dados brutos em ordem de grandeza crescente ou decrescente.
Distribuição de frequências: pode ser com ou sem intervalos de classe. Os elementos da distribuição de frequência são:
- classe: são intervalos de variação da variável
- limites da classe: são os extremos de cada classe
- amplitude de um intervalo: é a diferença entre o limite superior e inferior
- amplitude total: é a diferença entre o maior e o menor da amostra
- ponto médio: é a média aritmética dos limites da classe
- Determinação do número de classes (K)
É importante que a distribuição conte com um número adequado de classes. Se o número de classes for excessivamente pequeno acarretará perda de detalhe e pouca informação se poderá extrair da tabela.
Por outro lado, se for utilizado um número excessivo de classes, haverá alguma classe com freqüência nula ou muito pequena, não atingindo o objetivo de classificação que é tornar o conjunto de dados supervisionáveis.
Não há uma fórmula única para determinar o número de classes. Três solu- ções são apresentadas abaixo:
- Para n ≤ 25 → K = 5 e para n > 25 → K =˜ √n
Exemplo:
Se a amostra tiver 23 elementos analisados, o número de classes é 5, pois n ≤ 25. Suponha que a amostra tenha 83 elementos analisados (n ≥ 25) o número de classes é calculado por √83 = 9,1104335 =˜ 9.
- Pode-se utilizar a regra de Sturges, que fornece o número de classes em função do total de observações:
Onde:
K é o número de classes;
Log é a abreviação de logaritmo e o seu valor pode ser obtido com uma calculadora científica;
n é o número total de observações.
Para facilitar o cálculo do número de classes pela regra de Sturges, utilize a tabela abaixo:
nº total de observação k = nº de classes a usar
1 | 1 |
2 | 2 |
3 ├ ┤ 5 | 3 |
6 ├ ┤ 11 | 4 |
12 ├ ┤ 22 | 5 |
23 ├ ┤ 46 | 6 |
47 ├ ┤ 90 | 7 |
91 ├ ┤ 181 | 8 |
182 ├ ┤ 362 | 9 |
362 ├ ┤ 724 | 10 |
725 ├ ┤ 1448 | 11 |
1.449 ├ ┤ 2.896 | 12 |
… | … |
Observação:
- Inclui tanto o valor da direita quanto o da esquerda
- Não inclui nem o valor da direita, nem o da esquerda
- Inclui o valor da direita, mas não o da esquerda
- Inclui o valor da esquerda, mas não o da direita
Importante: A fórmula de Sturges revela um inconveniente: propõe um nú- mero demasiado de classes para um número pequeno de observações, e re- lativamente poucas classes quando o total de observações for muito grande.
Exemplo:
Se a amostra tiver 94 elementos analisados, o cálculo do número de classes pela fórmula de Sturges ficará da seguinte maneira:
K =˜ 1+3,3.log n K =˜ 1+3,3.log n 94 K =˜ 1+3,3.1,97313→K7,51 K =˜ 8
Também percebemos pela tabela que 94 é um número entre 91 | 181, logo teremos 8 classes formando a tabela de frequências.
- Truman Kelley sugere os seguintes números de classes, com base no número total de observações, para efeito de representação gráfica:
n | 5 | 10 | 25 | 50 | 100 | 200 | 500 |
K | 2 | 4 | 6 | 8 | 10 | 12 | 15 |
Exemplo:
Se a amostra tiver 50 elementos analisados o número de classes é 8, confor- me tabela acima.
Importante:
Qualquer regra para determinação do número de classes da tabela não nos leva a uma decisão final: esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados.
- Amplitude do intervalo de classe (Ai):
É o comprimento da classe.
Observação: convém arredondar o número correspondente à amplitude do intervalo de classe para facilitar os cálculos (arredondamento arbitrário).
Exemplo prático:
Antes de enviar um lote de aparelhos elétricos para venda, o Departamento de Inspeção da empresa produtora selecionou uma amostra casual de 32 aparelhos, avaliando o desempenho através de uma medida específica, obtendo os seguintes resultados:
154 | 155 | 156 | 164 | 165 | 170 | 172 | 175 |
175 | 176 | 178 | 178 | 180 | 180 | 180 | 184 |
190 | 190 | 190 | 192 | 195 | 198 | 200 | 200 |
202 | 205 | 205 | 210 | 211 | 212 | 215 | 218 |
Construir uma tabela de distribuição de frequências com intervalos de classes.
1º. passo: A amplitude total será dada por:
2º. passo: Neste caso, n = 32 ▶ pela regra de Sturges (consultar Tabela)
3º. passo: A amplitude do intervalo de cada classe será:
4º. passo: Construir a tabela de distribuição de frequências com intervalos de classes
Perceba que utilizamos o menor valor do Rol, para iniciar a 1ª classe e a amplitude do intervalo encontrado para formar as outras classes que completam a tabela.
Classes Frequências
154 ├ 165 | 4 |
165 ├ 176 | 5 |
176 ├ 187 | 7 |
187 ├ 198 | 5 |
198 ├ 209 | 6 |
209 ├ 220 | 5 |
TOTAL ( ) | 32 |
Resumo
Independente do método escolhido para determinar o número de classes, o im- portante é utilizar o bom senso na tabulação e exposição dos dados.
Cada regra ou método tem características próprias e são adequados a este ou aquele número de elementos da população. Sendo assim, no momento da con- fecção da tabela é importante ter em mente a quantidade de dados e fazer um esboço da tabela.
Caso a última linha não contemple a plenitude dos dados, deve-se optar por outro método.
- Frequências simples ou absolutas (fi)
É o número de repetições de um valor individual ou de uma classe de valo- res da variável. A soma das frequências simples é igual ao número total dos dados da distribuição.
- Frequências relativas (fri)
São os valores das razões (divisões) entre as frequências absolutas de cada
classe e a frequência total da distribuição. A soma das frequências relativas é igual a 1 ou100 %
- Frequência simples acumulada (faci)
É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.
- Frequência relativa acumulada (fraci)
É a frequência acumulada da classe, dividida pela frequência total da distri-
buição.
Resumo
Os tipos de frequências determinam com agilidade e objetividade a relação dos dados com o universo da pesquisa.
Em suma as frequências relativas (expressa em porcentagem) são uteis para a apresentação dos dados em linguagem comum e de amplo entendimen- to, que é a porcentagem, e as frequências acumuladas servem de gabarito para que se tenha certeza de que a totalidade dos dados coletados foram apresentados.
Anotações
Atividades de aprendizagem
O departamento comercial de uma empresa pediu o levantamento das ven- das diárias (em milhares de reais) durante os 25 dias do mês de novembro de 2007. Assim obteve os valores:
7, 9, 1, 3, 3, 3, 4, 5, 5, 7, 8, 9, 3, 2, 4, 5, 6, 7, 8, 9, 2, 3, 4, 2, 1.
Pede-se:
- Montar o Rol
- Calcular amplitude
- Calcular o número de
- Calcular a amplitude do intervalo de cada
- Construir uma tabela com todos os tipos de frequências (simples, relativa, acumulada e acumulada relativa)
Solução:
O Rol é:
A amplitude total será dada por:
Neste caso, n = 25 pela regra de Sturges, temos:
A amplitude do intervalo de cada classe será:
Utilizando o menor valor do Rol, para iniciar a 1ª classe e a amplitude do intervalo da cada classe e completando a tabela com as frequências, temos:
Classe | fi | fri | fri (%) | faci | faci(%) | Xi |
Total ( ) |
Resumo
Para determinar o número de classes temos três casos:
1º caso: para n 25 → número de classes é K = 5 para n 25 → número de classes é K =˜
2º caso: pela regra de Sturges K = 1 + 3,3 log n
3º caso: pela regra de Truman L. Kelley → conforme a tabela abaixo: Amplitude do intervalo de classe: é o conjunto da classe, calculado por:
Frequência simples ou absoluta: é o número de repetições de um valor indivi- dual.
Frequência relativa: são os valores das divisões entre as frequências absolutas de cada classe e a frequência total da distribuição.
n | 5 | 10 | 25 | 50 | 100 | 200 | 500 |
K | 2 | 4 | 6 | 8 | 10 | 12 | 15 |
Frequência simples acumulada: é o total das frequências de todos os va- lores inferiores ao limite superior do intervalo de uma determinada classe.
Frequência relativa acumulada: é a frequência acumulada da classe divi- dida pela frequência total da distribuição.
- Histograma e polígono de frequências
- Histograma
É um tipo de gráfico (semelhante ao gráfico de colunas) formado por um conjunto de retângulos justapostos e é muito utilizado para representar a distribuição de frequências cujos dados foram agrupados em classes ou in- tervalos de mesma amplitude. A base do retângulo é igual à amplitude do intervalo classe e sua altura é proporcional à frequência da classe.
Exemplo:
Figura 10.1: Estaturas dos alunos da Turma “A” – 2006
Fonte: Fictícia – imagem do autor
Polígono de Frequências: é obtido unindo-se por segmentos de reta os pontos médios das bases superiores dos retângulos de um histograma dese- nhando então um polígono de área bem definida.
Importante: A área do polígono e o número de total de observações é di- retamente proporcional ao número de observações do Universo ou Espaço Amostral da pesquisa.
Exemplo:
Figura 10.2: Estaturas dos alunos da Turma “A” – 2006 (polígono de frequências)
Fonte: Fictícia – imagem do autor
Atividades de aprendizagem
- Numa empresa, foi observada a seguinte tabela de salários semanais (em reais) de 40 operários não-especializados.
142 | 143 | 144 | 145 | 147 | 148 | 148 | 149 | 149 | 150 |
150 | 151 | 152 | 152 | 162 | 163 | 163 | 164 | 164 | 164 |
164 | 165 | 165 | 165 | 170 | 175 | 175 | 184 | 184 | 184 |
190 | 190 | 190 | 195 | 197 | 197 | 200 | 207 | 210 | 210 |
Forme com esses dados uma tabela de dados agrupados por classes e depois construa o Histograma e Polígono de Frequência correspondente.
Solução:
Antes de construirmos o histograma e o polígono de frequências, temos que montar a tabela com dados agrupados por classes, desta forma faremos inicialmente os seguintes cálculos:
1º. A amplitude total será dada por:
2º. Neste caso, n = 40 pela regra de Sturges, temos:
3º. A amplitude do intervalo de cada classe será:
Utilizando o menor valor do Rol, para iniciar a 1ª classe e a amplitude do intervalo da cada classe e completando a tabela com as frequências, temos:
Classes | fi |
TOTAL ( ) |
4º. Depois de montarmos a tabela com dados agrupados em classes, iremos construir o histograma e o polígono de frequência:
Resumo
Histograma: é um gráfico formado por um conjunto de retângulos justapostos.
Polígono de frequências: é obtido unindo-se por segmentos de reta os pontos médios das bases superiores dos retângulos de um histograma.
Anotações
Na maior parte das vezes em que os dados estatísticos são analisados, pro- curamos obter um valor para representar um conjunto de dados. Este valor deve sintetizar, da melhor maneira possível, o comportamento do conjunto do qual ele é originário. Nem sempre os dados estudados têm um bom com- portamento, isto pode fazer com que um único valor possa representá-lo ou não perante o grupo.
As medidas de posição mais importantes são as medidas de tendência cen- tral, que recebem tal denominação pelo fato de os dados observados tende- rem, em geral, a se agrupar em torno dos valores centrais.
Dentre as medidas de tendência central, destacam-se as seguintes: Médias, Moda e Mediana, Cada uma com um significado diferenciado, porém ten- do como serventia representar um conjunto de dados.
- Médias
- Média Aritmética Simples:
Para se obter a média aritmética simples de um conjunto de dados, devemos dividir a soma dos valores de todos os dados do conjunto pela quantidade deles.
Onde: xi = são os valores que a variável x assume n = o número de valores
X = é a média aritmética da amostra
= é a média aritmética da população
Exemplo:
Sabendo-se que as vendas diárias da empresa A, durante uma semana, fo- ram de 10, 14, 13, 15, 16, 18 e 12 unidades. Determinar a média de vendas nesta semana feitas pela empresa A:
Para obter a média aritmética simples das vendas, faremos o seguinte cálculo: x1 = 10, x2 = 14, x3 = 13, x4 = 15, x5 = 16, x6 = 18 e x7 = 12 e n = 7, logo:
- Média Aritmética Ponderada
Média ponderada é uma média aritmética na qual será atribuído um peso a cada valor da série.
Exemplo:
O capital da empresa está sendo formado pelos acionistas, por financiamen- tos e por debêntures. Cada tipo tem um custo diferente para a empresa, de- finido pela sua taxa de juros anual. Calcule a taxa de juros média do capital da empresa, considerando os dados apresentados na tabela seguinte:
Capital da Empresa Participação Taxas de Juros
Acionista | R$ 1.000.000,00 | 12 % |
Financiamento | R$ 600.000,00 | 8 % |
Debêntures | R$ 400.000,00 | 14 % |
A taxa de juros média é calculada pela seguinte relação:
- Média aritmética para dados agrupados sem intervalos de classes
As frequências são as quantidades de vezes que a variável ocorre na coleta de dados, elas funcionam como fatores de ponderação, o que nos leva a calcular uma média aritmética ponderada.
(População) (Amostra)
Exemplo:
Após ter sido realizado um trabalho bimestral, numa turma de Estatística, o professor efetuou o levantamento das notas obtidas pelos alunos, observou a seguinte distribuição e calculou a média de sua turma:
Notas dos alunos – xi Número de alunos – fi xifi
1 | 1 | 1 |
2 | 3 | 6 |
3 | 5 | 15 |
4 | 1 | 4 |
Total ( ) | n = 10 | 26 |
- Média aritmética para dados agrupados com intervalos de classes
Neste caso, convencionamos que todos os valores incluídos em um determi- nado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio das seguintes fórmulas:
(População)
(Amostra)
Exemplo:
|
Determine a renda média familiar, de acordo com os dados da tabela:
Classes – Renda familiar
fi – Número de famílias
xifi
2 ├ 4 | 3 | 5 | 15 |
4 ├ 6 | 5 | 10 | 50 |
6 ├ 8 | 7 | 14 | 98 |
8 ├ 10 | 9 | 8 | 72 |
10 ├ 12 | 11 | 3 | 33 |
Total | n = 40 | 268 |
Resumo
Média aritmética simples: (Referente à população)
Média aritmética simples: (Referente à amostra)
Média aritmética ponderada
Média aritmética para dados agrupados sem intervalos de classes:
Média aritmética para dados agrupados com intervalos de classes:
(População)
(Amostra)
Anotações
Define-se a moda como o valor que ocorre com maior frequência em con- junto de dados. Tal e qual aparece no senso comum, a moda “vai e volta”, e várias vezes se repete.
Figura 13.1: Moda
Fonte: Acervo do autor
- Moda (mo) – para dados não agrupados
Primeiramente os dados devem ser ordenados (colocados em Rol) para, em seguida, podermos observar o valor que tem maior frequência.
Exemplo: Calcular a moda dos seguintes conjuntos de dados:
- X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) → Mo = 6 (0 valor mais frequente) Esse conjunto é unimodal, pois apresenta apenas uma
- Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) → Mo = 2 e Mo = 4 (valores mais fre- quentes)
Esse conjunto é bimodal, pois apresenta duas modas.
- Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) →Mo = 2, Mo = 3 e Mo = 4 (valores
mais frequentes)
Esse conjunto é plurimodal, pois apresenta mais de duas modas.
- W = (1, 2, 3, 4, 5, 6) →Esse conjunto é amodal porque não apresenta um valor predominante, ou seja, não tem
Observação:
A moda é utilizada quando desejamos obter uma medida rápida e apro- ximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição. É uma medida pouco utilizada.
Já a média aritmética é a medida de posição que possui a maior confiabili- dade numérica, além de ser a mais intuitiva, do ponto de vista matemático.
- Mediana (Md)
Nesta aula abordaremos outro tipo de medida de tendência central: a Me- diana. Como já dissemos, esta tem caráter mais geométrico, de simetria, em comparação as demais medidas.
É uma medida de posição (Medida de Tendência Central) cujo valor divide um conjunto de dados em duas partes iguais. Portanto, a mediana se loca- liza no centro de um conjunto de números ordenados segundo uma ordem de grandeza.
Para se obter o elemento mediano de uma série deveremos seguir os seguin- tes procedimentos:
- Se N (número de elementos do conjunto) for ímpar a mediana é o termo de ordem P dado pela razão:
- Se N (número de elementos do conjunto) for par, a mediana é a média aritmética dos termos de ordem, em um primeiro passo de P1 (média aritmética simples) e, em seguida, pela razão P2 (termo subsequente da ordem P):
Exemplos:
- Determine o valor da mediana da série que é composta dos seguintes elementos: 56, 58, 62, 65 e
N = 5 (ímpar) → P =
- Ema pesquisa realizada a respeito de erros por folha, cometidos por digi- tadores, revelou as seguintes quantidades: 12, 12, 13, 13, 15, 16, 18 e
- Determinar a quantidade mediana de
N = 8 (par) → P1 =
N 8
Logo a mediana será: Md =
Ou ainda, de modo simplista, dividimos os dados em limites à esquerda e à direita, destacando os valores centrais.
Destaque: O procedimento seguinte é para uma quantidade par de elementos.
1º. passo: organizamos o Rol:
Rol: 12, 12, 13, 13, 15, 16, 18, 20.
2º. passo: destacamos os valores centrais (metade à esquerda, metade à direita):
|
12, 12, 13, 16, 18, 20
3º. passo: efetuamos a média aritmética:
Resumo
Moda: é o valor que se repete o maior número de vezes, entre os dados obtidos.
Mediana (Md): representa o valor central entre os dados obtidos, estando esses dados em ordem crescente ou decrescente.
Para obter o elemento mediano devemos considerar dois casos:
1º.caso: se N for ímpar, a mediana é o termo de ordem P dado pela razão:
2º. caso: se N for par, a mediana é a média aritmética dos termos de ordem
P dado pela razão:
Anotações
MEDIDA DEFINIÇÃO VANTAGENS DESVANTAGENS
Média |
Centro de distribuição de frequências. |
– reflete cada valor. – possui propriedades matemá- ticas atraentes. |
– é afetada por valores extremos. |
Mediana |
Metade dos valores são maiores, metade menores. |
– menos sensíves a valores ex- tremos do que a média. |
–difícil de determinar quando há uma grande quantidade de dados. |
Modo |
Valor mais frequente. |
– valor “típico”: maior quanti- dade de valores concentrados neste ponto. |
– não se presta à análise mate- mática.
– pode não ter modo para certos conjuntos de dados. |
Figura 14.1: Comparação entre média, mediana e moda
Fonte: Acervo do autor
Memorize as seguintes frases (três frases mágicas, garantimos!):
1ª. A seta puxa a Média!
2ª. A Moda está no topo!
3ª. A Mediana está no meio!
Assim, nestas pequenas frases teremos as características das três Medidas de Posição.
Resumo
A Média é sempre influenciada por valores extremos, os quais são “atraídos pela seta”.
A Moda é o elemento de maior frequência, e a maior frequência está no topo (no ponto mais alto da curva).
A Mediana está sempre no meio do conjunto, dividindo-o em duas partes iguais!
Figura 15.1: Linha de produção
Fonte: Acervo do autor
As medidas de dispersão ou variabilidade são utilizadas para encontrar o grau de variabilidade ou dispersão dos valores observados em torno da mé- dia aritmética. Servem para medir a representatividade da média e desta- cam o nível de homogeneidade ou heterogeneidade dentro de cada grupo estatístico analisado. Para compreender esse conceito, considere a seguinte situação prática:
Um empresário deseja comparar o desempenho de dois empregados, com base na produção diária de determinada peça, durante cinco dias:
- Tipos de medidas de dispersão absoluta
- Amplitude total (AT):
É a diferença entre o maior e o menor valor observado.
Exemplo:
Pela situação sugerida na introdução, temos para a amplitude total os se- guintes cálculos para os empregados:
- Empregado A → A T = 71 — 69 = 2
- Empregado B → A T = 83 — 60 = 23
Resumo
A amplitude total é a medida mais simples de dispersão.
- A desvantagem desta medida de dispersão é que ela leva em conta ape- nas os valores mínimo e máximo do Se ocorrer qualquer va- riação no interior do conjunto de dados, a amplitude total não nos dá qualquer indicação dessa mudança.
- A amplitude total também sofre a influência de um valor “atípico” na dis- tribuição (um valor muito elevado ou muito baixo em relação ao conjunto).
Anotações
A Variância e o Desvio Padrão são as medidas de dispersão mais em- pregadas nos procedimentos estatísticos de constatação da variação de um dado e a consequente validação de uma pesquisa, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável e de alto grau de confiabili- dade. Para medir a dispersão dos dados em torno da média, os estatís- ticos usam a soma dos quadrados dos desvios dividida pelo tamanho da população ou da amostra, definindo assim variância como média aritmética dos quadrados dos desvios.
Dados não agrupados Dados agrupados
Figura 16.1: Dados
Fonte: Acervo do autor
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente.
Por isso mesmo imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão, definido como a raiz quadrada da variância.
(População) (Amostra)
Observações:
- Se os valores dos dados se repetirem em todas as amostras, então a vari- ância da amostra será
- Se os dados estiverem muito espalhados, então a variância da amostra acusará um número positivo Assim, uma grande variância signi- ficará uma grande dispersão dos dados em relação à média.
- A variância é uma medida que tem pouca utilidade na estatística descri- tiva, porém é extremamente importante na inferência estatística e em combinações de
- Quanto menor o desvio padrão, mais os valores da variável se aproximam de sua média.
- Quanto maior o desvio padrão, mais significativo à heterogeneidade en- tre os elementos de um
Exemplo:
Pela situação sugerida na introdução, temos as variâncias e o desvio padrão apresentando os seguintes cálculos para os empregados:
- Como a média do empregado A é 70, a variância será:
E o desvio padrão será:
S = √S² = √0,4 0,63
- Como a média do empregado B é 71, a variância será:
E o desvio padrão será:
S = √S² = √85,6 9,25
Atividades de aprendizagem
Salários semanais (R$)
fi xi.fi (xi- ) (xi – )².fi
4 | |||||
9 | |||||
11 | |||||
8 | |||||
5 | |||||
3 | |||||
Total | 40 |
Figura 17.1: Salários semanais em reais de uma amostra dos funcionários da empresa
Fonte: Acervo do autor
Calcular a média dos salários:
Calcular a variância dos salários:
Calcular o desvio padrão: s=√s²
Resumo
Amplitude total é a diferença entre o maior e o menor valor observado
Variância de dados não agrupados em classe: População
Amostra
Variância de dados agrupados em classe: População
Amostra
Desvio padrão:
|
|
(População) (Amostra)
Anotações
Já sabemos que para se obter informações sobre alguma característica da população, o tamanho amostral é de fundamental importância.
Estudaremos agora a probabilidade, que é uma ferramenta usada e neces- sária para se fazer ligações entre a amostra e a população, de modo que a partir de informações da amostra se possam fazer afirmações sobre caracte- rísticas da população.
Assim, pode-se dizer que a probabilidade é a ferramenta básica da Estatística Inferencial.
- Experimento aleatório
São aqueles que não podem ser previamente determinados. A esta impossi- bilidade de preverem-se os resultados chamamos de acaso.
Exemplo: Lançamento de dados. Em seguida anotar o número que ocorrerá na face voltada para cima.
Figura 18.1: Dados
Fonte: www.sxc.hu
- Espaço Amostral (S) ou Universo
É o conjunto formado por todos os resultados possíveis de um experimento aleatório.
Exemplo 1: Ao se lançar um dado e observar a face superior, têm-se o espaço amostral:
S = {1, 2, 3, 4, 5, 6}, ou seja, o Espaço Amostral (ou Universo) é for- mado por seis elementos.
Exemplo 2: Numa partida de futebol, uma das equipes pode obter resulta- dos tais como: vitória (v), empate (e) ou derrota (d). Tem-se então:
S = { v, e, d }, ou seja, o Espaço Amostral (ou Universo) é formado por três elementos.
Figura – 18.2 Futebol
Fonte: Acervo do autor
- Evento (E)
É um conjunto qualquer de resultados de um experimento aleatório. Pode-se dizer que um evento é um subconjunto do espaço amostral.
Exemplo: No lançamento de duas moedas pode ser que apareçam faces iguais. Os elementos do evento são E = { (K, K) , (C, C) }.
Figura 18.3: Moeda cara e coroa
Fonte: Acervo do autor
- Tipos de eventos
- Evento certo – é o próprio espaço
Exemplo: Lançamento de um dado e ocorrência de um número menor ou igual a seis na face superior.
- Evento impossível – é o subconjunto vazio do espaço
Exemplo: Lançamento de um dado e ocorrência de um número maior do que 6 na face superior.
- Eventos elementares – são aqueles que têm um só
Exemplo: Lançamento de um dado e ocorrência de um número ímpar maior do que 4 na face superior.
Resumo
O problema fundamental da probabilidade consiste em atribuir um número a cada evento (E), o qual avaliará as chances de ocorrência de (E).
O quadro seguinte resume a simbologia utilizada na teoria da probabilidade:
Figura 18.4: Quadro resumo de probabilidade – simbologia
Fonte: http://w3.ufsm.br/
Podemos definir o cálculo da probabilidade de um evento como a razão (divisão) entre o número de elementos do evento e o número de elementos do espaço amostral.
Onde: n(E) = o número de elementos do evento
n (S) = o número de elementos do espaço amostral
P (E) = a probabilidade de ocorrer o evento (preferencialmente em por cento)
Na prática, calcular a probabilidade é dividir. Observação:
Percentualmente, a probabilidade varia de 0% a 100%, ou seja, 0% P (E) 100% ou 0 P (E) 1.
- Eventos complementares P (A)
A probabilidade de não ocorrer o evento A é igual a um menos a probabili- dade de ocorrer A, que pode ser representada algebricamente por:
Exemplo prático:
Analisando um lote de 360 peças para computador, o departamento de controle de qualidade de uma fábrica constatou que 40 peças estavam com defeito. Retirando-se uma das 360 peças, ao acaso, a probabilidade de esta peça NÃO ser defeituosa é:
- Sendo S = conjunto dos elementos do espaço amostral, casos possíveis, e n(s) o número de elementos deste
- Sendo E = conjunto de elementos das peças defeituosas, e n(E) o número de elementos deste
- Use a nomenclatura “~E” como sendo o conjunto dos elementos das peças não defeituosas, e n(~E) o número de elementos deste conjunto. Neste caso, é o conjunto dos casos favoráveis.
- n(S) = 360 , n(E) = 40 e n(~E) = 320
- Para calcular a probabilidade de retirada uma peça que seja não defeitu- osa, proceda assim:
P(~E)= = = 88,9%
- Probabilidade da união P(A B) = P(A ou B)
Nesse caso, existem dois tipos possíveis de situação:
- Eventos mutuamente exclusivos:
Dois eventos são mutuamente exclusivos se A B = , neste caso:
- Eventos não mutuamente exclusivos:
Dois eventos não são mutuamente exclusivos se A B , neste caso: a probabilidade de se obter um número par ou maior que três.
- Espaço amostral: S = {1, 2, 3, 4, 5, 6} → n (S) = 6
- Evento A (números pares): A = {2, 4, 6} → n (A) = 3
- Evento B (números maiores que 3): B = { 4, 5, 6} → n (B) = 3
- Evento de A B: A B = {4, 6} → n (A B) = 2
- Calculando a probabilidade, temos:
Anotações
Sejam dois eventos A e B associados a um espaço amostral S, a probabilida- de de “A” ocorrer, dado que o evento “B” ocorreu, é definida por:
Portanto, quando calculamos P(A/B), tudo se passa como se o evento B fos- se um novo espaço amostral reduzido dentro do qual queremos calcular a probabilidade do evento.
Exemplo:
Considere o conjunto de números inteiros {1, 2, 3, 4, 5, …,18, 19, 20}, e, por meio de um sorteio aleatório, retire um número. Se o número sorteado for ímpar, qual a probabilidade de o número sorteado ser o 13?
- Espaço amostral S = {1, 2, 3, …,19, 20} → n(S) = 20
- Evento A = {13} → n(A) = 1
- Evento B: Condição para ocorrência do evento A = {1, 3, 5, 7, 9,11,13,15,17,19} →n(B) = 10
- (A∩B) = {13} → n(A∩B) = 1
20.1 Eventos independentes
Diz-se que dois ou mais eventos são independentes quando a ocorrência de um não depende (ou não é condicionada, ou não se vincula) da ocorrência do outro, isto é, a informação adicional de que um dos eventos já ocorreu em nada altera a probabilidade de ocorrência do outro.
Dados dois eventos independentes A e B, a probabilidade de que ocorram os eventos A e B é dado pelo produto de P (A) e P (B):
Exemplo prático:
Num grupo de jovens estudantes, a probabilidade de que um jovem, esco- lhido ao acaso, tenha média acima de 7,0 é . Nesse mesmo grupo, a pro- babilidade de que um jovem saiba jogar futebol é . Qual a probabilidade de escolhermos um jovem (ao acaso) que tenha média maior que 7,0 e saiba jogar futebol?
O fato de ter média maior que 7,0, não depende do fato de saber jogar futebol, e vice-versa. Quando isso ocorre, dizemos que os eventos são independentes.
Considere então os eventos:
- A: ter média acima de 7,0.
- B: saber jogar
- A e B: ter média acima de 7,0 e saber jogar
Como queremos calcular P(A e B), pense assim: de todos os jovens, têm média acima de 7,0 e sabem jogar futebol. Ora, de , ou seja,
sabem jogar futebol e têm média acima de 7,0. Portanto, P (A e B) = .
Resumo
Experimentos aleatórios: são aqueles que, quando repetidos várias vezes, em situações idênticas, apresentam resultados diferentes, não sendo possível a determinação do resultado antes de sua realização.
Espaço amostral: é o conjunto formado por todos os resultados possíveis de um experimento. Notação: S
Evento: é qualquer subconjunto do espaço amostral. Notação: E Cálculo da probabilidade de um evento:
P (E) = número de resultados favoráveis
número de resultados possíveis com 0% ≤P (E) ≤ 100% ou 0 ≤ P (E) ≤ 1.
Probabilidade da união de eventos mutuamente exclusivos:
Probabilidade da união de eventos não mutuamente exclusivos:
Probabilidade condicional:
Probabilidade de eventos independentes:
Anotações
COSTA NETO, P.L. de O. Probabilidades. São Paulo: Edgard Blucher, 1985. COSTA NETO, P.L. de O. Estatística. 17. ed. São Paulo: Edgard Blucher,1999. CRESPO, A.A. Estatística Fácil. 17. ed. São Paulo: Saraiva, 1999.
DANTE, L.R. Matemática: Contexto de Aplicações. São Paulo: Ática, 1999.
DOWNING, D., CLARK, J. Estatística Aplicada. São Paulo: Saraiva, 2000.
KAZMIER, L.J. Estatística Aplicada à Economia e Administração. São Paulo: Makron Books, 1982.
LAPPONI, J.C. Estatística usando o Excel. São Paulo: Lapponi, 2000.
LEVIN, J. Estatística Aplicada a Ciências Humanas, 2ª edição. São Paulo: Harper & Row do Brasil, 1978.
NICK, E., KELLNER, S. R. O. Fundamentos de Estatística para as Ciências do Comportamento. Rio de Janeiro: Renes, 1971.
SIEGEL, S. Estatística Não Paramétrica. São Paulo: McGraw-Hill do Bra- sil,1975.
STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Har- per & Row do Brasil, 1981.
TRIOLA, M. F. Introdução à Estatística. 7. ed. Rio de Janeiro: Livros Técnicos e Científicos, 1999.
Referências das Figuras
Figuras 1.1 a 1.5
Acervo do professor-autor
Figura 1.6 Estudos www.sxc.hu
Figura 1.7 População
http:// www.seplan.go.gov.br/sepin/pub/GoDados/2003/imagens/demografia.jpg
Figura 1.10 Colégio
Figura 1.12 Gráfico http://uolpolitica.blog.uol.com.br/images/Mulher3.jpg
Figura 1.14 Conjunto de números reais http://alfaconnection.net/images/NUM010106a.gif
Figura 3.1 Gráficos http://4.bp.blogspot.com/_mzA7VqOPJc4/S_xnLUnwBWI/AAAAAAAAAeM/8bZ88_rxxEk/s1600/modelos-graficos1.jpg
Figura 3.2 até 18.3 Acervo do professor-autor
- Podemos dizer que a Estatística pode ser:
- Construtiva ou referencial
- Destrutiva ou direcional
- Descritiva ou inferencial
- Regressiva ou pontencial
- Ingressiva ou preferencial
- O que é Estatística Descritiva?
- É o cálculo de medidas que permitirão descrever, com detalhes, o fenô- meno que está sendo
- É a parte da Estatística referente à coleta e à tabulação dos
- É a parte da Estatística referente às conclusões sobre as fontes de
- É a generalização das conclusões sobre as fontes de
- É a obtenção dos dados, seja através de simples observação ou mediante a utilização de alguma
- Assinale a alternativa que expressa CORRETAMENTE o que é po- pulação para a Estatística:
- população é a totalidade de habitantes de uma país.
- população é uma parte da
- população é uma reunião de pessoas
- população é um conjunto de elementos portadores de, pelo menos, uma característica
- população é o conjunto de elementos que responderão a um questioná- rio que fornecerá informações relevantes para uma
- A definição correta de amostra é a que consta da alternativa:
- amostra é o conjunto de dados obtidos em uma
- amostra é um brinde que ganhamos em um
- amostra é o conjunto dos resultados obtidos com uma
- amostra é uma tabela de dados obtida com uma
- amostra é um subconjunto finito de uma população.
- Dentro do universo estatístico, as variáveis “cor dos cabelos” e nú- mero de irmãos” podem ser classificadas, respectivamente, como:
- 1ª –variável quantitativa discreta; 2ª variável
- 1ª –variável quantitativa contínua; 2ª variável
- 1ª –variável qualitativa; 2ª variável quantitativa contínua.
- 1ª –variável qualitativa; 2ª variável quantitativa
- 1ª –variável quantitativa discreta; 2ª variável qualitativa contínua.
- Classifique a série abaixo:
Mês Aplicações
Setembro | 20,3 |
Outubro | 22,2 |
Novembro | 23,1 |
Dezembro | 21,0 |
APLICAÇÕES EM MILHÕES DE REAIS, DO ÚLTIMO QUADRIMESTRE DE 2006, EM UM DETERMINADO BANCO
- cronológica
- geográfica
- específica
- distribuição de frequência
- nenhuma das anteriores
- Classifique a série abaixo:
Porte Exportações
Pequeno | 100 |
Médio | 150 |
Grande | 200 |
EXPORTAÇÕES EM MILHÕES DE DÓLARES POR PORTE DAS EMPRE- SAS, NO ANO DE 2006
- cronológica
- geográfica
- específica
- distribuição de frequência
- nenhuma das anteriores
- A escolaridade dos jogadores de futebol nos grandes centros é maior do que se imagina, como mostra a pesquisa abaixo, realizada com os jogadores profissionais dos quatro principais clubes de fute- bol do Rio de
De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluíram o Ensino Médio é de aproximadamente:
Fonte: Dados Fictícios (O Globo, 24/07/2005.)
- a) 14%.
- b) 48%.
- c) 54%.
- d) 60%.
- e) 68%.
- Por que é importante fazermos a representação gráfica de uma série de dados estatísticos?
- Para que a apresentação fique mais
- Para que seja possível uma melhor visualização dos fenômenos em
- Porque toda apresentação deve ter gráficos.
- Porque uma apresentação com gráficos impressiona mais os
- Nenhuma das alternativas está
- Segundo a Organização das Nações Unidas (ONU), o mundo não conseguirá atingir a meta de reduzir a fome pela metade em Nem mesmo em 2030 esse objetivo poderá ser alcançado. O grá- fico a seguir mostra o número, em milhões, de pessoas com fome em cinco regiões do mundo, em diferentes anos (1992, 1999, 2015 e 2030), segundo dados e estimativas da ONU.
Fonte: Dados Fictícios
Com base nos dados fornecidos pelo gráfico, pode-se AFIRMAR que:
- em 2030, haverá mais de 700 milhões de pessoas com fome nas regiões destacadas no gráfico;
- em cada região destacada no gráfico, o número de pessoas com fome em 2030 será menor do que em 1992;
- em cada região destacada no gráfico, o número de pessoas com fome em 2030 será menor do que em 2015;
- em cada região destacada no gráfico, o número de pessoas com fome em 2015 será menor do que em 1999;
- em 2030, o número de pessoas com fome no Sul da África será maior do que três vezes o número de pessoas com fome no Sul da Ásia.
- Em um município foi pesquisado, durante um ano, o número de casos de certa doença, encontrando-se os dados representados no gráfico abaixo:
Pela análise do gráfico, é CORRETO afirmar que:
- O número de casos foi máximo no mês de
- O número total de registros no 2º semestre é de 1500
- A maior diferença do número de casos registrados ocorreu entre os me- ses de julho e
- O número de casos foi mínimo no mês de
- O número total de registros no 3º trimestre é de 1700
- Quando um intervalo de classe está representado por 1,250 1,260, isto significa que:
- o valor 1,250 não faz parte do intervalo de
- o valor 1,250 é o limite superior do intervalo de
- o valor 1,260 faz parte do intervalo de
- o valor 1,260 é o limite inferior do intervalo de
- o ponto médio deste intervalo é o valor 1,255.
- Com relação à distribuição de frequência dada abaixo, é possível dizer que:
Comprimento, (em cm) de certa peça produzida pela indústria “y”
Comprimento (cm) | fi | |
12,32 | 12,36 | 3 |
12,36 | 12,40 | 5 |
12,40 |
12,44 |
12 |
12,40 | 12,44 | 15 |
12,48 | 12,52 | 8 |
12,52 | 12,56 | 2 |
45 |
- a amplitude total da distribuição é 0,24.
- o limite inferior da classe é 12,44.
- o limite superior da classe é 12,44.
- a amplitude do intervalo de classe é 0,04.
- todas as alternativa estão
- Dada a distribuição de frequências a seguir, responda qual o limi- te superior da quarta classe:
idades Frequência (f)
0 2 2 |
2 4 5 |
4 6 18 |
6 8 10 |
8 10 5 |
- 8
- 6
- 4
- 10
- 40
- Na distribuição de frequências da questão 14, qual a amplitude de cada classe ou intervalo?
- 10
- 1
- 2
- 40
- 8
- Na distribuição de frequências da questão 14, qual o ponto médio da quinta classe ou intervalo?
- 40
- 5
- 8
- 9
- 10
17.A tabela abaixo refere-se a uma pesquisa realizada com 20 alunos, a respeito da área da carreira universitária que cada um pretende seguir.
|
Frequência simples
Frequência relativa
Porcentagem
Humanas | 8 | 8 =0,4
20 |
40% |
Biológicas | 7 =0,35
20 |
36% | |
Exatas | 5 | 25% | |
Total | 20 | 1,00 | 100% |
A frequência simples e a frequência relativa que faltam (assinaladas por c ) são, respectivamente:
- 7 e
- 7 e
- 5 e
- 7 e
- 5 e
- Se a distribuição de frequência obtida através da entrevista com 35 pessoas, em relação ao número de irmãos que cada uma têm, é representada abaixo:
Obs.: A última frequência acumulada relativa resultou 1,0001. Por critérios de arredondamento, é perfeitamente admissível desprezar a última casa decimal.
Número de irmãos
Quantidade
irmãos |
de | fi | fri | fai | fari |
0 | 2 | 0,0571 | 2 | 0,0571 | |
1 | 5 | 0,1429 | 7 | 0,2000 | |
2 | 8 | 0,2286 | 15 | 0,4286 | |
3 | 12 | 0,3429 | 27 | 0,7715 | |
4 | 3 | 0,0857 | 30 | 0,8572 | |
5 | 3 | 0,0857 | 33 | 0,9429 | |
6 | 1 | 0,0286 | 34 | 0,9715 | |
7 | 1 | 0,0286 | 35 | 1,0001 | |
35 | 1,0000 |
Em relação a esta distribuição, é possível dizer que:
- temos 30 pessoas que possuem 3 irmãos.
- temos temos 8,57% das pessoas com, pelo menos, 3 irmãos.
- temos 94,29% das pessoas entrevistadas com 5 ou menos irmãos.
- temos 34 pessoas com mais de 6 irmãos.
- temos 15 pessoas com apenas 2 irmãos.
- Dada a distribuição de frequências a seguir, responda qual a fre- quência acumulada total:
Idades Frequências (f)
19 21 8 |
21 23 12 |
23 25 15 |
25 27 13 |
27 29 5 |
29 31 7 |
- 31
- 55
- 20
- 60
- 12
As questões de número 20 e 21 devem ser respondidas com base na tabela primitiva de dados obtidos em uma pesquisa.
Massa, em Kg, de pacotes de certo produto produzido por uma indústria “X”
1,026 | 1,015 | 1,084 | 1,095 | 1,067 | 1,084 | 1,054 | 1,018 | 1,004 | 1,048 |
1,035 | 1,101 | 1,072 | 1,006 | 1,045 | 1,065 | 1,053 | 1,058 | 1,026 | 1,043 |
1,080 | 1,035 | 1,060 | 1,054 | 1,039 | 1,022 | 1,090 | 1,049 | 1,018 | 1,057 |
1,058 | 1,031 | 1,029 | 1,062 | 1,048 | 1,038 | 1,045 | 1,034 | 1,062 | 1,068 |
1,005 | 1,063 | 1,038 | 1,081 | 1,052 | 1,064 | 1,024 | 1,048 | 1,034 | 1,050 |
20.O limite superior da quinta classe é: a) 1,060
- b) 1,046
- c) 1,088
- d) 1,074
- e) 1,052
- As frequências da terceira e da quinta classe são, respectivamente:
- a) 8 e 9
- b) 10 e 12
- 8 e 12
- 10 e 4
- 10 e 9
- Os dados da tabela abaixo, gerados pelo departamento de qua- lidade de uma indústria, são agrupados em classes, mostrando a distribuição das peças defeituosas em agosto de
X: classe y: número de peças com defeito
I 2 6 14 |
II 6 8 54 |
III 10 14 110 |
IV 14 16 64 |
O histograma que melhor se adapta aos dados da tabela é:
- d)
- e)
c)
As questões de número 23, 24, 25 e 26 devem ser respondidas com base na tabela de dados obtidos em uma pesquisa.
Os seguintes dados se referem à média salarial (em R$) dos funcionários de uma determinada empresa.
410, 440, 440, 454, 460, 460, 490, 490, 491, 491, 491, 491, 491, 520,
520, 540, 540, 553, 553, 556, 561, 577, 577, 579, 584
- Qual será a amplitude total da distribuição de frequência?
- a) 164
- b) 154
- c) 174
- d) 184
- e) 176
- Qual será a amplitude de cada uma das distribuição classes?
- 28
- 30
- 27
- 29
- 26
- As frequências simples da terceira e da quinta classe são, respecti- vamente:
- 4 e 7
- 5 e 7
- 2 e 4
- 6 e 7
- 7 e 4
- As frequências acumulada relativa da segunda e da quarta classe são, respectivamente:
- a) 0,24 e 0,54
- b) 0,6 e 0,76
- c) 0,04 e 0,6
- d) 0,6 e 1
- e) 0,24 e 0,6
27.A tabela a seguir representa a distribuição de frequências dos salários de um grupo de 50 empregados de uma empresa, num certo mês.
|
Número de classe Salário do mês em R$ Número de emprega-
1 | 1000 | 2000 | 20 |
2 | 2000 | 3000 | 18 |
3 | 3000 | 4000 | 9 |
4 | 4000 | 5000 | 3 |
O salário médio desses empregados, nesse mês, foi de:
- a) R$ 2 637,00
- b) R$ 2 520,00
- c) R$ 2 500,00
- d) R$ 2 420,00
- e) R$ 2 400,00
28.O professor Javert e o professor Roberto aplicaram uma prova de matemática a 25 alunos, contendo 5 questões, valendo 1 ponto cada uma. Após fazer a correção, o professor Roberto construiu o gráfico seguinte, que relaciona o número de alunos às notas obtidas por eles.
Fonte: Dados Fictícios
Observando o gráfico, conclui-se que a mediana das notas obtidas pelos 25 alunos corresponde a:
- 1
- 2
- 3
- 4
- 5
29.O gráfico de setores abaixo mostra os resultados obtidos em uma pes- quisa com clientes de um supermercado, sobre um de seus produtos.
Fonte: Dados Fictícios
De acordo com a satisfação, cada cliente indicava uma nota de 1 a 5 para o mesmo produto. Esse gráfico, por exemplo, mostra que 7% dos consu- midores deram nota 1 para o produto consultado. Considerando o mesmo gráfico, é correto afirmar que a moda do conjunto de todas as notas dadas para o produto foi:
- 1
- 2
- 3
- 4
- 5
- As notas de um candidato nas provas de um concurso foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. A nota média, a nota mediana e a nota mo- dal desse aluno são respectivamente:
- a) 7,9; 7,8; 7,2
- b) 7,1; 7,8; 7,9
- c) 7,8; 7,8; 7,9
- d) 7,2; 7,8; 7,9
- e) 7,8; 7,9; 7,2
- Uma equipe de futebol realizou um levantamento dos pesos dos seus 40 atletas e chegou à distribuição de frequência dada pela tabela a seguir, cujo histograma correspondente é visto
Peso (kg) Frequência
60 64 | 2 |
64 68 | 5 |
68 72 | 10 |
72 76 | 12 |
76 80 | 6 |
80 84 | 3 |
84 88 | 2 |
Total de atletas | 40 |
Com base nestes dados, pode-se afirmar que o valor da mediana dos pesos é igual a:
- 75
- 72
- 74
- 73
- 71
32.A distribuição das idades dos alunos de uma classe é dada pelo gráfico abaixo.
Qual das alternativas representa melhor a média de idades dos alunos?
- 16 anos e 10
- 17 anos e 1 mês.
- 17 anos e 5
- 18 anos e 6
- 19 anos e 2
- Na busca de solução para o problema da gravidez na adolescên- cia, uma equipe de orientadores educacionais de uma instituição de ensino pesquisou um grupo de adolescentes de uma comuni- dade próxima a essa escola e obteve os seguintes dados:
|
Idade (em anos) Frequência absoluta de Adolescentes
13 4 |
14 3 |
15 2 |
16 5 |
17 6 |
Com base nos textos e em seus conhecimentos, é CORRETO AFIRMAR, em relação às idades das adolescentes grávidas, que:
- a média é 15
- a mediana é 15,3
- a mediana é16,1
- a moda é 16
- a média é 15,3
- Dado o conjunto de números 8, 4, 6, 9, 10, 5, determine a variância des- se conjunto, supondo que esses valores correspondem a uma
- a) 28
- b) 2,3664
- c) 7
- d) 2,8
- e) 5,6
- Determine o desvio padrão do conjunto de números da questão anterior, supondo que esses valores correspondem a uma
- a) 28
- b) 2,3664
- c) 7
- d) 2,8
- e) 5,6
Considere as seguintes notas de uma amostra de uma turma e res- ponda as perguntas a seguir:
35, 45, 40, 40, 52, 56, 59, 60, 54, 55, 56, 59, 60, 54, 56, 57, 59, 60, 55, 56,
57, 59, 60, 55, 56, 58, 60, 60, 70, 75, 80, 85, 60, 65, 63.
- Calcule a amplitude total do
- 50
- 49
- 48
- 47
- 45
- Calcule a variância do
- a) 94,56
- b) 105,83
- c) 110,83
- d) 109,83
- e) 120,00
- Calcule o desvio padrão do a) 10,29
- b) 9,72
- c) 10,53
- d) 10,48
- e) 10,99
39.O serviço de atendimento ao consumidor de uma concessionária de veículos recebe as reclamações dos clientes via telefone. Tendo em vista a melhoria nesse serviço, foram anotados os números de chamadas durante um período de sete dias consecutivos. Os resultados obtidos foram os seguintes:
Dia Domingo. Segunda Terça Quarta Quinta Sexta Sábado
Sobre as informações contidas nesse quadro, considere as seguintes afirmativas:
- O número médio de chamadas dos últimos sete dias foi
- A variância dos dados é 4.
- O desvio padrão dos dados é √2 .
Assinale a alternativa CORRETA.
- Somente as afirmativas I e II são
- Somente as afirmativas I e III são
- Somente as afirmativas II e III são
- Somente a afirmativa I é
- Na tabela abaixo encontra-se a distribuição de frequência dos salá- rios das três funções existentes em uma empresa de médio
Função Salário (R$) Número de Funcionários
Operário | 500,00 | 40 |
Inpetor | 2.500,00 | 8 |
Diretor | 5.000,00 | 2 |
Com base nesses dados, assinale a alternativa CORRETA.
- O salário médio dessa empresa é de R$ 000,00.
- O salário médio dessa empresa é obtido somando-se os salários das três funções e dividindo-se esse resultado por três.
- A mediana é o salário de R$ 500,00, recebido pelo inspetor dessa em- presa.
- O desvio padrão é zero, pois 80% dos funcionários recebem o mesmo
- Existe uma grande homogeneidade de salários, pois a maioria dos fun- cionários recebe o mesmo valor de R$ 500,00.
- Uma determinada região apresentou, nos últimos cinco meses, os seguintes valores (fornecidos em mm) para a precipitação pluvio- métrica média:
A média, a mediana e a variância do conjunto de valores acima são, respectivamente:
Jun Jul Ago Set Out
32 34 27 29 28 |
- a) 30, 27 e 6,8.
- b) 27, 30 e 2,4.
- c) 30, 29 e 6,8.
- d) 29, 30 e 7,0.
- e) 30, 29 e 7,0.
- Dois jogadores A e B vão lançar um par de Eles combinam que se a soma dos números dos dados for 5, A ganha, e se a soma for 8, B é quem ganha. Os dados são lançados. Sabe-se que A não ganhou. Qual a probabilidade de B ter ganhado?
- a) 10/36
- b) 5/32
- c) 5/36
- d) 5/35
- e) Não se pode calcular sem saber os números
43.(UNIRIO) As probabilidades de três jogadores marcarem um gol cobrando um pênalti são, respectivamente, ½, 2/5 e 5/6. Se cada um bater um único pênalti, a probabilidade de todos errarem é igual a:
- 3%
- 5%
- c) 17%
- d) 20%
- e) 25%
- (MACK) Numa competição de tiro ao alvo, a probabilidade de um atirador A errar é 8% e a de um atirador B errar é o dobro. Ocorri- dos 200 tiros, 100 para cada atirador, e tendo havido erro num dos tiros, a probabilidade de o mesmo ter sido dado por A é:
- a) 1/5
- b) 1/3
- c) 3/4
- d) 1/2
- e) 1/6
45.O resultado de uma pesquisa realizada pelo IPESPE, sobre o perfil dos fumantes, e publicada pela revista Veja de 03/06/07, mostra que num grupo de 1000 pessoas 17% fumam e, dentre os fuman- tes, 44% são mulheres. Se nesse grupo de 1000 pessoas uma é escolhida ao acaso, a probabilidade de ser fumante e mulher é de aproximadamente:
- a) 0,044
- b) 0,075
- c) 0,44
- d) 0,0075
- e) 0,0044
- Um casal planeja ter 3 filhos. Sabendo que a probabilidade de cada um dos filhos nascer do sexo masculino ou feminino é a mes- ma, considere as seguintes AFIRMATIVAS:
- A probabilidade de que sejam todos do sexo masculino é de 12,5%.
- A probabilidade de o casal ter pelo menos dois filhos do sexo feminino é de 25%.
- A probabilidade de que os dois primeiros filhos sejam de sexos diferentes é de 50%.
- A probabilidade de o segundo filho ser do sexo masculino é de 25%.
Assinale a alternativa CORRETA.
- Somente as afirmativas I e III são
- Somente as afirmativas I e II são
- Somente as afirmativas II e III são
- Somente as afirmativas I, III e IV são
- Somente as afirmativas II e IV são
- As cartas de um baralho são amontoadas Qual é a probabilidade de a carta de cima ser de copas e a de baixo tam- bém? (O baralho é formado por 52 cartas de 4 naipes diferentes → 13 cartas por naipe).
- Um jogo de memória é formado por seis cartas, conforme as figu- ras que seguem:
Após embaralhar as cartas e virar as suas faces para baixo, o jogador deve buscar as cartas iguais, virando exatamente duas. A probabilidade de ele retirar, ao acaso, duas cartas iguais na primeira tentativa é de
49.(UNIRIO) As probabilidades de três jogadores marcarem um gol cobrando um pênalti são, respectivamente, ½, 2/5 e 5/6. Se cada um bater um único pênalti, a probabilidade de todos errarem é igual a:
- 3%
- 5%
- c) 17%
- d) 20%
- e) 25%
50.Para ter acesso a um determinado programa de computador o usuário deve digitar uma senha composta por 5 letras distintas. Supondo que o usuário saiba quais são essas quatro letras, mas não saiba a ordem correta em que deve ser digitada, qual a pro- babilidade de esse usuário conseguir acesso ao programa numa única tentativa?
- a) 1/4
- c) 1/16
b)1/12 d) 1/32
- e) 1/256
Anotações
Javert Guimarães Falco
É Tecnólogo em Gestão Financeira pela Faculdade OPET e licenciado em Matemática pela UTFPR (Universidade Tecnológica Federal do PR, antigo CEFET- PR). Cursa MBA em Gestão de Organizações Educacionais pela Faculdade OPET. Atualmente é professor convidado do Departamento de Educação a Distância do IFPR, onde ministra as disciplinas de Matemática Financeira, Matemática Aplicada e Estatística, lecionando também em outras instituições de Educação a Distância nas mesmas disciplinas. Atua como professor de Pré-Vestibulares dos estados do Paraná e Santa Catarina, ministrando aulas de Matemática. Também é professor universitário, lecionando Estatística e Matemática Aplicada. Trabalha com consultoria Pedagógica na Educação a Distância e Presencial, desenvolvendo trabalhos de seleção e formação de equipe docente, organização do trabalho pedagógico, desenvolvimento de planos estratégicos de gestão empresarial.
Roberto José Medeiros Junior
É Licenciado e Bacharel em Matemática pela Universidade Tuiuti do Paraná (1999), Especialista em Educação Matemática com ênfase em Tecnologias pela Universidade Tuiuti do Paraná (2001), Especialista em Educação à Distância (Tutoria a Distância) – EaD/FACINTER (2007) tem Mestrado em Educação Matemática pela Universidade Federal do Paraná (2007). Entre os anos de 1996 e 2008, atuou como professor de Matemática do Ensino Fundamental ao Médio da rede pública e privada, e desde 2003 vem atuando como professor no Ensino Superior, nos cursos de Licenciatura em Matemática, Física e Pedagogia, na modalidade presencial e a distância em instituições públicas e privadas com as disciplinas de Cálculo, Estruturas Algébricas, Estatística e Matemática Financeira, e entre os anos de 2003 e 2005 atuou como professor de Metodologia, Prática de Ensino e Estágio Supervisionado em Matemática na Universidade Federal do Paraná, nos cursos de Licenciatura em Matemática, Física e Pedagogia. Atualmente é professor de Matemática em regime de Dedicação Exclusiva do Instituto Federal do Paraná na modalidade presencial e a distância. É um dos autores do Livro Didático Público de Matemática para o Ensino Médio do Estado do Paraná, e é também autor de livros para a formação continuada do Centro Interdisciplinar de Formação Continuada de Professores (CINFOP), da Universidade Federal do Paraná. Prestador de serviços como assessor pedagógico em Educação Matemática para a as escolas públicas (municipal e estadual) e privadas.