Análise Estatística: Tipos de Dados

Veja também: Entendendo Correlações

Nossa página em Pesquisa observacional e dados secundários descreveu duas fontes principais de dados (sua própria pesquisa e dados que foram publicados anteriormente). No entanto, também existem muitos tipos diferentes de dados - e os dados podem ser classificados de várias maneiras diferentes. O tipo de dados afetará as maneiras como você pode usá-los e quais análises estatísticas são possíveis. Também afetará as conclusões e inferências que você pode tirar.

A escolha do tipo de dados é, portanto, muito importante. Esta página descreve algumas das distinções nos tipos de dados e as implicações para os métodos de pesquisa e descobertas.



Dados quantitativos vs. qualitativos

A primeira e mais óbvia distinção é entre dados quantitativos e qualitativos:



  • Dados quantitativos são numéricos: podem ser coletados e apresentados como números; e

  • Dados qualitativos não são numéricos.



Nossa página em pesquisa qualitativa e quantitativa explica esta distinção em mais detalhes e descreve as vantagens e desvantagens de ambos.

Dados objetivos vs. subjetivos

Os dados também podem ser divididos em objetivo e subjetivo.

  • Os dados objetivos são observáveis ​​e mensuráveis . Eles incluem coisas como altura, peso ou número de elementos. Eles geralmente são coletados por meio de observações ou medições diretas.



  • Os dados subjetivos são coletados de comunicações pessoais de indivíduos . Isso pode ser falado ou escrito, mas também pode assumir outras formas. Por exemplo, a linguagem corporal pode fornecer informações subjetivas (“ Ela ficou imóvel, com os olhos fechados e a boca apertada [objetiva], como se ela estivesse com dor [subjetiva] ”).

Os dados objetivos e subjetivos podem ser qualitativos e quantitativos. Por exemplo, você pode observar (objetiva) uma mudança de cor (qualitativa) e pode pedir às pessoas que expressem suas opiniões sobre um assunto (subjetivo) usando uma escala numérica (quantitativa).

é modo um tipo de média

Ambos os tipos têm vantagens e desvantagens. Por exemplo, dados subjetivos podem fornecer uma gama muito mais ampla de informações, porque muitas coisas são simplesmente incomensuráveis. Isso inclui variáveis ​​como nível de dor, onde cada um tem sua própria interpretação. Mesmo utilizando uma escala de 1 a 10, que torna os dados quantitativos, não significa que serão diretamente comparáveis ​​entre os indivíduos.

No entanto, os dados subjetivos também dependem das pessoas se lembrarem e avaliarem as coisas com precisão. Portanto, os dados subjetivos tendem a ser menos confiáveis ​​quando as pessoas precisam se lembrar de eventos mais antigos.

Sempre que possível, portanto, dados objetivos são preferidos, mas há um entendimento geral de que às vezes apenas dados subjetivos estão disponíveis.



Dados longitudinais vs. transversais

A distinção entre dados longitudinais e transversais é, na verdade, mais uma distinção em design de estudo do que o tipo de dados.

  • Estudos longitudinais trabalhar com o mesmo grupo ao longo do tempo. Eles podem, portanto, mostrar mudanças ao longo do tempo e identificar a causa.

  • Estudos transversais pode coletar dados em diferentes momentos, mas de grupos diferentes. Eles podem, portanto, mostrar apenas um instantâneo ou uma série de instantâneos no tempo.

A distinção crucial entre os dois tipos de estudo e, portanto, de dados, é que os dados longitudinais podem demonstrar causalidade.

Geralmente é considerado impossível demonstrar a causalidade a partir de dados transversais, porque você só tem informações sobre um momento no tempo. Portanto, não é possível mudar algo e ver que efeito tem (ou seja, se há um relacionamento casual )

No entanto, estudos transversais são muito mais convenientes. Você só precisa realizar uma única pesquisa ou pesquisa, em vez de seguir uma coorte ao longo do tempo. Os estudos longitudinais podem fornecer dados de alta qualidade e mostrar as causas, mas apresentam problemas como o abandono da coorte. Também é difícil conseguir financiamento para estudos longitudinais de alta qualidade e longo prazo.

Exemplo: Combinando Pesquisa Transversal e Longitudinal


O Surrey Communication and Language in Education Study (SCALES ) é um bom exemplo de um estudo longitudinal de longo prazo, que também incluiu alguns elementos transversais.

O primeiro elemento do estudo foi uma pesquisa em grande escala com crianças no ano de Recepção em 180 escolas primárias em Surrey. Todas as crianças da população foram examinadas quanto às habilidades de linguagem no ingresso na escola, por meio de uma pesquisa respondida pelos professores da turma para cada criança. Eles foram questionados sobre comportamento, linguagem e habilidades sociais. Isso deu um instantâneo das habilidades de linguagem no ingresso na escola e permitiu aos pesquisadores avaliar se o currículo combinava com as habilidades e estabelecer que as crianças mais novas eram mais propensas a ter problemas de linguagem.

O próximo estágio selecionou uma amostra de 590 crianças das triadas, estratificada usando os resultados do primeiro estágio para fornecer uma gama de habilidades de linguagem. Eles foram vistos por um pesquisador no Ano 1 e novamente no Ano 3, e suas habilidades de linguagem foram avaliadas. Os pais também foram solicitados a fornecer informações sobre a linguagem e o comportamento em ambos os pontos.

A próxima etapa seguiu a coorte SCALES original nos anos 6 e 8, para avaliar seus resultados sociais, emocionais e de saúde mental.

Os pesquisadores estavam interessados ​​na ligação entre o desenvolvimento da linguagem na primeira infância e o desenvolvimento social e emocional na adolescência. Esse tipo de informação simplesmente não pode ser obtido de um estudo transversal ou de dois estudos separados em idades diferentes. Você pode pedir aos participantes e aos pais que pensem no passado, mas o intervalo de tempo é tal que dificilmente a lembrança será confiável.

Dados categóricos, contínuos, discretos e classificados

Outra distinção são dados categóricos, contínuos, discretos ou classificados:

  • Os dados categóricos são divididos em grupos ou categorias distintas .

    Portanto, eles incluem, por exemplo, sexo, se você gosta de sorvete e se já visitou um determinado país. Eles também podem incluir a idade se ela for agrupada em blocos de dez ou cinco anos.

  • Os dados contínuos são definidos como aqueles que podem assumir um número infinito de valores entre quaisquer dois valores.

    Isso parece complicado, mas na verdade é simples. Esses são dados como peso ou altura, que podem ser qualquer valor dentro da faixa de pesos e alturas possíveis, não valores fixos ou porcentagem de uma classe que gosta de sorvete (qualquer valor dentro da faixa de 0-100%). Cada ponto de dados é um número distinto e separado e não se enquadra em um grupo. A idade, por exemplo, seria incluída se você a medisse com muita precisão em dias ou frações de um ano, em vez de anos inteiros.

  • Os dados discretos são definidos como aqueles que têm um número definido de valores possíveis entre quaisquer dois valores

    Os dados discretos incluem, portanto, o número de reclamações de clientes ou o número de pessoas que gostam de sorvete, ou seja, você não pode ter metade de uma reclamação ou um terço de uma pessoa. Outro exemplo seria a idade em anos inteiros. Para fins de análise, os dados discretos são considerados muito semelhantes aos dados contínuos.

  • Os dados classificados foram classificados e ordenados e, em seguida, numerados por sua ordem de classificação

    Por exemplo, se você tivesse quatro bits de dados com valores 4, 6, 3 e 7, você poderia classificá-los em ordem crescente como 3, 4, 6 e 7. Eles então tomariam sua ordem de classificação, então 3 seria 1 (1º), 4 seria 2 (2º) e assim por diante. Os dados geralmente são classificados quando tudo o que interessa a você é a ordem, e não os valores absolutos. Geralmente, esse é o caso quando duas variáveis ​​mudam juntas, mas não têm uma relação linear (ou seja, elas mudam em taxas diferentes). Por exemplo, o gráfico abaixo mostra esse tipo de relacionamento (neste caso, exponencial).

    Gráfico mostrando a relação exponencial entre duas variáveis.

    Aviso!

    Qual das alternativas a seguir é um impacto do alto autocuidado na comunicação interpessoal?

    É importante lembrar que, ao classificar os dados, você perde informações.

    Portanto, isso só deve ser feito quando você realmente precisar fazê-lo.


Esses quatro tipos de dados são adequados para diferentes tipos de análise - e você precisará usar diferentes testes estatísticos e formas de análise para cada um.

Para mais informações sobre o uso de diferentes tipos de dados para análise, você pode dar uma olhada em nossa página em Correlações .

Conclusão

Existem muitos tipos diferentes de dados que você pode coletar como parte de sua pesquisa. A escolha do tipo de dados geralmente é orientada por seus métodos de pesquisa, que por sua vez são orientados por sua pergunta de pesquisa e sua abordagem geral da pesquisa. No entanto, a escolha do tipo de dados também tem implicações para o tipo de análise e as conclusões que você pode tirar.


Continua a:
Entendendo Correlações
Análise Estatística Simples