English
- +

17/12/2013

ARTIGO: Pesquise apenas com grandes bancos de dados

É possível publicar artigos internacionais com uso de grandes bancos de dados sem coletar nenhum dado? A resposta é sim. Você pode publicar artigos científicos internacionais sobre grandes bancos de dados sem precisar coletar dados de um único paciente sequer. O que pode parecer um contrassenso, na verdade, é produto da explosão de bancos de dados disponibilizados, publicamente, ao redor do mundo. A maior parte deles possui foco em aspectos relacionados com a pratica clínica, que podem ser relevantes para a saúde pública. Esses bancos, que existem aos milhares, estão lá, esperando que um time de pesquisadores apareça com a simples combinação de: (1) uma pergunta cientifica inovadora que possa ser respondida com aqueles dados e (2) métodos de ciência de dados que extraiam informações úteis à prática e gerem insights.

Existem basicamente duas maneiras pelas quais você pode usar esses recursos. A primeira e mais simples é buscar um banco disponível publicamente, observando as suas variáveis (perguntas feitas nos seus questionários) e, a partir daí, formular uma pergunta relevante e inovadora para sua área, baseada nessas variáveis. Para isso, existem repositórios para bancos públicos internacionais mais antigos como o ICSPR (www.icpsr.umich.edu) e também recentes coleções que contém informações sobre doenças como o Sarven Capadisli (datahub.io/fr/user/csarven), ou ainda coleções de bancos clínicos que já foram pré-processados por outros pesquisadores como o repositório de Anthony Damico (www.asdfree.com).

Imagine, por exemplo, que um determinado banco contenha dados a respeito da relação entre peso corporal, mortalidade pós-operatória e uma determinada doença ocorrida em vários países. Agora suponhamos, em um exemplo fictício, que a relação entre mortalidade pós-cirurgia nunca tenha sido explorada comparativamente em vários países. Se essa for uma pergunta interessante para você, aí esta o seu artigo científico internacional.

A segunda possibilidade é que você já tenha um banco de dados local, digamos, do seu hospital ou de um grupo de pesquisas multi-institucional. Mesmo nesse caso os grandes bancos podem ser úteis já que algumas das suas variáveis podem ser inseridas indiretamente no seu banco local. Por exemplo: imaginemos que o seu banco local tenha informações sobre onde um determinado paciente mora, mas não informa sobre o seu perfil socioeconômico. Com um grande banco, como os gerados pelo Instituto Brasileiro de Geografia e Estatística (IBGE), você terá condições de determinar qual o perfil socioeconômico médio de pessoas que habitam uma determinada localidade e injetar essa variável dentro do seu banco local. Essa e uma prática frequentemente aplicada em grandes bancos de dados nos EUA.

As possibilidades são imensas. E, por isso, lá vai outra dica: se você é um pesquisador focado na pergunta cientifica é importante que você trabalhe com cientistas de dados que tenham uma mistura de habilidades estatísticas e computacionais para trabalhar com você.

 

Davi Prates é especialista em grandes bancos de dados, consultor e criador de cursos online sobre o assunto. Ele pode ser contatado por daviprates@gmail.com.

Ricardo Pietrobon é especialista em Educação, grandes bancos de dados e processos cognitivos. Uma lista de suas publicações internacionais pode ser encontrada no Google Acadêmico.

 

Edição Luiz Sérgio Dibe