Você precisa comparar os dados do questionário entre os estudos? Você quer encontrar a melhor correspondência para um conjunto de itens? Existem versões diferentes do mesmo questionário flutuando e você quer ter certeza de quão compatíveis elas são? Os questionários estão escritos em idiomas diferentes que você gostaria de comparar?
O projeto Harmony é um projeto de harmonização de dados que usa Natural Language Processing para ajudar os pesquisadores a fazer melhor uso dos dados existentes de diferentes estudos, apoiando-os com a harmonização de várias medidas e itens usados em diferentes estudos. o Harmony é um projeto de colaboração entre Ulster University , University College London , a Universidade Federal de Santa Maria e Fast Data Science .
o Harmony
pip install harmonydata
import harmony
harmony.download_models()
instruments = harmony.example_instruments["CES_D English"],
harmony.example_instruments["GAD-7 Portuguese"]
questions, similarity, query_similarity, _ = harmony.match_instruments
(instruments)
# How to load a PDF, Excel or Word into an instrument
harmony.load_instruments_from_local_file("gad-7.pdf")
install.packages("harmonydata")
library(harmonydata)
instruments <- harmony.example_instruments["CES_D English"],
harmony.example_instruments["GAD-7 Portuguese"]
similarity <- harmony.match_instruments(instruments)
Nossa ferramenta, o Harmony , permite que os pesquisadores carreguem um conjunto de questionários de saúde mental em formato PDF ou Excel, como o questionário de ansiedade GAD-7. Ele identifica quais perguntas entre os questionários são idênticas, semelhantes em significado ou antônimas umas das outras e gera um gráfico de rede. Isso permite que os pesquisadores harmonizem os conjuntos de dados.
Excepcionalmente, o Harmony depende de arquiteturas de rede neural Transformer e não depende de uma abordagem de dicionário ou lista de palavras. Isso permite suporte multilíngue (inglês e português são nossos idiomas de foco) e o Harmony é capaz de mapear corretamente o GAD-7 usado no Reino Unido para o GAD-7 usado no Brasil, apesar do questionário brasileiro estar em português do Brasil.
Usando o Harmony , nossa equipe foi capaz de realizar pesquisas inovadoras sobre isolamento social e ansiedade com a PNL, fornecendo uma medida quantitativa da equivalência dos diferentes conjuntos de dados de saúde mental.
HARMONY