Abstract:
RESUMO: No Brasil, um dos maiores problemas na área da saúde é a baixa capacidade de assistência
dos hospitais públicos para uma grande demanda populacional. Em razão disso, brasileiros
têm recorrido a saúde suplementar, atividade que envolve a operação de planos e seguros
privados de assistência médica e odontológica à saúde. Muitas empresas Operadoras
de Planos de Saúde (OPS) enfrentam dificuldades financeiras devido a fraudes e/ou
abusos na utilização dos serviços de saúde, como por exemplo, execução de procedimentos
desnecessários. Com a finalidade de evitar gastos abusivos, as OPS começaram a utilizar
um mecanismo chamado regulação, onde uma análise prévia da necessidade de cada
usuário é feita para autorizar ou recusar as solicitações requeridas. Normalmente, uma
empresa de porte médio recebe diariamente centenas de solicitações, as quais constam
os dados pessoais e o quadro clínico do paciente. Assim, faz-se necessária a presença de
especialistas para analisar cada solicitação e aprovar ou recusar, incluindo uma justificativa
para a decisão. Porém, o gasto para manter uma equipe de especialistas de tamanho
proporcional a demanda diária é alto. Por esse motivo as OPS têm buscado técnicas para
realizar essa atividade de forma automática ou semiautomática. Este trabalho tem como
objetivo estudar a influência do uso de características textuais na avaliação do processo
de regulação automática de uma OPS por meio do uso de técnicas de Processamento de
Linguagem Natural e Aprendizado de Máquina. Como este estudo possui um problema
característico de classificação, foram realizados experimentos utilizando os classificadores
KNN, J48, Naive Bayes (NB), Random Forest (RF) e SVM. As características do paciente
e as informações textuais do quadro clínico foram utilizadas como entradas para criação
do modelo para predizer qual classe um determinado conjunto de características pertence:
aprovada ou recusada. Foram estudados diferentes grupos de palavras e os resultados dos
experimentos apontam para o grupo criado pelo TF-IDF como maior melhoria em relação
a linha de base.Abstract:In Brazil, one of the biggest problems in the health area is the low capacity of assistance of
the public hospitals for a great population demand. As a result, Brazilians have resorted to
supplementary health care, which involves the operation of private health insurance plans,
dental care and insurance. Many health maintenance organizations (HMO) face financial
difficulties due to fraud and/or abuse of health services, such as unnecessary procedures.
In order to avoid abusive expenses, the HMO began to use a mechanism called prior
authorization, where a prior analysis of each user’s need is made to authorize or deny the
required requests. Usually, a medium-sized company receives hundreds of requests daily,
which contained personal data and the clinical condition of the patient. So it is necessary the
presence of experts to analyze each request and approve or decline, including a justification
for the decision. However, the expense to keep a team of experts of proportional size to daily
demand is high. For this reason, the HMO has sought techniques that perform this activity
automatically or semi-automatically. This work aims to study the influence of the use of
textual characteristics in the evaluation of the automatic prior authorization process of an
HMO through the use of techniques of Natural Language Processing and Machine Learning.
As this study has a characteristic problem of classification, we performed experiments using
the KNN, J48, Naive Bayes (NB), Random Forest (RF) and SVM classifiers. The patient’s
characteristics and the textual information of the clinical condition were used as inputs to
create the model to predict which class a certain set of characteristics belongs: approved
or refused. Different groups of words were studied and the results of the experiments point
to the group created by TF-IDF as a major improvement over the baseline..