SNOMED CT: Terminologia Clínica para Automação e Cuidado Coordenado
AC Camargo Cancer Center
Publicado: 19 de dezembro de 2025Desafio ou problema enfrentado antes da solução
A instituição adotou o uso do SNOMED CT (Systematized Nomenclature of Medicine—Clinical Terms - tida como a terminologia clínica mais abrangente para descrever achados e observações clínicas) para codificar diagnósticos anátomo-patológicos). Contudo, um novo desafio surgiu devido à fragmentação semântica da base de dados e na incapacidade de transformá-la em um corpo de conhecimento oncológico coerente, pois a simples codificação de diagnósticos de acordo com o SNOMED resulta em uma vasta gama de entidades descoesas e de alta granularidade. Estrategicamente, esta dispersão semântica tornava a informação gerada pelo ambiente de produção sobrecarregada e difícil de usar para a gestão. Sem um pós-processamento que explorasse as relações hierárquicas e de atributo do SNOMED CT, é inviável extrair automaticamente um significado prático e alinhado ao modelo de negócio institucional, no qual os atendimentos são organizados de acordo com o tipo de tumor, integrando a linha de cuidado com equipes médicas e multiprofissionais dedicadas às necessidades dos pacientes de cada Centro de Referência. Isso resulta em ineficiência na criação de conjuntos de valores (value sets) ou groupers clinicamente válidos para a gestão dos centros de referência oncológica. Em essência, a instituição possuía os dados (códigos SNOMED CT), mas não o contexto semântico computável. Essa falta de interoperabilidade semântica estruturada é uma barreira crítica para o uso secundário dos dados em análise avançada, pesquisa e, futuramente, para a troca padronizada de informações com outras instituições.
Objetivo principal do uso de IA
O principal objetivo do uso de Inteligência Artificial (IA) é criar um contexto semântico robusto a partir da base de dados de SNOMED CT, garantindo que a vasta gama de diagnósticos ganhe significado dentro de um contexto oncológico. A IA, seja através de abordagens de IA generativa ou híbrida, é aplicada para decompor e processar o alto volume de códigos brutos, unificando a representação de conceitos. Essa agregação de significado é o que permite a construção de regras de hierarquização diagnóstica (Groupers) fidedignas, que categorizam os pacientes de forma consistente de acordo com a regra de negócio da instituição. A IA apoia a validação e manutenção dessas regras, utilizando o conhecimento relacional da SNOMED CT para fornecer um padrão de conformidade semântica que reflete a realidade clínica e as necessidades de gestão. A principal vantagem estratégica de longo prazo é que o contexto semântico gerado pela IA pode servir como o padrão de conformidade (o nível semântico da interoperabilidade) para futuras gestões de bancos de dados entre instituições. Ao padronizar o significado (semântica), a solução facilita a conversão subsequente para padrões estruturais de intercâmbio de dados, como o HL7 FHIR, viabilizando a troca transparente e a análise em larga escala de dados oncológicos.
Visão geral do projeto
| Área de aplicação | Caso de uso medicina diagnóstica |
|---|---|
| Subárea de aplicação | Ciclo de Receita |
| Etapa de maturidade | Piloto/Prova de conceito |
| Data de implementação | 01/02/2026 |
| Tecnologia utilizada | IA Generativa |
| Nível de autonomia | IA Automatizada (Executa tarefas de ponta a ponta com supervisão limitada) |
| Origem da solução | Desenvolvimento interno |
Tecnologias integradas
Governança e ética
Requisitos atendidos
Indicadores de impacto
Indicadores clínicos
Indicadores operacionais
Indicadores financeiros
Indicadores de experiência
Indicadores de escala
Resultados obtidos
O objetivo principal da IA é construir um contexto semântico robusto a partir da base de dados de diagnósticos codificados em SNOMED CT, unificando a representação de conceitos e traduzindo dados brutos de alta granularidade em regras de hierarquização diagnóstica (Groupers). Este processo permite que a informação oncológica se torne computável e alinhada ao modelo de negócio, garantindo a alocação de pacientes nas especialidades adequadas na organização de um banco de dados da área da saúde. Prova de Conceito (PoC) Validada em Alta Complexidade: A iniciativa começou focada em um Centro de Referência (CR) para tumores neuroendócrinos, uma área complexa onde o CID-10 não possui códigos específicos. O piloto obteve sucesso, mapeando 2.373 pacientes ao longo de um ano, com validação da alocação pela equipe médica especialista. Expansão e Maturidade do Modelo Atual: Após o PoC bem-sucedido, a iniciativa expandiu-se para toda a base diagnóstica, focando na adoção dos códigos SNOMED-CT devido ao seu maior detalhamento diagnóstico. Em seu quarto ciclo de testes, o modelo de classificação de IA (que utiliza a combinação de GPT-4 e Llama 4 em uma abordagem híbrida/hierárquica) já é capaz de alocar todos os diagnósticos cadastrados em SNOMED-CT nos respectivos CRs, incluindo a discriminação entre neoplasias benignas e malignas. Fidelidade Clínica Operacional: O propósito estratégico do contexto semântico gerado é criar regras de hierarquização (Groupers) fidedignas que categorizam os pacientes de forma consistente com a regra de negócio, ligando o diagnóstico à linha de cuidado com equipes dedicadas a cada CR, por conseguinte, permite espelhar o fluxo de pacientes da vida real de forma automatizada na ordenação do banco de dados diagnósticos da instituição.
Evidências quantitativas
O projeto em fase piloto demonstrou robustez e escalabilidade por meio dos seguintes dados: Escopo do Processamento: O modelo de classificação foi desenvolvido e testado usando um espaço amostral de 11.551 combinações únicas de topografia, código SNOMED e descrição diagnóstica, provenientes de 10.504 requisições de 8.270 pacientes únicos. Coerência e Classificação Interna (4º Ciclo): No batch atual de resultados, dois métodos de classificação (um baseado em GPT-4 e outro híbrido usando Llama 4 para casos residuais) começaram a apresentar distribuições semelhantes. O modelo é capaz de: Classificar consistentemente entre 60% e 70% dos casos como benignos. Identificar metástases com uma variação entre 3.4% e 3.6%. Segurança e Acurácia Clínica (Casos Indeterminados): O modelo é programado para identificar diagnósticos que não podem ser alocados de forma segura (casos indeterminados). Este valor é um indicador de segurança clínica, registrando 5.8% e 1% de casos indeterminados para os Métodos 01 e 02, respectivamente, demonstrando a capacidade de autodiscriminação de alocação segura.
Evidências qualitativas
A principal vantagem estratégica do projeto reside na transformação da gestão operacional e na construção de uma base sólida para a interoperabilidade futura no setor de saúde. Eficiência Operacional Máxima: A solução proporciona uma alocação 100% automatizada dos pacientes nos respectivos CRs, baseada no diagnóstico anátomo-patológico definitivo. Padrão de Conformidade Semântica para Interoperabilidade: O método estabelece um padrão de conformidade semântica para dados diagnósticos oncológicos. Este contexto semântico gerado pela IA é a base necessária (o "nível semântico da interoperabilidade") para a conversão futura para padrões estruturais de intercâmbio de dados, como o HL7 FHIR. Esta padronização é fundamental para viabilizar a troca transparente e a análise em larga escala de dados oncológicos com outras instituições. Melhoria na Qualidade do Dado (SNOMED-CT): A utilização do SNOMED CT é estratégica, pois é tida como a terminologia clínica mais abrangente. Sua integração com a IA permite que a instituição use a granularidade necessária para definir com precisão as condições clínicas (Groupers), algo que a IA viabiliza ao transformar a alta granularidade em um corpo de conhecimento oncológico coerente.
Barreiras encontradas e lições aprendidas
As lições aprendidas e as barreiras encontradas são cruciais, pois demonstram a maturidade do processo de implementação e a mitigação de riscos inerentes a projetos de IA e terminologia complexa. Barreira Crítica: Determinação da Verdade Absoluta (Ground Truth): A principal dificuldade técnica não foi apenas a quantidade de tokens ou outputs gerados, mas sim a determinação do ground truth (o parâmetro de verdade absoluta). Este problema é desafiador porque exige uma contextualização clínica e de negócios adequada. Solução para Validação de Alto Volume: Para contornar a inviabilidade da avaliação manual de milhares de combinações, a equipe adotou uma estratégia inovadora: a comparação de dois métodos de IA (GPT-4 com few-shot e chain of tought versus classificação hierárquica com Llama 4 e one-shot), focando a avaliação detalhada do erro apenas nas situações de discordância. Lição Aprendida: Governança Semântica Multidisciplinar: A resolução do desafio do ground truth demonstrou a necessidade de debate ativo e validação conjunta. A avaliação dos casos discordantes é realizada por um médico patologista, pela equipe de dados e por membros da área de negócio, garantindo uma contextualização semântica multidisciplinar e a definição de um racional de alocação que reflete a coerência clínica e a gestão.
Perspectivas futuras
Próximos passos do projeto
O futuro imediato do projeto deve se concentrar na estabilização do modelo de IA e na concretização do valor de interoperabilidade de longo prazo. 1. Consolidação e Refinamento do Modelo (Curto Prazo) •Validação Clínica e Coerência: O próximo passo crucial é finalizar o processo de validação e refinamento do modelo para garantir a coerência clínica na alocação de todos os diagnósticos aos respectivos Centros de Referência (CRs), onde os atendimentos são organizados de acordo com o tipo de tumor, integrando a linha de cuidado com equipes médicas e multiprofissionais dedicadas às necessidades dos pacientes de cada Centro de Referência. Isso garante que a regra de negócio do Grouper seja fidedigna e consistente com a prática clínica especializada. • Fechamento do Ciclo de Aprendizado: Concluir o quarto ciclo de testes e a avaliação multidisciplinar dos casos discordantes (envolvendo equipes de dados, médica e de negócio) para definir o racional final da alocação de entidades diagnósticas. 2. Estruturação para Interoperabilidade e Uso Secundário (Médio Prazo) • Padrão de Conformidade Semântica: O contexto semântico criado pela IA (a camada de significado) deve ser formalmente adotado como o padrão de conformidade semântica da instituição, essencial para o uso secundário dos dados em análises avançadas e pesquisa. • Conversão para FHIR (Interoperabilidade Estrutural): Utilizar o alicerce semântico já estabelecido como ponto de partida para a conversão subsequente a padrões estruturais de intercâmbio de dados, como o HL7 FHIR (Fast Healthcare Interoperability Resources). O FHIR é um padrão que utiliza recursos modulares (como Diagnósticos e Condições) para troca de informações de saúde. 3. Otimização de Recursos e Governança (Longo Prazo) • Manutenção Automatizada de Groupers: O modelo de IA deve ser direcionado para automatizar a manutenção e atualização das regras de hierarquização (Groupers), garantindo que a base de conhecimento oncológico permaneça coerente e atualizada. O uso de hierarquias SNOMED CT e lógica booleana é um método comprovadamente resiliente a mudanças, mas a IA pode gerenciar o monitoramento.
Possibilidade de expansão ou replicação
Possibilidade de Expansão ou Replicação em Outras Áreas/Instituições A abordagem em desenvolvimento para a oncologia, ao focar na desambiguação e hierarquização semântica usando SNOMED CT e IA, estabelece um modelo robusto e altamente replicável para diversas necessidades do ecossistema de saúde. 1. Replicação Metodológica para Outras Especialidades e Clínicas • Criação de Groupers Interdisciplinares: A metodologia de criação de Groupers baseada em hierarquias e conceitos SNOMED CT combinados com lógica booleana é um método eficiente para definir condições clínicas para qualquer subpopulação de interesse. Isso permite que a solução seja facilmente expandida para outras especialidades que necessitam organizar diagnósticos de alta granularidade (e.g., Cardiologia, Neurologia, Pediatria ou Doenças Raras). • Suporte à Gestão da Lista de Problemas (PL): A capacidade de categorizar diagnósticos de forma precisa pode ser aplicada na organização da Lista de Problemas (PL) do Prontuário Eletrônico (EHR) por sistema clínico/especialidade, melhorando a utilidade clínica e a comunicação entre os prestadores de cuidados. 2. Replicação Interinstitucional e Interoperabilidade Estrutural • Base para Troca de Dados HIE: O output final da IA (Groupers refinados e mapeados semanticamente) é a definição de condição necessária para a troca de dados entre EHRs de diferentes fornecedores e organizações. Definir condições com hierarquias SNOMED CT é mais simples e pode ser facilmente compartilhado para garantir a definição de subpopulações idênticas em diferentes organizações de saúde. • Ferramenta de Interoperabilidade para PHR/EHR: A lógica de padronização pode ser replicada para gerenciar a consistência estrutural e semântica de registros pessoais de saúde (PHR) com registros eletrônicos hospitalares (EHR), sendo o FHIR e o SNOMED CT os padrões fundamentais para essa comunicação bidirecional e segura. A replicabilidade da solução reside no fato de que o core do problema resolvido—a fragmentação semântica na codificação clínica—é universal para sistemas de saúde que utilizam terminologias ricas como o SNOMED CT. Ao fornecer o nível semântico necessário para a interoperabilidade FHIR, o projeto se posiciona não apenas como um otimizador de processos internos, mas como um facilitador de troca de dados em nível de rede.