SNOMED CT: Terminologia Clínica para Automação e Cuidado Coordenado

AC Camargo Cancer Center

Publicado: 19 de dezembro de 2025

Desafio ou problema enfrentado antes da solução

A instituição adotou o uso do SNOMED CT (Systematized Nomenclature of Medicine—Clinical Terms - tida como a terminologia clínica mais abrangente para descrever achados e observações clínicas) para codificar diagnósticos anátomo-patológicos). Contudo, um novo desafio surgiu devido à fragmentação semântica da base de dados e na incapacidade de transformá-la em um corpo de conhecimento oncológico coerente, pois a simples codificação de diagnósticos de acordo com o SNOMED resulta em uma vasta gama de entidades descoesas e de alta granularidade. Estrategicamente, esta dispersão semântica tornava a informação gerada pelo ambiente de produção sobrecarregada e difícil de usar para a gestão. Sem um pós-processamento que explorasse as relações hierárquicas e de atributo do SNOMED CT, é inviável extrair automaticamente um significado prático e alinhado ao modelo de negócio institucional, no qual os atendimentos são organizados de acordo com o tipo de tumor, integrando a linha de cuidado com equipes médicas e multiprofissionais dedicadas às necessidades dos pacientes de cada Centro de Referência. Isso resulta em ineficiência na criação de conjuntos de valores (value sets) ou groupers clinicamente válidos para a gestão dos centros de referência oncológica. Em essência, a instituição possuía os dados (códigos SNOMED CT), mas não o contexto semântico computável. Essa falta de interoperabilidade semântica estruturada é uma barreira crítica para o uso secundário dos dados em análise avançada, pesquisa e, futuramente, para a troca padronizada de informações com outras instituições.

Objetivo principal do uso de IA

O principal objetivo do uso de Inteligência Artificial (IA) é criar um contexto semântico robusto a partir da base de dados de SNOMED CT, garantindo que a vasta gama de diagnósticos ganhe significado dentro de um contexto oncológico. A IA, seja através de abordagens de IA generativa ou híbrida, é aplicada para decompor e processar o alto volume de códigos brutos, unificando a representação de conceitos. Essa agregação de significado é o que permite a construção de regras de hierarquização diagnóstica (Groupers) fidedignas, que categorizam os pacientes de forma consistente de acordo com a regra de negócio da instituição. A IA apoia a validação e manutenção dessas regras, utilizando o conhecimento relacional da SNOMED CT para fornecer um padrão de conformidade semântica que reflete a realidade clínica e as necessidades de gestão. A principal vantagem estratégica de longo prazo é que o contexto semântico gerado pela IA pode servir como o padrão de conformidade (o nível semântico da interoperabilidade) para futuras gestões de bancos de dados entre instituições. Ao padronizar o significado (semântica), a solução facilita a conversão subsequente para padrões estruturais de intercâmbio de dados, como o HL7 FHIR, viabilizando a troca transparente e a análise em larga escala de dados oncológicos.

Visão geral do projeto

Área de aplicação	Caso de uso medicina diagnóstica
Subárea de aplicação	Ciclo de Receita
Etapa de maturidade	Piloto/Prova de conceito
Data de implementação	01/02/2026
Tecnologia utilizada	IA Generativa
Nível de autonomia	IA Automatizada (Executa tarefas de ponta a ponta com supervisão limitada)
Origem da solução	Desenvolvimento interno

Tecnologias integradas

Sistema de Laboratório (LIS)
Sistema de Prontuário Eletrônico do Paciente (PEP/RES)
Sistemas de Governança de dados

Governança e ética

Requisitos atendidos

Comitê de ética ou de inovação

Políticas de privacidade e segurança

Monitoramento para vieses algorítmicos

Indicadores de impacto

Indicadores clínicos

Melhora em precisão diagnóstica

Melhora no tempo de resposta

Redução de erros

Aumento de segurança do paciente

Indicadores operacionais

Redução de tempo em processos

Eficiência em fluxos

Otimização de recursos

Indicadores financeiros

Economia de custos

Aumento de receita

ROI estimado

Indicadores de experiência

Satisfação do paciente

Satisfação do profissional de saúde

Indicadores de escala

Número de pacientes / usuários beneficiados

Resultados obtidos

O objetivo principal da IA é construir um contexto semântico robusto a partir da base de dados de diagnósticos codificados em SNOMED CT, unificando a representação de conceitos e traduzindo dados brutos de alta granularidade em regras de hierarquização diagnóstica (Groupers). Este processo permite que a informação oncológica se torne computável e alinhada ao modelo de negócio, garantindo a alocação de pacientes nas especialidades adequadas na organização de um banco de dados da área da saúde. Prova de Conceito (PoC) Validada em Alta Complexidade: A iniciativa começou focada em um Centro de Referência (CR) para tumores neuroendócrinos, uma área complexa onde o CID-10 não possui códigos específicos. O piloto obteve sucesso, mapeando 2.373 pacientes ao longo de um ano, com validação da alocação pela equipe médica especialista. Expansão e Maturidade do Modelo Atual: Após o PoC bem-sucedido, a iniciativa expandiu-se para toda a base diagnóstica, focando na adoção dos códigos SNOMED-CT devido ao seu maior detalhamento diagnóstico. Em seu quarto ciclo de testes, o modelo de classificação de IA (que utiliza a combinação de GPT-4 e Llama 4 em uma abordagem híbrida/hierárquica) já é capaz de alocar todos os diagnósticos cadastrados em SNOMED-CT nos respectivos CRs, incluindo a discriminação entre neoplasias benignas e malignas. Fidelidade Clínica Operacional: O propósito estratégico do contexto semântico gerado é criar regras de hierarquização (Groupers) fidedignas que categorizam os pacientes de forma consistente com a regra de negócio, ligando o diagnóstico à linha de cuidado com equipes dedicadas a cada CR, por conseguinte, permite espelhar o fluxo de pacientes da vida real de forma automatizada na ordenação do banco de dados diagnósticos da instituição.

Evidências quantitativas

O projeto em fase piloto demonstrou robustez e escalabilidade por meio dos seguintes dados: Escopo do Processamento: O modelo de classificação foi desenvolvido e testado usando um espaço amostral de 11.551 combinações únicas de topografia, código SNOMED e descrição diagnóstica, provenientes de 10.504 requisições de 8.270 pacientes únicos. Coerência e Classificação Interna (4º Ciclo): No batch atual de resultados, dois métodos de classificação (um baseado em GPT-4 e outro híbrido usando Llama 4 para casos residuais) começaram a apresentar distribuições semelhantes. O modelo é capaz de: Classificar consistentemente entre 60% e 70% dos casos como benignos. Identificar metástases com uma variação entre 3.4% e 3.6%. Segurança e Acurácia Clínica (Casos Indeterminados): O modelo é programado para identificar diagnósticos que não podem ser alocados de forma segura (casos indeterminados). Este valor é um indicador de segurança clínica, registrando 5.8% e 1% de casos indeterminados para os Métodos 01 e 02, respectivamente, demonstrando a capacidade de autodiscriminação de alocação segura.

Evidências qualitativas

A principal vantagem estratégica do projeto reside na transformação da gestão operacional e na construção de uma base sólida para a interoperabilidade futura no setor de saúde. Eficiência Operacional Máxima: A solução proporciona uma alocação 100% automatizada dos pacientes nos respectivos CRs, baseada no diagnóstico anátomo-patológico definitivo. Padrão de Conformidade Semântica para Interoperabilidade: O método estabelece um padrão de conformidade semântica para dados diagnósticos oncológicos. Este contexto semântico gerado pela IA é a base necessária (o "nível semântico da interoperabilidade") para a conversão futura para padrões estruturais de intercâmbio de dados, como o HL7 FHIR. Esta padronização é fundamental para viabilizar a troca transparente e a análise em larga escala de dados oncológicos com outras instituições. Melhoria na Qualidade do Dado (SNOMED-CT): A utilização do SNOMED CT é estratégica, pois é tida como a terminologia clínica mais abrangente. Sua integração com a IA permite que a instituição use a granularidade necessária para definir com precisão as condições clínicas (Groupers), algo que a IA viabiliza ao transformar a alta granularidade em um corpo de conhecimento oncológico coerente.

Barreiras encontradas e lições aprendidas

As lições aprendidas e as barreiras encontradas são cruciais, pois demonstram a maturidade do processo de implementação e a mitigação de riscos inerentes a projetos de IA e terminologia complexa. Barreira Crítica: Determinação da Verdade Absoluta (Ground Truth): A principal dificuldade técnica não foi apenas a quantidade de tokens ou outputs gerados, mas sim a determinação do ground truth (o parâmetro de verdade absoluta). Este problema é desafiador porque exige uma contextualização clínica e de negócios adequada. Solução para Validação de Alto Volume: Para contornar a inviabilidade da avaliação manual de milhares de combinações, a equipe adotou uma estratégia inovadora: a comparação de dois métodos de IA (GPT-4 com few-shot e chain of tought versus classificação hierárquica com Llama 4 e one-shot), focando a avaliação detalhada do erro apenas nas situações de discordância. Lição Aprendida: Governança Semântica Multidisciplinar: A resolução do desafio do ground truth demonstrou a necessidade de debate ativo e validação conjunta. A avaliação dos casos discordantes é realizada por um médico patologista, pela equipe de dados e por membros da área de negócio, garantindo uma contextualização semântica multidisciplinar e a definição de um racional de alocação que reflete a coerência clínica e a gestão.

Perspectivas futuras

Próximos passos do projeto

O futuro imediato do projeto deve se concentrar na estabilização do modelo de IA e na concretização do valor de interoperabilidade de longo prazo. 1. Consolidação e Refinamento do Modelo (Curto Prazo) •Validação Clínica e Coerência: O próximo passo crucial é finalizar o processo de validação e refinamento do modelo para garantir a coerência clínica na alocação de todos os diagnósticos aos respectivos Centros de Referência (CRs), onde os atendimentos são organizados de acordo com o tipo de tumor, integrando a linha de cuidado com equipes médicas e multiprofissionais dedicadas às necessidades dos pacientes de cada Centro de Referência. Isso garante que a regra de negócio do Grouper seja fidedigna e consistente com a prática clínica especializada. • Fechamento do Ciclo de Aprendizado: Concluir o quarto ciclo de testes e a avaliação multidisciplinar dos casos discordantes (envolvendo equipes de dados, médica e de negócio) para definir o racional final da alocação de entidades diagnósticas. 2. Estruturação para Interoperabilidade e Uso Secundário (Médio Prazo) • Padrão de Conformidade Semântica: O contexto semântico criado pela IA (a camada de significado) deve ser formalmente adotado como o padrão de conformidade semântica da instituição, essencial para o uso secundário dos dados em análises avançadas e pesquisa. • Conversão para FHIR (Interoperabilidade Estrutural): Utilizar o alicerce semântico já estabelecido como ponto de partida para a conversão subsequente a padrões estruturais de intercâmbio de dados, como o HL7 FHIR (Fast Healthcare Interoperability Resources). O FHIR é um padrão que utiliza recursos modulares (como Diagnósticos e Condições) para troca de informações de saúde. 3. Otimização de Recursos e Governança (Longo Prazo) • Manutenção Automatizada de Groupers: O modelo de IA deve ser direcionado para automatizar a manutenção e atualização das regras de hierarquização (Groupers), garantindo que a base de conhecimento oncológico permaneça coerente e atualizada. O uso de hierarquias SNOMED CT e lógica booleana é um método comprovadamente resiliente a mudanças, mas a IA pode gerenciar o monitoramento.

Possibilidade de expansão ou replicação

Possibilidade de Expansão ou Replicação em Outras Áreas/Instituições A abordagem em desenvolvimento para a oncologia, ao focar na desambiguação e hierarquização semântica usando SNOMED CT e IA, estabelece um modelo robusto e altamente replicável para diversas necessidades do ecossistema de saúde. 1. Replicação Metodológica para Outras Especialidades e Clínicas • Criação de Groupers Interdisciplinares: A metodologia de criação de Groupers baseada em hierarquias e conceitos SNOMED CT combinados com lógica booleana é um método eficiente para definir condições clínicas para qualquer subpopulação de interesse. Isso permite que a solução seja facilmente expandida para outras especialidades que necessitam organizar diagnósticos de alta granularidade (e.g., Cardiologia, Neurologia, Pediatria ou Doenças Raras). • Suporte à Gestão da Lista de Problemas (PL): A capacidade de categorizar diagnósticos de forma precisa pode ser aplicada na organização da Lista de Problemas (PL) do Prontuário Eletrônico (EHR) por sistema clínico/especialidade, melhorando a utilidade clínica e a comunicação entre os prestadores de cuidados. 2. Replicação Interinstitucional e Interoperabilidade Estrutural • Base para Troca de Dados HIE: O output final da IA (Groupers refinados e mapeados semanticamente) é a definição de condição necessária para a troca de dados entre EHRs de diferentes fornecedores e organizações. Definir condições com hierarquias SNOMED CT é mais simples e pode ser facilmente compartilhado para garantir a definição de subpopulações idênticas em diferentes organizações de saúde. • Ferramenta de Interoperabilidade para PHR/EHR: A lógica de padronização pode ser replicada para gerenciar a consistência estrutural e semântica de registros pessoais de saúde (PHR) com registros eletrônicos hospitalares (EHR), sendo o FHIR e o SNOMED CT os padrões fundamentais para essa comunicação bidirecional e segura. A replicabilidade da solução reside no fato de que o core do problema resolvido—a fragmentação semântica na codificação clínica—é universal para sistemas de saúde que utilizam terminologias ricas como o SNOMED CT. Ao fornecer o nível semântico necessário para a interoperabilidade FHIR, o projeto se posiciona não apenas como um otimizador de processos internos, mas como um facilitador de troca de dados em nível de rede.