Metodologia
Este documento explica como Really?! analisa uma notícia, o que cada seção do relatório significa e quais são as limitações do sistema. Transparência não é opcional — é o produto.
Princípio fundador
Um fato não se torna falso porque um milhão de fontes repetem uma mentira, e uma mentira não se torna verdade porque é popular.
Toda decisão de scoring, ponderação e agregação do Really?! respeita esse princípio. Autoridade da fonte sempre supera volume de citações. Uma fonte primária com dados verificáveis — um documento oficial, um estudo revisado por pares, um registro judicial — vale mais que mil fontes secundárias repetindo a mesma informação. Isso significa que o sistema trata viralidade e consenso jornalístico como sinais fracos: o que importa é a existência de evidência original, não quantas vezes ela foi copiada.
O pipeline: 9 etapas em ~2 minutos
Cada análise passa por 9 etapas sequenciais que combinam 5 chamadas a modelos de linguagem, 7 heurísticas locais (sem tokens, determinísticas) e 3 APIs externas. O custo médio por análise é inferior a 6 centavos de dólar.
Como ler os scores
Score de credibilidade (0–100)
Combina todos os sinais anteriores usando uma fórmula de pior sinal pesa mais (60/40 blend): o sinal mais preocupante tem 60% do peso, a média dos demais tem 40%. Isso impede que um artigo "lave" uma manipulação grave com vários sinais positivos. Na prática, um artigo factualmente correto mas com lacunas contextuais graves ou manipulação retórica detectada não consegue receber nota alta.
Qualidade editorial
Tiers de autoridade das fontes
Headline bait score (0–100)
Mede a divergência entre o que o título promete e o que o corpo entrega. Um título que diz "confirmado" enquanto o corpo diz "fontes dizem" é um sinal clássico de bait. O score é composto por 5 heurísticas: proporção de claims não sustentados, sensacionalismo lexical, escalação de linguagem (título definitivo vs. corpo hedging), framing seletivo e downplaying de contra-evidência. Acima de 25, o artigo recebe um flag visual no relatório; acima de 60, a confiança geral é penalizada.
Completeness score (0–1)
Mede o que o artigo escolhe não dizer. Este é talvez o score mais importante: um artigo pode ter todas as afirmações individualmente verdadeiras e ainda assim construir uma narrativa enganosa por omissão deliberada. O score penaliza: omissão de contra-evidência conhecida, viés de seleção (citar apenas dados que apoiam a tese), gaps entre teoria e prática, amnésia histórica (ignorar precedentes relevantes) e atribuição seletiva (creditar resultados a atores que não os causaram).
Os 10 detectores
Além da verificação factual claim-por-claim, Really?! executa 10 detectores que analisam a estrutura do artigo como um todo.
Regras de veredito
Limitações
Nenhum sistema automatizado substitui jornalismo investigativo. Really?! é uma ferramenta de triagem que ajuda a identificar sinais de alerta, não um oráculo de verdade absoluta.
- Modelos de linguagem podem alucinar — por isso combinamos LLMs com heurísticas determinísticas e múltiplas fontes
- Artigos em idiomas diferentes do português e inglês têm cobertura de evidências reduzida
- Fontes primárias atrás de paywalls governamentais ou acadêmicos podem não ser acessíveis
- Claims subjetivas (opiniões, previsões, juízos de valor) não são verificáveis — são marcadas como "não verificável"
- O sistema analisa texto — imagens, áudio e vídeo embutidos no artigo não são processados
- A cobertura da web depende das APIs de busca (Tavily) — informações não indexadas não são encontradas
- Resultados são cacheados por 24h — evidências publicadas após a análise não são refletidas automaticamente