Metodologia

Este documento explica como Really?! analisa uma notícia, o que cada seção do relatório significa e quais são as limitações do sistema. Transparência não é opcional — é o produto.

Princípio fundador

Um fato não se torna falso porque um milhão de fontes repetem uma mentira, e uma mentira não se torna verdade porque é popular.

Toda decisão de scoring, ponderação e agregação do Really?! respeita esse princípio. Autoridade da fonte sempre supera volume de citações. Uma fonte primária com dados verificáveis — um documento oficial, um estudo revisado por pares, um registro judicial — vale mais que mil fontes secundárias repetindo a mesma informação. Isso significa que o sistema trata viralidade e consenso jornalístico como sinais fracos: o que importa é a existência de evidência original, não quantas vezes ela foi copiada.

O pipeline: 9 etapas em ~2 minutos

Cada análise passa por 9 etapas sequenciais que combinam 5 chamadas a modelos de linguagem, 7 heurísticas locais (sem tokens, determinísticas) e 3 APIs externas. O custo médio por análise é inferior a 6 centavos de dólar.

# Etapa Tipo O que faz

1 Leitura do artigo API Converte a página em texto limpo via Jina Reader (fallback: smry.ai para paywalls)

2 Classificação de autoridade Heurística Atribui tier ao domínio: primária, secundária ou baixa (150+ regras, 0 tokens)

3 Extração de claims LLM #1 Separa afirmações factuais verificáveis de conteúdo opinativo e retórico

4 Coleta de evidências API Busca fontes na web + fontes primárias especializadas (gov.br, PubMed, tribunais)

5 Leitura das fontes API Lê o conteúdo completo de até 10 fontes e reclassifica cada uma por autoridade

6 Avaliação de claims LLM #2 Determina a stance de cada fonte (apoia, contradiz, contextualiza) com justificativa

7 Detecção de manipulação LLM #3 5 detectores simultâneos: citação seletiva, engano estatístico, manipulação temporal, distorção de fontes, lavagem de autoridade

8 Falácias e lacunas LLM #4 16 tipos de falácia retórica + análise de lacunas contextuais (o que o artigo escolhe não dizer)

9 Relatório LLM #5 Sintetiza todos os dados em linguagem natural: resumo, pontos fortes/fracos, headline honesto

Como ler os scores

Score de credibilidade (0–100)

Combina todos os sinais anteriores usando uma fórmula de pior sinal pesa mais (60/40 blend): o sinal mais preocupante tem 60% do peso, a média dos demais tem 40%. Isso impede que um artigo "lave" uma manipulação grave com vários sinais positivos. Na prática, um artigo factualmente correto mas com lacunas contextuais graves ou manipulação retórica detectada não consegue receber nota alta.

Qualidade editorial

Forte Evidências sólidas, fontes primárias presentes, sem manipulação detectada

Mista Alguns claims sustentados, mas lacunas ou sinais de manipulação leve

Fraca Claims mal sustentados, manipulação detectada ou fontes insuficientes

Insuficiente Evidência insuficiente para avaliar — veredito conservador

Tiers de autoridade das fontes

Primária Dados oficiais, diários oficiais, tribunais, bases acadêmicas (gov.br, IBGE, PubMed, STF)

Secundária Jornais, agências de notícias, portais editoriais (Reuters, Folha, BBC)

Baixa Blogs, redes sociais, agregadores, conteúdo gerado por usuários

Headline bait score (0–100)

Mede a divergência entre o que o título promete e o que o corpo entrega. Um título que diz "confirmado" enquanto o corpo diz "fontes dizem" é um sinal clássico de bait. O score é composto por 5 heurísticas: proporção de claims não sustentados, sensacionalismo lexical, escalação de linguagem (título definitivo vs. corpo hedging), framing seletivo e downplaying de contra-evidência. Acima de 25, o artigo recebe um flag visual no relatório; acima de 60, a confiança geral é penalizada.

Completeness score (0–1)

Mede o que o artigo escolhe não dizer. Este é talvez o score mais importante: um artigo pode ter todas as afirmações individualmente verdadeiras e ainda assim construir uma narrativa enganosa por omissão deliberada. O score penaliza: omissão de contra-evidência conhecida, viés de seleção (citar apenas dados que apoiam a tese), gaps entre teoria e prática, amnésia histórica (ignorar precedentes relevantes) e atribuição seletiva (creditar resultados a atores que não os causaram).

Os 10 detectores

Além da verificação factual claim-por-claim, Really?! executa 10 detectores que analisam a estrutura do artigo como um todo.

Citação seletiva Identifica quando dados são usados fora de contexto original, fontes são truncadas para mudar o sentido, ou estatísticas são escolhidas a dedo (cherry-picking) para sustentar uma narrativa que os dados completos não apoiam

Engano estatístico Detecta métricas apresentadas sem base de comparação adequada, escalas visuais distorcidas, uso de correlação como prova de causalidade, e percentuais calculados sobre bases convenientes

Manipulação temporal Identifica datas intencionalmente vagas, saltos temporais que omitem contexto relevante, uso de "recentemente" sem especificar quando, e reapresentação de dados antigos como se fossem novos

Distorção de fontes Compara o que o artigo afirma que uma fonte disse com o que a fonte de fato diz. Detecta atribuições imprecisas, paráfrases que alteram o sentido e citações que omitem qualificadores importantes

Lavagem de autoridade Identifica cadeias de citação circular (A cita B, B cita A, nenhum tem evidência original), uso de "especialistas dizem" sem identificar quem, credenciais infladas e falsa imparcialidade

Falácias retóricas 16 tipos de falácia, incluindo falácias clássicas (ad hominem, falso dilema, apelo à autoridade) e 6 padrões derivados de A Arte de Ter Razão (Schopenhauer, 1831): equivocação (#2), conclusão distorcida (#9), admissão falsa (#11), enquadramento paradoxal (#13), categorização odiosa (#32) e exploração de prova defeituosa (#37). Dos 38 estratagemas originais, 19 são cobertos pelo sistema

Lacunas contextuais Analisa o que o artigo escolhe não dizer: contra-evidência conhecida mas omitida, viés de seleção de dados, amnésia histórica (ignorar precedentes), gaps entre teoria e prática, e reversão de framing (apresentar rollbacks parciais como novos benefícios)

Manipulação emocional Mede a densidade de palavras-gatilho (medo, indignação, urgência, absolutismo) cruzada com o nível de evidência apresentado. Linguagem emocional forte + evidência fraca = sinal de manipulação

Headline bait Mede a divergência entre o que o título promete e o que o corpo entrega: sensacionalismo lexical, escalação de linguagem (título definitivo, corpo hedging), framing seletivo e amplificação de headline por citação

Coordenação Detecta sinais de campanha coordenada ou viral sem lastro: múltiplas fontes secundárias convergindo na mesma narrativa, baixa independência editorial entre elas, e zero fontes primárias sustentando a tese

Regras de veredito

Prevalência da fonte original Se uma fonte primária (dados oficiais, estudo publicado, registro judicial) contradiz uma afirmação e nenhuma outra fonte primária a apoia, o veredito não pode ser "sustentado" — é forçado para "misto" e a confiança é limitada. Um dado oficial vale mais que qualquer quantidade de reportagens que o contradigam.

Viral sem lastro Quando 3 ou mais fontes secundárias apoiam uma afirmação mas nenhuma fonte primária existe para sustentá-la, a confiança é limitada a 0.45. Isso é uma defesa contra campanhas virais e boatos: volume de repetição sem evidência original não produz certeza, produz eco.

Teto de fontes secundárias Fontes secundárias nunca ultrapassam 80% do peso total da avaliação. Isso impede que o volume bruto de reportagem sobre um tema supere uma única fonte primária com dados verificáveis. Dez artigos repetindo a mesma informação da mesma agência contam como uma voz editorial, não dez.

Princípio da cautela Na dúvida, o veredito é "precisa de mais evidência", não "sustentado". Preferimos admitir incerteza a emitir um julgamento com confiança que não temos. Avaliação cautelosa protege melhor o leitor do que falsa certeza.

Limitações

Nenhum sistema automatizado substitui jornalismo investigativo. Really?! é uma ferramenta de triagem que ajuda a identificar sinais de alerta, não um oráculo de verdade absoluta.

Modelos de linguagem podem alucinar — por isso combinamos LLMs com heurísticas determinísticas e múltiplas fontes
Artigos em idiomas diferentes do português e inglês têm cobertura de evidências reduzida
Fontes primárias atrás de paywalls governamentais ou acadêmicos podem não ser acessíveis
Claims subjetivas (opiniões, previsões, juízos de valor) não são verificáveis — são marcadas como "não verificável"
O sistema analisa texto — imagens, áudio e vídeo embutidos no artigo não são processados
A cobertura da web depende das APIs de busca (Tavily) — informações não indexadas não são encontradas
Resultados são cacheados por 24h — evidências publicadas após a análise não são refletidas automaticamente

Stack técnica

LLMs Gemini 2.0 Flash (rápido, barato) + Claude Sonnet 4 (raciocínio profundo) via OpenRouter

Busca Tavily Search API

Leitura Jina Reader + smry.ai (fallback para paywalls)

Frontend Astro SSR + Vercel

Persistência Supabase (cache 24h)