A produção automatizada de matérias jornalísticas

Por FabioREM
De O Globo
Jornalismo em software
Por Pedro Doria
Falando no último sábado a um grupo de colegas de profissão no 13° Simpósio Internacional de Jornalismo Online, que ocorreu em Austin, no Texas, o repórter do Los Angeles Times Ben Welsh causou uma boa dose de desconforto. Faz três anos que ele vem automatizando a escrita de matérias. O leitor que piscar e reler terá feito o mesmo que muitos editores e repórteres fizeram no auditório do Museu Blanton de Arte. O LA Times publica matérias escritas pelo computador. (E não é o único.)
p>O Brasil não tem uma boa legislação que regulamente a disponibilidade pública de dados que deveriam ser públicos. Nos EUA, os vários órgãos de governo são pressionados a fazê-lo digitalmente. É o caso da LAPD, a Polícia da cidade de Welsh. Todo fim de madrugada, jornais e cidadãos interessados recebem uma tabela com a lista das prisões feitas no dia e na noite anteriores.
Nada complexo: uma planilha de Excel. Lá está o nome de quem foi preso, profissão, local em que ocorreu, crime do qual o sujeito é acusado. Ben Welsh escreveu um programinha simples que lê diariamente esta planilha, distribui num banco de dados e faz algumas análises.
Como se trata de Los Angeles, terra máxima das celebridades, a primeira coisa que o software pinça é se há um ator ou músico entre os presos da noite. Ele compara também a natureza dos crimes. Há nas últimas semanas, por exemplo, uma incidência maior de furtos nalgum canto específico da cidade? O crime cometido é um crime muito raro de ocorrer? O indivíduo preso é acusado de uma série particularmente longa de crimes? É tudo coisa que um repórter policial experiente buscaria. O programa faz isso em poucos segundos.
Os dados isolados e analisados são transformados em texto. O programa tem uma série de matrizes para isso. “Ontem à tal hora se deu o crime tal, a ocorrência foi registrada por fulano” e daí vai. O texto curto, carregado de informações, é distribuído entre os repórteres policiais. Alguns deles podem virar uma reportagem maior e profunda. Por conta desse estudo diário, qualquer mudança nos hábitos de criminosos em Los Angeles é imediatamente percebida na redação. E alguns dos textos produzidos pelo computador são publicados no site exatamente como saem da forma. Não carecem de apuração adicional, fica o registro.
No LA Times, o projeto sai do esforço pessoal de Welsh. Mas pelo menos uma empresa, a Narrative Science, baseada em Chicago, já tem um software comercial para empresas de jornalismo. No momento, sua ênfase se dá no jornalismo financeiro e esportivo. Neste último caso, leia-se beisebol. O site da revista Forbes é um dos principais clientes.
Beisebol é um esporte estranho. Popular nos EUA, em Cuba, na Venezuela, no Japão e talvez em nenhum outro canto do mundo, se uma característica o define é que é predominantemente estatístico. O que o programa faz é, recebendo os números de uma partida, produz a análise de dados. Em que jogada um time começou a aumentar a diferença de pontos em relação ao outro? Em qual um time virou? Uma longa fila de derrotas foi interrompida? Qual o ponto que mais se destacou? Há várias matrizes para as inúmeras situações que podem ocorrer.
Criminalidade em Los Angeles, partidas de beisebol e o cotidiano do mercado financeiro têm em comum a base estatística. A informação está na forma de uma lista de números, e a notícia principal nasce da comparação destes números entre si. Um software não pode substituir todo o jornalismo. Não produz um texto original e instigante. É incapaz de perceber emoção. Provavelmente não seria lá muito útil para falar de futebol, que tem poucos gols e muitos lances nos quais emoção ou arte é que imperam.
Mas computadores já começam, lentamente, a produzir ao menos um pedaço do conteúdo jornalístico. Há um quê de desconforto aí, ao menos para nós. Bem usado, porém — como é o caso do trabalho no LA Times —, elimina o trabalho braçal e permite que repórteres gastem mais tempo pensando. É um mundo no mínimo diferente, este que vem por aí.